照例 5 月,山景城,少了来自全世界各地程序员的「朝拜」,Google I/O 好像没了「灵魂」。面向寥寥无几的戴着口罩的员工,CEO 桑达尔・皮查伊好像自说自话。外界猜测的手机、耳机等硬件纷纷缺位,Android 12 反而成为「最大亮点」。
「太没意思了。」这是看到半个小时的心里话,但将持续了两个小时的开场看完,会发现 Google 把每一处技术和产品的更新迭代都加上了「人性的温度」。
「Hey Google」,Google 的语音助手被召唤出来了,「我想看视频里『雄狮在夕阳下咆哮』的画面」,手机背后的 AI 经过短暂的处理,像是听懂了人话一样,直接跳转到了用户想看的片段。
20 年前,人们使用 Google 搜索,只能看到带有蓝色下划线的超链接,而现在却能看到文本、图片、音频、视频等多模态结合的结果。又比如,你问「我打算来一场公路旅行,哪条路会有好看的山景?」Google 会直接在地图上规划好一条路线,至于你想沿途欣赏的美景,机器也已经在地图界面上给出了具体节点的图片、视频。
而这种高效的搜索,受益于了 Google 最新的自然语言模型 LaMDA。要执行用户提出的复杂指令,AI 理解人类语言是第一步,AI 越「听话」,人类就越能有求必应。
和 AI 明星 GPT-3 一样,LaMDA 也是基于 Transformer 架构,在语言对话方面非常出色。为了展示 LaMDA 的能力,Google 和 LaMDA 进行了两个简短对话。在其中一个对话中,LaMDA「扮演」了冥王星,Google 团队开聊后,AI 显得非常自如,回答说「如果要来旅游记得穿得暖和点,因为我这里特别冷」,至于被问到「有没有人访问过冥王星」,AI 也能答出准确的事实。
如果 Google 能让 AI 更好地理解语言,它就能改善其核心产品 —— 搜索。它可以把搜索,变成一种交互摩擦更小的「对话」。
但皮查伊仍非常谨慎地表示 LaMDA 仍在开发的初期阶段,虽然 AI 能够开放地回答人类问题,但它有时还是会出现逻辑错误。值得一提的是,Google 前几年公布了能帮用户打电话订餐厅的 AI Duplex,被媒体发现背后有真人代劳。
Google 还公布了一个全新模型 MUM(Multitask Unified Model)。MUM 能同时处理文字、图片、视频等信息,最终得到有极强参考价值的信息。在发布会上 Google 演示了一番,用户问 MUM「我已经成功登上了亚当斯山,明年想去攀登富士山,自己应该做些什么准备?」MUM 通过用户提供的照片、视频、路线图等信息,并针对富士山和亚当斯山的季节、地质等差异,提出最合理的攀登路线、时间和装备建议。
和 LaMDA 一样,MUM 目前也还在开发阶段。
Google 还强调会确保 AI 尽量避免偏见,对社会有益,还宣布引入 Android private compute core,作用是将系统中需要基于用户数据进行 AI 处理的部分和其他部分隔离开来,保证 AI 任务收集的个人数据的安全性。
除了帮你搜索之外,Google 还想做你的购物助手。「人们每天在 Google 上购物次数超过 10 亿次,今天我们要推出『购物图谱』(2012 年 Google 提出了『知识图谱』概念)。」在搜索沉淀下来的知识图谱基础上,Google 生成了很多种产品品类和销售这些产品的商家的数据集。据说,Google 可以对接全网数百万商家,提供了超过 240 亿的商品的报价,帮用户找到最划算的商品。由于「购物图谱」覆盖整个 Google 生态,用户可以在 Lens、Photos、YouTube 等场景随时随地「剁手」。
Google 还借助 AI 给旗下产品加入了一些人性的温度。比如,用 AI 分析用户上传到 Google Photos 里的相片,「Little Patterns」功能可以把相片里频繁出现的小物件(比如某一个橙色背包)提取出来,做成你背着这个背包行走的「旅途回忆」。「Cinematic」通过智能补帧的方式,可以将可能相关的照片合成一张有更多细节的动图。又比如,优化算法,为有色人种设计一个更「公平」的相机:过去图像处理针对浅色肤色优化,黑人的皮肤往往会被过度提亮。
AI 需要有强大的基础设施来驱动,Google 在 I/O 上也展示了专门为机器学习设计的最新一代芯片 TPU v4,速度是 TPU v3 的两倍多。另外,Google 也首次展示了他们设立在特殊园区内的量子 AI 中心,可在其中一些设施中实现接近绝对零度,以保护其量子比特。这个中心未来将很快拥有几十个第四代 TPU,以驱动量子中心的运行。
安卓设备总量已经超过 30 亿台,从软件开发的角度,安卓是谷歌生态系统的关键。Google 曾经在 I/O 2014 上推出设计语言 Material Design,目的是为 Google 打造一个独有的设计风格,无论是手机、平板还是其他平台形成统一的设计理念。
然而,在 Android 12 引入全新的设计语言 ——Material You 中,Google 强调「你」才应该是你的操作系统的创作者。Android 12 不仅重新设计了 UI,交互上也有简化,对系统空间也进行了重构。
Google 举了「颜色提取」例子,如果用户设置一张新的壁纸,系统会根据算法为桌面主题创建一个「调色板」,选出主色和互补色。Android 12 强调 UI 与现实世界的关系,从桌面拿起手机时亮屏动画会遵循设备拿起的方向,按下电源键锁屏时屏幕会朝电源键位置逐渐熄灭,时钟的大小取决于是否有未读通知。Android 12 中一些动画和其他指标做了优化,将 CPU 系统服务器时间减少 22%,因此 Android 12 体验会更快、更流畅。
当然,作为所有科技巨头的重中之重,每逢发布会必谈「隐私和安全」。在 Android 12 层面,Google 称它通过创建一个新的隐私仪表盘来提高数据透明度,该仪表盘可以显示用户的应用程序正在访问什么,何时访问数据,它会报告包括第一方和第三方所有软件,一旦用户看到哪个软件「行为怪异」,可以直接在仪表盘中管理和撤销对于该应用程序的权限。
基于新一代操作系统,Google 还提出要让手机成为中心,与其他智能设备更好地协作。对于 Chromebook,Android 12 添加了一项新功能,允许用户从手机解锁并登陆到附近的电脑;对于那些永远找不到电视遥控器的人来说,手机将逐渐替代电视遥控器,控制 Android TV 和 Google TV 将是一个福音;甚至未来,手机还能当作汽车钥匙使用。
除此之外,WearOS 也做了常规节奏的更新,虽然 Google 称这是 WearOs 史上最大更新 ——Google 将与三星联手,将 WearOS 和三星可穿戴操作系统 Tizen 相结合,可将应用启动速度提高 30%,加强设备续航持续运行心率传感器,以及繁荣开发者生态。
对照往年,今年的发布会略显平淡。过去人们说,Google 总是有办法,把最前沿的技术用最简单实用的方式尽量普及给最广泛的用户,因此带给人们超出预期的欢呼和惊喜。然而,曾经代表前沿技术的互联网科技公司,现在早已渗透到生活的方方面面,后疫情时代的远程办公,图像识别乳腺癌,碳中和…… 这些在 Google I/O 开场中出现的词语,也正是过去一年离不开人们嘴边的话题。
针对远程会议的体验优化,Google 内部正在研发名为 Project Starline 的项目,利用高清摄像头和景深传感器,捕捉身型相貌之后,创建一个实时的 3D 模型,加上光场和显示器,一个栩栩如生的 3D 形象就能赫然坐在你的对面,用来模拟面对面会议的真实感。
每逢开场的结尾处,总少不了温馨和感动的环节。虽然 Pixel 系列手机没有登场,但是 Google 预告了对于摄像头的改进期待,Google 正在对摄像头的自动白平衡和曝光算法进行改进,避免黑色皮肤人种在拍摄时过度增亮和饱和度不足,「改变的不应该是人们的外貌,而是我们的工作方式,有色人种需要更加美丽和准确的展现自我。」
或许有人说,这届 Google I/O 没有那么炫酷了,但是你发现,它在距离「Building a more helpful Google for everyone」的使命感却越来越靠近了,切实地对每个人的真实生活有所助益,这是 Google 在变大变强之后,回过头来对社会责任感的反思和实践。
当技术不止停留在「酷炫」,它才变成与人们生活密不可分的底层技术,才能真正变得「helpful」。