超负荷 Google I/O:AI 大满贯更新在前,没人关注 Pixel 手机了-国际期货
行业资讯 发布时间:2023-05-11 08:46:00 来源:https://ii-iv.com 阅读次数:
摘要: 在 AI 上积累了7年的谷歌,迎来了一场真正以 AI 为焦点的 I/O 宣布会。 比起去年,强调「整合全球信息,使人人都能从接见中受益」的使命, 谷歌 CEO Sundar Pichai 今年 以「Making AI helpf

在 AI 上积累了7年的谷歌,迎来了一场真正以 AI 为焦点的 I/O 宣布会。

比起去年,强调「整合全球信息,使人人都能从接见中受益」的使命,谷歌 CEO Sundar Pichai 今年 以「Making AI helpful for everyone」总领整个宣布会。AI 将成为工具,辅助每一小我私人。这既包罗了谷歌一向强调的整合信息、学习,还包罗 AI 成为创作力辅助、辅助企业更好地创新产物。

模子、产物、功效、平台、硬件,一个接一个 demo,一个接一个 trailer,掌声和欢呼一刻也没有停下。

若是没有 OpenAI 和微软带来的竞争,我们可能永远看到不到这样一场,超负荷的 Google I/O 宣布会。

在这两个半小时里,山景城的海滨露天剧场,盼望成为天下中央。

开场三个 Demo

开场前的演出即是一个天生式人工智能实验。

音乐家丹·迪肯使用谷歌的 MusicLM、Phenaki 和 Bard Al 制作。「在制作这个节目的历程中,没有鸭子受到危险。」

Sundar Pichai 登台,「时机终于来了,」他说,「这是 AI 的好年」。

在大模子及一系列产物功效更新前,他先上了三碟前菜。

Gmail 宣布新功效「帮我写」(Help Me Write),凭证邮件内容,用自然语言下令 AI 撰写对应的回复。

好比,航空公司发来航班作废的邮件,示意会送上代金券作为抵偿,这时刻你可以让 AI 帮你写一个全额退款的邮件,它就会连系详细邮件内容,撰写全文。

Google Maps 将街景与导航连系,宣布新功效「陶醉式蹊径视图」(Immersive View for routes)。

用户可以在导航时,直接提前看到整个蹊径的动态街景视角。

在这一视图中,用户还能查看蹊径中的交通、天气情形。

Google Photos 推出「邪术编辑器」(Magic Editor)。

这是编辑前的图片,仅仅使用拖拽和一键优化,孩子的位置移动了,天空变得更蓝了。

PaLM2 取代了 LamDA,分化出四个版本

现在谈 AI 手艺,必须先亮出大模子,谷歌也不破例。

在 I/O 之前,关于谷歌最新模子的新闻就陆续传出。此前支持 Bard 的模子是一个轻量级的对话模子 LamDA,Pichai 在三月份采访中就示意,将把背后的模子升级为更大规模的 PaLM 模子。

I/O2023 上,最新最强的 PaLM2 终于露出了庐山真面目。PaLM2 是 PaLM1 的升级版。PaLM2 在数学、编码、推理、多语言翻译和自然语言天生上的显示都加倍精彩。

Pichai 现场展示了一个修改 Bug 后,用韩语对代码举行注释的例子:

PaLM 是谷歌于 2022 年 4 月份推出的大语言模子,有 5400 亿参数。这次先容的 PaLM2 是在此基础上的升级版。PaLM 是 Pathways Language Model 缩写。可以明白为,在 Pathway 架构上训练的模子。

Jeff Dean 曾经专门撰文先容 Pathway 架构,这个架构是为了可以处置多义务的通用模子而设计,接纳了一种新的异步漫衍式数据流,这使得并行盘算和运行加倍高效。Pathways 还可以支持包罗视觉、听觉和语言明白的多模态模子。

PaLM2 使用谷歌自主研发的 TPU 举行盘算,详细使用了若干算力盘算 PaLM2 现在尚未宣布,但可以参考训练 PaLM1 的数据,使用了 6144 块 TPU。

使用谷歌最新的 TPU 架构来训练模子,意味着在基础工程上,谷歌举行了整合盘算、优化缩放、改善数据集组合和模子架构等各项事情,这些也能够使得模子能力天真被挪用进种种产物、服务中。谷歌能够将模子的能力根据需求举行蒸馏和提炼。

为了让模子的能力更天真地服务于产物,Pichai 专程强调,PalM2 有四种差其余尺寸,划分以动物的名称命名:壁虎、水獭、野牛和独角兽。其中壁虎(Gecko)最轻量级的版本。

Gecko is so lightweight that it can work on mobile devices and is fast enough for great interactive applications on-device, even when offline. This versatility means PaLM 2 can be fine-tuned to support entire classes of products in more ways, to help more people.

Gecko 是云云轻量级,以至于它可以在移动装备上事情,而且速率足够快,可以在装备上运行交互式应用程序,纵然在离线时也是云云。这种多功效性意味着可以对 PalM2 举行微调,以便以更多的方式支持整个种其余产物,从而辅助更多的人。

最轻的模子可以在移动装备上运行交互应用程序,而在最新的三星 Galaxy 上,它能够每秒处置 16 个Token。

此外,pathway 架构的设置,也利于在特定领域对模子举行微调。康健研究团队在此基础上进一步生长,确立了 Med-PaLM 2,它可以检索医学知识、回覆问题、天生有用的模板,解码医学行话。

在上一代 AI 视觉手艺中,AI 已经被训练能够看懂 X 光片等图像,现在连系语言天生能力,模子能够凭证提供的 X 光片,写出病例剖析。

搜索新体验:升级 Bard 之外,

又加了一个 Search Lab

之前为了应对 NewBing 的挑战,谷歌急遽上线了对话机械人 Bard。然则从种种用户反馈来看,许多人都以为作为搜索助手的 Bard 不如 NewBing 好用。

对话与天生将更新搜索体验,已经成为新的共识,然则详细的产物形态依旧在探索的路上。谷歌也不想用 Bard 这个产物完全界说自己未来的搜索产物形态,因此关于搜索功效的升级,Keynote 中分为两个部门来展示:Bard 产物升级,Search Lab 的新功效测试。而这些新的功效,都由最 PalM2 来支持。

Bard 的基本功效点升级好比支持更多语言,能够识别图像信息,都属于划定动作,并无意外。让人感应惊喜的地方是,Bard 将接通谷歌自己的应用程序,以及一些外部的应用,来实现更壮大的功效。

投资界24h | 谷歌发布全新大语言模型挑战GPT-4;格力:孟羽童已离职;今年第二大IPO,市值430亿

好比,有着惊艳语言天生图像能力的 Adobe firefly,在未来几个月将直接集成到 Bard 中。这样在和 Bard 的对话中,就能够设计图片,好比请帖的封面、想象中的蛋糕。

谷歌舆图、图表能力也能够直接在 Bard 中挪用。现场演示给了一个例子,用户通过提问获得了几所相符自己报考目的大学名单,让 Bard 在舆图中将这几个学校的地址标出来,再让 Bard 凭证学习的专业、排名、地址等相关信息天生对比表格。

关于庞大问题的搜索,则在 Search Lab 的环节中举行演示。Search Lab 是一个探索性的产物,现在还没有所有开放,需要申请 Waitlist 才气使用。

新的搜索体验试图辅助人们更好地剖析一个庞大、或者有些模糊的问题。在人们最先搜索的时刻,往往问题并不明确,而是知道一个大致的偏向,又或者是问题能够再被拆分为子问题。

现场演示了对比景点、购置 ebike 两个例子。搜索即是决议历程,AI 天生要点提供了思索的框架,并提供相关链接,用户可以通过对话深挖信息。

有 3 岁以下的孩子和狗狗的家庭,Bryce Canyon 和 National Parks 哪个更适合?在这个案例演示中,Generative AI 汇总提炼了两个景点的优劣,而且提供了几篇参考链接,若是用户有需求,可以打开参考链接阅读,而且链接文章也会凭证差其余内容重点举行分类。

在另外一个演示案例中,用户需要选购一辆支持通勤 5 英里和山路的 ebike,AI 会提炼设计、电池、减震装置等要害的选购因素。

对话模式下,AI 会记着用户之前的一些选择,对信息做进一步的处置。好比用户想要「红色的 Ebike」,AI 会继续基于「通勤 5 英里、支持山路」等条件继续举行筛选。

谷歌的 AI 副驾驶,叫「Duet AI」

不出意外,有了新模子,对内,能升级的产物升级;对外,向企业提供服务,辅助他们更好地用上模子能力。这也相符 Pichai 在开场后不久提到的「AI helpful everyone」。

Google Workspace 是谷歌推出的多人协作软件,现在无论是写作文案、故事写作、制作幻灯片、制作表格,都可以用上 AI 了,形式类似于微软的 Copilot,在事情的主界面右侧有一个边栏,谷歌将其称为「sidekick」,AI 会在这里提出文章的修改意见、建议天生配图、表格的样式,用户选择合适的效果,就可以将 AI 天生的内容移入主界面。

「sidekick」样式

「Help Me Write」的写作辅助功效,同时泛起在 Workspace 和 Gamil 里。据谷歌先容,现在在 Workspace *的用例是「给出几个要害词,完成招聘要点」。

阅读室、豌豆荚首创人,同时也是谷歌前员工的王俊煜对此吐槽,这个产物设计就是沿用了 Microsoft 365 Copilot 的思绪,然则换了个「Duet AI」的名字。

形式上看起来简直差不多,不外使用体验若何涉及许多细微的因素,好比凭证 prompt 的天生内容是否令人知足,凭证文章内容天生的配图效果若何,是不是可以直接使用。这些都需要守候用户们使用了一段时间后,给出反馈。

就像各处泛起的「Help Me Write」,「Duet AI」也泛起在给开发者的云工具上,在 Cloud Console 泛起的「Duet AI」,功效是用语言改善开发者与云平台上工具的交互体验。行使天生式 AI 提供实时的上下文代码完成、代码函数天生、基于代码库的建议,甚至协助举行代码审查和检查。

面面俱到的服务:

平台、模子、盘算设施

谷歌面向企业的 AI 平台叫做 vertex AI,企业用户可以在这个平台上挪用需要的模子、根据需求对模子的参数权重举行微调、凭证内部数据确立企业版本的搜索引擎。

除了语言模子,谷歌还提供了其它三个专业能力模子供选用:图像天生模子、代码天生模子、以及文本转语音模子 Chirp。

在现场展示的互助同伴中,Replit、Character AI、Canvas 等明星公司都在其中,固然另有谷歌自己投资的 Antropic,也在使用谷歌提供的模子云服务。

现场还宣布了一个基础设施层面的新闻,谷歌和英伟达互助,搭建了基于 H100 的下一代 A3 图形处置器超级盘算机。

基于 H100 的 A3 虚拟机,网络带宽比上一代 A2 虚拟机多 10 倍。固然,PalM 的 API 也将在不久开放。

可以说,在对外输出模子能力上,谷歌确实拿出了实力雄厚的大厂做派,从开发工具平台、到基础模子、到基础设施、开放 API,一整个做了全套。

硬件:三款新产物,

Android 14 未登场

这次 I/O 大会上 Google 也宣布了一系列的硬件。除了在 2022 I/O 上预告的 Android 平板、新机 Pixel 7a,谷歌也终于宣布了自己的折叠手机。

今年 5 月 4 日星战日,Google 的一段视频泄露了折叠手机 Pixel Fold 的存在。

对标三星的 Galaxy Z Fold 系列,现在有是非两种配色,官方价钱 1799 美元,已同步上架,预定送 Pixel Watch,6 月最先配送,默认不包罗充电器。

为了实现折叠的形态,谷歌重新设计了长焦镜头模组、电池组件等等,使其保持相对的轻薄,官方号称是最薄的折叠屏手机。

双屏除了我们常见的桌面模式和悬停模式之外,谷歌思量的「内外屏」同时显示功效是『实时翻译』,内外屏显示两种翻译的语言(感受并不是什么有用的功效,语音翻译不是更适用?)。

总结

在微软的 NewBing、Office 365 全家桶、Notion AI 辅助写作功效面世之后,再看谷歌的产物似乎都给人一种似曾相识之感,很难线人一新。大模子给产物形态上带来的*轮袭击,已经基本完成了。

值得注重的是,虽然产物展示了识别图片的能力,然则谷歌似乎还没有一个像 GPT-4 这样的拥有文字、图像多模态的基础模子。Pichai 只是预告了一个叫做 Gemini 的多模态模子,正在研发之中,不久后会宣布。

抛开 Duet AI 与 Copilot 类似的产物形态,谷歌在先容时,强调了其自动优化 Prompt 语言表述,以及自动凭证文章内容提出写作建议的特点,似乎加倍用户友好。是否用起来也会云云,还需要守候用户反馈。同理,最新的模子 PaLM2 所支持的搜索功效,和 NewBing 相比,事实体验若何?PaLM2 支持的 Bard,比之前 LamDA 支持的 Bard,使用感能够提升若干?

在 I/O 的媒体预相同会上,有人提问,看起来谷歌将模子的能力涣散到了各个产物里,重点不明确。来自谷歌研究部门的事情职员回覆道,「这似乎是一种涣散战略,但在谷歌,我们支持大量的产物,我们将其视为模子的天真性,来支持差其余用例和受众群体。这也是我们能够同时在许多差异偏向上测试模子能力的好方式。」

耐久来看,大模子的最终竞争壁垒不在于手艺,而在于产物是否会被用户真正接纳,围绕手艺能否实现开发者生态。从这次宣布来看,谷歌结构了所有能结构的产物与服务,而在其进入的领域中,是否能够真正形成优势,所有人将拭目以待。

标签: