AI前哨｜美搜索巨头被“AI接管” 谷歌全新生成式搜索重磅发布

业界 | 2023-05-11 10:43:43

时间：2023-05-11 10:43:43 / 来源：凤凰网 / 点击数：()

谷歌全面拥抱AI

凤凰网科技讯《AI前哨》北京时间5月11日消息，北京时间今天凌晨，谷歌公司的年度I/O开发者大会正式拉开帷幕。不出所料，顶着巨大压力的谷歌把主题演讲的重中之重放在了生成式人工智能(AI)上，但是推进得依旧小心翼翼。

眼下，谷歌最大的压力来自ChatGPT和微软必应对于谷歌搜索霸主地位的冲击。AI的加持让原本名不见经传的微软必应焕发了第二春，也让外界批评谷歌行动迟缓。

(资料图)

谷歌管理层当然意识到了这一点，这次开发者大会就是为自己正名的大好时机。“我们正在重新构想包括搜索在内的所有核心产品。”谷歌CEO桑达尔·皮查伊(Sundar Pichai)在主题演讲中表示。

皮查伊称，谷歌正在将生成式AI整合到搜索和其他产品中，比如可以创建草稿的Gmail，以及可以对图像进行调整将人物居中、在空白区域上色的谷歌相册。

生成式谷歌搜索

谷歌搜索的未来是AI，但它并没有完全把宝押在聊天机器人上(尽管它正在开发一个名为“巴德”的聊天机器人)，也没有重新设计自己的主页，让它看起来更像一个ChatGPT风格的信息系统。相反，谷歌把AI放在了互联网上最具价值版面的核心位置上，也就是现有的搜索结果中。

大会现场，为了演示全新生成式搜索，谷歌搜索副总裁利兹·里德(Liz Reid)打开笔记本电脑，开始在谷歌搜索框中输入，“为什么酸面包仍然如此受欢迎？”她写道，然后回车。谷歌的正常搜索结果几乎立即加载。在它们的上方，一个矩形的橙色区域脉冲发光，显示出“生成式AI是实验性的”。

谷歌生成式搜索处于实验性阶段

几秒钟后，发光被AI生成的摘要所取代：上面的几段话详细介绍了酸面包的味道有多好，它的益生元成分的优点等等。在右边，还有三个网站链接。里德称，这些网站的信息“证实”了摘要中的内容。

谷歌把这种形式称之为“AI快照”。所有这些都由谷歌大语言模型驱动，源自开放网络。然后，里德将鼠标移到对话框的右上角，点击一个被谷歌设计师称为“熊爪”的图标，它看起来像一个汉堡包菜单，左边有一条竖线。“熊爪”打开了一个新的视图：AI快照接着被一个句子一个句子地分割，下面有链接到特定句子的信息来源。里德再次指出，这是一种验证。她说，这是谷歌AI做到与众不同的关键。“我们希望当大语言模型说了什么时，它能告诉人们可以从哪里阅读更多相关信息。”

AI快照显示在搜索结果最顶端

几秒钟后，里德点击回到主页，开始另一次搜索。这一次，她为泳池派对寻找最好的蓝牙音箱。同样，标准搜索结果几乎立即出现，AI搜索结果也会在几秒钟后生成。这一次，搜索顶部有一个简短的总结，详细介绍了你应该关心的蓝牙音箱问题：电池寿命，防水性能，音质。右边是三个购买指南的链接，下面是六个不错候选音箱的购物链接，每个链接旁边都有一个AI生成的摘要。记者让里德接着说“100美元以下”选择，她照做了。AI快照会重新生成新的摘要和新选择。

这是谷歌搜索结果页面的新外观。它是AI优先的，色彩丰富，与你所习惯的完全不同。它由谷歌迄今为止最先进的大语言模型提供支持，包括一个名为PaLM 2的新通用模型、谷歌用来理解多种媒体类型的多任务统一模型(MUM)。在记者看到的演示中，它通常令人印象极其深刻。它改变了你体验搜索的方式，尤其是在移动设备上，AI快照通常会占据搜索结果的整个第一页。

AI快照的颜色会根据搜索内容而变化

需要提醒的是，要想访问这些AI快照，你必须选择一个名为生成式搜索体验(SGE)的新功能，这是另一个名为搜索实验室的新功能的一部分。并不是所有的搜索都会触发AI答案，只有当谷歌的算法认为它比标准结果更有用时，AI会出现，而像健康和财务这样的敏感话题目前被设置为完全避免AI的干扰。但在记者的简短演示和测试中，不管搜索巧克力饼干、阿黛尔(Adele)、附近的咖啡店，还是2022年的最佳电影，AI快照都出现了。AI可能不会杀死谷歌搜索传统上显示的10个蓝色链接，但肯定会把它们往页面下方推。

大语言模型PaLM 2

今年3月，谷歌发布了旨在与ChatGPT竞争的实验性聊天机器人“巴德”。谷歌周三扩大了这一工具的使用范围，将其英文版本推向180多个国家和地区，同时还提供日文和韩文版本。

谷歌AI利器PaLM 2

皮查伊还在大会上讨论了谷歌为打造更强大AI技术所做的努力。他公布了一项更强大技术的最新版本——Pathways语言模型2 (PaLM 2)，并表示已经开始研发一款更大的模型，名为Gemini。

谷歌称，通过在PaLM 2上运行，Gmail变得更加智能和富有创意。该聊天机器人将能够显示和解释图像，并允许用户将回复导出到Gmail、Docs和其他应用程序。

“PaLM 2模型在逻辑和推理方面更强，这要归功于广泛的逻辑和推理训练，”皮查伊称，“它还接受了100多种语言的多语言文本训练。”

PaLM 2的翻译能理解更深层意思

谷歌高级研究主管斯拉夫·彼得罗夫(Slav Petrov)在PaLM 2发布前表示，PaLM 2在一系列基于文本的任务上表现得更好，包括推理、编码和翻译。“与(2022年4月宣布的)PaLM 1相比，它有了显著改进。”他表示。

为了演示PaLM 2的多语言功能，彼得罗夫展示了PaLM 2如何能够理解不同语言中的习语，并给出了德语短语“Ich verstehe nur Bahnhof”的例子，它的字面意思是“我只理解火车站”，但是言外之意是“我不明白你在说什么”，相当于英语中的“一窍不通”。

谷歌工程师在一篇描述PaLM 2能力的研究论文中称，该系统的语言熟练程度“足以教授这门语言”，这在一定程度上是因为其训练数据中非英语文本的比重更高。

谷歌的医疗模型Med-PaLM 2

此外，谷歌还基于PaLM 2为医疗领域推出了Med-PaLM 2模型。该模型由谷歌健康研究团队训练，可以回答问题并总结各种医学文本的发现，比如它可以分析X光胸透影像。