谷歌发布最强AI模型,引领AI搜索引擎新潮流,语音功能强势挑战OpenAI

尽管OpenAI率先发布了重磅新品演示,但谷歌后发制人,实现了OpenAI尚未能达到的目标,率先推出了人工智能(AI)搜索引擎,巩固了其在搜索领域的领先地位,并且推出了升级版的最强大AI模型Gemini,以迎战OpenAI新发布的旗舰模型GPT-4o。

美东时间5月14日周二,谷歌在年度开发者大会Google I/O上宣布,所有谷歌的工作都将围绕生成式AI模型Gemini展开。谷歌CEO Sundar Pichai表示:“我们希望每个人都能从Gemini所带来的变革中受益。” 谷歌将生成式AI引入搜索领域,推出了AI搜索引擎,并将Gemini的功能融入了多种服务之中。

Pichai宣布,谷歌搜索将推出AI生成摘要功能,名为AI Overviews,首先在美国上线,并将很快在更多国家地区推出。通过Gemini的多步推理,谷歌搜索可以代替用户进行研究,找到更好的搜索结果。比如,Gemini可以根据用户的需求汇总一天中的所有膳食和食谱,为用户规划膳食,并且可以为用户寻找购买食物的地点。

除了搜索功能外,Gemini还将影响用户的搜索结果页面,比如在寻找有现场音乐的餐厅时,Gemini可以根据不同的季节做出推荐,比如推荐有屋顶的餐厅。

在Google Photos中,Gemini也发挥了重要作用,用户可以通过新功能Ask Photos with Gemini,让Gemini找到他们想要的照片中的车牌号码。

Gemini还将与Google Workspace中的许多服务结合,比如在Gmail中搜索特定发件人的电子邮件,在Google Meeting中找到会议的亮点等。

Gemini还可以帮助用户搜索他们的手机,查找收据并安排取货窗口,还可以帮助用户计划旅行活动。

谷歌表示,用户将能够直接通过视频进行搜索。Pichai演示了如何使用视频搜索来解决电唱机的故障问题。

同时,谷歌在Gemini Advanced中推出了新的模型成员Gemini 1.5 Pro,拥有全球最长的上下文窗口,支持超过35种语言。Gemini 1.5 Pro将向150多个国家和地区的Gemini Advanced订阅者提供,拥有200万个token的上下文窗口,是当前模型100万个token窗口的两倍。

总体而言,谷歌的Gemini搜索引擎和Gemini 1.5 Pro模型的推出,标志着谷歌在人工智能领域的持续领先,并将为用户提供更加智能、个性化的搜索体验。

谷歌表示,今年夏季将扩展Gemini的多模态功能,包括增加使用语音进行深入双向对话的能力,这一功能被称为Live。通过Gemini Live,用户可以与Gemini进行交谈,并可以从各种自然的声音中选择Gemini的回应声音。用户甚至可以按照自己的节奏说话,或者在Gemini回答过程中打断并澄清问题,就像在任何人类对话中一样。

有网友评论称,想知道Gemini的对话功能相比OpenAI周一发布的最新旗舰模型GPT-4o会有多好。

谷歌还表示,今年夏季将在Gemini Advanced中添加新的旅行规划功能。借助考虑时间和空间方面物流的先进推理,Gemini将能够创建个性化的行程,节省用户的工作时间。

未来几周,谷歌将在Gemini Advanced中添加新的数据分析功能。用户只需上传电子表格,Gemini就可以分析数据、制作图表,并更快地发现见解。

谷歌还将推出Gemini的定制版本Gem。Gemini Advanced订阅者将很快可以获得更个性化的体验,只需描述用户希望Gemini做什么以及希望它如何响应,就可以让Gemini化身为健身伙伴、主厨帮手、编程拍档或创意写作指南。

例如,用户可以要求Gemini成为他们的跑步教练,给出每天的跑步计划,并保持积极、乐观,激励用户。Gemini将接收这些说明,用户只需单击一下,就可以强化这方面的特质,创建一个满足特定需求的Gem。

谷歌还宣布推出新的多模态AI项目Project Astra,它可以为用户解释智能手机拍摄的物体。通过将手机摄像头对准物体,Gemini可以识别物体,比如一个红色的苹果,并回答镜头中的物体是否可以发声等问题。

谷歌表示,将为Gemini Nano添加多模态功能,用户的手机可以通过文本、图像、声音和语音按照用户理解的方式理解世界。

谷歌还称,今年晚些时候,Gemini Nano的辅助功能TalkBack将增强,图像描述将更清晰、更丰富,帮助弱视用户和盲人用户通过语音反馈更好地使用他们的手机。

对于周二谷歌开发者大会的所有发布和演示内容,前谷歌Health AI产品经理Charlene Wang在社交媒体上评论称,除了AI代理和AI团队之外,她从中得到的主要收获实际上是Gmail、搜索、Workspace甚至Chat在未来几个月将变得更加有用。目前有许多具有杀手级用户体验的产品引人注目,将所有内容组织并同步在一个空间中的想法将是使用谷歌产品最令人信服的理由。

有网友认为,谷歌的整场活动没有达到苹果的水准,呼吁谷歌的高管向苹果学习,称虽然喜欢Project Astra项目的内容,但并没有觉得很兴奋,因为OpenAI周一已经发布了类似的内容。

还有网友表示,周二的活动中没有听到任何与安卓15系统或相关硬件有关的信息,不知道谷歌是否打算将它们保留到今年10月的发布会上再进行发布。