免责声明:金色财经所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(jinse.com.cn) 举报

    I/O大会一文速览 新模型不是重点 谷歌要让AI进入一切

    Yetawos7M8kKb6Cyij1aTu2dFr3KUGJ6BiWFSXjd.jpeg

    摘要:AI开始“模拟现实”

    作者:董雨晴,凤凰网科技

    “这是一个非凡的时刻。这是一个超高速发展的时期。”

    北京时间5月20日凌晨,谷歌CEO Sundar Pichai在I/O大会上,用一句话定调了谷歌当前对AI行业的判断。在凤凰网科技看来,与其说这是一场技术发布会,不如说谷歌在向外界传递一个清晰的信号:当行业还在追逐参数榜时,谷歌已经把战火烧到了“世界模型”和“极致性价比”两条新赛道上了。

    Gemini Omni正式登场:AI开始“模拟现实”

    今天最值得关注的模型更新,不是某个跑分更高的文本模型,而是Gemini Omni。

    谷歌将Omni定义为“世界模型”向前迈出的关键一步。用Pichai的话说,AI正从预测文本转向模拟现实,而Omni是第一个“可以从任何输入生成任何输出模态”的模型,这次率先落地的是视频输出。

    谷歌DeepMind首席架构师Korai在讲解中放出了一段演示:给Omni一个简单的提示词“蛋白质折叠的解说”,模型直接生成了一段讲解蛋白质如何从氨基酸链折叠成α螺旋和β折叠、最终形成三维形状的视频。并且,这个视频还不是从素材库拼接的,而是基于模型在训练中积累的知识直接生成的。换句话说,Omni开始展现出对“直觉物理学”的理解——它没有在检索信息,而是在模拟现实世界的运行逻辑。

    U1zctpHHesAsCnh9OPBMgcC4fJLOgYXAawq7YhMV.jpeg

    行业感到兴奋的是Omni在视频编辑上的能力。Korai演示了用户上传自己的视频后,Omni能基于音频、图像和视频等多种输入进行跨模态推理,然后自然地对角色、细节、风格进行改变。某种意义上看,这相当于把Nano Banana在图像编辑上重新定义规则的能力,完整复制到了视频领域。

    Omni Flash将从本周二起向Google AI订阅用户开放,用户可以在Gemini应用、Google Photos和YouTube Shorts上体验。值得注意的是,所有由Omni创建或编辑的内容,都会被嵌入谷歌不可察觉的数字水印,以应对急迫的安全伦理问题。Pichai同时宣布,OpenAI和ElevenLabs正在采用SynthID 2,这种跨行业合作在AI透明度议题上并不多见。

    Gemini 3.5 Flash:一场针对成本的“闪电战”

    如果说Omni是谷歌向未来的技术储备,那Gemini 3.5 Flash就是一把当下刺向市场痛点的快刀。

    根据谷歌官方数据,3.5 Flash在几乎所有基准测试中都超越了上一代旗舰模型3.1 Pro,编码能力尤其进步巨大,在衡量现实经济价值任务的GDP Val基准上实现了“非凡飞跃”。但真正的杀伤力不在跑分。

    JLanE9GOvZPVlTnVz2R38MKcYmexrkglzxrECIhO.jpeg

    Pichai在台上给出了一组清晰的对比:3.5 Flash的智能处于前沿水平,几乎与市面上最好的模型持平,但它的输出速度是其他前沿模型的四倍。在谷歌内部为Anti Gravity平台优化后,速度优势甚至拉大到12倍。

    TRwurEczbAjpRWi6ubdLDPDAxkKDxckWY6RkbeOX.jpeg

    实际上,这种组合应用在谷歌内部直接改变了游戏规则。

    速度背后是成本逻辑。Pichai罕见地替企业CIO算了一笔账:“我听到很多CIO说公司快用完年度Token预算了。假如他们拿出80%的工作负载从别家模型切换到3.5 Flash,一年能省超过10亿美元。”这种用真金白银做武器的话术,等于向企业市场直接摊牌:谷歌要走量、要规模、要用性价比清场。

    支撑这种性价比的,也逃不开谷歌自研的第八代TPU。这次谷歌首次采用双芯片设计(CPU 80和8 I),为训练和推理分别优化架构。更重要的是,谷歌通过多机多任务训练框架“Pathways”技术,将训练分布到全球超过100万个TPU上,创建了全球最大的训练集群。Korai透露了一个内部数据:今年3月谷歌内部每天处理0.5万亿Token,现在已飙升至每天超过3万亿Token,几周就翻一番。这种内部大规模使用形成的反馈闭环,正是把成本不断压低的核心引擎。

    生态卡位:从开发者到购物车,全面“包围”

    模型之外,谷歌今天展示的生态系统打法同样值得深究。

    在开发者侧,谷歌发布了Anti Gravity 2.0,一个独立桌面应用,可以让用户编排多个AI智能体并行完成任务:一个写网站代码,一个生成品牌素材,一个做产品架构。同时推出的还有命令行界面和SDK,等于给了程序员与谷歌自身产品同等能力的智能体工具包。

    在安全领域,谷歌展示了一款名为Covenant的工具,能利用Gemini模型自动查找并直接修补代码漏洞,而不只是发现。这显然是在瞄准大型企业对安全自动化日益增长的需求。

    但真正能让谷歌流量入口继续坐稳的,是搜索和购物体验的改造。

    搜索负责人Liz Reid确认,AI Mode模型已升级至3.5 Flash。一组数据佐证了这种AI搜索的势能:AI Overviews月活超25亿,AI Mode推出仅一年月活破10亿,搜索查询量在上季度达到历史最高点。谷歌顺势推出了25年来最大的一次搜索框升级,支持更长的对话式查询和AI驱动的建议系统,并将从夏季开始允许用户创建在后台7×24小时工作的“信息智能体”。

    购物场景的野心更大。谷歌商务负责人Vidhya展示了“Universal Card”智能购物车,能跨设备、跨商家运作:用户可以在搜索、YouTube、Gmail中随时添加商品,购物车在后台自动查优惠、监控降价、补货提醒,甚至能根据用户钱包里的多张银行卡,自动计算用哪张卡结算最划算。配合已获得亚马逊、Meta、微软等支持的通用商务协议(UCP)和保障支付的AP2协议,谷歌正在搭建一个让AI智能体安全花钱的完整商业闭环。

    在个人助手层面,全新的Gemini Spark定位为7×24小时运行在云端的个人AI智能体。比较可怕的是,即使你关掉电脑或手机,它仍在后台继续完成任务。Spark将首先面向可信测试者开放,随后以每月100美元的新Ultra套餐价格推出。

    看完这场发布会的全部内容,我们的一个核心感受是:谷歌已经不再把AI当成单一的产品竞赛,而是把它变成了一个从芯片到模型、从开发者到消费者、从搜索到购物的全栈战争。用Omni去定义“理解世界”的技术上限,用3.5 Flash去打穿商业化的价格底线,再用搜索、地图、购物、邮件等国民级应用完成场景收割——这套组合拳的背后,是谷歌对自己规模优势的最大化利用。

    当然,挑战同样清晰。Spark智能体能否跨过用户隐私和信任的门槛?Omni的视频生成能力在开放后能否守住安全边界?这些问题的答案,将决定谷歌这盘AI大棋的终局成色。

    jinse.com.cn 0
    好文章,需要你的鼓励
    jinse.com.cn 0
    好文章,需要你的鼓励
    参与评论
    0/140
    提交评论
    文章作者: / 责任编辑:

    声明:本文由入驻金色财经的作者撰写,观点仅代表作者本人,绝不代表金色财经赞同其观点或证实其描述。

    提示:投资有风险,入市须谨慎。本资讯不作为投资理财建议。

    金色财经 > 凤凰网科技 > I/O大会一文速览 新模型不是重点 谷歌要让AI进入一切
    • 寻求报道
    • 金色财经中国版App下载
      金色财经APP
      iOS & Android
    • 加入社群
      Telegram
    • 意见反馈
    • 返回顶部
    • 返回底部