Gemini 3实现断层式领先 大模型竞争格局加速重构)
智通财经APP获悉,国泰海通发布研报称,谷歌Gemini 3的发布标志着大模型技术进入新一轮跃迁期,其在推理、多模态、代码生成等核心能力上实现断层式领先,并创新性地推出生成式UI与智能体平台Antigravity。此次突破验证了Scaling Law的持续有效性,将加速AI应用生态成熟。
国泰海通主要观点如下:
北美时间周二,谷歌正式推出新一代大模型Gemini 3,实现多维度断层式领先。新模型在核心推理能力上取得显著进步,在Humanity#39;s Last Exam中得分从2.5 Pro的21.6%跃升至37.5%,在被称为“AI界图灵测试”的ARC-AGI-2中更以31.1%的成绩超越GPT-5.1(17.6%)近一倍,展现出接近人类的抽象推理能力;多模态理解方面,新模型在复杂科学图表解析和动态视频理解测试中均创下新高,其卓越的屏幕理解能力为构建真正实用的AI代理奠定了坚实基础;在数学推理领域,新模型从前代仅能处理基础运算提升至可解决复杂建模与逻辑推演问题,为工程计算与金融分析等高阶应用提供了可靠的技术基础。
Gemini 3在代码生成与前端设计领域展现出革命性进步,不仅彻底扭转了谷歌在编程竞赛中的竞争态势,更通过架构创新为规模化商用铺平道路。其在LiveCodeBench上取得显著领先优势,在Design Arena的网站、游戏开发等四大赛区均位列第一。突破性的是,模型不仅能够生成功能代码,更具备quot;审美智能quot;,能根据用户意图自动生成符合现代设计规范的交互界面,催生了quot;生成式UIquot;新范式。在技术架构方面,Gemini 3采用稀疏MoE的全新设计,支持百万级token上下文长度,在长文档理解和事实回忆测试中表现优异。尽管API定价处于行业高端,但通过提升token效率和首答准确率,实际任务完成成本增幅有限,这种性能与成本间的精细平衡为模型在企业级市场的大规模应用提供了坚实支撑。
Gemini 3在智能体能力上实现质的飞跃,成为首个在消费级产品中深度融合通用Agent能力的基础模型。其工具使用能力较前代提升30%,在终端环境测试和长时间跨度的商业模拟中表现卓越,能够自主规划并执行复杂的端到端任务。配合全新推出的Antigravity智能体开发平台,开发者可在更高抽象层级进行任务导向编程,将AI从辅助工具升级为“积极合作伙伴”。此次突破验证了Scaling Law的持续有效性,推动了AI应用生态的加速成熟,推动AI应用开发范式发生根本性变革。
风险提示:大模型迭代速度不及预期,算力供给不足,数据隐私合规风险。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
智通财经APP获悉,汇丰正在对其交易部门进行重组,这是首席执行官GeorgesElhedery推动举措的一部分,旨在使该银行在债务融资业务领域成为行业巨头。据一份给员工的备忘录显示,该行的十国集团(G...
智通财经APP获悉,在人工智能投资热潮面临质疑之际,英伟达最新公布的季度业绩与前景指引,再次给华尔街打了一针“强心剂”。多位分析师表示,这份财报不仅回应了市场对AI需求、融资泡沫及GPU生命周期的担忧...
11月20日晚间,广州期货交易所发布最新公告,就碳酸锂期货部分合约的交易手续费及交易限额进行调整。 业内人士认为,此次举措旨在引导市场理性交易、防范品种短期过度波动,同时提升市场运行的稳健性。 上...
进入11月份,A股市场ESG实践热情不减。数据显示,截至11月20日记者发稿,已有36家公司首次披露或更新修订公司ESG管理制度,覆盖新能源、高端装备制造、金融、消费等多个行业领域。 这正是A股上市...
11月20日,在南方财经全媒体集团、21世纪经济报道主办的2025新汽车年度盛典上,理想汽车首款纯电SUV理想i8获得“年度AI汽车”称号。理想汽车i8在今年7月底正式上市,并在交付时就搭载了理想汽车...