WAIC 2025 观察:大模型进入“效率与场景”决胜期

AI资讯 12小时前 charles
490 0

WAIC 2025 观察:大模型进入“效率与场景”决胜期
WAIC 2025 观察:大模型进入“效率与场景”决胜期

WAIC 2025热度背后的AI产业发展趋势逐步浮现:模型转向追求极致“推理效率”,算力升级为系统级工程的“超级工厂”,应用走向物理世界的“自主执行”。

WAIC 2025 观察:大模型进入“效率与场景”决胜期

模型范式:极致参数让位于极致效率和多模态

Scaling Law边际收益递减,行业侧重“低成本、高并发”的推理优化。阿里带来最新开源的三款大模型,其中,Qwen3推理模型比肩Gemini 2.5 Pro和o4-mini等顶级闭源模型;Qwen3-Coder编程模型登顶全球最大开源社区HuggingFace模型总榜冠军,并带动千问API调用量暴涨,三天突破千亿Tokens。商汤科技发布日日新V6.5多模态大模型及系列产品,原生集成感知、视觉导航及多模态交互能力,推理吞吐量提升35%以上,多模态交互能力优于GPT-4o和Gemini 2.5 Flash,带来5倍以上性价比提升。阶跃星辰发布新一代基础模型Step 3和多模理解生成一体化模型 Step 3o Vision,主打多模态推理能力;同时,对所有芯片友好,在国产芯片上的推理效率更是可达DeepSeek-R1的300%。

多技术路径助力效率提升,MoE架构、混合精度、量化剪枝和Test-Time Scaling等技术组合,使模型在推理阶段“边想边算”,用更少计算量换取更高准确率。未来两年,谁在相同算力预算内交付更高性能,谁就拥有市场主动权。

WAIC 2025 观察:大模型进入“效率与场景”决胜期

算力范式:以多元化“芯”实力、系统级“超”能力和“模芯双向奔赴”为大模型发展提供强劲动力

1.“单点突破”,多元化满足训推多场景需

通用和专用路线齐头并进。沐曦GPU曦云C600基于全自研GPU IP。中昊芯英TPU“刹那”IP核和指令集完全自主可控,能耗和单位算力成本分别低至海外主流GPU的70%和50%。

SoC赋能边缘和端侧应用。爱芯元智AX8850集成CPU和NPU,具备24 TOPS混合精度算力、原生支持Transformer、功耗低至6W,为边缘计算场景提供极致能效比。此芯科技P1集成CPU、GPU和NPU,联合算力达45 TOPS,全面适用于PC、边缘和车载计算场景。

非经典计算开始崭露头角。曦智科技展出天枢光电混合计算卡,包含128x128光子矩阵,支持ResNet50和Llama等商业级AI模型,标志前沿技术从实验室走向产业化。

2.“系统攻坚”,从“堆卡”到“AI超级工厂”,Scale Up和Scale Out突破算力规模和性能的上限

智能算力的系统级工程将单节点Scale Up与集群Scale Out融合,既支持单节点内增加GPU,又能通过网络连接多节点,实现“乐高式”灵活搭建。Scale Up,以超节点实现超强性能。华为展出昇腾384超节点,通过384卡高速总线互联满足模型训推对低时延、大带宽和稳定要求,算力总规模达300 PFLOPS。中兴通讯、曦智科技和壁仞科技联合推出基于光互连光交换技术的GPU超节点解决方案。恒为科技联合算能发布国产TPU正交架构超节点,DeepSeek-R1推理输出吞吐率达6000~8000 Tokens/s。Scale Out,以强组网扩展集群边界。新华三推出基于DDC多元动态联接架构的新一代无损网络系列新品,适配千卡到7万卡级别的高速无损算力集群互联,有效带宽较传统组网方案提升107%,总线带宽性能较InfiniBand方案平均提升2.5%。

3.“模芯协同”,实现高性价比的“双向奔赴”

阶跃星辰联合超10家国产芯片及基础设施厂商发起“模芯生态创新联盟”,突破过去先设计模型再让芯片适配的模式,转向让模型主动适配可用芯片资源,其最新基础模型Step 3已完成与华为昇腾、沐曦、天数智芯、燧原等的适配。商汤日日新大模型体系与昇腾AI基础软硬件平台结合,应用落地编程、医疗、金融等领域。

WAIC 2025 观察:大模型进入“效率与场景”决胜期

应用范式:从“对话型”向“助理型”的物理泛终端延伸

大模型正把比特的智能翻译成原子的动作,数字世界与物理世界的边界正在消失。群核科技发布 InteriorGS数据集,包含近千个3D高斯语义场景,让机器人“看懂”物理空间。大模型让机器人拥有“大脑”,动作精度高、任务泛化能力强,可以执行抓取、递送、搬运、格斗等各种操作,满足全天候作业要求。斑马智行基于端侧多模态大模型实现智能座舱90%的“感知、决策、执行”服务闭环。腾讯车载Agents支持一句话点咖啡并自动核销。同时,可持续的商业闭环初步显现。阶跃星辰以终端License+云消耗的分成模式锁定10亿元年化预期收入;阿里云百炼平台已孵化70万Agent,验证“平台+生态”变现路径。


本文作者

WAIC 2025 观察:大模型进入“效率与场景”决胜期

魏玥

战略发展研究所

副主任分析师

硕士,高级工程师,长期从事ICT产业研究,近年来专注云计算、人工智能、产业数字化等领域。

WAIC 2025 观察:大模型进入“效率与场景”决胜期

陈元谋

战略发展研究所

主任分析师

硕士,就职于中国电信研究院,高级工程师,长期从事IP网络、数据中心相关云网技术及行业研究。    


媒体运营

编审:研发云数字体验设计与研发团队

制图:李银鑫

编辑:王凯雯

审校:董智明 刘馨

WAIC 2025 观察:大模型进入“效率与场景”决胜期
WAIC 2025 观察:大模型进入“效率与场景”决胜期

版权声明:charles 发表于 2025年7月29日 pm1:17。
转载请注明:WAIC 2025 观察:大模型进入“效率与场景”决胜期 | AI工具大全&导航

相关文章