2025年7月26日至29日,备受瞩目的“2025世界人工智能大会”(WAIC 2025)将在上海世博中心及世博展览馆隆重举办。本届论坛以“智联全球(Global Solidarity in the AI Era)”为主题,将吸引来自政府、企业和学术界的逾千位嘉宾,展示当前最前沿的AI技术与应用。从大模型算力竞赛到实体智能落地,从多模态融合趋势到AI治理机制改革,今年大会的核心关键词包括:应用为王、交互升级、终端智能、AI服务化。本文将深入解析这场大会的主题、热点和未来趋势,并切入声网 7月28日“对话式 AI Workshop:一小时搭建你的 voice agent”环节,展现实时语音+对话交互技术为何成为AI落地的关键驱动力。
智联全球,百舸争流
本次大会主旨为,“智联全球”传递全球协作、共享技术的新理念,强调AI应服务人类、落地实际场景,实现“算法红利普惠至全球”。出席嘉宾超1200人,代表800+家创新企业,现场展示3000+项最新AI成果(包括大模型、机器人、硬件设备等)。
2025世界人工智能大会热点话题全面拆解
1. 大模型与基础模型走向“应用资产”
开源 + 商业化双轨并进
WAIC 2025 展现出“开源+商业化”共生趋势。多个大模型项目既提供社区版实现,也支持行业私有化部署,兼容企业合规和定制需求。大会上揭晓的 SAIL Award 评选项目中,开源基础模型和行业定向大模型成为重点评审对象,体现“大模型资产化”理论实践。
基础模型当作企业战略资产
基础模型不再是演示系统,而是进入商业授权、系统级服务体系。参评的 SAIL 项目中,60%以上为模型能力输出与商业部署相关,模型权发挥着“战略资产”作用。
2. 多模态融合的新时代
视觉+语言+动作融合落地
WAIC 2025 展馆中,40余款 LLMs、50+ AI 终端与60+机器人亮相。这些设备整合“视觉感知+语言交流+主体动作”,可在安防巡检、自动驾驶、交互式机器人等领域实现闭环应用。
实时交互场景爆发
多模态智能的成熟,使得现场出现智能客服机器人、虚拟主播、展览导览机器人等多样形态,能实时感知环境变化并主动对话,大幅提升用户体验,有效推动了实体交互的“沉浸式”应用。
3. AI + 实体智能:机器人“爆款化”
机器人展区亮点汇总
本届展区展示了 60 多款智能机器人,涵盖送餐、陪伴、麻将、检修等多场景产品(如 DeepRobotics M20 Lynx 等)。
- 实体机器人从概念时代迈入商业化示范:
- 送餐机器人:可导航人群、适应复杂室内环境;
- 陪伴机器人:具备声音识别、人脸、情绪检测;
- 麻将机器人:完成识牌、抓牌、出牌闭环;
这些体现“机器人从千人千面变为万人万人”的集群应用趋势。
实体智能交互升级中
声音识别、动作捕捉与视觉融合,已实现对环境的即时感知并做出反馈行为,形成“语音→视觉→行动”的闭环。例如:机器人在餐桌周围根据声音停下、微调身姿、递送餐点;展览助手能识别观众提问并提供解说,引发互动共鸣。
4. 行业 AI 论坛:精细化标签下的落地赋能
金融AI:算法风控与智能投顾双轮驱动
WAIC 举办了 AI+金融专项论坛,包括“Fintech Innovation”、“Investment Ecosystem”等9场主论坛系列,共同关注:模型在支付、风控、投顾、保险场景中的行业适配策略。金融机构是 Agent 类产品的重要尝试方,强调“大模型+行业语料”融合以满足合规渲染、审计链路等关键要求。
医疗AI:影像诊断+语音辅助协作
大会医疗板块涉足“AI影像分析”、“智能辅助诊疗”、“电子病历”及“远程问诊辅助”,并举办相关论坛探讨模型泛化、隐私保护与临床安全。
教育AI:个性化辅导走深走心
教育专项论坛则更多演示“泛知识图谱+实时语音批改/辅导”,兼容智能教室和在线学习机制。AI 作业批注、口语陪练、教学互动成新热点。
制造/物流/法律:合规与智能生成结合
不同行业论坛从法规合规、智能审核、合同生成,到设备运维监控,形成丰富矩阵体系。制造中用视觉+语音 Agent 进行质量检验和状态上报,物流中提升仓储效率,法律中实现合规审查自动化。
5. AI治理与全球协作议题登场
高端对话聚焦治理机制
WAIC 举办高层 AI 治理与多边合作会议,覆盖全球各国监管标准匹配讨论,涵盖伦理责任、跨境数据隐私、电信频谱治理、智能与无线协同创新等议题。
标准化与互认架构建设
大会推动 AI 标准建立:包括可信评测、电信融合接口、新兴智能体标准、国际合作组织对标准化闭环路径(如ITU、UNIDO、UNESCO)贡献重大,可推动模型跨文化跨区域互认。
6. 竞赛体系“赋奖”加速行业创新
SAIL Award:多维赛道设立标杆
本届 SAIL Award 吸引240个参赛项目,17%来自海外,赛道囊括开源大模型、Agent化身、芯片技术与行业场景落地等多个类别。大奖含金量与国际参与度高,有助推动创新链条从算法到产品闭环构建。
BPAA算法赛与青年赛:产学研协同共进
BPAA 强调“从算法到业务”的实战能力考察,青年赛则对接年轻科学家,涌现大量论文成果,力图形成一套从基础研究向产业应用的生态孵化链。
三、趋势洞察:AI 从能力革命迈向用户体验革命
1. 从“模型主义”到“产品主义”——AI 不再只是算法,而是能落地的服务
核心变化:过去 AI 衡量标准主要聚焦“参数多寡”、“模型性能”,而今年大会关注更偏向“是否可用”、“是否落地”“是否能服务人群”。
- 大会声称超过 800 家参展公司展示的是完整产品方案——不是原型,而是能部署的系统,从语义理解到多轮对话都具备规范能力支持。
- IBM 与 Forbes 的报告指出,如今 AI 授予经典能力已不足,市场追求的是“Agent 能否自驱完成任务”。
为何重要:AI 的价值已从“性能”转向“效益”。企业更关注:
- 部署成本与合规性;
- 交互体验可复用性;
- 真正使用过程中“是否被用户接受”。
WAIC 上,多场论坛围绕“金融智能投顾”、“教育语音批改”“机器人陪伴”等落地案例展开讨论,印证 AI 已从实验室奔向市场。
2. Home+Agent+终端+交互四位一体——语音 Agent 成为全场景接入入口
关键变化:Agent 不再是单一终端产品,而是连接家庭设备、工业终端、App 小程序等多维融合的入口。
- WAIC 展出内容包括智能音箱、陪伴机器人、客服机器人、自助投顾终端等;
- “多模态+多终端”成为常态,语音为底 Simultaneously trigger 交互流程中的核心“中枢”。
3. 多终端适配共识:Agent 不限平台,触点无处不在
趋势延展:AI Agent 的价值在于“随时随地可用”,今年大会体现出从 Web,到 App、车载,到 IoT 设备的多终端融合思路。
- Ten Framework 展台展示了 Web、iOS、Android 和嵌入式设备 SDK 的简单接入方式;
- 多公司演讲中提到例:车载投顾、工位助手、小家电控制语音交互等场景真实走向。
为何成为趋势:多终端意味着多触点,扩大 Agent 应用场景。正如 PwC 报告显示,50% 企业计划在 12 个月内整合多个 Agent 到不同系统中。
4. 开发者生态与 Plug‑and‑play 架构体系化
变化表现:
- TEN、LangChain 等跨模型、跨平台 Agent 框架崛起;
- 开发者现场可下载 SDK、快速部署,并互动演示 Agent 接入情况;
- 大会提供“开源展区”“技术沙龙”“Developer Track”等多入口。
5. 实时语音交互成为新评价体系:强调节奏、打断、情感识别
核心指标:
- 语音响应延迟:语音交互需在 <1 秒,最好 <700ms;
- 打断识别与插入:VAD+响应机制需精准;
- 情感识别与语气变换:提升“声线自然度”。
这些已超越传统 ASR+TTS,而成为 Bot 交互质量的核心评价指标。
结语:AI 人类共生的下半场,由交互起航
2025 世界人工智能大会不只是算法展览,更“见证”了 AI 从能力为主到可用为主的范式变革。在这个交互为王的时代,“Agent”不再是实验室概念,而是连接人、机器与场景的关键介质。