在线咨询
专属客服在线解答,提供专业解决方案
声网 AI 助手
您的专属 AI 伙伴,开启全新搜索体验

AWE 2026|对话式 AI 正“卷”进每一个终端硬件

过去10年是移动互联网黄金时代,我们习惯于将生活、娱乐、办公乃至情感陪伴,统统装进那个几英寸的屏幕里。APP 成了万能入口,软件定义了一切服务。

而如今,站在2026年的人工智能拐点上,一场逆向迁徙正在发生。随着 AI 大模型和芯片的指数级进化,那些曾经被困在 APP 里的核心功能,正被逐一“释放”——不再甘于栖身于虚拟软件,而是以智能穿戴、桌面机器人、毛绒陪伴玩偶等实体形态,走进了我们的物理空间。

这是从“移动互联网”向“万物智联、软硬一体”的范式转移。而在这次转移中,基于人类自然语言交互的对话式 AI ,正在成为连接数字智能与物理实体的主线。

声网,作为这条主线的关键铺设者,正通过一系列开发套件与开源生态,悄然定义着下一代 AI 硬件的交互标准。

一年三迭代:陆续发布 R1、R1-4G、R2 开发套件

要在物理世界实现真正的智能,硬件不仅需要云端或端侧的大模型作为“大脑”来思考、理解与规划,更需要一整套实时交互的“神经系统”和“感知器官”——让它能听见声音、看见环境、协调动作,在物理空间中做出自然流畅的实时反应。2025年3月,声网发布对话式 AI 开发套件 R1 ,基于博通集成 BK7258 芯片,专注于解决实时全双工对话、背景降噪和智能打断,让 AI 硬件首次拥有了近乎真人的“对话节奏” 。发布至今,R1 套件出货已达百万量级,被广泛应用于各类 AI 玩具、陪伴机器人等产品中,成为行业内的标准参考方案之一。

2025年9月,声网洞察到场景的移动化需求,联合紫光展锐、谨讯推出了 R1-4G 开发套件。通过加入 4G 通信能力,AI 硬件具备了随时随地陪伴的属性,为智能穿戴和车载场景铺平了道路 。

而在本次 AWE 上,声网 R2 全场景 AI 机器人开发套件原型机首次亮相。R2 在继承全双工语音优势的基础上,新增了本地视觉识别与多自由度运动控制,能“看懂”手势、识别人脸轨迹,甚至实现“走到你面前打招呼”或“转头注视说话者”这类充满生命感的本能反应 。这是语音交互向多模态具身交互的巨大跨越,为后续的复杂场景落地提供了标准化的“技术基座”。

场景的跃迁:从陪伴到桌面机器人,再到具身智能

技术的演进最终要落脚于用户体验的变迁。在声网的展台上,这种变迁直观地表现为产品形态的进化。早期的代表是珞博智能的芙崽 Fuzozo ,这款口袋里的AI毛绒宠物“618”预售10分钟破千单,单月出货2万台,斩获主流电商平台 AI 玩具品类销量冠军,用实实在在的市场表现验证了“情感陪伴”赛道的爆发力。它凭借声网提供的流畅全双工对话能力,让用户第一次感受到”原来和机器聊天可以如此自然,没有延迟。”芙崽的成功,证明了 AI 硬件走出工具属性、进入情感维度的商业可行性。

技术的演进最终要落脚于用户体验的变迁。在声网的展台上,这种变迁直观地表现为产品形态的进化。早期的代表是珞博智能的芙崽 Fuzozo ,这款口袋里的AI毛绒宠物“618”预售10分钟破千单,单月出货2万台,斩获主流电商平台 AI 玩具品类销量冠军,用实实在在的市场表现验证了“情感陪伴”赛道的爆发力。它凭借声网提供的流畅全双工对话能力,让用户第一次感受到”原来和机器聊天可以如此自然,没有延迟。”芙崽的成功,证明了 AI 硬件走出工具属性、进入情感维度的商业可行性。

而在 AWE 上亮相的陆卡卡,则代表了全新的物种。作为搭载 R2 套件的桌面级情感机器人,陆卡卡不再被动等待对话。当你走近它时,它会转头凝视你;当你指向某处,它能循声辨位。这种“被注视”的体验,将人机交互从“命令-响应”的机械流程,推进到了“感知-共鸣”的情感层面 。芙崽到陆卡卡,是从“能听会说”到“能看会动”的跨越。随着运动控制算法与端侧多模态模型的进一步融合,具身智能将是声网的下一站。未来的 AI 硬件将不再局限于桌面或口袋,而是拥有移动能力,能在复杂的三维空间中执行任务,真正成为进入家庭和企业的通用基础单元。

开放的“基建”:AOSL开源,把创新的门槛拆掉

没有生态的技术是孤岛。在推动硬件智能化的过程中,声网意识到,碎片化是制约行业创新的最大瓶颈——不同的芯片架构、迥异的操作系统、复杂的底层驱动,让许多创意在原型阶段就消耗了大量工程成本。

为此,在今年年初,声网宣布了一项具有行业战略意义的举措:将核心的硬件抽象层项目 AOSL 在GitHub全面开源 。

AOSL的本质,是在操作系统、芯片与RTC传输层之间定义了一套标准接口。目前 AOSL 已完成对乐鑫 ESP32、博通集成 BK7258 等市场主流芯片的适配,并全面支持 RTOS 和 Linux 操作系统。对于芯片厂商而言,接入 AOSL 意味着其硬件从出厂即具备了“声网级”的实时互动能力,成为吸引开发者的加分项 。

本次 AWE 上声网首次展现了最新的开源生态,这种“开源底座+商业套件”的模式,正在吸引越来越多芯片伙伴加入生态。它不仅将开发者从繁琐的适配工作中解放出来,更将硬件的创新模式从过去的“一次性定制”推向了“可复用、可扩展”的生态协作。

落地进行时:AWE 上的 AI 硬件军团

在此次 AWE 展会上,声网的对话式 AI 能力已经成为众多明星硬件产品的共同技术语言。展台上看到的不仅是成熟的技术方案,更是一个正在成型的 AI 硬件军团:

  • AI 陪伴:芙崽、糯宝、小匠…
  • AI 教育:盒智、灵宇宙小方机、牛听听早教机…
  • 桌面机器人:二白、陆吾机器人…
  • AI 可穿戴:HeyCyan智能眼镜…
不同形态、不同场景的产品,共同构成了一幅由声网技术底座支撑起的多元创新图景。

对话式 AI :撬动万物有灵的AIoT 未来

回顾这十年变迁,我们不难发现:无论是 APP 还是硬件,形态终将更迭,但人类通过最自然的语言与机器交互的诉求是永恒的。当 AI 硬件从“功能机”向“情感机”、“智能体”进化,实时互动体验的优劣将成为决定产品生死的关键。作为全球实时音视频云服务的开创者,声网始终致力于为人与人、人与 Agent 、Agent 与 Agent 的多模态实时交互提供最佳体验。通过对话式 AI 开发套件的一代代升级、通过 AOSL 开源生态的构建,声网正在将这一复杂的实时互动能力标准化、模块化,为整个行业铺设通往万物智联时代的底层通路。

从移动互联网的“软件吞噬世界”,到 AI 时代的“硬件释放智能”,声网正以对话式 AI 为支点,撬动一个万物有灵、软硬一体的新世界。