双十一战鼓擂响,流量洪峰来袭,您的客服团队准备好了吗?面对激增的咨询量,传统人工客服排队漫长、响应迟缓、深夜无人的痛点被无限放大,不仅导致客户流失,更让企业背负沉重的人力成本。
在人工智能技术日益成熟的今天,单纯的“问答机器人”已无法满足高标准的交互需求。声网推出的对话式AI引擎,旨在从根本上解决这一难题。它并非简单的关键词触发工具,而是一个集成了先进语音识别(ASR)、自然语言处理(NLP)、大语言模型(LLM)与语音合成(TTS)的全链路、端到端智能交互系统。
一. 为什么选择声网AI?因为它真正做到了“智能”与“真人感”的完美结合
相比较于传统AI客服机械、刻板、不自然的“机器人腔”,声网致力于打造“真人感”对话式AI引擎。声网对话式AI引擎通过几项核心技术,致力于消除这种“非人感”:

1. 超低延迟:全链路深度优化的极致追求
我们常说的“延迟”,是语音数据从用户端采集、传输、云端处理、再返回回复的全过程时间。声网凭借在实时音视频领域多年的技术积淀,对这条复杂链路进行了全链路深度优化。将端到端的响应延迟控制在650毫秒以内。这是一个什么概念?接近于人类面对面交谈时的自然反应时间。这使得一问一答之间几乎没有令人不适的停顿感,为“流畅自然”的对话奠定了基石。
2. 优雅打断:对话控制权的流畅移交
这是区分初级机器人与智能体的关键能力。声网AI引擎具备340毫秒的极致打断响应能力。当用户不想听完全部预设回复时,可以随时中断AI的发言。系统能在极短时间内精准检测到打断意图,立刻停止当前播报,并快速理解用户的新问题生成响应。这模拟了真人对话中常见的“话轮转换”,让对话节奏更贴近真人交互,极大地提升了沟通效率和自然度。
3. 选择性注意力锁定与背景人声抑制:嘈杂环境下的清晰通信
双十一期间,消费者可能在任何环境下咨询——嘈杂的办公室、喧闹的街道。声网引擎的选择性注意力锁定技术,基于先进的深度学习模型,智能屏蔽高达95% 的环境人声与各类背景噪声干扰。结合背景人声抑制功能,可以有效分离并消除多个说话人声音中的非目标声源,确保在复杂声学环境中,只有清晰、纯净的目标人声被送入后续处理环节,显著提升语音识别的准确率和交互的可靠性。
二. 2 行代码 + 15 分钟:中小企业的 “低成本入场券”
对电商企业尤其是中小企业而言,技术门槛和成本是最大的顾虑。声网 AI 客服的 “快速接入” 能力(2 行代码、15 分钟快速构建对话式 AI 智能体)直接扫清了这些障碍。
企业技术人员无需具备高深的 AI 开发经验,只需调用声网提供的标准化接口,复制粘贴两行核心代码,再经过简单配置,就能在 15 分钟内搭建起专属的 AI 客服系统。这种 “轻量化” 接入方式,让中小企业也能在双十一期间拥有 “大厂级” 的客服能力,大幅降低人力成本的同时,服务效率却直线上升。
具体的操作流程
1)前提条件
开始前,请确保:
已参考开通服务在声网控制台完成以下步骤:
-
- 为你的项目开通声网对话式 AI 引擎。
- 获取 App ID:声网随机生成的字符串,用于识别你的项目和调用对话式智能体 RESTful API。
- 获取客户 ID 和客户密钥:用于在调用对话式 AI 引擎 RESTful API 时进行 HTTP 安全认证。
- 生成临时 Token:Token 也称为动态密钥,用于在加入 RTC 频道时对用户鉴权。临时 Token 的有效期为 24 小时。在生产环境中,你需要参考使用 Token 鉴权在你的 App 服务端生成 Token。
- 已参考实现音视频互动集成 v4.5.1 及以上版本的实时互动 SDK,并在你的 App 中实现基本的实时音视频功能。
- 已获取大语言模型 (LLM) 供应商的 API key 和回调 URL。
- 已参考文本转语音 (TTS) 供应商的官方文档获取身份认证信息(token、appid 等)并了解相关参数配置方式。
2)加入 RTC 频道
在你的 App 中调用 joinChannel 加入一个 RTC 频道。
3)创建对话式智能体
调用创建对话式智能体创建一个智能体实例,并传入上一步中使用的频道名和 Token 让智能体加入同一个 RTC 频道。
提示
- 声网推荐你前往控制台的 Playground 快速体验与 AI 智能体对话,正确配置各项参数并完成体验后,点击右上角的 View code 复制自动生成的服务端 API 调用示例代码。
- 你可以使用第三方在线工具快速得到
Authorization值。将客户 ID 和客户密钥分别填入Username和Password框,得到形如Authorization: Basic NDI1OTQ3N2I4MzYy...YwZjA=的结果。将该结果替代下面代码中的Authorization: <credentials>即可
curl --request POST \
--url https://api.agora.io/cn/api/conversational-ai-agent/v2/projects//join \
--header 'Authorization: Basic ' \
--data '
{
"name": "unique_name",
"properties": {
"channel": "channel_name",
"token": "token",
"agent_rtc_uid": "0",
"remote_rtc_uids": [
"*"
],
"asr": {
"language": "zh-CN"
},
"llm": {
"url": "https://api.xxxx/v1/xxxx",
"api_key": "xxx",
"system_messages": [
{
"role": "system",
"content": "You are a helpful chatbot."
}
],
"greeting_message": "您好,有什么可以帮您?",
"failure_message": "抱歉,我无法回答这个问题。",
"max_history": 10,
"params": {
"model": "xxxx",
}
},
"tts": {
"vendor": "vendor_name",
"params": {
"key": "xxxx",
"voice_id": "xxxx",
}
}
}
}
'
调用成功后,你会收到如下响应:
/// 200 OK
{
// highlight-start
"agent_id": "1NT29X10YHxxxxxWJOXLYHNYB",
// highlight-end
"create_ts": 1737111452,
"status": "RUNNING"
}
同时,智能体会加入到 RTC 频道中,向用户问好;用户则可以开始与智能体对话。
3)停止智能体
当用户与智能体对话结束后,你可以调用停止对话式智能体,传入创建智能体时返回的 agent_id 让指定智能体离开 RTC 频道。
curl --request POST \
// highlight-start
--url https://api.agora.io/cn/api/conversational-ai-agent/v2/projects//agents//leave \
--header 'Authorization: Basic '
// highlight-end
调用成功后,你会收到如下响应:
/// 200 OK
{}
使用Go SDK或Java SDK请参考声网官网文档 https://doc.shengwang.cn/doc/convoai/restful/get-started/enable-service
