在线咨询
专属客服在线解答,提供专业解决方案
声网 AI 助手
您的专属 AI 伙伴,开启全新搜索体验

对话式 AI 交互正在造就下一个”移动互联网级”风口

自史蒂夫·乔布斯推出智能手机之后,科技圈的标题党层出不穷,“会不会是下一个乔布斯”,“再不去学就要被时代抛弃了”这样的字眼频繁出现在各类资讯中。然而相比 NFT 数字藏品,XR 增强现实这些昙花一现的资本狂欢,下一个“移动互联网级”风口,或许正伴随着对话式AI的成熟悄然到来。

回顾历史上的每一次产业升级,技术革新只是必要,但绝非充分条件。真正能掀起时代浪潮的,从来是那些顺应人类行为模式、降低使用门槛、让更多人参与其中的技术。而对话式 AI 引爆实时交互的核心,并不是算法本身,而是一个更基础却更强大的能力:可及性(Accessibility)

 

可及性:能够改变技术命运的力量

“Accessibility”这个词,业内目前一般将其翻译为无障碍。这原本是在技术和设计领域,确保产品可以被残障人士使用的一项课题。然而一个更准确的翻译则是“可及性”,从“Access”的字面意义:获取,使用,访问(经允许)来看,“Accessibility”更像是一种追求,追求无论任何人,在任何环境、任何条件下,都应该能够顺利的使用我们的产品。

移动互联网之所以能掀起颠覆性的浪潮,相比于成熟的技术,更重要的是它让每个人都能够成为参与者。从未用过电脑,不会打字的人,也可以通过触屏做自己想做的事,而这些事包括打电话,拍照等日常生活中的点点滴滴。而当大多数人都持有智能手机的时候,从中生长出的生态也吸引了众多开发者,如同当年淘金热一样来到旧金山追寻财富自由的梦。

“更成功的技术”并不一定得是“更高级的技术”,却一定是“更符合当下的技术”。比如移动互联网,相比家用计算机,画质有所下降,却因为更贴近人们的生活而造就了时代。而前几年资本追捧的 “元宇宙”,纵使这几年热度不在,Meta却和当年的摩托罗拉有几分相似:卫星电话概念,如今换了一副模样,支撑起了我们日常生活中不可或缺的定位和导航功能。

再看史蒂夫·乔布斯的老相好——前世界首富比尔·盖茨,他所推行的 Windows 操作系统,让计算机从高智商工程师们手中的神兵利器,摇身一变,成为了普通老百姓们居家过日子的锅碗瓢盆。又或是 YouTube、短视频等这些日新月异的网络技术,让内容创作不再是专业人士的特权,这些对“可及性”的追求,才是每一波浪潮下最有力的推手。

 

对话式 AI × RTE :正在开启新的可及性时代

如今,成熟的对话式AI与不断迭代的 RTE 实时互动技术,正在解锁全新的“可及性”维度。

从视障人士的角度看,画外音(voice over)很早就为他们提供了阅读文字内容的协助,而交互式语音AI则能够更好地实现这个功能。不过“无障碍”从来都不是“accessibility”的上限,“可及性”才是,相信在日常生活中,有许多需要解放双手双眼的时刻。无论是开车长途旅行,还是在家操持家务,又或是看了一天的屏幕用眼过度,只是想好好休息一下双眼,有太多的使用场景,等待我们去开发。

设想未来,人们可以通过对话,行为交互等方式,更加随心所欲地调动身边的软硬件,盯着一个屏幕滑动直到被查出肩颈问题的时代,或许也会成为过去。人类第一次解放双手,是学会直立行走的时候,而这一次,将会是我们开始和 AI 充分互动的时候。

 

互动内容娱乐:AI × RTE 落地场景的探讨

如果说“可及性”让对话式AI具备了走向大众的可能性,那么一个更现实的问题是:它会最先在哪些场景开花结果?回顾过去,有那么一个领域,一直充当着新技术的试炼场。导航软件借鉴了它的交互设计,NVIDIA 靠着它积累了第一桶金,OpenAI用它来训练智能体,甚至有人认为,元宇宙也只是个换了名字的 MMORPG。从家庭电脑到智能手机,每一次交互方式的变化,都首先在内容娱乐行业涌现出最具生命力的新物种。

在日常生活中,仍有大量用户需要“语音式娱乐”。比如长途司机车上的广播,和单身公寓内睡前的电台。而外卖骑手抽空刷的抖音爽剧,看上去是视频,其信息载体却主要依赖声音,视频部分更多不过是劣质素材和 AI 的无意义拼凑。显然,语音娱乐存在巨大且年轻化的市场需求。

现如今业内关注的AI游戏,例如蔡浩宇的《星之低语》中,视觉玩法只是一部分,其核心玩法是与AI的互动。即使改为纯语音的版本,牺牲画面交互,对游戏的核心玩法影响不大,反而能以极致的“可及性”开辟一个全新的游戏品类。

当前游戏行业虽一片红海,然而语音赛道却还是一片未知的领域,坐在家中的高端设备前才能玩的东西,和耳机一戴手上干着活也能开一把的东西,相互之间没有太多的竞争。

这正意味着,语音交互赛道并非在瓜分现有市场的蛋糕,而是在创造一块全新的、属于“伴随式”和“场景化”娱乐的蛋糕。而老牌 3A 大厂虽然拥有大量优秀的视觉人才,却也会使他们路径依赖,很难参与这个赛道的竞争。

设想你是一位长途司机,平时爱刷短剧和小说,然而一边开车一边盯着手机显然是不行的。你可能会找到一个方法,让手机把小说读出来,然而如果小说的角色真的能“走”出来和你互动,是否能让原本枯燥的长途旅行充满乐趣?又或者你是一个曾经热爱游戏的技术宅,毕业后的程序员的工作让你下班后不再想盯着屏幕,你是否会期待一个,闭上双眼也能交互的世界?

笔者原本从事游戏行业,现在也热衷于创造有趣的、能够丰富人们生活的体验。对话式AI和游戏,可以是相辅相成的关系。我深信这个方向充满可能,并随时欢迎志同道合的伙伴,一起探索如何利用对话式 AI 与 RTE 技术,创造下一个丰富人类交互体验的应用。

在声网,连接无限可能

想进一步了解「对话式 AI 与 实时互动」?欢迎注册,开启探索之旅。