在语音AI系统中,“听懂人话”之后,最后一步就是让机器“开口说话”。文本转语音(Text-to-Speech, TTS)技术实现了将文本变为自然的语音播放出来。此外,近年兴起的音色转换(Voice C…
在语音AI系统中,“听懂人话”之后,最后一步就是让机器“开口说话”。文本转语音(Text-to-Speech, TTS)技术实现了将文本变为自然的语音播放出来。此外,近年兴起的音色转换(Voice C…
在上一部分中,我们概览了语音AI系统的整体架构。其中自动语音识别(ASR)和自然语言理解(NLU)是将语音“听懂”的关键环节。本篇将深入解析这两个模块的技术原理、常用模型和评价指标,并介绍一些开源和商…
语音人工智能(Voice AI)正迅速崛起,根据联合市场研究公司 (Allied Market Research) 的最新报告,2018 年全球语音识别行业价值为 63.9 亿美元,预计到 2026 …
人工智能物联网(AIoT)是人工智能(AI)与物联网(IoT)的深度融合,孕育出一个智能化、数据驱动的生态系统。在AIoT体系中,海量传感器和设备源源不断地产生数据,AI技术则对这些物联网数据进行实时…
2025 年 7 月 26–28 日,第八届世界人工智能大会(WAIC)在上海世博中心举行,主题为“智联全球(Global Solidarity in the AI Era)”,吸引约 1200 名嘉…
1. Grok虚拟陪伴角色Rudi 火了,但儿童 AI 陪伴才刚开始 最近,由 Elon Musk 创办的 xAI 在其 Grok 聊天机器人中推出多款虚拟角色,其中一款角色为面向儿童的红熊猫角色 R…
2025年7月26日至29日,备受瞩目的“2025世界人工智能大会”(WAIC 2025)将在上海世博中心及世博展览馆隆重举办。本届论坛以“智联全球(Global Solidarity in the …
在数字时代,我们与他人的联结方式正在发生深刻变化。当现实社交受到地域、时间、社交圈的限制时,AI虚拟陪伴(AI companionship)正崛起为一种全新的关系形态。从聊天机器人到虚拟恋人,从数字朋…
近年来,随着大模型技术的发展,多模态交互成为人工智能应用的新趋势。在2024年7月末,OpenAI发布了支持视频交互的GPT-4o版本;紧接着,8月29日,智谱AI正式宣布清言App上线视频通话功能,…
当人工智能邂逅互动娱乐,一个充满创意与想象的新世界正加速到来。在直播间里,虚拟主播不知疲倦地卖力演出;在游戏中,AI队友与你并肩作战、谈笑风生;在K歌房,AI歌手与真人合唱共舞;甚至在陪玩平台,AI化…
本博客为技术交流与平台行业信息分享平台,内容仅供交流参考,文章内容不代表本公司立场和观点,亦不构成任何出版或销售行为。