在实时音视频通信场景里,数据包的加密一直是个微妙的问题。传统的TLS协议工作在TCP之上,握手过程需要多次往返确认,这对延迟敏感的RTC应用来说完全不可接受。UDP虽然快,但缺少加密和身份认证机制。D…
在实时音视频通信场景里,数据包的加密一直是个微妙的问题。传统的TLS协议工作在TCP之上,握手过程需要多次往返确认,这对延迟敏感的RTC应用来说完全不可接受。UDP虽然快,但缺少加密和身份认证机制。D…
一. 首帧时间是什么 首帧渲染时间(Time to First Frame)指的是从用户发起视频通话,到屏幕上显示出对方第一帧画面的时间间隔。 这个指标听起来简单,但它包含了整个通话建立过程中所有环节…
当你打开RTC服务的监控后台,密密麻麻的数据指标扑面而来:延迟、丢包率、卡顿率、码率、帧率……每个都在波动,每个看起来都很重要。产品经理在催优化用户体验,但技术资源有限,该从哪里下手? 这个问题在不同…
一. MOS评分是什么? MOS(Mean Opinion Score,平均意见分) 是一种主观质量评估标准,用于衡量音频、视频通话的用户体验质量。它通过让真实用户对通话质量进行打分,然后计算平均值,…
一. 为什么出海企业需要实时转录翻译 当企业业务拓展到海外市场,语言沟通成为绕不开的障碍。一场跨国视频会议,参会人员可能来自中国、美国、日本、德国,每个人用母语表达最自然高效,但传统的人工同声传译成本…
2026年4月下旬,三款终端AI Agent同时处于密集迭代期。Google Gemini CLI发布v0.39.0稳定版(4月23日),Anthropic Claude Code在一个月内推送30+…
声网智能云会议引擎(以下简称”云会议引擎”)具备头部级云会议体验与核心能力,支持开放扩展与AI赋能,助力企业和集成商构建自主可控的智能云会议产品。它支持带UI快速上线、带UI定…
2025年初,当大多数 AI 硬件公司还在追逐复杂的机器人时,珞博智能选择了一条更轻盈的路径——做一个 AI 养成系毛绒潮玩。这个看似“简单”的选择,背后是对 Z 世代女性群体情感需求的精准洞察:她们…
2026年4月,声网正式发布了政企智能云会议引擎。不同于传统的云会议产品以及 Meeting SDK,声网智能云会议引擎是一套基于声网 RTC PaaS 基础之上、可复用、可编排、可嵌入业务系统的会议…
2026年第一季度,开源语音AI迎来了集中爆发。NVIDIA Parakeet RNNT 在 LibriSpeech 基准上把词错率(WER)压到了 1.8%,与顶级商用 ASR 几乎没有差距;Hum…
本博客为技术交流与平台行业信息分享平台,内容仅供交流参考,文章内容不代表本公司立场和观点,亦不构成任何出版或销售行为。