
引言: 在问答和对话的场景下,通常可以通过检索和生成两种方式得到一个回复。 检索式回复是在外部知识库中检索出满意的回复,较为可靠和可控,但回复缺乏多样性;而生成式回复则依赖于强大的语言模型中储存的内部...
2025-03-11

美颜是当今短视频、视频社交、直播等日常生活中经常使用到的一项技术,好的美颜可以给视频中自己的外貌、肤色、妆容等加分,进而带来更好的视觉体验。而然,美颜并不是万能的,我们平时看直播时,有的平台在主播开启...
2025-03-11

本文为「Dev for Dev 专栏」系列内容,作者为声网网络体验团队 @王瑞。 01 背景 在实时音视频通话中,音视频质量受网络丢包影响较大,特别是对于视频。 为什么视频对丢包更敏感呢?通常来说,音...
2025-03-11

“至臻画质”是声网“实时高清·超级画质”解决方案中的一项核心能力,不仅支持移动端1080P、PC端4K高清画质,还通过端侧实时超分、暗光增强、色彩增强等算法对画质进行增强与提升,相比技术门槛较高的超分...
2025-03-11

云计算的出现为企业的管理、业务开展、资源整合等带来了极大的便利性,也是数字化建设的核心基建之一,然而局部宕机或者大面积宕机事件对于云厂商来说却也无法避免,全球领先的计算平台也不例外。例如,美国东部时间...
2025-03-11

GPT-4o 自发布以来,支持端到端实时多模态成为国内外大模型厂商纷纷跟进的新方向,先是AI初创公司 Character.AI 表示其已经推出了一项通话功能,允许用户与其人工智能角色进行语音对话,并支...
2024-07-25

北京时间5月14日凌晨,OpenAI 发布了新一代旗舰生成模型 GPT-4o,这是一款真正的多模态大模型,可以「实时对音频、视觉和文本进行推理」。核心亮点包含:支持与 AI 实时语音对话,且响应时间达...
2024-06-13

AV1 是一种新型的视频编码格式,设计初衷是为了提供一款免专利费,且具备更高效、更灵活视频压缩的编码器,以适应不断增长的在线视频需求,特别是在流媒体和实时音视频领域。目前声网 SDK 已接入 AV1,...
2024-05-28