在线咨询
专属客服在线解答,提供专业解决方案
声网 AI 助手
您的专属 AI 伙伴,开启全新搜索体验

漫步1024

博客封面花系列2
深度访谈:OpenAI 如何打破常规,构建基于 WebRTC 的大规模实时语音 AI 架构

近期,OpenAI 发布了一篇关于他们如何在大规模下实现低延迟语音 AI 的技术博客,引发了业内的广泛关注。在 WebRTC.ventures 最新的一期访谈中,业内专家 Tsahi 对这篇博客进行了...

声网博客2026年3月封面5
Agent Skills 开发者指南:8 个最值得关注的开源仓

最近更新:2026年5月22日 Agent Skills 正在成为 AI 原生开发的基础设施。自 Anthropic 于2025年12月将 Skills 标准开放以来,Claude Code、Open...

2026-05-22

博客封面花系列1
全双工交互模型TML-Interaction-Small:0.40秒轮次延迟,FD-bench 超 GPT 和 Gemini

前 OpenAI CTO Mira Murati 在2025年2月创立Thinking Machines Lab,完成了20亿美金种子轮融资(1200亿美金估值),是历史上最大的种子轮之一。公司202...

声网博客5月
Google I/O 2026:从 XR 眼镜到 Gemini,语音交互成绝对核心

Google I/O 2026 明天 (5月19日) 开幕。过去几年,I/O已经不太像一个发布会,更像是Google每年一次对行业说“我们接下来押哪里”的公开表态。今年的信号,在开幕前就已经很清楚了。...

声网博客2026年1月封面2
AI 编程费用居高不下?三款开源工具大幅削减 Token 开销

用 Claude Code 跑一个中等规模的 TypeScript 或 Rust 项目,cargo test的完整输出约4800个 token,git status约2000个,ls -la约3200...

声网博客2026年3月封面6
OpenAI重构WebRTC架构:Relay+Transceiver如何支撑9亿用户毫秒级语音交互?

2026 年 5 月初,OpenAI 工程师 Yi Zhang 和 William McDonald 在官方博客发布了一篇罕见的基础设施技术披露,详细介绍了支撑 ChatGPT Voice 和 Rea...

2026-05-08

声网博客2026年3月封面10
Gemini CLI、Claude Code、OpenAI Codex:终端AI Agent三国杀,谁才是开发者的最优解?

2026年4月下旬,三款终端AI Agent同时处于密集迭代期。Google Gemini CLI发布v0.39.0稳定版(4月23日),Anthropic Claude Code在一个月内推送30+...

2026-04-28

声网博客2026年3月封面14
谷歌发布最新实时语音模型 Gemini 3.1 Flash Live,架构上到底变了什么?

2026年3月26日,谷歌正式发布 Gemini 3.1 Flash Live,将其定位为”迄今为止质量最高的音频与语音模型”,同步上线 Google AI Studio 的 ...

2026-03-27

1 2 3 7