在线咨询
专属客服在线解答,提供专业解决方案
声网 AI 助手
您的专属 AI 伙伴,开启全新搜索体验

AI 情报局

博客封面花系列1
全双工交互模型TML-Interaction-Small:0.40秒轮次延迟,FD-bench 超 GPT 和 Gemini

前 OpenAI CTO Mira Murati 在2025年2月创立Thinking Machines Lab,完成了20亿美金种子轮融资(1200亿美金估值),是历史上最大的种子轮之一。公司202...

2026-05-19

声网博客5月
Google I/O 2026:从 XR 眼镜到 Gemini,语音交互成绝对核心

Google I/O 2026 明天 (5月19日) 开幕。过去几年,I/O已经不太像一个发布会,更像是Google每年一次对行业说“我们接下来押哪里”的公开表态。今年的信号,在开幕前就已经很清楚了。...

2026-05-18

声网博客2026年3月封面6
OpenAI重构WebRTC架构:Relay+Transceiver如何支撑9亿用户毫秒级语音交互?

2026 年 5 月初,OpenAI 工程师 Yi Zhang 和 William McDonald 在官方博客发布了一篇罕见的基础设施技术披露,详细介绍了支撑 ChatGPT Voice 和 Rea...

2026-05-08

声网博客2026年3月封面10
Gemini CLI、Claude Code、OpenAI Codex:终端AI Agent三国杀,谁才是开发者的最优解?

2026年4月下旬,三款终端AI Agent同时处于密集迭代期。Google Gemini CLI发布v0.39.0稳定版(4月23日),Anthropic Claude Code在一个月内推送30+...

2026-04-28

声网博客2026年3月封面14
谷歌发布最新实时语音模型 Gemini 3.1 Flash Live,架构上到底变了什么?

2026年3月26日,谷歌正式发布 Gemini 3.1 Flash Live,将其定位为”迄今为止质量最高的音频与语音模型”,同步上线 Google AI Studio 的 ...

2026-03-27

声网博客2026年3月封面13
GTC 2026 的隐藏看点:NVIDIA 押注实时语音 AI

GTC 2026 的两大主角,一个是芯片——Vera Rubin 平台、Groq 3 LPX;另一个是机器人——黄仁勋把真人大小的 Olaf 机器人推上了台。相比之下,Nemotron 3 Voice...

2026-03-25

声网博客2026年3月封面8
Skills vs MCP:到底谁在“接管” Agent 生态?

如果你在 2026 年初混过一阵子「coding agent 圈」,大概率见过一句话:“Skills 会不会把 MCP 干掉?” Skills 不会“接管”MCP,MCP 也不会“吞掉”Skills。...

2026-03-10

声网博客2026年2月封面10
什么是 Agent Skills?为什么 2026 年突然爆火(下)

上一篇我们围绕 Agent Skills 明确其核心定位,本质是包含 SKILL.md 文件的文件夹,可将流程、脚本等资源打包为可复用、可版本化、可按需加载的“技能”,且该格式由 Anthropic ...

2026-02-21

1 2 3