在线咨询
专属客服在线解答,提供专业解决方案
声网 AI 助手
您的专属 AI 伙伴,开启全新搜索体验

漫步1024

声网博客2026年3月封面14
谷歌发布最新实时语音模型 Gemini 3.1 Flash Live,架构上到底变了什么?

2026年3月26日,谷歌正式发布 Gemini 3.1 Flash Live,将其定位为”迄今为止质量最高的音频与语音模型”,同步上线 Google AI Studio 的 ...

2026-03-27

声网博客2026年3月封面13
GTC 2026 的隐藏看点:NVIDIA 押注实时语音 AI

GTC 2026 的两大主角,一个是芯片——Vera Rubin 平台、Groq 3 LPX;另一个是机器人——黄仁勋把真人大小的 Olaf 机器人推上了台。相比之下,Nemotron 3 Voice...

2026-03-25

声网博客2026年3月封面8
Skills vs MCP:到底谁在“接管” Agent 生态?

如果你在 2026 年初混过一阵子「coding agent 圈」,大概率见过一句话:“Skills 会不会把 MCP 干掉?” Skills 不会“接管”MCP,MCP 也不会“吞掉”Skills。...

2026-03-10

面向规模化的实时语音智能体:基于缓存感知流式 ASR 的方法

传统实时 ASR 依赖缓冲式推理,通过重叠音频窗口维持上下文,在规模化场景下面临计算冗余、显存膨胀和延迟漂移等问题,难以支撑高并发语音智能体。NVIDIA Nemotron Speech ASR 基于...

声网博客2026年3月封面5
GitHub 开源精选:开发者必收藏的 Skills 清单

Agent Skills 正在把“会聊天的模型”变成“能交付的工具人”:它把经验写进 SKILL.md,把流程写进脚本,把复用写进目录结构。本文按 stars、活跃度与工程可复制性,精选 8 个最受欢...

2026-03-03

声网博客2026年2月封面10
什么是 Agent Skills?为什么 2026 年突然爆火(下)

上一篇我们围绕 Agent Skills 明确其核心定位,本质是包含 SKILL.md 文件的文件夹,可将流程、脚本等资源打包为可复用、可版本化、可按需加载的“技能”,且该格式由 Anthropic ...

2026-02-21

声网博客2026年2月封面9
什么是 Agent Skills?为什么 2026 年突然爆火(上)

Agent Skills 可以理解为“给 AI 看的可执行入职手册”:用一个包含 SKILL.md 的文件夹,把流程、脚本、模板、参考资料打包成可复用、可版本化、可按需加载的“技能”。它在 2026 ...

2026-02-13

声网博客2026年2月封面8
GLM-5 到底强在哪:用 6 个开发者任务做“能力剖面图”

2 月 12 日,智谱正式发布 GLM-5。官方给出的关键词非常明确:更强的代码能力、更长的 200K 上下文、更好的 Agent 工具调用能力,以及在多项工程类基准上的显著提升。但问题来了——GLM...

2026-02-12

1 2 3 6