
如果你的产品有欧盟用户,这篇值得花十分钟读完。
一. 先说清楚 EU AI Act 是什么
EU AI Act(《欧盟人工智能法》)是欧盟在2024年通过的一部专门规范AI的法律,适用范围很广,只要你的产品或服务面向欧盟用户,不管公司注册在哪里,都在管辖范围内。
这部法的逻辑是按风险分级:高风险AI(比如医疗诊断、招聘筛选)要过严格的认证流程,低风险AI要求相对宽松。
但有一类义务是横跨所有风险等级的,即透明度义务,写在 Article 50 里。
也就是说,哪怕你的产品不属于高风险AI,只要触发了 Article 50 的条件,就要满足相应的合规要求。而对于做语音AI的团队来说,Article 50 几乎是必踩的范围。
法规整体是分阶段生效的。Article 50 的执行日期是 2026年8月2日,到那时还没达标的,最高面临 1500 万欧元或全球年营业额 3% 的罚款,取两者中较高的那个。
二. 两个日期,别搞混
8月2日是 Article 50 正式执行的日期,这个不用解释。
7月22日是另外一件事,欧盟 AI 办公室发布了一份《AI 生成内容透明度行为准则》,这份准则是自愿签署的。签署的好处是,监管机构在执法时会默认你已经合规,举证的压力在对方而不在你。7月22日(CET 18:00)是签署初始成员的截止日期,错过了还能之后加入,但就不是”初始签署方”了,也就少了这层保护。
ElevenLabs 已经在这个方向上提前动了,他们开始在生成内容里嵌入 Google SynthID 水印,正是在为 Article 50(2) 的技术合规做准备。
三. Article 50 到底管哪些事
Article 50 列了四种情形,触发任意一种就有对应义务:
第一种:AI 系统直接跟用户交互。聊天机器人、语音助手、自动电话系统都算。要求是在第一次交互时告诉用户”你在和 AI 说话”。
第二种:AI 系统生成合成内容。包括文字、图片、音频、视频。要求是在输出内容里加上机器可读的标记,让检测工具能识别出这是 AI 生成的。
第三种:AI 系统用于情绪识别或生物特征分类。要求是告知被分析的用户。
第四种:AI 系统生成深度伪造内容。要求是明确告知内容经过 AI 生成或处理。
接下来把这四种情形对应到语音AI的具体产品场景来说。
四. 语音AI产品,各自对应哪条
4.1 语音助手、AI 客服机器人
对应第一种情形(Article 50(1)),约束的是开发和提供这套系统的一方。
要做的事是:在每次对话开始前,让用户知道他们在跟 AI 说话。这个告知不能藏在服务条款里,也不能只是界面角落一行小字,要出现在对话真正开始的时候,清楚到让用户一眼就能看到或听到。
法规有一个例外:”如果任何一个理性的、了解基本信息的普通人都能明显看出这是 AI,就不需要额外告知。”但欧委会的草案指引说得很清楚,这个例外要严格用,不能随便套。判断标准是先看你的目标用户群体,再评估这个群体里的普通用户会不会真的自己识别出来。
电话客服场景要特别注意:自动接听入线电话的AI系统明确被列在范围内,需要在通话开始时主动告知。
4.2 TTS 服务提供商
对应第二种情形(Article 50(2)),约束的是提供 TTS 能力的一方。
要做的事是:TTS 生成的音频必须带上机器可读的标记,让内容检测工具能识别出这是 AI 合成的声音。技术上目前主要有两条路:音频水印(像 SynthID 这类方案)和元数据标注。具体标准还在行为准则和 EU 标准化工作里制定,预计7月前落地。
时间上有个区分要注意:8月2日之前就已经上线的系统,机器可读标记有宽限期,延到2026年12月2日。8月2日之后新发布的系统,发布起就要满足要求,没有缓冲。
如果你的 TTS 只是做辅助性的编辑(比如润色语气、修正语法),没有对原始内容做实质改变,可以适用豁免条款。
声音克隆工具
声音克隆叠了两层义务,提供商和使用方都有责任。
提供克隆能力的一方,要满足 Article 50(2) 的机器可读标记要求,跟 TTS 一样。
使用克隆工具来生成内容的一方,如果生成的音频”像某个真实存在的人、且会被误认为真实录音”,就落入了深度伪造的定义(Article 50(4)),需要明确告知听众这段音频是 AI 生成的。
有一个容易踩的坑放到下一节单独说。
语音情绪识别、声纹分类
对应第三种情形(Article 50(3)),约束的是使用这套功能的一方,而不是提供能力的服务商。
要做的事是:在用 AI 分析用户语音来判断情绪或做生物特征分类之前,先告知用户。同时要检查 GDPR 下的数据处理是否合法。
另外还有一步要先做:Article 5(在2025年2月已经生效)里对工作场所和教育机构的情绪识别有更严格的禁止性规定。如果你的场景落在这两类里,要先过这一关,再谈 Article 50 的告知义务。
五. “深度伪造”的定义,比你想的宽
Article 50(4) 对深度伪造的定义是:AI 生成或处理的图像、音频、视频,内容酷似现实中存在的人、物体、地点或事件,而且看起来/听起来像是真实发生的。
几个常见的误解值得说一下:
很多人以为”只要我没有欺骗意图就没事”,这是错的。深度伪造义务和你的主观意图无关,只看内容本身会不会被误认为真实。
还有人以为”虚构人物不是真实存在的人,所以不算”,这也不对。如果一个虚构角色的声音听起来像某个真实的人,而且这种相似度会让听众误以为是真人录音,50(4) 照样适用。
对语音AI来说,这意味着用 TTS 给虚拟主播、AI 客服代表配音,只要声音”像真人”,就可能在深度伪造的范围里,需要提前想好怎么告知。
法规明确排除在外的是”明显是幻想性的或物理上不可能发生的内容”,比如龙、人类飞行这类。”听起来像人的AI声音”不在这个排除里。
有一个减轻义务的条件:如果内容明显属于艺术创作、讽刺、虚构类作品,披露要求可以降低——只需以不影响作品体验的方式注明”内容经过AI处理”就行。
六. 7月22日的签署窗口,要不要管
行为准则是自愿性质的,但签了有实质好处。
签署之后,监管机构默认你满足了 Article 50(2) 和 50(4) 的义务。如果日后被调查,举证责任在对方,你不需要自己证明合规,他们要证明你违规。没签的话,处境反过来。
即使现在技术标准还没最终定稿(行为准则预计6月底至7月出正式版),7月22日前签署至少说明了一个态度——你是在主动跟进,而不是在观望。在执法资源有限的早期阶段,这个态度有一定的实际意义。
签署入口在欧盟官网:digital-strategy.ec.europa.eu,填完表单提交即可。
七. 按角色整理:各自需要做什么
如果你做的是语音AI能力(TTS、语音助手SDK、克隆工具等)
先把自己产品面向欧盟用户的场景列出来,确认每个场景触发了 Article 50 的哪条。对话类产品检查第一次交互时有没有AI身份告知,告知方式够不够显眼。TTS 和克隆工具评估音频水印或元数据标注的技术路径,跟进行为准则7月的最终技术方案。如果你的输出会被下游客户用于生成内容,在合同里明确他们的披露责任,别让这个灰色地带留在合同外面。
如果你是用语音AI构建产品或发布内容的一方
把所有对欧盟用户的语音AI应用场景过一遍,对应 Article 50 的四种情形逐一检查。对话产品的AI身份告知要出现在对话真正开始时,别埋进欢迎语后面。用声音克隆或AI配音生成的内容,在发布端根据媒介来设计标注:音频内容用开头可听的声明,视频用持久性字幕。用语音情绪识别功能的,先排查 Article 5 的禁止性规定,再设计用户告知。
八. 时间节点一览
| 日期 | 事项 |
|---|---|
| 2026年7月22日 CET 18:00 | 《AI生成内容透明度行为准则》初始签署截止,签署后获得Article 50(2)(4)合规推定 |
| 2026年8月2日 | Article 50全部义务正式执行,Article 50(1)(3)(4)无宽限期 |
| 2026年12月2日 | 8月2日前已上线系统的机器可读标记宽限期结束(Article 50(2),需Digital Omnibus协议正式通过) |
12月2日的宽限期来自今年5月的 Digital Omnibus 临时协议,还需要欧洲议会正式通过,目前还不是板上钉钉的事,不建议把合规计划押在这个宽限期上。
欧盟官方合规自查工具(输入场景自动判断适用哪条义务):artificialintelligenceact.eu
Article 50 草案指引(正式版预计7月前发布):digital-strategy.ec.europa.eu
