来自比利时媒体 VRT(报道视频)的一篇报道揭示了 Google 如何利用第三方承包商在全球范围内帮助转录和改进其助理语音识别系统,这其中涉及严重的个人隐私问题。
我们都知道 Google 正在为其 AI 语音拨号系统 Duplex 做类似的事情,以确保系统在拨号时能一切顺利。也就是说,这些承包商可能已经收听到了诸如姓名、地址和其他个人信息在内的隐私内容。
更令人担忧的是,部分审查这些 Google 语音助理录音的承包商声称他们经常会听到用户并非直接与 Google Home 设备对话时的音频。这些设备经常会误将对话错误地理解为指定的唤醒词,通常是 “Hey Google” 或 “OK Google”。
举报人告诉 VRT,他经常会每周录制约 1000 张荷兰语和弗拉芒语(Flemish)录音。他还解释说,一张录音似乎记录了一起家庭暴力事件。
Google 的一位发言人告诉 Wired,所有录音中只有 0.2% 最终被真人转录。该公司还指出,这些音频剪辑从不包含最初记录它们的人的任何识别信息。
伦敦艾伦图灵研究所的技术政策研究员 Michael Veale 表示,如此针对个人信息的披露方式可能不符合欧盟的 GDPR(通用数据保护条例)。Veale 说:“你必须非常具体地了解你正在执行什么以及如何执行,我认为 Google 没有这样做,因为它看起来令人发毛。”