英文原文:Audio fingerprinting being used to track web users, study finds
普林斯顿大学研究人员对网络追踪技术的一项全面研究 显示 ,一种新技术正被用于发掘互联网用户的隐私数据。此外研究还对当前正在使用的常用追踪技术进行了量化分析。
这项研究发现的新技术利用 AudioContext API(应用程序接口)给计算设备的声音环境打上指纹标签。这款 API 不会收集计算设备播放或录制的声音,而是分析这些设备的声音信号,将其作为标识符,从而跟踪互联网用户。
关于这项技术,研究人员制作了一个 实时演示页面 。
研究发现,声音指纹技术尚未得到广泛使用。不过,常见的追踪拦截和隐私保护工具,例如 Ghostery,也没有将这项技术包括在内。
为了分析网站采用的追踪技术,研究人员使用了开源工具 OpenWP,覆盖了 Alexa 排名前 100 万的网站。
研究指出:“如果没有新的网页技术提供全面支持,我们也无法发现并确定 AudioContext API 在设备指纹方面的应用。”
在互联网上追踪用户信息已成为一场军备竞赛。与隐私保护相关的研究需要反映用户实际的上网行为,从而得出真实的分析结果。
研究关注的其他追踪技术还包括 WebRTC IP、Canvas 指纹识别、Canvas 字体指纹识别,以及电池 API15。
尽管 Ghostery 和火狐的第三方 cookie 拦截工具等隐私保护工具被证明有效,但研究人员发现,“模糊不清的追踪技术”带来了更多挑战。他们表示:“当前的隐私保护工具大多不会拦截指纹脚本的‘长尾’端。”
因此,尽管声音指纹技术并不常用,但这项技术足够新颖,因此尚未被常用的隐私保护工具覆盖在内。
研究人员认为,对于不断变化的互联网追踪技术,机器学习未来将可能成为解决方案之一。他们希望,机器学习能自动探测并分类追踪技术,最终取代当前人工需要去做的工作。
关于机器学习,研究人员表示:“如果获得成功,那么这将极大地提升浏览器隐私保护工具的效率。今天,这样的工具使用追踪保护列表,而列表是由人工创建的,有可能出现很多‘假阳性’和‘假阴性’。大数据带来了理想的基础,以训练分类工具探测及归类追踪技术。”
这里是 研究报告全文 。
翻译:维金