斯诺登泄露了美国国家安全局(NSA)的各种“黑科技”后,美国民众逐渐意识到,无论采用何种通信方式,都无法逃脱政府的监控。事实上,NSA早在40年前就能识别语音了。
语音识别技术的历史可以追溯到20世纪70年代。当时,美国国防高级研究计划局(DARPA)资助了多个研究项目,致力于将语音转化为文本格式。尽管早期进展缓慢,但随着技术不断进步,语音识别的速度和准确性都有了显著提升。
DARPA信息创新办公室主任Dan Kaufman表示,将语音转换为文本是一项艰巨的任务,因为通话中常常存在各种干扰因素。不过,研究人员正在逐步克服这些挑战,提高语音信息的识别能力。
2001年后,对间谍工具的投资大幅增加。从斯诺登曝光的文件中可以看出,十年前NSA的分析师对“Google for Voice”的问世感到非常兴奋。然而,没有任何工具能够完美地翻译语音对话,至少目前还没有这样的工具。但不可否认的是,现有的工具已经相当强大,可以通过广泛的关键字搜索、提取语音信息以及运用算法标记对话等方式,使翻译变得更加精确。
斯诺登文件还显示,美国情报部门已在伊拉克、阿富汗、拉丁美洲等地的一些战区使用了这些工具进行监听,但他们不会监听美国公民的通话信息。这或许意味着全球公民都应保持警惕,因为美国情报机构利用雷达等手段进行活动,即使是美国国会也可能察觉不到。
语音转换工具及其发展历程
2001年发生的一系列恐怖袭击事件中,袭击者就是使用类似工具,通过自动化方式收集了大量的语音通信数据。
第一代语音转换工具:RHINEHART
2004年,第一代工具RHINEHART首次亮相。一份NSA的内部文件提到,语音搜索技术有助于分析师快速查找情报内容,并能根据情报内容优先拦截通话。RHINEHART支持实时和回顾性搜索,使分析师能够查找到当前和过去的通信信息。2006年时,RHINEHART已能在多种语言中进行翻译,其中西班牙语的准确率最高。
第二代语音转换工具:VoiceRT
2009年,VoiceRT开始投入使用,最初应用于巴格达地区,目标是每天检索并标记100万条信息。
第三代语音转换工具:SPIRITFIRE
2011年至2012年间,出现了一款名为SPIRITFIRE的新工具,它可以处理更多数据,并且处理速度更快。在语音-文本关键字搜索和对话转录功能的基础上,SPIRITFIRE具备更强大的语音处理能力。
作为普通公民,我们希望相关机构能够充分尊重我们的权利,严格管理和监管这些工具,并通过立法保护我们的隐私。
参考来源:securityaffairs
大数据文摘精彩文章
回复金融:查看金融与商业专栏历史文章
回复可视化:感受技术和艺术的完美结合
回复安全:获取关于泄密、黑客、攻防的新鲜案例
回复算法:了解既涨知识又有趣的事件
回复谷歌:了解其在大数据领域的举措
回复院士:了解众多院士的大数据观点
回复色情:探讨这个话题
回复隐私:探讨大数据时代下的隐私问题
回复医疗:查看医疗领域相关文章
回复征信:了解大数据征信专题
回复大国:了解各国大数据国家档案
回复体育:了解大数据在网球、NBA等领域的应用
回复平安:了解中国平安的大数据案例和新闻
回复志愿者:了解大数据文摘及如何加入
大数据文摘ID: BigDataDigest
专注大数据,每日分享
作为WeMedia联盟的一员,大数据文摘覆盖千万读者