我认为,美国国家安全局监视丑闻中最有趣的故事之一是,该情报机构一直在使用所收集到的部分数据对普通民众进行社交网络分析(SNA)。
这是我在书中详细讨论的一个主题。社会网络是由相互联系和相互依赖的个人组成的群体。这些个人之间的互动范围广泛,从家庭关系到友谊、就业信息和发展。社会网络可以理解为任何有界的相互连接的社会单位集合。社会网络依赖于三个关键的构建模块:所研究的社会元素的边界,无论是家庭、部落还是国家;社会单位之间的连接元素,即将单位联系在一起的纽带;以及社会单位本身的定义,这些通常是个人,但也可以是群体的群体,因此我们可以有由组织和机构组成的社会单位。因此,SNA 是一种以分析方式查看这些网络的系统方法,它使用图论来提供有关该群体的有用信息。
美国国家安全局似乎在利用从电话和互联网服务中收集到的元数据,试图绘制出一幅精确的美国乃至全世界的社交地图。这似乎是一项无害的练习,但从这些看似无害的东西中可以了解到很多东西,比如从你的通信中收集到的信息。SNA 最困难的一个方面是试图定义一个网络,我们在任何媒介中的通信都是巧妙的分界参数,通过这些参数可以准确地描绘出一个人的社交环境和情况。有一些工具可以帮助你了解元数据对 SNA 的重要性,比如Project Immersion,它通过 Gmail 分析你的社交网络。尝试使用 Immersion 来绘制一个人的通信地图会让人大开眼界,我个人觉得它的准确性令人生畏,有趣的是,随着时间滚动条的移动,我的社交网络在我眼前发生变化。
很容易忽略这些工具,它们可以帮助描绘出一个人的 Linkedin 联系人或 Facebook 好友的漂亮图景,但为什么 NSA 对此感兴趣呢?尽管有人试图将恐怖分子非人化,但他们也是社会实体,他们有朋友、家人、熟人,更重要的是,他们也倾向于加入恐怖分子网络。孤狼实际上很少见,大多数恐怖分子倾向于以团体的形式行动。抓捕本·拉登的困难恰恰在于他小心翼翼地将自己从社交互动中剔除出去,几乎完全与世隔绝。利用他的少数几个联系人之一来辨别他的位置,这是社交网络分析最伟大的成功之一。因此,NSA 一直在使用 巴基斯坦手机数据 通过他们的侦听程序收集的元数据来尝试识别恐怖分子网络。假设 NSA 已经确定了一名嫌疑人,通过分析他的联系人,一旦识别并过滤了其他网络,就有可能很好地了解一个团体的可能成员。例如,请参见 9 月 11 日恐怖分子网络的这个表示(来自此处):
事实上,这可以相当准确地描绘出可能的领导人,实际上它可以用于识别可能需要进一步调查的成员和其他可能的嫌疑人。
那么,美国国家安全局的计划是否合理呢?不一定。虽然社交网络分析在识别可能的恐怖分子网络方面非常有用,但将其部署到普通人群中显然会增加误报的可能性,甚至会因牵连而产生罪责。我们真的想生活在这样一个世界里:与可能做错事的人偶然联系就足以引发进一步的监视吗?这种方法对隐私有严重的隐患。此外,对“恐怖分子”定义的任何改变都可能被用来为加强监视提供理由。
不幸的是,一些媒体一直从错误的角度关注这个问题。在这篇文章中,作者提出,他似乎错误地阅读了两篇独立的研究报告,并得出结论,认为很多人可能已经是恐怖分子嫌疑人。作者引用了几年前的一项研究,该研究发现,互联网显示出3.3 度分离,也就是说,网上人与人之间的平均社交距离刚好超过 3 个连接。这意味着你只需超过 3 个跳数就可以联系到任何人。由于美国国家安全局在其 SNA 分析中使用了 3 度分离,因此结论是,你可能已经是嫌疑人,因为你很可能已经与恐怖分子有联系。
这是对正在发生的事情的略带耸人听闻的解读。首先,互联网连接更像是 4-6 度或以上的分离度,具体取决于您使用的工具(Facebook 产生 4.7 度)。其次,与恐怖嫌疑人的任何随机连接都不太可能产生正面结果。