。但是,即使员工进入innercircle,也不可能偷走任何数据。马克,给她讲讲关于数据圈的事情。” “当然,”马克对萨克斯说,“我们有水泥防火墙。” “我不是技术人员。”萨克斯说。 惠特科姆笑了起来:“不,不,这算不上科技。我说的就是字面上的水泥墙。我们收到数据后,会将其分开存储在不同的地方。我告诉你ssd是如何运作的,你就能明白了。数据是我们的主要资产。如果有人能将innercircle里的数据复制下来,那我们一周之内就可以歇业了。所以,我们的口号是“保护我们的资产”。那么,这些数据是从哪里来的呢?我们有数以千计的信息来源:信用卡公司、银行、政府记录、零售商店、在线操作、法庭记录、汽车驾驶管理部、医院、保险公司。我们将产生数据的行为称为‘事件’,‘事件’可以是拨出的电话、登记车牌号、医疗保险索赔、提起诉讼、出生、结婚、购房、退货、投诉……而在你们警察的工作范围内,‘事件’可能是强奸、抢劫、谋杀——任何犯罪行为。此外,还有建立案宗、选择陪审员、审判、定罪。” 惠特科姆继续说道:“任何‘事件’的数据来到ssd时,都会先进入数据进口中心库,在那里进行评估。为了安全起见,我们还有一个数据屏蔽策略——就是用代码替换个人的名字。” “社会保障号码?” 斯德林的脸上出现了一丝情感波动。“啊,不是。那个是政府为公民退休账户单独设立的,是很久以前的事了。它能成为确认身份的标准纯粹是一个偶然。它很不准确,容易被盗。那是很危险的——就像将一把上了膛的枪放在家里。而我们的代码是一个十六位数字,百分之九十八的美国成年人都有一个ssd码。而现在,每一个刚出生的婴儿登记时,无论在北美哪里,都会自动获得一个代码。” “为什么是十六位?”普拉斯基问。 “这样就有扩展的空间。”斯德林说。“我们再也不用担心会用完数字序列。十六位数可以产生将近五万亿个号码。在地球的生活空间被用完之前,ssd的代码都还有余地。这些代码使我们的系统更加安全,而且比使用名字或社保号码的处理速度要快很多。此外,使用代码代表个人,可以中和人为因素,把偏见从数据方程里剔除。心理上,我们在见到名字的瞬间就会对一个人有所判断。而数字可以消除偏见,提高效率。请继续吧,马克。” “当然。数据中的名字被替换后,就会进入数据进口中心库,进行评估、分类,发送给一个或多个不同的数据圈。我们一共有三个数据圈。数据圈a存储个人生活方式数据;b是金融类数据,包括工资、银行记录、信用报告、保险;c是公众和政府记录。” “然后我们就会统一数据格式,清除冗余信息。”斯德林又一次接着道,“比如,有时女性被标记成‘f’,有时是全拼的‘女性’一词。有时又只是一个1或0。我们的信息要保持一致。” “我们也需要消除数据里的噪声,也就是不纯数据。数据可能有误,可能有太多细节,也可能没有细节。噪声是污染,而污染必须被消除。”他再次流露了些许情感,“然后,清理好的数据会被存储在数据圈里,直到有客户需要一位占卜师。” “占卜师?”普拉斯基问道。 斯德林解释说:“在二十世纪七十年代,计算机数据库软件公司可以进行历史数据分析。二十世纪九十年代,数据分析可以随时随地进行。而现在,我们可以预测消费者的下一步行动,并引导客户充分利用这一优势。” 萨克斯说:“你们不只是预测未来,也试图去改变它。” “确实如此,但人们去找占卜师,不就是为了改写未来吗?” 他的目光平和,甚至有几分兴味。萨克斯却感到不安,想起了昨天自己在布鲁克林与fbi特工的惊险相遇。那也正是因为五二二预测了未来——他们之间会发生一场枪战。 斯德林示意惠特科姆继续说下去。 “所以,数据中没有姓名,只有数字,进入不同的数据圈。这三个数据圈位于不同的楼层,彼此独立,保安队伍也不同。c圈的员工不能进入a圈或b圈。而且没有人能同时访问数据进口中心和数据圈的信息,将姓名与代码联系起来。” 斯德林说:“所以他才会说,黑客要拿到所有信息,将不得不入侵至少三到四个服务器。” 奥德补充道:“而且我们有二十四小时监控。如果有人未经授权,试图闯入数据圈楼层,我们会立刻知道。他们会被当场解雇甚至可能被捕。除此以外,你还不能从数据圈的电脑下载数据——那里根本没有端口。即使你设法进入服务器,连上一个硬件设备,也不可能带出来。每个人都会被搜查。每一位员工、高级管理人员、保安、消防员、看门人。即使是安德鲁本人。我们有金属和致密材料检测器,在数据圈和进口中心的每个入口和出口,甚至是防火门旁。” 惠特科姆说:“而且,你必须要穿过一个磁场产生器。它会删除你携带的任何介质上的所有数据。ipod、手机或移动硬盘。没有任何人能走过那些房间,还带出来上千字节的数据。” 萨克斯说:“所以M.bGmbuILdINg.COM