de-anonymization:去匿名化
去匿名化(de-anonymization,de-anonymization)是一种数据挖掘(data mining)策略,其中的匿名数据和其它数据来源相互对照来重新识别匿名的数据来源。区别一个数据来源和另一个数据来源的任一信息都能用于去匿名化。 随着美国政府和其它国家进行进一步的开放政府活动,大众可以通过互联网得到更多的数据。这些数据中的很多已经清理(data scrubbing)过,用来创建政府所谓的“有限的数据集”。个人验证信息(PII),如名字、地址和身份证号都从有限数据集中移除,因此数据的特定来源还是匿名的。这种匿名保证保护了来源的隐私性并让政府可以合法地与第三方共享有限数据集,不需要编写许可。这样的数据对搜索者来说很有价值,尤其是在医疗中。但隐私倡导者还是担心尽管数据清理过,但是太多数据可用的话,某个人的身份会被发现。 尽管去匿名化(de-anonymization,de-anonymization)的概念并不新,该术语在2006年Arvind Narayanan和Vitaly Shmatikov参加网飞公司(Netflix)主办的竞赛时成为头条,网飞是一种流行的视频出租服务。Narayanan和Shmatikov在一个数据集(data set)中应用了他们的去匿名化方法,这些数据集中有500,000名会员的匿名电影评级,该方法能够为大量有针对性的用户成功地识别网飞数据。根据Narayanan和hmatik所说,去匿名化需要数据大量、颗粒状且在时间和环境变化时非常稳定。 另见:关联规则(association rule)、商业智能(business intelligence)、在线分析处理(OLAP)、模糊逻辑(fuzzy logic)
最近更新时间:2011-08-03 翻译:徐艳EN
相关推荐
-
比较CompTIA Cloud+ 与 Cloud Essentials+ 认证
现在,云认证就像天上的云朵一样普遍。很多供应商采取独特的方法以使他们的认证计划脱颖而出。而其中有一家供应商,C […]
-
量子AI:它将如何影响商业世界
在当下AI的黄金时代,人们对量子计算的兴趣开始激增,因为它有可能提供前所未有的计算能力。 为此,处于技术前沿的 […]
-
量子计算的现状:企业需要知道什么
我们很难明确说明量子计算的现状。这项新兴技术目前面对的是不断变化的主张、不确定的时间表和分散的技术格局。 考虑 […]
-
如何保护AI基础设施:最佳做法
AI和生成式AI给企业带来巨大的创新机会,但随着这些工具变得越来越普遍,它们也吸引着恶意攻击者来探测其潜在漏洞 […]