de-anonymization:去匿名化
去匿名化(de-anonymization,de-anonymization)是一种数据挖掘(data mining)策略,其中的匿名数据和其它数据来源相互对照来重新识别匿名的数据来源。区别一个数据来源和另一个数据来源的任一信息都能用于去匿名化。 随着美国政府和其它国家进行进一步的开放政府活动,大众可以通过互联网得到更多的数据。这些数据中的很多已经清理(data scrubbing)过,用来创建政府所谓的“有限的数据集”。个人验证信息(PII),如名字、地址和身份证号都从有限数据集中移除,因此数据的特定来源还是匿名的。这种匿名保证保护了来源的隐私性并让政府可以合法地与第三方共享有限数据集,不需要编写许可。这样的数据对搜索者来说很有价值,尤其是在医疗中。但隐私倡导者还是担心尽管数据清理过,但是太多数据可用的话,某个人的身份会被发现。 尽管去匿名化(de-anonymization,de-anonymization)的概念并不新,该术语在2006年Arvind Narayanan和Vitaly Shmatikov参加网飞公司(Netflix)主办的竞赛时成为头条,网飞是一种流行的视频出租服务。Narayanan和Shmatikov在一个数据集(data set)中应用了他们的去匿名化方法,这些数据集中有500,000名会员的匿名电影评级,该方法能够为大量有针对性的用户成功地识别网飞数据。根据Narayanan和hmatik所说,去匿名化需要数据大量、颗粒状且在时间和环境变化时非常稳定。 另见:关联规则(association rule)、商业智能(business intelligence)、在线分析处理(OLAP)、模糊逻辑(fuzzy logic)
最近更新时间:2011-08-03 翻译:徐艳EN
相关推荐
-
区块链与传统数据库:区别和用例
区块链和数据库技术有很多相似之处和不同之处,它们经常被拿来比较。 虽然区块链和数据库技术都专注于存储和管理数据 […]
-
专家称:美国政府入股英特尔无法解决长期困境
近日英特尔与美国政府达成协议,美国政府将入股英特尔,此举可能有助于应对科技行业的危机,但这并不意味着这家陷入困 […]
-
2025年如何吸引科技人才:7个要点
在争夺人才时,从首席信息官到一线招聘人员,都应该了解如何吸引出色的IT和技术团队。 提高工资、提供工作与生活的 […]
-
黑帽大会:Halcyon和Sophos联手阻击勒索软件
网络安全专家Halcyon和Sophos合作建立一家威胁情报共享合资企业,这两家公司将交换关键指标数据,例如威 […]