data dredging:数据疏浚
数据疏浚(data dredging)有时候指得是“数据捕鱼(data fishing)”,它是一个数据挖掘(data mining)实践,分析其中大批量的数据(data)来寻找数据间可能的关系。相反地,传统科学方法以假设开始,紧接着测试数据。有时候会引向不道德的目的,数据疏浚常常避免传统的数据挖掘技术,并会导致结论得出得太早。数据疏浚有时候被描述成“从数据集中寻找比实际含有的更多的信息。” 数据疏浚(data dredging)有时候导致变量间的关系很重要,事实上,和数据在合法决定这种联想前要求更多研究时宣布的一样。很多变量可能通过偶然机会相关,其它的可能因为一些未知原因彼此联系。为了有效评估任意两个变量间的关系,需要进一步的研究,这其中孤立的变量和控制组形成对照。数据疏浚有时候用于呈现未核实的同时发生的变量,就像它们得出的有效结论,领先于其它相似研究。 尽管数据疏浚(data dredging)常常用得不恰当,但它查找令人惊讶的关系时是很实用的方式,这是其它方法发现不了的。但是,由于同时发生的变量不构成它们关系的信息(这可能、终究只是巧合),要求进一步的分析来得到实用结论。
最近更新时间:2010-08-04 翻译:徐艳EN
相关推荐
-
机器学习、AI要求、示例的基础设施
对于寻求利用数据获得竞争优势的公司来说,IT是作为一种专业学科的存在。现在,企业充斥着数据,但处理和分析数据的 […]
-
缓解多云治理挑战的5个最佳做法
部署多云模型会给云团队带来更多的复杂性和管理挑战。这些挑战影响着企业环境的方方面面,包括设计、部署、配置、运营 […]
-
联合国决议表明全球关注AI规则和原则
联合国大会周四通过了一项关于人工智能的最终决议,这是朝着全球合作迈出的一步-关于如何使用人工智能和全球支持保护 […]
-
4个需要解决的虚拟现实道德问题
虚拟、增强和混合现实(统称为扩展现实XR)的增长导致出现分歧。一边是用户和供应商,另一边是法律专家和伦理学家& […]