noisy data:噪声数据
噪声数据(noisy data)就是无意义的数据(meaningless data)。这个词通常作为损坏数据(corrupt data)的同义词使用。但是,现在它的意义已经扩展到包含所有难以被机器正确理解和翻译的数据,如非结构化文本。任何不可被创造它的源程序读取和运用的数据,不管是已经接收的、存储的还是改变的,都被称为噪声。 噪声数据未必增加了需要的存储空间容量,相反地,它可能会影响所有数据挖掘(data mining)分析的结果。统计分析可以运用历史数据中收集的信息来清除噪声数据从而促进数据挖掘。 引起噪声数据(noisy data)的原因可能是硬件故障、编程错误或者语音或光学字符识别程序(OCR)中的乱码。拼写错误、行业简称和俚语也会阻碍机器读取。
最近更新时间:2010-05-13 翻译:徐艳EN
相关推荐
-
2025年12个企业风险管理趋势
在很多企业中,企业风险管理已经占据中心地位,随着这些企业努力应对经济不确定性带来的影响–先是新冠肺 […]
-
2025年重塑CIO角色的8个因素
企业继续将技术视为未来成功和增长的关键,这将促使2025年IT支出增加。 研究和咨询公司Gartner估计,明 […]
-
英特尔CEO Pat Gelsinger离职;董事会寻找新CEO
近日英特尔宣布首席执行官Pat Gelsinger退休,结束他在这家公司近四年的领导生涯,这期间他帮助这家陷入 […]
-
如何成功运行IT试点项目
正确的软件可以帮助公司获得竞争优势,但错误的软件可能会增加关键流程的复杂性和失败率。这意味着,测试潜在软件在企 […]