noisy data:噪声数据
噪声数据(noisy data)就是无意义的数据(meaningless data)。这个词通常作为损坏数据(corrupt data)的同义词使用。但是,现在它的意义已经扩展到包含所有难以被机器正确理解和翻译的数据,如非结构化文本。任何不可被创造它的源程序读取和运用的数据,不管是已经接收的、存储的还是改变的,都被称为噪声。 噪声数据未必增加了需要的存储空间容量,相反地,它可能会影响所有数据挖掘(data mining)分析的结果。统计分析可以运用历史数据中收集的信息来清除噪声数据从而促进数据挖掘。 引起噪声数据(noisy data)的原因可能是硬件故障、编程错误或者语音或光学字符识别程序(OCR)中的乱码。拼写错误、行业简称和俚语也会阻碍机器读取。
最近更新时间:2010-05-13 翻译:徐艳EN
相关推荐
-
数字员工:CIO的新IT力量
现在的首席信息官面临着越来越多的要求,即增加产出、保持可靠性和更快地创新——同时努力减少预算和员工数量。 AI […]
-
从业务到IT:探索非常规CIO职业发展道路
成为CIO的道路并非千篇一律。 虽然很多IT领导者遵循传统的职业发展道路(通过IT),但现在越来越多的领导者来 […]
-
CIO减少技术债务的指导手册
债务通常被简单地称为“欠款”,企业技术采用率的提高带来新型债务,这给企业和IT领导者带来困扰。技术债务通常是指 […]
-
CIO帮助改进客户体验战略的4种方式
对于客户体验(CX),IT与企业领导的观点并不一致,对此,首席信息官(CIO)应该在制定客户体验战略方面发挥至 […]