text mining:文本挖掘
文本挖掘(text mining)是对自然语言正文中所包含数据的分析。文本挖掘将非结构化数据中的词和短语转化成数值,这些数值可以连接到一个数据库中的结构化数据并且可被传统数据挖掘技术分析。 文本挖掘(text mining)在处理以下任务时尤其有用: 人们普遍认为,非结构式数据大多存在于文本文件中,它在一个组织数据中所占比例至少达八成。由于自然语言正文通常是矛盾的,所以文本挖掘工作很有挑战性。这些矛盾包含由语义、句法和俚语所引起的意义不明确。 另见全文数据库(full text database)。
最近更新时间:2010-05-10 翻译:徐艳EN
相关推荐
-
从业务到IT:探索非常规CIO职业发展道路
成为CIO的道路并非千篇一律。 虽然很多IT领导者遵循传统的职业发展道路(通过IT),但现在越来越多的领导者来 […]
-
CIO减少技术债务的指导手册
债务通常被简单地称为“欠款”,企业技术采用率的提高带来新型债务,这给企业和IT领导者带来困扰。技术债务通常是指 […]
-
CIO帮助改进客户体验战略的4种方式
对于客户体验(CX),IT与企业领导的观点并不一致,对此,首席信息官(CIO)应该在制定客户体验战略方面发挥至 […]
-
无视数字主权?CIO无法承担
这十年来,地缘政治紧张、混乱和战争,促使企业想办法在强烈的不确定性中寻求发展。对于大多数公司及其首席信息官(C […]