text mining:文本挖掘
文本挖掘(text mining)是对自然语言正文中所包含数据的分析。文本挖掘将非结构化数据中的词和短语转化成数值,这些数值可以连接到一个数据库中的结构化数据并且可被传统数据挖掘技术分析。 文本挖掘(text mining)在处理以下任务时尤其有用: 人们普遍认为,非结构式数据大多存在于文本文件中,它在一个组织数据中所占比例至少达八成。由于自然语言正文通常是矛盾的,所以文本挖掘工作很有挑战性。这些矛盾包含由语义、句法和俚语所引起的意义不明确。 另见全文数据库(full text database)。
最近更新时间:2010-05-10 翻译:徐艳EN
相关推荐
-
CrowdStrike事件揭露关于IT的残酷真相
美国立法者希望CrowdStrike首席执行官George Kurtz解释其软件更新如何导致数千次航班取消、医 […]
-
CIO的绿色IT指南:融合技术和可持续性
可持续性为当今企业带来巨大的机遇,但同时也带来重大挑战。这种挑战与数字转型的挑战不相上下,甚至超过数字转型的挑 […]
-
如何领导数字化转型:10个关键步骤
对于获得竞争优势,数字化转型可能至关重要,但这并不意味数字化转型很容易。 重新思考企业的运营方式,并实施数字技 […]
-
更好沟通数字化转型的5个技巧
很多首席信息官和IT领导者很难有效地沟通数字化转型的重要性。 5月14日在马萨诸塞州剑桥举行的2024年麻省理 […]