TechTarget信息化 > 百科词汇

text mining:文本挖掘

文本挖掘(text mining)是对自然语言正文中所包含数据的分析。文本挖掘将非结构化数据中的词和短语转化成数值,这些数值可以连接到一个数据库中的结构化数据并且可被传统数据挖掘技术分析。

  文本挖掘(text mining)在处理以下任务时尤其有用:

  • 给相关部门发邮件。
  • 整理不同数据存储文本中有关产品满意度的信息。
  • 分析开放式问题。

  人们普遍认为,非结构式数据大多存在于文本文件中,它在一个组织数据中所占比例至少达八成。由于自然语言正文通常是矛盾的,所以文本挖掘工作很有挑战性。这些矛盾包含由语义、句法和俚语所引起的意义不明确。

  另见全文数据库(full text database)。 

 

最近更新时间:2010-05-10 翻译:徐艳EN

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐