text mining:文本挖掘
文本挖掘(text mining)是对自然语言正文中所包含数据的分析。文本挖掘将非结构化数据中的词和短语转化成数值,这些数值可以连接到一个数据库中的结构化数据并且可被传统数据挖掘技术分析。 文本挖掘(text mining)在处理以下任务时尤其有用: 人们普遍认为,非结构式数据大多存在于文本文件中,它在一个组织数据中所占比例至少达八成。由于自然语言正文通常是矛盾的,所以文本挖掘工作很有挑战性。这些矛盾包含由语义、句法和俚语所引起的意义不明确。 另见全文数据库(full text database)。
最近更新时间:2010-05-10 翻译:徐艳EN
相关推荐
-
专家称:美国政府入股英特尔无法解决长期困境
近日英特尔与美国政府达成协议,美国政府将入股英特尔,此举可能有助于应对科技行业的危机,但这并不意味着这家陷入困 […]
-
2025年如何吸引科技人才:7个要点
在争夺人才时,从首席信息官到一线招聘人员,都应该了解如何吸引出色的IT和技术团队。 提高工资、提供工作与生活的 […]
-
黑帽大会:Halcyon和Sophos联手阻击勒索软件
网络安全专家Halcyon和Sophos合作建立一家威胁情报共享合资企业,这两家公司将交换关键指标数据,例如威 […]
-
对于ASM,CISO角色可增加运行时安全、令牌化
攻击面管理(ASM)是不断发展的网络安全领域,ASM旨在识别内部和外部漏洞,提供建议,并观察新出现的威胁。如果 […]