text mining:文本挖掘
文本挖掘(text mining)是对自然语言正文中所包含数据的分析。文本挖掘将非结构化数据中的词和短语转化成数值,这些数值可以连接到一个数据库中的结构化数据并且可被传统数据挖掘技术分析。 文本挖掘(text mining)在处理以下任务时尤其有用: 人们普遍认为,非结构式数据大多存在于文本文件中,它在一个组织数据中所占比例至少达八成。由于自然语言正文通常是矛盾的,所以文本挖掘工作很有挑战性。这些矛盾包含由语义、句法和俚语所引起的意义不明确。 另见全文数据库(full text database)。
最近更新时间:2010-05-10 翻译:徐艳EN
相关推荐
-
企业中通行密钥的好处和挑战
尽管密码是主要身份验证方式,但它们是企业安全的薄弱环节。数据泄露事故和网络钓鱼攻击利用被盗或弱密码,让企业面临 […]
-
Gartner预测价格上涨将影响技术支出
本周Gartner预测,今年全球IT支出将增长近两位数,但他们表示,大部分增长将源于涨价:IT产品和服务价格高 […]
-
2025年12个企业风险管理趋势
在很多企业中,企业风险管理已经占据中心地位,随着这些企业努力应对经济不确定性带来的影响–先是新冠肺 […]
-
2025年重塑CIO角色的8个因素
企业继续将技术视为未来成功和增长的关键,这将促使2025年IT支出增加。 研究和咨询公司Gartner估计,明 […]