世界正处在信息爆炸的时代,信息正在以指数级的速度增长。随着当今企业的国际化发展及员工队伍的分散分布,企业内部的各种系统和格式中所存储的数据的与日俱增,如何快速和准确地找到关键业务问题的解决方案和信息显得比以往任何时候都要重要。
美国泰码(Teragram)公司在文本采掘、文本分析、信息检索等技术领域涉足较早,它独有的自然语言处理(NLP)和高级语言技术能够为用户提供快速、准确和全球化的语言支持,高效地从大量的数据中提取出相关信息。美国泰码公司北京代表处首席代表兼泰码(北京)科技有限公司总经理杨旭接受了TechTarget中国的独家专访,对自然语言处理技术进行详细的介绍。
您能否简单介绍一下公司的业务,为企业级用户提供哪些技术和服务?
杨旭:公司致力于解决文本的搜索和管理问题,针对数据过载问题提供可扩展的策略性解决方案。这些解决方案对于海量信息处理具有可伸缩性,它能够为任意数量的数据提供相同的处理速度,同时以一种高度压缩格式对数据进行编码。
现如今,信息社会的发展相当迅速,面对严峻的信息处理要求,传统技术方法已无法胜任,现在都有哪些技术可以帮助企业更好的进行信息处理这项工作?
杨旭:现在已有很多的技术可以解决这个问题,一些软件能够利用文本的含义从大量的数据中提取出相关信息,为用户和合作伙伴提供所需的快速、准确和全球化的语言支持,帮助他们检索和组织不断增加的数字信息,可以帮助客户在30多种语言中开展更加有效的搜索和信息的组织工作,使他们能够进入到新兴市场,并且更加准确地进行决策。
与其他的提供这方面技术服务的公司相比,泰码公司具有哪些独特的技术?
杨旭:现在对企业及用户比较有用的技术主要有自然语言企业搜索技术,这种技术针对企业级的搜索需求,可以对结构性的企业数据以及非结构性的数据源进行扫描,包括基于文本的报表和网页,以便从这些不同的信息源中获取综合性的答案。
同时,还提供归档和检索等解决方案,为用户编写规则,提供服务,方便用户进行文档的归类和信息的提取,具有很高的精确度和效率性。泰码的客户主要集中在国外,如纽约时报、CNN、美联社、美国国会图书馆等媒体和搜索引擎的特定行业。在中国,目前泰码主要的客户包括中华英才网等媒体。我们提供的服务是基于软件的附加值,在文档的分类和实体的提取方面具有更高的精度和更快的效率。
现在有哪些更为先进的技术正在研发或即将面向用户?
杨旭:现在,正在开发一种移动搜索技术,这项移动搜索功能能通过移动设备帮助个人实现远程信息的扫描,更加快速地获得答案,用户能够存储和检索信息、连接到诸如BI系统的外部应用、来自BlackBerry的搜索数据库、职能电话或其他移动设备。用户可以通过手机发短信或其他方式,获取某些方面的归档信息,这种方式在速度上占有优势,但由于其内存容量的限制,得到的信息也是有限的,但这些信息会更贴近需求。目前,这项技术已应用于iPone、摩托罗拉、Blackberry等手机中。今后还会继续拓展其应用范围。
今年3月17日,商业智能和分析软件供应商SAS公司宣布收购美国泰码公司,是什么吸引了SAS公司进行此次收购?
杨旭:SAS看中的是泰码公司的技术和人才。在技术方面,泰码公司具有很多基于规则的先进技术,这与SAS基于统计的模式形成了高度的互补。泰码公司主要是进行文本的挖掘、文本的分析以及归档;SAS则侧重于数据的挖掘。更为重要的是,泰码拥有很强的软件研发专业人才,这是很吸引SAS的主要因素之一。
此项并购对于今后企业用户在处理信息数据方面会有哪些有利之处?
杨旭:随着数据爆炸继续呈现发展的趋势,任何企业都需要一种智能的方式对其加以利用,无论这些数据是存储在结构性数据库还是存在于大量非结构性数据源之中。企业级搜索是充分挖掘企业现有数据源的一个有力武器。SAS与泰码公司的相互结合可以做到人才和技术方面的互补,可以为用户提供类似报表标题的索引,也能够依据实际内容和与之相关的元数据给出必要的索引,能为企业在处理信息方面节约时间,提高效率。同时,泰码提供的产品具有跨语种的优势,能够帮助客户在30多种语言中开展更加有效的搜索和信息的组织工作,使他们能够进入到新兴市场,并且更加准确地进行决策。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国