Informatica 9.5释放Hadoop潜能

日期: 2012-05-21 来源:TechTarget中国

  全球领先的独立企业数据集成软件提供商Informatica公司(纳斯达克代码:INFA)近日宣布了Informatica 9.5的多项进展,使得Hadoop成为企业级之选。

  通过交互性、生产力及可管理性,Informatica 9.5提供全新及扩展功能,释放了Hadoop的潜能,使用户能够提高大数据的投资回报:

  • 通过数据接入拓展了其交互性,包括社交媒体数据,并且可将其通过批量或实时的方式导入Hadoop。
  • 通过在Informatica中利用图形数据设计数据集成任务及流程,提高了生产力,并且可将设计直接部署在Hadoop中进行自主执行。
  • 借助通用数据整合平台,提高了所有企业数据的可管理性,包括Hadoop中的数据。

  Informatica首席技术官 James Markarian表示:“在IT环境中,Hadoop不可能作为一个孤岛存在。为了让Hadoop可以跨越不同平台并成为一种主流技术,用户需要将Hadoop作为他们IT大环境中的一部分来管理,通过Hadoop重复使用他们的开发技巧、资产及数据,并统筹管理全部数据。Informatica 9.5 为企业带来了他们所需的交互性、生产力以及可管理性,以便快速采用Hadoop并最大化他们的大数据投资回报。”

  通过访问社交数据以扩展交互性,带来对Hadoop近乎实时的管理

  鉴于社交计算继续急速增长的步伐,许多企业正在转向利用社交数据,从而更加清晰地洞悉用户及市场。Informatica 9.5 带来了扩展的社交数据集成功能,以帮助获取社交数据,并且可以以批量、数据流或者复制的方式将数据按任意延迟速度导入Hadoop中。新功能包括:

  • 对社交数据更好的连接性:Informatica 9.5可提供对Twitter数据流的支持,以及一个数据流API支持RSS、ATOM或其它网页来源协议。
  • 近乎实时的数据复制至Hadoop:Informatica 9.5 提供了Informatica 快速克隆及数据复制HDFS支持功能,以大量快照及近乎实时数据复制的方式将数据导入Hadoop。

  通过在Informatica中进行设计并在Hadoop中自主运行,提高生产力

  借助通用数据整合平台,Informatica 9.5进一步提高了企业集成并管理全部数据的能力,其核心在于通过在Informatica HParser中设计数据整合关键任务,然后在Hadoop中进行自主运行而无需编写代码。
为实现这个目标,针对大数据分析,Informatica 9.5 为Informatica HParser加入了增强的性能,包括:

  • 通过Protobuf,为数据交互及系列格式提供拓展支持:借助Informatica 9.5,用户现在可以自主地进行Google Protobuf分析,并且通过Informatica HParser在Hadoop上进行转换。

  在七月即将发布的Hadoop beta版本中,更多新的Hadoop-native功能可以带来更高的生产力,正式版本计划在2012年第四季度发布:

  • 针对数据恢复、数据集成以及数据清洗的Native Hadoop支持。
  • Hadoop自然语言处理(NLP) 功能提供了强大的社交数据处理及分析能力。
  • Hadoop中的社交数据识别及处理功能可将对象相互关联并丰富主数据。

  利用通用数据集成平台,提升所有数据的可管理性

  如果没有企业级的管理功能,企业无法从Hadoop上获得全部收益。Informatica 9.5 为Hadoop带来了Informatica 的可管理性优势,包括:

  • 针对Hadoop的基于策略的数据归档,可降低存储以及法规遵循的成本,并且通过丰富的企业历史信息带来新的洞察力。
  • 对开发、部署、监控及管理Hadoop和非Hadoop任务提供混合负载支持,建立一个复合IT环境,该功能会在beta版本中出现。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐

  • 大数据分析:选对池塘钓大鱼

    谈到大数据分析,毫无疑问,Hadoop是最受企业欢迎的数据分析平台。但Hadoop集群的安装、配置及运行,却有许多地方需要慎重考量。针对Hadoop所存在的这一系列问题,戴尔联合Cloudera推出了Dell Cloudera大数据解决方案。

  • Spark会成为大数据分析的新里程碑?

    在年初于纽约举行的Spark Summit East大会上,Databrick成为了焦点所在,通过新发布的数据处理云服务,该公司力图将Spark与MapReduce及Hadoop系统划清界限。

  • 你造吗?这才是大数据项目成功的七大秘密

    大数据项目的成功有哪些法宝?又有哪些陷阱会导致大数据项目的失败?本文中的三位专家将对此进行详解。

  • CIO部署Hadoop前需要考虑哪些因素?

    尽管Hadoop的标价有诱惑力,但它并不是所有大数据问题的最优技术方案。该技术还相对较新、不够完善,这意味着它必然会伴随相应的症结和问题。那么,CIO要如何确定在何时部署Hadoop框架呢?