全球领先的独立企业数据集成软件提供商Informatica公司(纳斯达克代码:INFA)近日宣布了Informatica 9.5的多项进展,使得Hadoop成为企业级之选。
通过交互性、生产力及可管理性,Informatica 9.5提供全新及扩展功能,释放了Hadoop的潜能,使用户能够提高大数据的投资回报:
• 通过数据接入拓展了其交互性,包括社交媒体数据,并且可将其通过批量或实时的方式导入Hadoop。
• 通过在Informatica中利用图形数据设计数据集成任务及流程,提高了生产力,并且可将设计直接部署在Hadoop中进行自主执行。
• 借助通用数据整合平台,提高了所有企业数据的可管理性,包括Hadoop中的数据。
Informatica首席技术官 James Markarian表示:“在IT环境中,Hadoop不可能作为一个孤岛存在。为了让Hadoop可以跨越不同平台并成为一种主流技术,用户需要将Hadoop作为他们IT大环境中的一部分来管理,通过Hadoop重复使用他们的开发技巧、资产及数据,并统筹管理全部数据。Informatica 9.5 为企业带来了他们所需的交互性、生产力以及可管理性,以便快速采用Hadoop并最大化他们的大数据投资回报。”
通过访问社交数据以扩展交互性,带来对Hadoop近乎实时的管理
鉴于社交计算继续急速增长的步伐,许多企业正在转向利用社交数据,从而更加清晰地洞悉用户及市场。Informatica 9.5 带来了扩展的社交数据集成功能,以帮助获取社交数据,并且可以以批量、数据流或者复制的方式将数据按任意延迟速度导入Hadoop中。新功能包括:
• 对社交数据更好的连接性:Informatica 9.5可提供对Twitter数据流的支持,以及一个数据流API支持RSS、ATOM或其它网页来源协议。
• 近乎实时的数据复制至Hadoop:Informatica 9.5 提供了Informatica 快速克隆及数据复制HDFS支持功能,以大量快照及近乎实时数据复制的方式将数据导入Hadoop。
通过在Informatica中进行设计并在Hadoop中自主运行,提高生产力
借助通用数据整合平台,Informatica 9.5进一步提高了企业集成并管理全部数据的能力,其核心在于通过在Informatica HParser中设计数据整合关键任务,然后在Hadoop中进行自主运行而无需编写代码。
为实现这个目标,针对大数据分析,Informatica 9.5 为Informatica HParser加入了增强的性能,包括:
• 通过Protobuf,为数据交互及系列格式提供拓展支持:借助Informatica 9.5,用户现在可以自主地进行Google Protobuf分析,并且通过Informatica HParser在Hadoop上进行转换。
在七月即将发布的Hadoop beta版本中,更多新的Hadoop-native功能可以带来更高的生产力,正式版本计划在2012年第四季度发布:
• 针对数据恢复、数据集成以及数据清洗的Native Hadoop支持。
• Hadoop自然语言处理(NLP) 功能提供了强大的社交数据处理及分析能力。
• Hadoop中的社交数据识别及处理功能可将对象相互关联并丰富主数据。
利用通用数据集成平台,提升所有数据的可管理性
如果没有企业级的管理功能,企业无法从Hadoop上获得全部收益。Informatica 9.5 为Hadoop带来了Informatica 的可管理性优势,包括:
• 针对Hadoop的基于策略的数据归档,可降低存储以及法规遵循的成本,并且通过丰富的企业历史信息带来新的洞察力。
• 对开发、部署、监控及管理Hadoop和非Hadoop任务提供混合负载支持,建立一个复合IT环境,该功能会在beta版本中出现。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
相关推荐
-
大数据分析:选对池塘钓大鱼
谈到大数据分析,毫无疑问,Hadoop是最受企业欢迎的数据分析平台。但Hadoop集群的安装、配置及运行,却有许多地方需要慎重考量。针对Hadoop所存在的这一系列问题,戴尔联合Cloudera推出了Dell Cloudera大数据解决方案。
-
Spark会成为大数据分析的新里程碑?
在年初于纽约举行的Spark Summit East大会上,Databrick成为了焦点所在,通过新发布的数据处理云服务,该公司力图将Spark与MapReduce及Hadoop系统划清界限。
-
你造吗?这才是大数据项目成功的七大秘密
大数据项目的成功有哪些法宝?又有哪些陷阱会导致大数据项目的失败?本文中的三位专家将对此进行详解。
-
CIO部署Hadoop前需要考虑哪些因素?
尽管Hadoop的标价有诱惑力,但它并不是所有大数据问题的最优技术方案。该技术还相对较新、不够完善,这意味着它必然会伴随相应的症结和问题。那么,CIO要如何确定在何时部署Hadoop框架呢?