如何更好地进行数据管理

日期: 2008-11-19 作者:贾晋玲 来源:TechTarget中国

数据对于一个企业或者政府机构来说其重要性是不言而喻的。从根本意义上来说,数据就是政府、机构和企业的信息资产。伴随业务的高速增长,数据也在急剧增长。是否能够有效地保存、索取、保护好这些信息资产,能够随时根据业务的需要获得数据,越来越成为业务稳定和发展的关键因素。一旦数据损坏或丢失,业务系统就必须停止,等待数据恢复正确状态才能够继续运行。所以,数据的保护和管理问题与业务连续性,也就是业务的连续运行能力是直接相关的。中国人口发展研究中心是国内从事收集、整理人口数据信息的机构,每天都要处理许多数据信息。那么面对庞大的数据资源,他们是如何进行管理的呢?为此,TechTarget中国采访了中国人口发展研究中心的信息总监冯方回先生。

  TechTarget:对人口发展进行研究,需要基于一定的数据基础。能否介绍一下中国人口发展研究中心在数据方面的工作?

  冯方回:中国人口发展研究中心是在上个世纪80年代成立的,名字最初是中国人口情报中心,后来改为中国人口资料中心,到最后改成现在的这个中国人口发展研究中心。该中心创建的初始目的就是收集资料,整理数据,从事人口与发展信息收集、整理、分析和服务工作。

  TechTarget:随着人口数据与日俱增,对数据管理压力越来越大,中国人口发展研究中心是如何利用IT技术解决这样的压力?

  冯方回:可以说,我们的业务每天都在围绕着数据进行。上个世纪80年代的时候,主要是利用图书馆收集关于人口方面的杂志和书籍资料,中西文都有,资料非常全面。随着信息技术的发展以及业务范围的扩大,单纯的图书馆已不能满足信息长久保存、快速查询的需求。后来,我们就建立了一个图书检索系统,对大量的图书、杂志进行归类管理,通过检索系统能够快速地找到所要的信息。

  随着数据量越来越大,许多数据已经不是纸质的了,电子“资料”和数据越来越多,因此基于图书馆的资料检索系统已不能满足我们管理数据和提供数据的要求,更不能满足广大人口学家和计划生育工作者对各种数据使用的需求。上个世纪90年代,国家在中国人口发展研究中心建立了国家人口计划生育委员会信息基地。用信息化手段来对数据进行采集、整理和存储,其中包括数据用户服务(DUS)项目的实施。这个项目主要是建立一个统一的数据管理平台,把中国所有的人口数据采集到这个平台之中。我们会提供数据清单,您可以通过多种途径多种方法进入平台,便于搜索、使用、共享数据信息。在这个项目中,我们有专门的手工录入员,每天都会对数据进行更新和维护。而且,我们也会在对数据整理分类后定期出版一些数据集。例如,婚姻数据集、常用人口数据集等等。最后,我们还要请专家对数据进行分析和评论。

  TechTarget:中国人口发展研究中心在日常的工作中是如何对数据进行管理的?如何正确地选择数据存储产品?

  冯方回:目前,我们有很多专门存放数据的服务器,这些服务器由专门的人员来保管,而且这些服务器是不联网的。前一段时间,我们购买了一批IBM小型机,并与IBM公司合作共同解决数据存储问题。随着业务的发展,我们会不断地调整存储策略来适应业务的需要。现在,我们的数据量还不是很大,所以对于一些高效的数据存储软硬件设施,我们还没有必要引入,随着数据量的日益增大,我们会考虑选择一些高效的先进的存储软硬件。

    我们做数据管理规划时要有前瞻性,根据自身情况选择工具,要在自身状况及存储工具的选择之间做好平衡。不要一味地认为那些昂贵的、最先进的就是最适合自己的,就要全部引进。也不要在一方面做得比较好,在其他方面有所忽视。要结合自身的实际情况选择最适合的,钱要花在刀刃上,还要在数据管理的各个方面做到综合的平衡。当然这些产品的选择也要配合业务的需求,信息技术人员要对业务非常熟悉,同时也要与业务部门做好沟通。

  TechTarget:随着信息技术的发展和网络的进一步普及,众多新型病毒和黑客攻击等安全隐患的威胁已经对数据安全造成了巨大影响。中国人口发展研究中心是如何保障数据的安全?

  冯方回:在数据管理方面,我认为数据的安全管理是最重要的,我们要防止黑客破坏,要确保数据完整,没有丢失。首先,要做好数据备份工作,我们将数据放在多台服务器上,并在许多不同的地方实施备份。其次,对于那些登录到网站查找数据的使用者来说,我们有专门的身份认证系统,严格管理数据使用。此外,还通过防火请、IDS系统、桌面管理、专用安全通道等非常严密的系统全面地防护数据安全。在数据安全管理方面,我们要做到所有的城墙都是牢固的,不要顾此失彼,不要留下漏洞。随着数据的不断变大,我们还会考虑更为安全的备份策略。

  TechTarget:技术在不断创新中,您对这几年大家讨论的重复数据删除技术、虚拟化技术有什么看法?中国人口发展研究中心是否考虑加以运用,还是有待进一步研究?

  冯方回:重复数据删除技术、虚拟化技术等能给数据存储带来很多好处,例如,可以节省存储空间,减少服务器的数量,减少电源耗费,绿化数据中心的建设,同时,也减少了系统崩溃的风险。但是,在使用这些新的技术之前,我们必须结合自己的实际情况,需要考虑投入产出问题,计算一下使用这些技术所带来的成本是否大于购入及维护的成本,然后再决定目前适不适合使用。我们会不断地关注这些新技术的发展,也会将这些技术与自己的实力状况结合起来,当我们的数据积累到一定程度时,我们会考虑使用这些技术。

  TechTarget:2008年,中国人口发展研究中心在数据管理方面都有哪些新的举措?2009年将至,您认为,数据管理将在哪些方面还有待于改善?

  冯方回:目前,我们正在实施“人口宏观管理与决策信息系统(PADIS)项目”,这是一个国家发改委批准的国家级项目。该项目在06年年底通过可行性报告,在07-08年两年时间内完成一期建设。一期建设包括建立涵盖全国各地区部分人口,特别是育龄妇女人口数据的中央数据库,将全部数据资源集中到中央数据库中,并对其实施动态更新,保持数据最新,而且完整。初步完成全国各个业务系统的建立和改造工作。一期建设已经将数据存储的基本架构都搭建完备,在二期建设中,我们要扩大一期工程到全国,涵盖全员数据,将各个信息系统进行完善。这个项目如果通过验收,其他部门都会效仿。PADIS项目的启动,将对建设全国人口信息化、科学化、系统化、现代化管理系统发挥重要作用。这对于我们人口发展研究中心来说是一次挑战,会使人口与计划生育工作信息化水平迈向一个新的台阶。

  此外,我们还要加强数据仓库的建设。决策信息系统就是将各种决策信息技术放在一起,进行决策支持,便于进一步进行数据挖掘、数据分析等工作。2009年,我们将会不断地加强数据的备份、灾难恢复等工作,确保数据的安全和完整。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐