IT治理能力带动宾州大学医学院大数据挖掘

日期: 2013-12-01 作者:Linda Tucci翻译:赵瑞 来源:TechTarget中国 英文

IT治理能力如今似乎特别的供不应求。对宾大医学院IT领导者Michael Restuccia和Brian Wells也是如此。他们把宾夕法尼亚大学医学中心带入了大数据挖掘和高性能计算的轨道。他们认为,这在很大程度上收效于一个不同寻常并且自上而下的治理结构。接下来我们可以进一步了解关于该CIO团队通过有效治理收获的突破性工作和大数据优势。

  几周后,宾夕法尼亚大学医学院首席信息官Michael Restuccia和卫生技术和学术运算助理副总裁Brian Wells,将使来自被称为PennOmics的倡议组织的第一个数据量达到TB级别的数据库成为现实。作为全国范围内极少数的此类数据库, PennOmics研究数据库结合了从医疗中心临床试验管理系统得来的病人护理信息和研究实验室的癌症基因组学数据。随着感恩节的到来,研究人员将能够在自己的实验室通过互联网连接来访问数据。他们将能够就数据进行提问,假设测试,并希望能够探索到新的筹资机会—包括与业界合作伙伴的临床试验,或者获得更多的联邦补助金。

  “这是一个非同寻常的举措,”Wells说。没有多少学术医疗机构有临床系统和足够的研究分量来推出一个这种规模的数据项目。宾夕法尼亚州卫生系统大学在东南宾夕法尼亚州和新泽西州南部的部分地区拥有四家医院, 2000多名医生和6,000名临床医生。成立于1765年的全国第一所医学院-佩雷尔曼医学学校,拥有1,000名教师和800名学生。 PennOmics却有一些不以规模而论的东西,Restuccia和Wells解释说。

  宾夕法尼亚大学的医学院和医疗系统均向同一个实体负责,医学院长办公室。在实验室进行的研究会被集成到病人的护理中——这是宾夕法尼亚大学医学院提供 “精准医疗”的承诺, Restuccia说。这个任务的背后,是被称为高级IT治理委员会的一个强大集团。该委员会每月至少会面一次来讨论技术要求,计划,项目现状,挑战和目标等。

  “最高管理层由医学院和卫生系统的领导者构成,”和Wells一起作为该领导层必然成员的Restuccia说。 “有十二个人进行概览和监督,并向我及Brian和其他人指明我们需要行动的明确方向。 ”

  所以,因为PennOmics项目, 在Restuccia和Wells从整个宾州系统搜出半打不相关遗传学数据之前;在Wells一个一个实验室向心脏科,肿瘤科,神经科医师们和其他专家推销分享数据的价值之前;在与甲骨文公司合作来微调厂商的基因数据模型之前;实际上,在他们购买甲骨文转化研究中心的硬件和软件套件之前,这两位IT领导者很大程度上依靠该委员会的“集成领导方法”。

  一个摆在PennOmics倡议组织面前的紧迫问题是,例如,到底是购买还是建造研究数据仓库的软件。委员会认为该项目是对宾州医学使命至关重要的,所以做了购买的决定。从合同谈判到实施花了九个月时间,Wells说,相对于采取内部开发系统可能需要的多年时间。

  治理委员会的介入也从该项目的其他方面证明了其重要性。PennOmics数据库的一个创新是,它就会从不同的来源获取数据。大约三分之二的数据来自现有的IT团队已经维护了六年的病人护理数据库。其它数据来自IT知之甚少的环境- Penn研究实验室的分散化世界,其中的数据往往是杂乱无章的,而其接入途径相对协作来说更为“自我”。 “他们有很多善于收集信息和存储信息的系统,但却没有方法来共享信息,并链接回卫生系统的数据库,”Wells说。

  Restuccia说Wells加快研究系统和文化速度的能力非比寻常,对滨州医学来说是一个“巨大的区别”。但是,一个背负如此多希望的项目,不单单需要快速的学习。

  “它需要治理的原因是因为我们从卫生系统和研究方面都要获取数据, ” Restuccia说。 “我们必须获得领导者的资源来创建它,以及贡献数据和支持整个决策。 ”

  非但没有成为IT的拖累,治理不仅带给了宾夕法尼亚大学医学院大数据的优势,据该CIO团队说,而且也造就了一个更有效的IT组织。“IT能够更迅速地能够定义我们的方向,更有效地利用我们有限的美元,我们在制定决策中不是排外而是更具包容性,” Restuccia说。 “浪费的时间减少了。团队让我们专注于最重要的事情。”

集中化方法来进行高性能计算

  事实上,这种关系是双向的。 Restuccia和Wells已经建立起的与医疗保健系统和医学院的信任关系,使IT挑战极限变成了可能。

  典型的例子是与另一个备受瞩目的举措密切相关的PennOmics研究数据仓库:宾夕法尼亚大学医学院高性能计算集群(HPCC)。集成到PennOmics倡议组织的癌症基因组学数据很大 – 每名患者的基因组大约一兆位元组。 “如果你在临床试验中有400名患者而且你在给他们每个人测序- 好吧,管理400 TB的数据对于我们来说是很陌生的,” Restuccia说。也不是由放在研究者实验室工作台下的普通电脑就能够轻易管理的那么大小的数据。瓶颈促进IT推动了利用医疗中心数百名研究人员运行他们算法而实现的校园集中高性能计算中心。 (参见边栏上的新HPCC能力。 )

  该计算集群在2012年春天被购买并于2013年1月投入运营。“我们能够为客户更快的提供解决方案,而且比他们自己去做更为经济,这是一个人们得到共同利益的实例, ”Wells说。

  集中式方法还有助于保护包含在数据中的敏感的病人的健康信息( PHI )。大部分的处理在防火墙的后面进行。研究人员有一个“云溢出方案”用来向外扩展,“但我们不允许任何可识别的PHI上传到云上,”Wells说。让云服务供应商签订的服务水平协议,以满足宾州医学严格安全要求,以保护此类型数据的艰巨的工作正在进行中。“我们还没有完成,”他说。

  最低层面上说,最大的挑战是从顺序分析仪传输遗传学结果数据到HPCC并进入大型研究数据库。 “你能获取的从你办公室墙壁(或任何你的顺序分析仪在的地方)到数据中心的速度是每秒1千兆。这意味着它需要大约三个小时来传输一个TB的数据,这可是挺长的时间,”Wells说。IT部门正在与网络供应商联系以获取10甚至40千兆网络带宽,以及一次可装入多达10至30 TB数据的便携式分析存储阵列。

  该项目再次展现了IT领导治理委员会的价值,不仅由于集中高性能计算集群在整个企业获得共识,而且把他们的专业领域知识带入IT项目。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者

Linda Tucci
Linda Tucci

Executive Editor Linda Tucci oversees news and e-zine projects for SearchCIO.com and SearchCIO-Midmarket.com. She has covered CIO strategy since joining TechTarget in 2005, focusing most recently on big data, mobile computing and social media. She also writes frequently about the CIO role and CIO careers for SearchCIO.com's weekly CIO Matters column. Prior to joining TechTarget she was a business columnist for the St. Louis Post-Dispatch. Her freelance work has appeared in The Boston Globe and T

翻译

赵瑞
赵瑞

相关推荐