7.10发布会倒计时|掘金医疗大数据,如何四两拨千斤?
count down 2
客观的说,过去十年来在“新医改”政策和数字化技术的双重推动下,国内医疗行业的数字化转型取得了长足的进步,但随着数字化转型的不断深入,同样也对未来智慧医院的建设提出了更多的要求和挑战。
☞ 一方面,是随着数字化转型的提速,医院的数据正在不断变“大”。如果将医疗大数据比喻为一座冰山的话,那么露出水面的仅仅只是“冰山一角”,大量隐藏在水面之下的还有众多的非结构化数据,如影像、心电、监护、基因分析、病毒检测等等。因此,如何存储和管理这些数据成为了新的难题。
☞ 另一方面,今年突如其来的疫情,更进一步突显了大数据在疫情防控中的重要性。而利用大数据分析技术,进行创新性研究开发利用,服务于疫情防控、临床救治和科研攻关,支撑基于数据的科学决策已是“迫在眉睫”。
那么,在后疫情时代 对于医院而言 未来如何更好的完成医疗大数据的 “存、取、管、用” 实现医疗大数据的掘金 并寻找到一条
众所周知,如果按照国际统一医疗系统信息化水平划分,医院的信息化发展普遍经历三个阶段:
即以收费为中心,以人财物资源调配管理等为主的医院管理信息化(HIS)阶段;以患者为中心,以医生临床诊疗行为为导向,借助多种应用整合患者临床数据,并实现全院级别的诊疗信息与管理信息集成的医院临床医疗管理信息化(CIS)阶段;通过运用信息技术把社会医疗资源和服务整合为一体,从而实现区域医疗卫生服务(GMIS)阶段。
而经过十年来“新医改”的推进,目前国内医疗信息化正处在第二和第三阶段相互并存的阶段,即二级和三乙/丙医院的重点是临床系统建设,而三甲医院重点是医疗协同建设。换句话说,目前国内的医疗信息化正在从基础信息化阶段向医疗大数据应用创新,以及数据互联互通快速迈进的关键时期。
在此过程中,医院的数字化建设,特别是医疗大数据的应用方面还存在和面临着诸多挑战,可以从几个维度来做观察:
医院的“数据孤岛”现象 依然大量存在1
过去几年智慧医院建设中最为明确的目标,就是确定了“以人为本,以患者为核心”,而要实现这个目标的落地其实需要依靠大量的数据作为关键基础。但是在推进过程中,可以发现仍然有不少的医院还存在着“数据孤岛”的现象。
特别是近几年人工智能的应用,不少是各个医院科室和相关服务商一起来展开的,而这些应用数据由于各种原因导致没有进入到医院的统一数据平台之中。因此,建设医院大数据平台,打造全院级的“数据湖”,并在此基础上加速数据转化为资产,转化为生产力的速度,由此推动智慧医院的落地至关重要。
医院上云给数据的管理 提出了新要求2
今年突如其来的疫情也成为了医院上云的“催化剂”。例如,疫情发生后,各地定点医疗机构线下门诊压力剧增,患者不断增加,需要通过互联网医院的新模式来提供服务;此外,临时增加的数据中心资源扩充,也需要以更加灵活、快捷的方式来提供,这些都让医院上云成为大势所趋。
由此带来的一个新挑战则是,医院上云之后,其应用数据的部署范围也从传统数据中心扩展至混合多云模式,因此应用和数据的复杂性和多样性随之快速上升,这让医院大数据管理变得更加困难。
现有的存储基础设施 不能有效支撑起医院的科研攻关3
如今,包括人工智能在内的新技术在医疗行业应用已越来越深,特别是那些研究型的医院,往往会有十几个科研团队同时在做基因测序、AI、深度学习相关的项目,而传统的存储基础设施已难以满足这样的需求。
以基因相关的科研项目为例,基因测序仪一天能完成20个人左右的全基因测序,数据量在6TB左右。但医院的科学家用移动硬盘将这些数据拷贝到基因数据分析平台需要2-3天的时间,同时做科研至少需要1000人以上的基因样本,这就意味着光拷贝1000人的基因数据最少也需要100天,而对科学家来说,花超过100天的时间用于数据的准备是完全不可接受的。
而这仅仅是数据的采集阶段,要让基因测序数据产生价值,还需要进一步做好准备、训练和推理的其他环节,可以说每一个环节都存在着大量的挑战,这也让基因测序的数据管理和价值挖掘变得愈加复杂和困难。
更要命的是,如今很多医院的PB级存储需求已成为通常的衡量单位,同时对存储性能的要求也越来越高,且数据还要保存30年以上,如此大的存储需求,数据又需要高度保密,给医院的传统的存储基础设施带来的挑战和压力是可以想象的。
由此可见,随着云计算、大数据、AI等新技术在医院的的快速发展,不仅会产生新的数据形态、新的部署环境、新的应用模式、新的价值需求,更让存储的重要性变得比以往更加明显,变革与创新俨然“刻不容缓”。
在此背景下,戴尔科技集团近期正式发布了Dell EMC PowerScale,它继承自Isilon的“衣钵”,可以理解为Isilon的全新升级版本。
PowerScale首次把戴尔科技强大的横向扩展文件系统OneFS和卓越的服务器平台PowerEdge有机结合起来,在高效地存储、管理、保护和分析非结构化数据的同时,也为各种应用程序和工作负载提供了强大的支持能力,对于医院的大数据管理乃至智慧医院建设真正起到了“四两拨千斤”的价值和作用。
PowerScale可以提供从最小7TB到多PB规模的存储能力,支持对数百万个文件进行操作;同时,智能的横向扩展群集可确保在添加节点时不会出现“热点”,这样可显著提升存储的效率,整个集群的存储利用率可超过80%。
不仅如此,PowerScale中的OneFS操作系统,通过单一命名空间、单一文件系统环境和企业级数据服务优势,医院客户可以通过提高效率和新的自动化功能获得易用性、灵活性和高性能,而这种易用性,不仅体现在最终用户使用的客户体验上,同时也体现在管理上的体验上。
例如,客户容量和性能的扩容可以在60秒之内通过简单增加节点而实现,更新换代也可以通过简单地切换下过时的老旧节点完成,而不需要考虑任何的数据迁移。
同时,通过大规模简化能力,PowerScale的成本也更低,一位管理员就可以管理PB级的存储。这种“伸缩自如、简捷如一”的能力实现了性能和成本之间的平衡,无疑可以成为医院大数据平台建设中的首选。
PowerScale同时支持高达8种协议的企业级非结构化数据服务,包括NFS、SMB、HDFS、S3、REST、HTTP、NDMP和FTP,同时可向任意客户端提供访问权限,并支持任意用户的需求。
具体来说,这种支持多协议访问同一数据的特性,既解决了不同用户的不同访问方式的需求,更为重要的是解决了数据在存储和使用中的一致性和完整性问题,比如源数据的存储访问,和大数据分析之间数据差异问题。
值得一提的是,全新引入的对S3协议的支持,以及基于PowerEdge的全闪存和NVMe节点的能力,还可以让PowerScale无论是在数据中心、边缘、核心还是云中,都能借助统一的OneFS操作系统,以相同的方式进行存储管理,可以说强大的“任意数据、任意位置”的能力,真正化解了医院在未来混合多云时代面临的数据管理复杂性、一致性的难题。
主要体现在PowerScale是一款可编程的基础架构,支持Kubernetes和OpenShift的集成,由此医院用户可以更好的完成应用现代化的重构,满足当下互联网医院建设的迫切需求。
在此基础上,全新增加的“DataIQ”功能还能够帮助用户发现、理解,并且更好地对已经拥有的数据采取行动和提取价值。通过提供快速搜索功能和统一文件系统视图(无论数据来自Isilon、PowerStore、ECS还是第三方存储和云存储),DataIQ都允许用户通过单一窗口来可视化所有非结构化数据,有效消除数据孤岛。
这种“海量数据、智能洞察”的独特优势,也让医院可以从大量的非结构化数据中获取最大价值,并将数据转化为洞察力,并为医院今后展开基因测序、AI、深度学习等相关的项目提供重要的支撑能力。
不难发现,PowerScale通过技术创新,在每一处细节上做到了突破,又将之融合,解决了医院用户在“云数智”等多个领域的“痛点”,并彻底释放了医疗大数据的价值。
毫无疑问,随着疫情防控的“常态化”,无疑会让医院催生出越来越多的新服务和新模式,更会对存储基础设施的可持续发展提出更高的需求,而这也让PowerScale为医疗行业客户创造更多价值提供了全新的机会。
第一,PowerScale的技术源自一线实践验证,实战锤炼证明其具备一流的可靠性、可用性。从全球数据看,目前全球已有超过6000家医疗提供商已部署OneFS;此外,全球还有超过400家生命科学组织已部署OneFS用于下一代测序(NGS)、高性能计算(HPC)等相关工作。
在中国市场,戴尔科技集团也帮助国内超过3000家医院进行了数字化转型,有效化解了来自结构化、半结构化、非结构化数据与流数据带来的挑战,可以说在医院数据湖乃至医疗大数据平台建设过程中发挥了重要的作用。
第二,PowerScale还始终以场景化创新解决方案作为突破点,在全院级PACS应用支持、医疗大数据平台建设、医疗数据湖建设、医疗影像云建设、IoT及视频监控应用、海量小文件存储管理管理方面都具备独特的优势,而这也为智慧医疗的落地打下了坚实的基础。
以全院级PACS应用支持为例,PowerScale单一文件系统可以有效简化海量数据管理;横向扩展架构满足全院级PACS应用性能需求;在线软硬件升级解决海量数据迁移和长期保存负担;数据自动分层满足数据生命周期管理要求,由此带来的好处体现在两个维度:
除此之外,PowerScale在医疗大数据分析和AI创新应用方面也能“大显身手”,特别是PowerScale能完美配合主流的Hadoop/Spark等大数据分析软件。
由于PowerScale支持原生HDFS,且在POC验证中性能出色,由此就可以让医院在原有数据的集合上就能立即展开AI深度学习这类应用,而无需任何数据的导出和迁移,也不需要额外的数据复制和容量开销,真正打破了AI应用中过去存储面临的种种瓶颈,使得医院也能够更好的释放数据的潜能。
第三,戴尔科技集团在医疗行业的丰富实践经验,又让它打造出了面向新一代医院数据中心基础设施,以及新一代应用交付的完整架构。
例如,在戴尔科技面向智慧医院数据中心的整体架构中,除基于PowerScale构建数据湖的全院级数据中心外,还可以基于分布式架构打造VMware云平台,以及提供数据安全的保护平台(如备份、恢复、归档、迁移与容灾安全),从而实现了针对医疗大数据的全生命周期管理,这对盘活医疗大数据这一最重要的核心资产显然会贡献出更高的价值。
从这个角度来说,全新的PowerScale不仅能够在医疗大数据平台建设中发挥出更加重要的作用,也可以在智慧医院的升级过程中成为关键的基石,在推动医院基础设施架构进化和迭代的同时,也一定可以书写出医院数字化转型的新篇章。