微观云计算系列谈之一:基本概念

现在云计算是炙手可热的话题,也是在可预见的未来中的一个有着巨大发展空间的技术领域,国家对云计算投入重金进行开发,近期云计算的大型项目如下(引自 赛迪网):

    不过话又说回来,HIT企业应该是大部分精力关注于市场,小部分精力照顾到国家政策,企业经营更多的应该是靠自己对市场的把握,完全靠政府有点伴君如伴虎的意思。毕竟光伏产业的前车之鉴还历历在目,那边的企业伤不起啊。

    笔者从事于医疗信息化行业,因此特别说说云计算在医疗信息化行业中的应用。在此笔者提出微观云计算的概念。[袁永福版权所有]
   在说明微观云概念前,先扯一下人类研究自然世界的方法。

   目前人类研究自然世界是朝着两个方向发展,一个方向是仰望星空,进行超大尺度的宇宙天文学观测,比如星系、类星体、黑洞等等,空间计量单位都是亿光年,时间计量单位都是百万年甚至亿年。另外一个方向就是埋头试验,进行微观的基本粒子的研究,比如夸克,中微子等,空间计量单位都是10E-15米,时间计量单位达到千万分之一秒。人们发现,这两个方向钻研得越深,相互之间的关系就越大,微观的粒子能揭示出宇宙的本质。可谓草蛇灰线,伏脉千里。
 
   类似地,针对云计算,笔者认为,应该从微观角度研究云计算,即所谓微观云计算,也就是从细节入手研究云计算,这些细节也很可能反映出云计算的本质。此外,也希望抛砖引玉,让大家能从另外一个角度来研究云计算。
 
   从云计算这个名称很自然的联想到自然界中的云。自然界的云是水汽蒸发在高空中凝结成一个个微小的水滴,聚集在一起,这些小水滴反射阳光而呈现出一种白色。很显然,云的存在具有两个基本因素,广阔的天空和大量的水汽。[袁永福版权所有]
 
   和自然云的天空和水汽两个基本要素相对应,云计算也有两个基本要素,那就是数字空间和数据。这里的数字空间包括存储空间和计算能力空间,通俗地讲就是服务器。对于产生云计算的所需的数字空间,IT业界已经提供了不少,而且会越来越大。此时云计算更关注的就是数据,而这恰恰是目前云计算研究领域所没有引起足够重视的。
 
   中国国情是重硬轻软,云计算中心的服务器摆的整整齐齐的,但其中缺乏数据,这好比朗朗乾坤,万里无云,此时的云计算就只是“号称”而已。
 
   自然界的云,远看白白的一团,走近仔细分析一下其中的微观结构,可以看出它的本质。如果里面是微小的水汽,那就是真正的云,能降下雨水滋润万物;如果水汽中含有酸性成分,那落下的就是酸雨;如果里面是一个个尘埃而不是水汽,那就是雾霾。[袁永福版权所有]
 
   类似地,医疗行业的云计算中的数据,就是各种临床数据,包括HIS、EMR、LIS、PACS等各种临床信息系统产生的数据,其中最重要的就是电子病历文档。若服务器中没有电子病历文档,那就万里无云,若只有几份电子病历文档,还远远没有达到云计算所需的数量级。
 
   构成云计算的电子病历文档除了数量上的要求外,还具有质量的要求,主要有文档格式和信息质量方面的要求。组成云计算的电子病历文档格式必须采用开放格式,否则云计算就成为雾霾计算。云计算对开放文档格式的要求是有先例的。大家都知道,云计算概念最先是来自互联网搜索引擎行业的,这是为什么呢?原因是搜索引擎行业率先满足了云计算所需的空间和数据的要求。
 
   比如谷歌公司,在空间方面,它实现了几百万台廉价PC机集成在一起构造了一个超级计算空间,其能力足以支撑云计算。在数据方面,搜索引擎收集处理的是HTML文档,他们所收集的HTML文档数以亿计,由此达到文档数量的要求;而且HTML文档是开放格式,处理方便,由此达到对数据质量的要求。因此凡是组成云计算的数据必须采用开放格式。
 
   互联网企业把这些长期积累的技术打包上市,就演化为现在的云计算。[袁永福版权所有]
 
   因此医疗行业的云计算需要电子病历文档采用开放格式,而现实中很多电子病历系统生成的病历文档是封闭格式的。比如目前还有相当多的系统是基于MS Word进行二次开发的,生成的是DOC二进制文件;此外还有其他格式,比如OpenOffice的ODT格式,有些还加密了,故意不让别人解析。这些方式实现的电子病历文档,都不是开放格式,即使程序能解析,其效能也不是云计算环境下的有效文档。此时,即使文档数量上去了,也只是雾霾计算,压根不会掉一滴雨的。大量的信息,只能被封闭在文件当中,而不能被有效利用。
 
   因此,凡是使用封闭文件格式的云计算都是忽悠人的。立志为云计算做出实际工作的HIT厂家及甲方,就不能采用这些封闭格式,而应该全面转向XML格式。[袁永福版权所有]

   开放文件格式有很多种,比如HTML、纯文本等等,为啥一定要采用XML格式呢?笔者认为有以下原因。

  第一,XML的群众基础好。
  云计算的应用必定是跨平台的,而能为各种平台共同支持的文件格式中,XML是首选。
  XML已经成为最常用最基础的国际标准,不为少数人控制的,是真正代表了最广大IT业界的根本利益。脱离XML就是脱离群众,在多平台应用中会受到诸多不便。

  第二,XML得到各个IT巨头的支持。
  IT巨头,特别是数据库巨头比如微软、甲骨文、IBM等等都投入着巨大的资源在进行XML数据库的基础技术研究,虽然目前遇到技术瓶颈,但在业界强烈的需求下,相信这些技术会比较快的突破的。不久的将来,站在这些巨人的肩膀上,使得快速处理海量XML文件成为可能。
  反过来,若电子病历文档不是以XML格式存储,这些巨头们不大可能针对电子病历这个“小”领域而定制开发适合电子病历文档格式的数据存储和分析技术。脱离XML技术,电子病历行业也就无法利用巨头们在基础技术研究中获得的成果了。
  另外使用XML技术能很好的利用现有的搜索引擎技术。这是因为XML和HTML两者是非常接近的。下图表现了XML和HTML及其相关技术的发展历史。  [袁永福版权所有]

   XML技术渊源体系   可以看出HTML和XML是亲兄弟,共享了很多语法结构。此时搜索引擎技术稍微改进一下即可投入针对XML文档的搜索处理。

  第三点,XML能很好的支持电子病历系统业务需求。
  在笔者具体的实践中,采用XML技术能很好的描述电子病历文档信息,尚未遇到不能满足电子病历系统业务需求的情况,预计未来也不大可能遇到。
  另外,XML技术的向上向下兼容性支持也是其他文件格式所少见的,云计算中的电子病历文档难于做到完全的规范一致,此时XML的兼容性就能派上大用场。虽然XML格式比较冗余,文件比较大,但由于现在的硬件条件很好,它的光辉彻底的掩盖了它的弱点。因此XML成为云计算对文件格式的必然选择。

  医疗云计算对电子病历文档的要求还有信息质量的要求,这要求电子病历文档能比较客观的反应患者的病情和诊疗过程,也就是把病历质控工作做好。如果病历文档质量低劣,那文档就是酸性,组成的云计算就是酸性云计算,其功能也受到很大的限制,甚至其反作用。因此云计算不是万能的,还是需要运行过程中老老实实的做好病历管理,保证病历的质量。[袁永福版权所有]

  在此那些实践着云计算的读者可以问问自己,我做的到底是雾霾计算、还是酸性云计算还是真正的云计算。

  如此微观云计算,深入研究下去其内容还是很丰富的。欲知更多微观细节,请听下回分解。 本文最先发布在HIT专家网:http://www.hit180.com/原文地址:http://www.hit180.com/5881.html

【作者简介】
 
袁永福,微软MVP,十余年来关注于医疗信息化系统的UI层技术,并著有《从毕业生到程序员-使用C#开发商业软件》、《精通C#编程》两部书籍。现创立南京都昌信息科技有限公司(http://www.dcwriter.cn ),专业进行电子病历编辑器技术和电子病历文档技术的相关研究。

posted on 2013-06-20 14:33  袁永福 电子病历,医疗信息化  阅读(1587)  评论(2编辑  收藏  举报

导航