[文章摘录] 云计算:系统实例与研究现状 (软件学报, 2009)
Time: 3 hours
陈康(清华大学),郑纬民.云计算:系统实例与研究现状.软件学报,2009,20(5):1337-1348
新鲜出炉的软件学报关于云计算的综述.
该文作者的单位是清华信息科学与技术国家实验室(筹).
国家实验室可比国家重点实验室要NB多了, 从数量上来看, 目前已经建成的国家实验室才4个, 包括
北京正负电子对撞机国家实验室(中国科学院高能物理研究所),
沈阳材料科学国家(联合)实验室(中国科学院金属研究所),
国家同步辐射实验室(中国科学技术大学)
兰州重离子加速器国家实验室(中国科学院兰州近代物理研究所);
2003年的时候又正式批准筹建5个国家实验室(包括这篇综述作者所在的实验室, 这么多年过去了后面还带着个"筹"字, 可见组建之难),;
2006年又确定筹建第二批10个国家实验室. 这样总共就19个.
从院校分布上来看, 中科院(9个), 中国科技大学(2个), 北京大学(1个), 清华大学(1个), 华中科技大学(1个)等, 详见中华人民共和国国家实验室列表
而国家重点实验室的数量截止2008年上半年则有220个之多. 从数量上对两者重要性可窥一斑.
本文是对云计算的一个基本的综述, 重点放在云计算的基础架构建设方面. 介绍了当前云计算的三个巨头(Google, IBM与Amazon)的云计算平台, 其实salesforce.com也是目前云计算领域非常重要的一家, 不清楚本文为什么甚至都没有提到. 作者还提到了当前云计算的研究方向与未来发展.
以下是论文摘录, 其中有些概念我也是初次接触, 细节并不清楚, 摘录在此做为了解, 仅此而已.
1. IBM技术白皮书(Cloud_computing_wp_final_8Oct.pdf)中对Cloud Computing的定义:
Cloud computing is a term used to describe both a platform and type of application.
A cloud computing platform dynamically provisions, configures, reconfigures, and deprovisions servers as needed. Servers in the cloud can be physical machines or virtual machines. Advanced clouds typically include other computing resources such as storage area networks (SANs), network equipment, firewall and other security devices.
(基础设施, 这部分是提供商所关心的)
Cloud computing also describes applications that are extended to be accessible through the Internet. These cloud applications use large data centers and powerful servers that host Web applications and Web services. Anyone with a suitable Internet connection and a standard browser can access a cloud application.
(建立在基础设施之上的云计算应用, 这部分是提供商和使用者都关心的)
2. 云计算实现使用的技术体现了以下3个方面特征
(1)硬件基础设施架构在大规模的廉价服务器集群之上.
(2) 应用程序与底层服务协作开发, 最大限度地利用了资源.
(ykt: 传统的应用程序开发通过分层对底下细节进行包装和抽象, 从而达到简化的目的; 此处作者提到了云计算中"应用程序与底层服务写作开发", 在提高效率的同时, 云计算中如何解决程序复杂度上升的问题?)
(3)通过多个廉价服务器之间的冗余, 使用软件获得高可用性.
2. Google云计算基础架构包括4个部分:
(1) Google File System分布式文件系统
(2) MapReduce编程模式
(3) 分布式的锁机制Chubby
(4)模型简化的大规模分布式数据库BigTable
3. IBM BlueCloud计算平台
IBM的”蓝云”计算平台是一套软, 硬件平台, 将Internet上使用的技术扩展到企业平台上, 使得数据中心使用类似于互联网的计算环境.
"蓝云"基于IBM Almaden研究中心的云基础架构, 采用了Xen和PowerVM虚拟化软件, Linux操作系统映像以及Hadoop软件(Google File System以及MapReduce的开源实现).
4. 作者认为目前针对云计算的学术研究主要有2个方向:
(1) 如何构建分布式平台的基础设施.
主要包括微软的Dryad框架, Amazon的Dynamo框架, 以及应用于Ask.com公司的Neptune框架
(2) 如何帮助开发人员在云计算的分布式平台上进行编程
包括Yahoo提出了MapReduceMerge框架(扩展了MapReduce), Stanford大学将MapReduce思想应用到多核处理器上, Wisconsin大学在Cell处理器上运行了基于MapReduce的应用程序.
另外不同于MapReduce编程方面, HP的Sinfonia则将注意力关注与分布式共享内存的使用.
5. 作者认为云计算未来主要有2个研究方向:
(1) 构建与应用程序紧密结合的大规模底层基础设施
(2) 通过构建新型的云计算应用程序, 在网络上提供更加丰富的用户体验.
陈康(清华大学),郑纬民.云计算:系统实例与研究现状.软件学报,2009,20(5):1337-1348
新鲜出炉的软件学报关于云计算的综述.
该文作者的单位是清华信息科学与技术国家实验室(筹).
国家实验室可比国家重点实验室要NB多了, 从数量上来看, 目前已经建成的国家实验室才4个, 包括
北京正负电子对撞机国家实验室(中国科学院高能物理研究所),
沈阳材料科学国家(联合)实验室(中国科学院金属研究所),
国家同步辐射实验室(中国科学技术大学)
兰州重离子加速器国家实验室(中国科学院兰州近代物理研究所);
2003年的时候又正式批准筹建5个国家实验室(包括这篇综述作者所在的实验室, 这么多年过去了后面还带着个"筹"字, 可见组建之难),;
2006年又确定筹建第二批10个国家实验室. 这样总共就19个.
从院校分布上来看, 中科院(9个), 中国科技大学(2个), 北京大学(1个), 清华大学(1个), 华中科技大学(1个)等, 详见中华人民共和国国家实验室列表
而国家重点实验室的数量截止2008年上半年则有220个之多. 从数量上对两者重要性可窥一斑.
本文是对云计算的一个基本的综述, 重点放在云计算的基础架构建设方面. 介绍了当前云计算的三个巨头(Google, IBM与Amazon)的云计算平台, 其实salesforce.com也是目前云计算领域非常重要的一家, 不清楚本文为什么甚至都没有提到. 作者还提到了当前云计算的研究方向与未来发展.
以下是论文摘录, 其中有些概念我也是初次接触, 细节并不清楚, 摘录在此做为了解, 仅此而已.
1. IBM技术白皮书(Cloud_computing_wp_final_8Oct.pdf)中对Cloud Computing的定义:
Cloud computing is a term used to describe both a platform and type of application.
A cloud computing platform dynamically provisions, configures, reconfigures, and deprovisions servers as needed. Servers in the cloud can be physical machines or virtual machines. Advanced clouds typically include other computing resources such as storage area networks (SANs), network equipment, firewall and other security devices.
(基础设施, 这部分是提供商所关心的)
Cloud computing also describes applications that are extended to be accessible through the Internet. These cloud applications use large data centers and powerful servers that host Web applications and Web services. Anyone with a suitable Internet connection and a standard browser can access a cloud application.
(建立在基础设施之上的云计算应用, 这部分是提供商和使用者都关心的)
2. 云计算实现使用的技术体现了以下3个方面特征
(1)硬件基础设施架构在大规模的廉价服务器集群之上.
(2) 应用程序与底层服务协作开发, 最大限度地利用了资源.
(ykt: 传统的应用程序开发通过分层对底下细节进行包装和抽象, 从而达到简化的目的; 此处作者提到了云计算中"应用程序与底层服务写作开发", 在提高效率的同时, 云计算中如何解决程序复杂度上升的问题?)
(3)通过多个廉价服务器之间的冗余, 使用软件获得高可用性.
2. Google云计算基础架构包括4个部分:
(1) Google File System分布式文件系统
(2) MapReduce编程模式
(3) 分布式的锁机制Chubby
(4)模型简化的大规模分布式数据库BigTable
3. IBM BlueCloud计算平台
IBM的”蓝云”计算平台是一套软, 硬件平台, 将Internet上使用的技术扩展到企业平台上, 使得数据中心使用类似于互联网的计算环境.
"蓝云"基于IBM Almaden研究中心的云基础架构, 采用了Xen和PowerVM虚拟化软件, Linux操作系统映像以及Hadoop软件(Google File System以及MapReduce的开源实现).
4. 作者认为目前针对云计算的学术研究主要有2个方向:
(1) 如何构建分布式平台的基础设施.
主要包括微软的Dryad框架, Amazon的Dynamo框架, 以及应用于Ask.com公司的Neptune框架
(2) 如何帮助开发人员在云计算的分布式平台上进行编程
包括Yahoo提出了MapReduceMerge框架(扩展了MapReduce), Stanford大学将MapReduce思想应用到多核处理器上, Wisconsin大学在Cell处理器上运行了基于MapReduce的应用程序.
另外不同于MapReduce编程方面, HP的Sinfonia则将注意力关注与分布式共享内存的使用.
5. 作者认为云计算未来主要有2个研究方向:
(1) 构建与应用程序紧密结合的大规模底层基础设施
(2) 通过构建新型的云计算应用程序, 在网络上提供更加丰富的用户体验.