云端计算的基本技巧
对于到底什么是云计算,至少可以找到100种解释。目前广为接受的是中国云计算专家咨询委员会副主任、秘书长刘鹏教授给出的定义:“云计算是通过网络提供可伸缩的廉价的分布式计算能力。”
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式计算架构。它的特色在于对海量数据的挖掘,但它必须依托云计算的分布式处理、分布式数据库、云存储和虚拟化技术。
什么是云计算呢?
其实云端(cloud)就代表了互联网(Internet),通过网络的计算能力,取代使用你原本安装在自己电脑上的软件,或者是取代原本你把资料存在自己硬盘的动作,你转而通过网络来进行各种工作,并存放档案资料在网络,也就是庞大的虚拟空间上。我们通过所使用的网络服务,把资料存放在网络上的服务器中,并借由浏览器浏览这些服务的网页,使用上面的界面进行各种计算和工作。
猜猜看怎样?其实你已经在云端之中了
网络为基础的电子邮件服务像是Hotmail或Yahoo,可以说是云计算中最早的热门形式。如果你使用Facebook来与朋友互动,使用Flickr来存放照片,或者是用GOogle Gmail来发送邮件,你已经是在云端环境中存放自己的资料,同时使用云端为基础的技术,也就是新闻说的幕后神奇魔法。
云端冲浪(Cloud surfing)
就像是不论你在哪边都看得到天空,你可以在任何能够使用网络访问的地方,连接你需要的云计算服务,即便你不是在自己的电脑上
走进云端之中
上网本(netbook)的成功,以及移动网络(如可上网手机)的发迹,让云计算的普及性更高,人手一机是云计算很好的增长动力。上网本与手机通常被定义成较低性能的计算设备,也因此他们消耗较少的电力,同时具备相当程度的便携性。
一台上网本也许不能把肥大的Photoshop软件跑得很顺,或者是不能存储超大量的音乐文档。但感谢云计算之赐,上网本并不需要具备这些能力,它需要的只是一个浏览器,以及网络连接能力,这样就能够听大量的音乐,线上处理照片,或者是在云端上发送电子邮件给其他联络人。
所以,如果你需要的只是打一份文件,也许它同时需要包涵一些基本的格式处理,你并不需要微软Word软件的完整计算能力,你只需要上网登录Google Docs就可以做到类似的效果。
在云计算中,服务器并不会管你电脑的计算能量有多强。有的同事在办公室用PC连上Google Docs,在家则是用Apple MacBook,同时还有很多其他的服务可以通过你的手机或iPhone与Android平台手机上的应用软件来完成。
多人协同操作的云计算
你可以在任何一台电脑上登入使用云端服务,而一个朋友或同事也可以登入并和你一起在一样的文件上工作。Google Docs只是能够协同操作的一种办公室型态云计算服务。有些服务甚至还可以让人在全球不同的地点登入服务并同时在一样的文件上工作。
云计算也许听起来很棒,但是它还是有一些隐忧的,也是你在使用时必须要考虑的地方。正如同开放源代码阵营名人Richard Stallman指出的,你的资料是在第三方厂商的手上,而且是在你控制以外的。
在云端上安全吗?
最有可能遇到的问题是安全性,鲜少有公司会想窃取你的资料并做出无耻的网站设计,但最好还是研究一下各种网站和网络服务,找一些可信赖的专家推荐的,例如Lifehacker或是你谦卑的仆人科技疯人。
就算某个网站的服务声誉卓着又值得信赖,还是可能会出现技术性问题,今年稍Google Docs就因设备故障导致私人资料外泄,像在线音乐串流服务Spotify就有可能成为那些想窃取使用者资料的黑客的目标。
云端安全性
幸运的是,一点点常识和一些简单的正确电脑操作练习可以将这类安全性失误的影响降至最低,避免将你的机密资料放在云端上,如果你真的放了,例如利用网上银行时,避免在网咖、学校或图书馆内的公用电脑上进行,也别太随便给出自己真正的联络资料,避免每个帐号都使用同一个密码,就算只更改一个字母也好。
云计算特点
(1)超大规模。“云”具有相当的规模,Google云计算已经拥有100多万台服务器,Amazon、IBM、微软和Yahoo等公司的“云”均拥有几十万台服务器。“云”能赋予用户前所未有的计算能力。
(2)虚拟化。云计算支持用户在任意位置、使用各种终端获取服务。所请求的资源来自“云”,而不是固定的有形的实体。应用在“云”中某处运行,但实际上用户无需了解应用运行的具体位置,只需要一台笔记本或一个PDA,就可以通过网络服务来获取各种能力超强的服务。
(3)高可靠性。“云”使用了数据多副本容错、计算节点同构可互换等措施来保障服务的高可靠性,使用云计算比使用本地计算机更加可靠。
(4)通用性。云计算不针对特定的应用,在“云”的支撑下可以构造出千变万化的应用,同一片“云”可以同时支撑不同的应用运行。
(5)高可伸缩性。“云”的规模可以动态伸缩,满足应用和用户规模增长的需要。
(6)按需服务。“云”是一个庞大的资源池,用户按需购买,像自来水、电和煤气那样计费。
(7)极其廉价。“云”的特殊容错措施使得可以采用极其廉价的节点来构成云;“云”的自动化管理使数据中心管理成本大幅降低;“云”的公用性和通用性使资源的利用率大幅提升;“云”设施可以建在电力资源丰富的地区,从而大幅降低能源成本。因此“云”具有前所未有的性能价格比。因此,用户可以充分享受“云”的低成本优势,需要时,花费几百美元、一天时间就能完成以前需要数万美元、数月时间才能完成的数据处理任务。
云端失联
云计算第二个主要问题是可能暂时故障导致你无法使用某项服务,你可能把资料放在某个网站上而这个网站却因服务器故障导致某一段时间无法进入,Twitter就因偶发性挂点而恶名昭彰,每次它的网站挂掉时就会出现“掉落的鲸鱼”图案, 更糟的是,你有可能因此而遗失全部的资料。
云端消失
最糟、最糟的情况是,当你想搜索自己在云端上的资料时却发现“情空中万里无云”,如果你想野餐这当然是好事,但如果是这个为你保管资料的公司突然关门大吉,可就大事不妙了。
去年Linkup与博客平台JournalSpace就发生这样的事情。可能要选择真正的大公司才会比较安全,例如Google,不过英国北岩银行(Northern Rock)、Woolworths、瑞银集团(UBS)以及全冰岛人民的客户可能当初也是这么想的。
就算一家公司运营正常,还是可能会选择关闭某项服务,例如Google最近就宣布要关闭提供记事功能的Google Notebook服务,不过网络的适应性是很强的,提供类似服务的Evernote马上就接着发布一项可从Google将你的资料移植的工具。
云层过多
如果你还没有备份自己的资料,你真的应该开始备份了。如果你不信邪,用iTunes就好了,但如果你信邪而且开始备份这些资料,就一直备份下去吧...想想要把全部的CD都跑过一次要花上多少时间(如果你还保有它们的话),更别提那些你借来的CD或是已经购买的MP3。
想像一下明早你醒来时发现它们全部不见了,至少你还有音乐可以听,但如果遗失的是你的生日或婚礼或在瑞典穿着日本浴衣驾驶拖拉机的照片,那可能反而是件好事。
如果你想避免资料流失,结合实质的备份与线上服务提供的以云端为基础的备份是最起码的措施,当你的外部硬盘坏掉或你的房子烧毁时,云端那边的备份会派得上用场,而当在线服务的某个服务器坏掉或网站破产关闭时,你硬盘内的备份就有用了。
通过云端传送资料
不论你已经在云端上,每件事都在网络上做,或是你不信任云端,无法将你赖以为生的资料交给它们保管,都可留言分享你的看法。