[编者按]云计算是目前被广泛讨论的互联网热点,各大IT巨擘都推出了自己的云计算产品。本讲座将分3期对云计算技术进行讨论:第一讲从云计算服务的使用者角度简单叙述云计算的由来、基本特点以及当前的典型应用;第二、三讲从技术角度探讨云内部的具体内容,分析云计算的组成、体系结构、计算模型,比较云计算与其他分布式计算技术的区别,探讨云计算的成功案例、云计算商业模式、相关的经济技术问题、云计算发展趋势等。
虽然IT业界对云计算趋之若鹜,却鲜有人能给出云计算的真正含义。多数普通百姓、甚至专业人士也不是很清楚到底什么是云计算。人们最常见的感受就如同流行歌曲里唱的雾里看花,看不清云(Cloud)到底是什么样子,也不知道云计算能做什么。
1 什么是云计算
云计算是一种IT世界基础设施的变迁,但是如何准确的定义它呢?事实上,很难用一句话说清楚到底什么才是真正的云计算。2009年1月24日,Jeremy Geelan在云计算杂志上发表一篇文章,题目就是“21位专家定义云计算”,其结果是21位专家给出了21种定义。
到底什么是云计算?从维基百科上几乎可以查到你所需要的一切。维基百科对云计算的解释是:云计算,是一种互联网上的资源利用新方式,可为大众用户依托互联网上异构、自治的服务进行按需即取的计算。由于资源是在互联网上,而在计算机流程图中,互联网常以一个云状图案来表示,因此可以形象地类比为云计算,“云”同时也是对底层基础设施的一种抽象概念。
再看看学院派的学者们是如何定义的?下面是伯克利大学的定义:云计算包含互联网上的应用服务及在数据中心提供这些服务的软硬件设施。互联网上的应用服务一直被称作软件即服务(SaaS),所以我们使用这个术语。而数据中心的软硬件设施就是我们称作的“云”。
看了这两个定义后,我们对云计算有了大概的了解。其实云计算到底是什么,还取决于人们所关注的兴趣点。不同的人群看待云计算会有不同的视图和理解。我们可以把人群分为3类:
本文将分为3讲,从这3类人群的角度来叙述什么是云计算。本期主要侧重云计算的用户视图,即用户看到的云计算到底是什么样子的,它能给我们带来什么?那么什么是云计算的问题就可以由用户根据自己的理解来加以定义了。
从用户的角度来看,云计算可以用图来形象地表达,如图1所示。
从图1看来,云非常简单。一切的一切都在云里边,它可以为你提供云计算、云存储以及各类应用服务。作为云计算的使用者,你不用关心云里边到底是什么、云里的CPU是什么型号的、硬盘的容量是多少、服务器在哪里、计算机是怎么连接的、应用软件是谁开发的等等问题。你需要关心的就是随时随地可以接入、有无限的存储可供使用、有无限的计算能力为你提供安全可靠的服务,而你只需要按实际使用情况计量付费。
云计算最典型的应用就是基于Internet的各类业务。云计算成功案例包括:Google的搜索、在线文档GoogleDocs、基于Web的电子邮件系统Gmail;微软的MSN、Hotmail和最新推出的必应(Bing)搜索;Amazon的弹性计算云(EC2)和简单存储服务(S3)业务等等。
2 为什么需要云计算
为什么会有云计算,或者说为什么需要云计算呢?这得从头说起。
1946年第一台电子计算机ENIAC问世,研制该计算机的主要目的是用来计算弹道导弹轨迹。那时候的计算机非常昂贵,不仅速度慢而且还很笨重,普通人根本不法使用,也使用不起。有传言IBM总裁在1950年代曾预言全世界只需要5台计算机。但是随着技术的发展,尤其是PC机的诞生,计算机逐渐进入各行各业甚至寻常百姓家中。与此同时,计算机科学家试图把不同地方的计算机连接在一起,使得计算机之间能够通信以实现资源共享。这就是现在Internet的前身ARPAnet。
云计算的概念可以追溯到1961年,当时计算机科学的奠基人John McCarthy就指出:计算机的分时技术使得将来的计算能力甚至特定的应用程序有可能按公共服务的商业模式来销售,就像自来水和电力一样。这个概念在现在看来就是云计算。
计算机科学家试图用网络连接的计算机来共同完成一些更为复杂的计算任务,即用分布系统来求解计算问题,其中问题被分解成许多小的任务由不同的计算机来完成。这就是所谓的分布式计算。
分布式计算其实是一种泛泛的说法,与之相关的技术词汇还有:
这些分布式计算技术是随着各类科学工程问题、企业应用问题对计算机功能、性能的要求越来越高而逐步发展演化的结果。简单地说,云计算就是最新的一种分布式计算技术,人们的终极目标就是网络就是计算机,可以像使用PC机一样方便地使用整个互联网构成的真正的超级计算能力。
3 云计算与网格计算
类似于云计算,网格计算是几年前最热门的IT词汇。如果读者对网格计算和云计算有一定了解,那就会知道它们的愿景都提到将来能像使用电力或自来水一样使用网格或云的计算能力。时至今日,有人认为网格计算已经过时,云计算是一种“革命性的计算模型”;也有人认为云计算是新瓶装旧酒;还有一种说法是下层是网格计算基础设施,上层是云计算服务平台。那么云计算和网格计算是否有什么关系或区别呢?
网格计算是一个很理想的概念。它的出发点是依托专网或互联网,将部分处于不同地域的自愿参加的计算机组织起来,统一调度,利用闲散的计算资源,组成一台虚拟的超级计算机,形成超级计算能力。
网格计算在科学计算领域有一些成功的应用,欧洲粒子研究中心(CERN)的数据网格就是一个成功案例(读者熟知的WWW就是CERN的Tim Berners-Lee创造发明的,其原动力就是要解决如何在相关的科研资料之间架起一座桥梁以方便研究人员获取所需要的信息)。网格在CERN的应用EGEE是为了解决目前世界上最大功率的粒子加速器大型强子对撞机(LHC)所产生的海量数据的处理。LHC探测器提供的数据流大约是300 Gbit/s,经过滤后有效原始数据约为300 Mbit/s,LHC每年的数据量大约在10~15 Pbit,足以刻录约170万张双层DVD光盘。这是真正的海量数据,平常我们计算中碰到的所谓海量数据和它相比只能算是九牛一毛而已。由于数据量的巨大,LHC所产生的数据的收集、存储、分发等等必须采用网格计算技术来实现。
云计算也是在先前发展起来的技术基础上提出的,广大用户依托互联网某些节点强大的信息资源,包括存储资源、计算资源、软件资源、数据资源、管理资源为我所用,不对用户集中控制,用户不关心服务者在什么地方。
比较一下网格计算和云计算,很难说云计算和网格计算有什么本质的区别,它们的目标都是以互联网为中心,提供安全、快速、便捷的数据存储和网络计算服务。相形之下,网格计算更强调资源共享,强调将工作量转移到远程的可用计算资源上。任何人都可以作为请求者使用其他节点的资源,任何人都需要贡献一定资源给其他节点。而云计算则强调专有,任何人都可以获取自己的专有资源,这些资源是由少数团体提供的,用户不需要贡献自己的资源。网格计算完成特定的任务,云计算则完成多样化服务。
此外,云计算更强调其运行的商业模式,即用多少付多少费用。表现为需求驱动、用户主导、按需服务、即用即付、用完即散。如果一定要说哪项技术是云计算专有的,那就是Google提出的支持其互联网搜索业务的云计算三大法宝:GFS、MapReduce和BigTable了。
4 云计算特点
云究竟能为我们带来什么样的好处呢?
现今科技发展不再以技术为驱动,而更多是需求驱动了。一种新技术要能吸引人们来使用就必须具备吸引人的特点。虽然云计算的专家们指出了许多云计算所具有的特点,但是作为用户所关注的特点主要有以下几点:
(1)降低资本投资。随着企业的业务创新发展,赖以支持企业业务的计算任务也越来越复杂。为此,企业的传统做法是投资购买最先进的计算设施以支持企业应用。但是这种贵重设备的利用率通常都很低,也造成了大量投资的浪费。而采用云计算方式,则企业不必进行大量先期设备投资,只是在需要时将企业的计算任务提交到能够提供强大计算能力的云计算平台上或调用其上的云服务即可,从而可以节省企业投资。
(2)云服务商业模式。云平台是同时为大量用户提供各类计算服务的,每个用户只需要对云平台为自己的计算任务所作的计算支付费用,这就是所谓的pay-per-use商业模式。就像大家使用电力一样,用户用多少度电就支付多少度电的电费。这就降低了企业使用云的门槛,同时大大降低了其计算成本。
(3)强大的计算和存储能力。聚集了互联网上成百上千万台计算机的云自然可以提供超强的计算能力和无限的存储空间。还有许多云计算服务提供者开发的各类互联网应用,你可以在云中选择云计算服务商为你提供更专业的企业计算服务。
(4)安全可靠。相信多数读者都有过数据丢失的体验。若某人的笔记本电脑不幸丢失或被盗,比起电脑本身,当事人往往更关注电脑中的数据丢失问题,这就说明了数据具有更高的价值。如果把数据存放到云平台上,由最先进的数据中心帮助保存数据,由专业的团队帮助管理信息,同时,严格的权限管理策略帮助用户放心地与指定的人共享数据,数据就会更安全可靠些。为什么要把最敏感的数据交给别人管理?究竟是把资料存在自己的电脑上安全还是放在云上安全?这是一个复杂的问题。然而,大家可以想象一下,把钱放在有严格安全制度的银行安全还是放在枕头底下更安全呢?
因此,云计算能带给用户最大的好处应该在于它能提供灵活、个性化、多样化、简单的应用和服务。有了云计算,广大用户不再需要不断自购或升级软硬件;对大量中小企业,无需一开始就花费大量的投资来购买部署计算机软硬件设备、建设机房和聘用维护人员,不必因为高估自身业务受欢迎的程度,而过度部署造成资源浪费,也不会再因对广受欢迎的业务部署不足而痛失潜在的客户。
5 云计算在业界的典型应用
网格计算的发展可以用“学术界热,企业界不热”来形容,而云计算则在企业界大热。自从2006年Google CEO埃里克·施密特(Eric Schmidt)首次提出云计算一词以来,业界迅速卷入云端,各大IT巨头纷纷宣布了自己的云计算计划,竞相标榜自己的云计算服务。IT大公司如此一致的行动在IT产业的历史上很难得一见。
5.1 Google
Google是云计算的始作俑者,也是最大的赢家。Google为了建立其搜索领域的老大地位,其搜索引擎分布在200多个地点、超过100万台服务器的支撑之上,且这些设施的数量还在迅猛增长。正是为了解决这些服务器群之间的通信和协作,Google才提出GFS、MapReduce和BigTable技术。这些技术使Google可以让几十万台甚至上百万台计算机一起形成“云”,组成强大的数据中心,因而被后人称为云计算三大法宝。Google中国前CEO李开复曾说过,Google真正的竞争力就在于拥有这些“云”,他们让Google有了无与伦比的存储和计算全球数据的能力。
基于Google的云计算基础设施,Google还提供了基于Web的传统办公软件服务,包括:Gmail、Google日历、Google Talk、Google Docs以及Google地球和地图应用。采用Google Docs,数据会保存在互联网上的某个位置,用户可以通过任何一个与互联网相连的系统方便地访问这些数据。目前,Google已经允许第3方在Google的云计算中通过Google App Engine运行大型并行应用程序。Google值得称颂的是它不保守,它早已以发表学术论文的形式公开了其云计算三大法宝,在高校和研究机构受到热捧,成为搭建云计算平台和云计算编程的工具。
5.2 IBM
IBM在2007年11月推出了“改变游戏规则”的“蓝云”计算平台,为客户带来即买即用的云计算平台。它包括一系列的自动化、自我管理和自我修复的虚拟化云计算软件,使来自全球的应用可以访问分布式的大型服务器池,使得数据中心在类似于互联网的环境下运行计算任务。
目前,IBM正在与17个欧洲组织合作开展云计算项目。欧盟提供了1.7亿欧元作为部分资金。该计划名为RESERVOIR,以“无障碍的资源和服务虚拟化”为口号。2008年8月,IBM宣布将投资约4亿美元用于其设在北卡罗来纳州和日本东京的云计算数据中心改造,并计划2009年在10个国家投资3亿美元建设13个云计算中心。
5.3 Amazon
Amazon两年前就进军新兴的云计算市场,为尝试进入该领域的企业开创了良好的开端。
Amazon网络服务(简称AWS)使得用户可以通过简单的Web服务接口,租用弹性计算云(EC2)的计算机来运行自己的程序,并使用简单存储服务(S3)无限的存储空间。Amazon计费模式主要包括:虚拟机按小时计费、数据传输按数据量计费。Amazon把云计算做成一个大生意只用了不到两年时间。现在,在Amazon上的注册开发人员达44万人,还有为数众多的企业级用户。有第三方统计机构提供的数据显示,Amazon与云计算相关的业务收入已达1亿美元。云计算是Amazon增长最快的业务之一。
5.4 Microsoft
微软于2008年10月推出了Windows Azure(蓝天)云计算操作系统,Azure服务平台是一个云应用平台,并提供一组服务:Live服务、Azure数据服务、NET服务、SharePoint服务和Dynamics CRM服务,以便在云上开发、管理和进行应用程序的托管。Azure的底层是微软全球基础服务系统,由遍布全球的数据中心构成。微软拥有全世界数以亿计的Windows用户桌面和浏览器,现在它将它们连接到“蓝天”上。
微软的在线服务云计算产品还包括:MSN、Hotmail、Bing和Product Service & Support。
5.5 Salesforce
Salesforce是软件即服务(SaaS)厂商的先驱,它提供的是可通过网络访问的自动化应用软件。在该公司的带动下,其他SaaS厂商已如雨后春笋般蓬勃而起。
Salesforce的下一目标是:平台即服务(PaaS)。Salesforce正在建造自己的网络应用软件平台Force.com,这一平台可作为其他企业构建自己的软件服务的基础。Force.com包括关系数据库、用户界面选项、企业逻辑以及一个名为Apex的集成开发环境。
5.6 Oracle
Oracle一直是推动企业网格应用的先驱之一,其产品包括真正的应用集群(RAC)、自动存储管理(ASM)和存储网格(Storage Grid)。
Oracle CEO拉里·埃里森(Larry Ellison)在2008年9月26日表示,“我们已经重新定义了云计算,它将囊括我们所做的一切。最近发布的一切新产品新服务都是云计算。”Oracle还和Amazon合作,基于AWS提供了下列产品和服务:
5.7 中国云计算进展
中国云计算的发展也非常迅猛。2008年11月25日,中国电子学会专门成立了云计算专家委员会,2009年5月22日,中国电子学会在北京中国大饭店隆重举办了第一届中国云计算大会。
2008年5月10日,IBM在中国无锡太湖新城科教产业园建立的中国第一个云计算中心投入运营。2008年6月24日,IBM在北京IBM中国创新中心成立了第二家中国的云计算中心——IBM大中华区云计算中心。
2008年12月30日,阿里巴巴集团旗下子公司阿里软件与江苏省南京市政府正式签订了2009年战略合作框架协议,于2009年初在南京建立国内首个电子商务云计算中心。
中国移动研究院云计算的探索起步较早,已经完成了云计算中心试验。中国移动董事长兼CEO王建宙认为云计算和互联网的移动化是未来发展方向。
中国企业创造的“云安全”概念,在国际云计算领域算是独树一帜。云安全通过互联网上大量客户端对软件的异常行为进行监测,获取木马、恶意程序的最新信息,发送到云安全端进行自动分析和处理,之后把相应的解决方案分发到每一个客户端。云安全的发展像一阵风,瑞星、趋势、卡巴斯基、MCAFEE、SYMANTEC等都推出了云安全解决方案。瑞星基于云安全策略开发的2009新品每天可拦截数百万次木马攻击。借助云安全,趋势科技每天阻断的病毒感染最高达1 000万次。 (待续)
收稿日期:2009-11-06