Spark和Ray,一个是开源于2010年,专为大规模数据处理而设计的快速通用的计算引擎,另一个则是开源于2018年,由加利福尼亚大学伯克利分校RISELab推出的新一代高性能分布式计算框架,两者都已成为开源领域备受关注的明星项目,而它们成长的背后都离不开一个核心人物,Ion Stoica。
图:Ion Stoica教授
加利福尼亚大学伯克利分校计算机科学与电气工程教授Ion Stoica在展望云计算的未来时,思考了该如何推动目前的差异化云计算平台逐渐发展成为一项公共服务,称其为“Sky Computing”,就像这个词汇的含义,Sky Computing是云平台之上的一层,目标是实现云之间的互操作性。
事实上,实现Sky Computing的障碍更多来自于经济层面,而不是技术层面,对等互惠则是实现SkyComputing的关键步骤。Stoica提出将其作为通用软件平台用于未来计算,并考虑技术趋势和市场力量如何在Sky Computing的实现中发挥关键作用。
商业化VS公共化,云计算平台壁垒高筑
互联网的出现迅速带来了全球范围内可以访问的多种服务,包括电子邮件、搜索、游戏以及在线零售和社交媒体等新服务的爆炸式增长。
为了应对由此带来的大规模数据和工作负载,服务商必须构建数据中心,并设计复杂的分布式系统。
但是,创建大规模的基础计算设施也需要付出高昂的代价,这大大阻碍了大多数公司进入互联网市场的脚步。
这种情况下,2006年亚马逊推出S3和EC2时发生了变化。
通过普及计算/存储访问,并且推广“即用即付”商业模式,亚马逊开启了云计算时代。
再加上摩尔定律的终结,重新推动了构建公用计算事业的设想。然而,商业趋势却将云计算推向了不同的方向。
在过去十几年中,云计算市场内出现了多个竞争对手,包括AWS、微软、谷歌、阿里以及其他云平台(IBM、甲骨文等)。
这种竞争导致价格越来越低,产品和服务种类不断增加,比如仅AWS一家就提供了近200种产品和服务。
这些服务中有许多是专有服务,每个云平台都有自己独特的用于管理集群的API、对象存储、数据仓库等,导致在某个云上开发的应用程序通常不能在不同的云上运行。
直到2021年,依然没有一个底层云平台拥有一套任何人都可以使用的开放标准,这离公用计算的愿景越来越远。
因此,现在主要的问题是,如何朝着云计算公共设施化这一目标前进?
“云计算公共设施化”愿景
20世纪60年代,人工智能之父约翰·麦卡锡提出了把计算能力作为一种像电话一样的公用事业提供给用户的理念,云计算由此起源。
麦卡锡的预测颇有先见之明,云计算最终应运而生,作为一种新兴的资源使用和交付模式逐渐为学界和产业界所认知。
然而,他在经济学方面的预测却与现实相去甚远。
如今,电话服务并没有成为一种公用设施,而是由互相竞争的云计算服务商提供。
同样,现在也没有单一的公用计算设施,云计算也是差异化商品。
并且,云计算市场已经离商品化越来越远,甚至演变成一系列彼此基本不兼容的专有平台,例如亚马逊网络服务(AWS)、微软Azure、谷歌云等。
当时,AWS刚刚成立几年,谷歌唯一的云产品是App Engine,微软的Azure尚未正式发布。
尽管云计算确实在2010年从根本上改变了IT行业以及应用程序的构建和部署方式,但也存在一个明显的问题,云计算并没有像互联网或网络那样成为一种公共设施。
直到2021年,全球都没有一个单一的底层云平台具有一套任何人都可以使用的开放标准。
因此,“云计算公共设施化”作为一种新的商业化版本,其创新性受到行业更多关注。
Sky Computing有望实现多云平台的互操作
尽管云计算和互联网在许多方面存在差异,但是互联网的公共设施化为云计算提供了有用的经验。
在Sky Computing模式下,有三个关键的设计使互联网能够为大量异构技术和竞争公司提供统一的接口。
- 第一个是掩盖技术差异的“兼容性”层。
- 第二种是“云间层”,它将互联网粘合在一起,使其对用户来说是一个网络。
- 第三个是一组经济协议,称之为“对等层”,允许相互竞争的网络合作创建一个统一的网络。
兼容层将使应用程序开发人员能够轻松地选择他们的应用程序,并将其AWS迁移到Google Cloud。
简而言之,兼容层是一组可以构建应用程序的接口或 API,然后可以通过云平台的一组接口将该兼容性层移植到每个云。
该层可以类比于互联网中的IP层,然而与之不同的是,云兼容层更像一个操作系统,可以管理计算机资源并向应用程序提供API。
通过云间层,用户可以指定有关其作业应在何处运行的策略。 这些策略允许用户表达他们对性能、可用性和成本之间权衡的偏好。
此外,用户可能希望避免他们的应用程序在竞争对手运营的数据中心上运行,或者留在某些国家/地区以遵守相关的隐私法规。并且云间层也可以实现更安全的应用。
对等层与数据传输相关,目前大多数云平台都有定价政策,将数据传入云中比将数据移出要便宜得多。
例如,将数据提取到AWS是免费的,而将数据从AWS传输出去可能需要0.05-0.09美元/GB。
在“互惠数据对等”方案下,云间可以通过建立高速连接互相免费传递数据,使数据传输又快又便宜,降低两个同级云之间的数据定价差异,并实现更大的数据流动自由。
此外,用户不必管理单个云上的部署,也不应该面临从一个云迁移到另一个云的各种障碍。
简而言之,开发人员构建多云应用程序应该像构建在单个云上运行的应用程序一样容易,而Sky Computing正是在由多个不同云平台组成的基础设施上构建公用计算。
展望未来,会有更多创新将发生在云计算领域。尽管在未来几年内,云服务商推出的新产品可能会继续成为重磅新闻,但云技术的真正创新将是性能和成本优化。
大多数组织已经在使用云,他们正在寻找更高效、更便宜地使用云的方法,而时髦的新服务相对来说或许就不那么重要了。