移动互联网

CIPU面世,云计算将指向何方?

2022/6/20 16:05:00

作者  / 金德路 

本文图片均来源于网络 

 

近日,阿里云正式对外发布了全新处理器:CIPU,并宣称CIPU未来或将替代CPU成为云计算的管控和加速中心。

CPU指中央处理器,它的规格决定了一台服务器工作效能的高低,当前的云计算基于以CPU为中心的体系架构,以软件定义的方式进行优化,在数据量暴涨的情况下已然触及瓶颈。

CIPU则是指云基础设施处理器,它能通过特定的操作系统,将阿里云再全球的200 多万台服务器变成一台“超级计算机”,为客户提供更高性能、更低价格、更可靠的云计算服务。

一家小店的运营能力,再怎么提高也有限度,两百万家小店高效协同之下,运营能力的提升可想而知。而从个体计算机的集群到“超级计算机”的诞生,也更符合云计算的定义。

可以说,CIPU从源头再造了云计算全新发展路径,这种回归源头突破瓶颈的方式,与整个现代科技的发展路径不谋而合,正如基础科学是土壤,应用技术是树木,当参天大树难以长成的时候,最需要的往往是厚植培育土壤。

01 云计算遭遇什么瓶颈?

要想更深入地理解阿里云对以CIPU取代CPU成为云计算体系架构中心的信心,还需要将之放入云计算发展历程当中来看。

在过去十多年里,云计算技术经历了两个发展阶段。第一个阶段是分布式和虚拟化技术替代了大型机、小型机,满足了当时企业业务扩展带来的算力弹性需求。

企业通过分布式架构将计算能力打散到不同的机器上,解放供应链的弹性,同时引入虚拟化技术,实现分时复用,解决单个集群资源利用率相对较低的问题。

这种分布式架构让企业具备了云的基础技术能力,但没有云计算的核心生产力,比如没有达到即开即用的资源弹性、按需扩容、线性可扩展性等,难以满足规模不断扩大的业务需求。

第二阶段是资源池化技术,把计算和存储资源分离,再规模化编排和调度,提供了超大规模的计算和存储资源池。

这种通过将不同的物理资源变成虚拟化的资源,进行统一池化管理的技术,推动了公有云时代的加速到来,企业不再需要自己管理这些资源,而是由云厂商提供统一调度、统一管理和统一编排,以提高资源的利用率。

如果说分布式和虚拟化技术成就了云计算的崛起,资源池化技术则是大大降低了云计算的使用门槛。但它们都是通过软件定义的方法,基于传统的以CPU为中心的体系架构去做优化,随着数字经济的到来,“以软件定义为主”的云计算再次无法满足产业需求。

云厂商们发现管理基础设施规模越来越大,复杂度也越来越高,数据密集型的计算越来越多,一个纯软件定义的、以 CPU 为中心的云体系结构,虚拟化的代价很高,费用会不断增加,也难以实现对云计算低时延、高带宽的需求。

行业期待着、也努力着推动下一代云计算的发展。2020年之后,部分芯片巨头陆续推出了相关数据中心产品,如英伟达的DPU(Data Processing Unit,数据处理器)和英特尔的IPU(Infrastructure Processing Units,基础设施处理器),与阿里云推出CIPU一样,都是希望设计一个新的管控中心,以替换掉CPU的管控职能。

02 CIPU的破局思路

那么,这些诞生之初就被赋予了替代CPU使命的产品,是如何解决以CPU为中心的云计算所面临的瓶颈呢?

首先来看DPU。它诞生的背景是带宽与计算性能的增速失调,CPU的性能从5-10年前每年30%的增幅,到三年前大概只有每年不到3%的增幅。而网络带宽每年依旧还有35%左右的增长,这意味着,处理性能和带宽增速的比例从原来的大概1:1,变成了现在的1:10左右。

因此,DPU侧重的是数据迁移带宽能力,作为集成加速平台,DPU能够从CPU上卸载关键的网络、存储和安全任务,降低CPU的开销,直接效果是给 CPU“减负”。

再来看IPU。IPU紧随DPU之后,作用也有所类似。IPU通过专用协议加速器来加速基础设施功能,包括存储虚拟化、网络虚拟化和安全,通过把软件中的存储和网络虚拟化功能从CPU转移到IPU,从而释放CPU核心,还能允许灵活的工作负载分配,提高数据中心利用率。

因此,IPU更强调虚拟化云化能力,它扩展了英特尔的智能网卡功能,旨在应对当下日益复杂的数据中心,提高数据密集场景的计算能力。

尽管技术路径上有所区分,但无论是DPU还是IPU,都是想通过软件定义+硬件加速的方式,替代CPU成为数据中心的核心硬件。

CIPU则更像是两者的综合体,它向下接入物理的计算、存储、网络资源,快速云化并进行硬件加速;向上接入飞天云操作系统,管控阿里云全球上百万台服务器,让算力虚拟化损耗降到0,并通过规模化应用RDMA网络技术,让访问云端比访问本地硬盘更快。

因此,CIPU既能解决数据迁移带宽的问题,也能云化虚拟化管控数据中心。同时,搭载飞天系统设计后,实现了软硬件一体化,既能通过硬件提供高性能,又能通过软件提供灵活性。

而CIPU和飞天云操作系统还出自阿里云同一大的研发团队之手。阿里云基础产品首席架构师黄瑞瑞就曾在媒体采访中指出:“向上设计的飞天云操作系统和向下的 CIPU,两者之间结合的效果一定是大于 2 的,因为本身就是一体化的。”

03 3.0的云计算新生态

宝剑锋从磨砺出,在正式推出CIPU和飞天云操作系统之前,阿里云在技术积累这条道路上已经走了十余年。

2009年,阿里云自主研发云计算操作系统飞天诞生,这个系统帮助多个平台解决了必不可少的极限并发场景,如天猫的双十一购物节,12306的春运购票高峰等等。

2017年,阿里云再度自研发神龙架构,通过把虚拟化转移到专用硬件中进行加速,实现了性能“0损耗”,一定程度上解决了服务器虚拟化性能损耗的问题。

此后,经过数轮迭代,神龙卡逐渐加入了编排调度、硬件加速等更多能力,最终诞生了CIPU的雏形,并在不断完善后推出。

不难发现,阿里云先是通过对飞天系统的定义和迭代,实现了对于客户需求清晰化的感知。然后才去做 CIPU,通过深度定制底层基础设施,实现了客户对于云计算的极致性能和体验。

与此同时,CIPU和飞天系统还可以与其他自研产品,如神龙计算平台、盘古存储平台和洛神网络平台等进行深度的适配。实际上,阿里云已经打造了以飞天云操作系统为核心,自研芯片、服务器、计算、存储、网络、安全等软硬一体的新型计算体系架构。

新型科技产业中,技术和产品的突破意味着生产力的变革和竞争格局的重塑,因此,技术路线之争或许还是企业乃至产业的命运之争。

一如新能源技术,磷酸铁锂电池之争与三元锂电池之争,单晶硅片与多晶硅片之争等等,背后都是一个个企业的没落与崛起。又如移动通信技术,国内产业从1G的空白、2G的跟随、3G的同步,实现了5G的超越。

云计算也是如此。CIPU和飞天系统的推出意味着阿里云找到了一条打破云计算传统发展路线的全新途径,一旦成为主流,阿里云将拥有定义下一代云计算标准的实力,成为中国在云计算,乃至IT产业的国际竞争中的一大助力。

正如郑纬民院士所言,阿里云的CIPU将使得中国在争取云计算的定义权中处于有利位置,改变了原本由西方技术制定的游戏规则,让我国IT产业建立了全球领导力。这一改变格局的事,让他对中国在下一个技术时代拥有自己的一席之地表示乐观。

当然,技术的发展往往是一个不断突破、不断前进的过程,技术的路线之争也常常是一个艰难且漫长的过程,CIPU和飞天系统不会是云计算竞争的终点,阿里云仍需要不断研发更多高附加值且代表产业发展方向的产品,以争夺云计算的话语权。


版权声明
本文仅代表作者观点,不代表艾瑞立场。本文系作者授权艾瑞专栏发表,未经许可,不得转载。
  • 合作伙伴

  • 官方微信
    官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。
     关于艾瑞| 业务体系| 加入艾瑞| 服务声明| 信息反馈| 联系我们| 合作伙伴| 友情链接

Copyright© 沪公网安备 31010402000581号沪ICP备15021772号-10

扫一扫,或长按识别二维码

关注艾瑞网官方微信公众号