有啥事资讯网

主页
分享互联网新闻
有啥事资讯网-国内外新闻时事,奇事,新鲜事

阿里云靠什么竞争?

更新时间:2021-10-25 14:55:18点击:


2021年的云栖大会再一次锁定了“国内科技春晚”的头衔,芯片、服务器、云电脑、计算架构,甚至服务器操作系统都悉数登场。


其中平头哥发布的通用服务器芯片倚天710,更是引发各界关注。


早在2018年,阿里就成立了平头哥芯片公司,当时平头哥是由达摩院和中天微共同成立的,而云栖大会期间,AI财经社独家获悉,阿里内部近期又进行了一次低调的组织梳理。平头哥已与云智能、达摩院部门平级,相互强协同,形成三位一体的战略优势。


平头哥一位员工也证实了上述组织梳理。他告诉AI财经社,2018年成立的芯片公司“平头哥”,原本是阿里达摩院旗下组织,“在今年国庆节后,已经成为和达摩院平级的组织。”此前,达摩院更像是阿里内部的“核高基项目组”,下设语音、视觉、智能计算、量子等多个实验室。


在此次组织梳理前,今年初,阿里云已经进行了一次“前所未有”的组织架构大调整,设立了18个行业部门、16个区域,为的是销售组织下沉,服务政企客户。不过,那次调整主要影响到外部的生态伙伴和渠道商。而这次阿里云、达摩院和平头哥“三位一体”的组织梳理,更像是阿里云内部的一次组织更新,更倾向于加强内部协同,应对云市场的演化。


这也是继2020年“云钉一体”战略后,阿里云新一次重要的战略和组织加码。


互联网企业的组织架构调整并不足为奇。但讲求稳健的2B业务发生变化,背后必有原因。在云栖大会期间,阿里云智能总裁、达摩院院长张建锋称,从云计算到云原生,今天的云已经是一个新型产业生态。“云正成为核心,向上延伸,推动企业的软件架构现代化;向下延伸,推动软硬件的一体化和标准化;水平延伸,推动研发和运维更高效的运行。”这些都需要云厂商从芯片、服务器,到操作系统、数据库和AI+大数据的强协作,组织梳理的必然性不言自明。


对于此次组织梳理,2019年从硅谷回国的阿里副总裁贾扬清告诉AI财经社,体现了平头哥、达摩院和云计算在技术上分层、协同的状态。平头哥从底层芯片提供弹性、通用资源,相当于云的底座;达摩院在上层提供数据化、智能化的可能性。“我觉得这种打通在某种程度上就是创新。”


去年,“云钉一体”下,钉钉上承客户的各种应用,下连阿里云基础设施。如今,在此基础上的“三位一体”,同样是为了集阿里集团之力,执行“做深基础”的战略。


这样的协同效应已经初步显现。今年云栖大会上,平头哥推出了自研的Arm架构服务器CPU芯片“倚天710”,采用了5nm制程,为阿里云自用。据悉,采用Arm v9架构的倚天710,更适合云游戏、视频直播等场景。



图片
阿里云智能总裁、达摩院院长张建锋发布倚天710芯片



这也是继2019年推出AI芯片含光后,平头哥推出的第二颗大芯片。不同芯片可以更好支撑不同的应用。有了倚天710,目前阿里云已全面兼容x86、Arm及RISC-V等芯片架构,朝“一云多芯”的目标迈进了一步。


为何阿里云要选择自研难度更高的通用芯片?张建锋对AI财经社说,云场景有很多高并发、高性能和高能效需求,但原来的CPU并不是完全为了云设计,“就像GPU最初是为了游戏而非人工智能。这也造成了这并不是一个最优的解决方案,因此云原生需要一些新的芯片设计。”


实际上,云计算巨头在底层芯片上已开展竞赛。比如倚天710采用128核CPU设计,此前亚马逊推出的CPU为64核。核越多,云上就能同时跑更多业务。有业界人士对AI财经社预计,年底前,亚马逊云也会推出128核的CPU。


云智能和达摩院也在更深地协作。今年云栖大会期间,阿里云推出了大数据+AI一体化平台“阿里灵杰”,将云智能和达摩院的人工智能、大数据产品和技术形成统一品牌,建立统一入口,对外提供给客户和生态合作伙伴。灵杰的推出,也是阿里云内部协作的结果。


在云栖大会的展区里,有更多看得见、摸得着的协作成果。比如阿里边缘计算展位上,展示着一个边缘计算设备,内部既有平头哥的芯片,又跑着阿里云的人工智能算法。它们被用于智能工厂、停车场等多个地方。

阿里巴巴合伙人、阿里云基础产品事业部负责人蒋江伟记得,2019年的阿里云北京云峰会上,张建锋首次提出了“做深基础”。这个说法并不突兀。在阿里云内部早有一句话,“基础不牢,地动山摇”,这也是技术产品团队最喜欢的。所以,蒋江伟特别能理解这个战略的含义。


“对于云计算公司来说,有些问题有时没有其他人能帮你解决。你比如说,硬件厂商没有办法理解,云上长出来的硬件是什么样子的——云跟直接卖盒子,区别还是蛮大的。所以这个硬件必须是阿里云来提出和设计。”蒋江伟告诉AI财经社社。


阿里云洛神网络负责人江鹤也有同感,他们要为线下0.1%的客户去打造更强劲的网络能力。“某些特别的应用,会推动整个行业。这就像早期,因为打游戏,大家才去买CPU,CPU技术才不断升级。”当少数场景逐渐变成普遍场景,一个变革性的产品也就逐步打磨成型了。而如今在云的环境下,一些应用需要极高的性能、极低的时延,这考验着云的网络能力。


云这种新型产业生态,逼着阿里云要做自研,做深基础。

 

这些年,阿里云集齐了“硬件层-中间层-平台及应用层”三层自研技术拼图。硬件层有芯片、磐久服务器、液冷机柜和超级数据中心;在中间层,有飞天云操作系统、神龙、盘古和洛神等计算、存储和网络平台,还有自研的云原生数据库PolarDB;在平台和应用层,则有PAI、DataWorks等AI+大数据一体化平台,及无影云电脑、钉钉等。


一位阿里内部人士形容,这些就像三级火箭推进器,生成巨大的推力,将阿里云逐步推向广阔的太空。


图片


尤其在近两年,阿里云的“做深基础”战略越来越明确,研发进展也在加快。这届云栖大会也格外热闹,成为集中展示“根技术”的舞台,令外界有种“阿里云底层自研技术大爆发”的感觉。有人形容为生物学上的“寒武纪大爆发”,在这次爆发后,地球迎来了长久的生物繁荣。

 

一位阿里云内部人士告诉AI财经社,尤其在这两年,阿里的“中间层”技术取得了很大突破。

 

由于有了这些自研技术,张建锋称,这让阿里云能调度150万台以上的服务器、大范围提供公共云服务,它和市面上很多云,已经不是同一物种。


为了提高系统的运行效率,阿里云干脆追根溯源,将中间层重新设计了一遍。神龙就是一个典型的产品,它是软硬件一体的新一代虚拟化技术。形象地说,虚拟化技术就像乐高积木,把无数台计算机组合成一台超级计算机,或者把一台超级计算机拆成无数小计算机。早期的虚拟化全靠软件。在2016年双11,阿里云支撑了1682亿元的电商成交额,但也付出10%的“虚拟化”的性能开销。这10%的开销已经是软件优化的极限,“退无可退”。张建锋在复盘会上,提出一个大胆的想法:“要把虚拟化的损耗降低到0。”这让在场技术领导挠破了头。

 

原因在于,这是没有任何云计算公司干过的事情。说干就干,阿里云三顾茅庐招纳芯片和中间件负责人,终于在2017年造出了“神龙”。这比全球最大的云计算公司亚马逊还早1个月。

 

在本次云栖大会,“神龙”已经迭代到第四代,成为阿里云核心技术展台上“最靓的仔”,搭载了全球首个大规模的RDMA高速网络,可以提供更高性能的计算,也可以更好地服务于人工智能。很多客户在观展前,从未想过阿里云还有用硬件实现虚拟化的技术。与负责存储的“盘古”、负责网络的“洛神”一起,“神龙”将虚拟化的损耗降到了零。目前全球只有阿里云和亚马逊云有这项技术。



图片
阿里云基础产品事业部负责人蒋江伟发布神龙第四代


除了“神龙”,阿里云的自研数据库恰好成为一面镜子,映照出阿里云技术发展的三个阶段:替换外部、打磨自研和对外输出。

 

在阿里巴巴早期,电商业务承载在14套甲骨文数据库上。但伴随阿里电商业务壮大,甲骨文数据库已经支撑不住了,阿里开始了去IOE(去掉IBM小型机、甲骨文数据库、EMC存储)的过程。2013年7月,阿里将淘宝的广告系统,从最后一个甲骨文数据库上下线,搬上自家数据库,完成向自研技术的转身。

 

阿里自研的分布式数据库PolarDB-X就是在内部解决大规模场景的需求下诞生,后来逐渐产品化。“那几年,技术追着业务跑,基本上前一年双11的峰值,就是下一年的平值,没给技术太多喘息和对外输出的空间。”阿里云数据库事业部解决方案资深专家刘昆说。这给了阿里云技术在自有业务上最严酷的磨练。

 

而2018年,则成为阿里云技术全面成熟的一个时间点。“不只是数据库,包括计算、网络、存储方面的阿里云整个技术体系都成熟了。”刘昆观察道。在2019年,张建锋则更新阿里云目标,首次提出“做深基础”的口号。


2020年,阿里云数据库挺进Gartner全球魔力象限领导者象限,成为基础软件领域首次进入领导者象限的中国企业。今年,PolarDB形成三层池化解耦,使得弹性有数量级的提升。在作深基础的同时,市场地位自然也就打了出来。国税总局、中国邮政、友邦保险等诸多企业采用了阿里云自研的云原生分布式数据库。

 

负责神龙架构的雁杨告诉AI财经社,“我们做最底层硬件技术的人,一般比较闷。负责组织文化的同学跟我们说,你们团队最难调动气氛了。”但“做深基础”的口号提出以后,“大家能够看到我们自己做的事情,跟整个公司战略的链接,对我们团队的士气、组织力和定力非常有帮助。”从某种程度上,这个口号也帮助阿里云确认了技术的本色。


如今,“做深基础”到了第一次交卷的时候。张建锋在2021年云栖大会上不无自豪地说:“在云计算最基础的部分,我们跟全球的主要竞争对手比,已经没有任何的代差,很多理念还是我们先去做尝试的。”他认为,阿里云在“做深基础”上,已经处于全球第一梯队。

 

今年,阿里云首次进入了Gartner云基础设施魔力象限的“远见者象限”,这是只属于最顶尖云计算公司的殊荣,过去一直被亚马逊、微软和谷歌所包揽。在Gartner的9个技术分类评分中里,阿里云则在其中4个方面——计算、存储、网络和安全获得了全球最高分。

“今年的云栖大会有些不一样。阿里云为前沿科技提供了更多的展台,也讲了很多非商业的事情。”一位物理学教授告诉AI财经社。他是应邀来云栖大会的直播间做演讲,也参与评选了今年达摩院的“青橙奖”。



图片
云栖大会为前沿科技提供了更多的展台



也有人说,今年的云栖大会“是在向未来播撒火种”。阿里云已经处于国内云服务的领导者地位,有必要对未来三年、五年甚至十年的云服务发展提前布局。这些种子有些先播撒在阿里云的土地上,有些则从起始就惠及整个云服务市场。

 

青橙奖就是阿里云埋下的伏笔。今年,阿里巴巴集团董事会主席兼首席执行官张勇宣布将青橙奖获奖人数从10人提升到30人,奖金池也提升到3000万元。获奖领域则从软体机器人、肺结节早期筛查,到数据中心的资源管理,无所不包。

 

青橙奖是达摩院于2018年设立的学术奖项,完全奖励给个人,不作经费用途要求。“很多青年研究工作者在研究初期申请经费很难,自己又有家庭负担。所以我们就给一批奖金,这笔钱干什么都可以。”青橙奖阿里巴巴集团学术合作总监、达摩院青橙奖组委会成员李贝说。

 

在青橙奖早期,获奖者一半来自计算机领域。其中很多佼佼者后来都加入了阿里巴巴,比如2019年获奖的梁小丹,研究认知智能,后来就加入阿里巴巴从事衣饰分类和智能化推荐。2020年获奖的聂礼强,从事多模态人机交互,也把技术用在了天猫精灵上。

 

而另一些奖金,则为外部学术界播下种子。2019年,青橙奖颁给了数学学者江文帅。李贝告诉AI财经社,在他印象里,江文帅原本是个害羞的年轻人,不常与外界交流。但获奖之后,他知名度大幅增长,开始主动去做数学报告讲座。由于研究成果突出,2021年,他已经评上了“国家杰出青年科学基金”,成为中国最年轻的“杰青”。

 

云栖大会的第二个变化,是“谈商业更少、谈开源更多”。今年云栖大会上,张建锋宣布了一个数字:“玄铁芯片已经出货25亿颗。”这一度让很多台下观众怀疑自己是不是听错了。

 

玄铁就是阿里基于RSIC-V架构做出的物联网芯片IP(成熟设计模块)。通过开放IP的方式,全球开发者都可以免费下载代码,做出芯片设计和架构创新。平头哥半导体副总裁孟建熠就表示:“对于RISC-V这种开放型的架构,需要比传统授权更加开放的模式,才能更好的支持创新。”

 

除了芯片架构,阿里还开源了龙蜥服务器操作系统。虽然龙蜥是基于Linux的开源版优化的,但在稳定性和性能方面都有大幅提升。一位阿里云服务器团队成员告诉AI财经社,阿里云在过去10年里,斥资50亿元开发出三套服务器操作系统,例如飞天操作系统,是用于阿里云内部的,也有开源开放给客户使用的,比如龙蜥。


阿里云承诺投入20亿元专项资金,联合100家合作伙伴推动龙蜥开源生态建设,并提供至少10年免费技术支持。“龙蜥的稳定性经过千锤百炼,在云上大规模服务客户;而其他一些海外操作系统,没有经历这样的测试。”龙蜥的负责人马涛说。

 

在去年,市场上主流服务器操作系统CentOS突然终止维护,让开发者手足无措。而龙蜥兼容CentOS生态,并且搭建了龙蜥开源社区。“这部分地接过了CentOS的大旗。”一位阿里云服务器团队人士说。

 

阿里云为什么要做这些事?这部分是因为技术进步的方式已经改变。张建锋称,“以前的开源是因为商业软件非常贵,客户负担不起,又有这个需求,开源是取代一部分商业软件的。但今天,所有的计算机核心系统、核心架构,基本上都是开源来推动的。全球95%以上的企业都在用开源软件。开源不仅是补充,而是创新和引领。”


除了软硬件的开源,阿里云设计的服务器技术规范、液冷服务器解决方案等,开源设计,不做生产。这样一来,大规模IDC(数据中心)的客户,包括互联网公司,也可享受到了阿里云技术开放的红利,买到更先进、透明的产品。


在数据中心层面,阿里云自研了液冷技术,让PUE(电能使用效率)降到1.09,远低于国内平均1.63,即你每用1度电做计算,还有0.63度电要来做散热。“液冷的技术方案去年初就对外开放了,希望让更多厂商参与生产”,一位阿里云人士透露,“现在的制冷液普遍要从3M买,单价比茅台还贵。更多厂商进来了,就可以推动跟3M统一谈判,或者选用国产制冷液。”


“未来10年,公有云会保持巨大增长。阿里云就要回答另一个问题:这个高速增长中,有多大程度上是因为你的创新带来的?我们反复问自己,你今天为云计算的增长做出了什么有价值的贡献?”在云栖小镇,张建锋在被问及“阿里云下一个十年”时如此回复,“我们今天最大的挑战,就是如何去定义未来是什么样子。”而做深基础,将有助于国内企业在云这个新赛道上,获得更多的定义权。