移动互联网

“技术公司”阿里巴巴的未来野望

2019/9/26 14:12:00

9 月 25 日,阿里巴巴在云栖大会现场发布第一颗自研芯片含光 800——全球最强 AI 芯片,并称,这是他们在芯片领域「万里长征的第一步」。做云、做芯片、做量子计算,这个大家眼中的电商公司什么时候变得这么硬核了?


过去 20 年时间阿里巴巴经历了一场技术长征,慢慢地从「业务驱动技术」的互联网公司转变为以技术为核心竞争力的平台型高科技公司。这 20 年发生了什么?

作者 | 周天

周天财经 原创出品

2007 年 9 月 28 日,十几个中年人挤进宁波一家五星级酒店的顶楼会议室,他们的目标只有一个,为急速成长的阿里巴巴画出一张「路线图」。

彼时,距离阿里接管雅虎中国已满两年,阿里 B2B 正处在赴港上市前的冲刺阶段,淘宝则在国内战线彻底压制 eBay。在外界看来,这家公司正处在自 1999 年成立以来最美妙的时光。

但没有对手,也意味着没有能够参照的路径。

「当时整个集团的情况其实相当迷茫」,阿里参谋长曾鸣日后回忆,淘宝该向哪个方向前进,支付宝是该继续服务淘宝还是独立出来发展,种种问题像一团浓雾,罩在阿里巴巴面前。

讨论最后聚焦在未来十年阿里巴巴到底该往哪个方向前进,「大家被关在一个密闭的房间里吵得不可开交」。

或许真理确实能愈辩愈明,讨论到最后,所有人对十年战略达成了共识。现在来看,这句话,价值千亿美金。「建设一个开放、协同、繁荣的电子商务生态系统」。

目标有了,问题是,怎么建?「奔月计划」也在这次会议上被首次提出,要通过技术把分散在各个子公司业务的数据彻底打通,构建底层的信息流、资金流与物流。



2007年宁波会议画出的架构图


「阿里巴巴一定要在一年的时间内找到一个 CTO,能够带领公司完成奔月计划,向技术要生产力」2008 年 9 月,王坚博士加入阿里巴巴。

回头来看 2007 年的宁波会议,不止制订了阿里十年战略,它更是中国互联网历程中,一次技术与商业之间关系的奇妙转折。就像按下电钮启动一列轰鸣的火车,一次驶向未来的技术长征就此拉开序幕。

在 2019 年 9 月阿里巴巴集团 20 周年年会上,马云说,「阿里巴巴今天已经变成一家技术公司。我们明明有很好的路可以走,却选择没有人走过的路,但又必须要去走的路。」

在宁波会议 12 年后,阿里完成了当年的目标,技术成为阿里巴巴未来最重要的凭靠。

罗马不是一天建成的,这中间发生了什么?

01 让构想成为现实的五彩石

阿里巴巴成立的头一个十年,技术在这家公司的角色是业务的追随者、支持者。

这实际上也是一种商业上的必然选择。根据工信部数据,截至 2007 年 6 月,全国网民人数为 1.62 亿,以手机为终端的无线网民人数为 4430 万,发展近十年的中国互联网,仍然只是人们在生活中获取资讯的工具——在那一年中国互联网大会上唱主角的,不是 BAT,而是新浪、TOM 与空中网。

基于一些通用的建站系统,人们可以轻松开设网站,比如使用 Discuz!架设的校园 BBS,又因为网民数量本身就比较有限,互联网创业者们更多将精力放在商业模式、营销、跑马圈地上来。技术,仅仅是业务的保障部门。

但网民人数在破亿后仍然保持着每年翻番的迅猛增长,这就好比小马拉大车,车上的货物还越堆越多,拐点很快来到。

2008 年 5 月 10 日,阿里发布了淘宝商城,也就是后来的天猫。当时淘宝商城和淘宝网是互相独立的两套系统,数据和业务都不互通,运行了半年,因为数据和系统的独立,淘宝商城很难方便快速地借力淘宝,这不符合互联网快速变化的业务特性,也不适合新生的平台经济。当年 10 月,淘宝网和淘宝商城的数据打通项目开始启动,代号「五彩石」。

这一项目由行癫直接负责,总计参与人员超过 200 人,而在这一项目之前,一般超过 10 人参与的项目就已经算得上是「公司级」项目,阿里的决心可见一斑。



阿里巴巴 CTO 「行癫」张建锋


五彩石分为三期进行,第一期打通商品,第二期打通交易,第三期打通店铺。

项目在一期刚开始时就遇到了一个不大不小的意外,因为需要将商品的各项数据标签打通,涉及到数据和收据结构的变革,必须要停机发布,也就是说,淘宝网将在一段时间内无法访问。为了不影响业务,团队选择在 0 到 5 点停机调整,并提前进行了公告。

凌晨四点,系统完成上线,就在大家准备庆祝的时候,有人能发现在淘宝社区中有大量的链接打不开。问题很快定位,但解决完再发布已经是早上 8 点,所幸早上的流量洪峰是在半小时后才到来,没有造成更严重的后果。

有着这次的经验教训,后面两期都顺利完成,最终历时半年时间,彻底打通了淘宝和淘宝商城的底层数据和通用服务,最直接地,为后续淘宝商城、也就是天猫的飞速发展打下了技术基础。

但五彩石的影响远不止于此。如果说宁波会议厘清了一句话、一张图,那么五彩石项目则完美搭好了大厦的地基,让构想开始变成现实。

业务架构上,抽出组建的共享业务事业部,在马上到来的「千团大战」中支持了聚划算的迅速落地,一战成名,更成为了后来「中台战略」的业务前身。

技术上,因为共享服务层让业务变得迅速,反过来给技术带来了应对分布式研发的新挑战,阿里技术团队「不得不」自己动手开发分布式中间件技术,由此开启了阿里技术的分布式时代。

而从人员安排上看,从上到下锻炼了队伍,特别是负责五彩石项目的「行癫」张建锋与力主淘宝商城 B2C 模式的「逍遥子」张勇,前者统掌阿里技术,后者接班马云。

五彩石项目源于业务需要,但它所创造的技术革新,却让阿里决策层初识技术滋养业务的一种可能。

种子就此埋下。

02 被「双11」逼出的技术创新

「双 11 是过去几年阿里技术发展的强大驱动力。」王坚博士在多个场合都曾这样讲到。

从 2009 年开始的双十一,在本就迅速扩张的中国互联网江河中,人为造出每年一场的「钱塘江大潮」。它对技术堤坝提出了前所未有的「防洪」要求,却也全方位地倒逼着阿里的技术能力向前疾驰。

在 2009 年之前,阿里还没有如今纷繁多样的大促活动,全年下来流量都不会有太大幅度的波动。几个业务负责人靠着过往经验,聚在一起开半天会,再将信息汇总到一张 Excel 上,就完成了容量规划的机器预算。

可是第一次双十一就给所有技术人员惊出一身冷汗。0 点 0 分 0 秒刚过的一瞬间,流量如同开闸洪水一般涌进业务系统,部分页面响应时间超过 5 秒,工程师们手忙脚乱,最终堪堪应付下来。

那一年 11 月 11 日的全天交易额,是 5000 万元。

双十一对阿里技术所提出的挑战是,怎样才能稳定度过零点的流量峰值。对于同时期的中国互联网企业来说,需要面对大量用户登录压力的往往集中在游戏行业。

但阿里的难题有其特殊性,一方面,峰值高度极大,但持续时间却又很短,因此扩容服务器后还需要考虑使用后的冗余成本问题;另一方面,游戏服务器超过荷载后可以开启排队机制,但电商大促却必须争分夺秒,每一秒都直接关乎商家、平台和消费者的三方利益,尤其是在铺垫预热吊高胃口后,一旦宕机,造成的负面伤害难以估量。

解决前者,靠阿里云,稍后再谈;解决后者,则需要一系列确保稳定性的技术手段,其中最著名的技术创新,便是被称为「核武器」的全链路压测。

什么是全链路压测?简单来说,可以将全链路压测理解为「全真模拟考试」,它通过构造、模拟双十一的流量规模和数据复杂性,让技术全链路提前接受考验,从而排除掉绝大多数 Bug 隐患。

原理简单,实际操作起来却是困难重重——整条链路牵涉上百个业务系统,怎么避免遗漏;如何构造出足够真实的用户数据与流量规模;测试时要用到真实线上环境,既不能污染数据又必须要有压垮后的紧急备案。

临危受命的叔同带领团队披星戴月,在两个月时间内开发出 1.0 版本的全链路压测,赶在 2013 年双十一前投入使用。「核武器」一炮而红,那一年的双十一也是自 09 年以来最平顺的一次。



2013 年全链路压测首次投入使用


在随后的几年里,全链路压测不断升级,在内部完成平台化,各业务方可以根据自己需要自行完成。至此,技术开始先行一步,不再是业务发展的瓶颈与掣肘。

而云计算,则要走得更远。

03 「飞天」阿里云

2009 年 9 月 10 日阿里巴巴十周年年会,阿里云子公司成立,400 多人的团队开启了中国最早研发云计算的里程,向深水区的探险就此起笔。

阿里云公司有一个明确的目标,自主研发一套云计算系统,让阿里能够摆脱对 IOE 的依赖。

从敲下第一行代码开始,阿里云就走上了一条「不归路」,最初创始的几十人经过几次架构调整,已经换了好几拨。在当时,云计算还只是一个模糊的概念,团队能够参照的是非常有限的几篇国外论文。

即便是在 2006 年先行一步的亚马逊 AWS,在当时的营收也只有数亿美元,并且仍在亏损,是亚马逊的「边角料」业务。

争议同样来自内部,许多员工无法理解为什么要做这样一个虚无缥缈的业务,在内网上发出尖锐的质疑。



2019年云栖大会,阿里云「三代掌门」同台


到了 2012 年,阿里云「飞天」仍然没有冲上 5K 门槛:独立调动 5000 台服务器规模,那是研发成功的重要标志。

马云一锤定音:「我每年给阿里云投 10 个亿,投个十年,做不出来再说。」阿里「财神爷」蔡崇信也对大家说,在云计算上,「凡是能用钱解决的问题,都不是问题」。

2013 年,飞天进入 5K 最危急的攻坚阶段,全阿里巴巴最精锐的研发力量将争议搁置一旁,满负荷投入到阿里云的建设中来。

后来的故事,人们都已知晓。

飞天云计算获得中国电子学会 15 年来的第一个特等奖;阿里云与亚马逊 AWS、微软 Azure 为首的「3A」阵营占据了超过七成的全球公有云份额;2018 自然年阿里云营收规模达到 213.6 亿元人民币,4 年时间增长了 20 倍;由阿里云所支撑的 2018 年双十一交易额,高达 2135 亿元人民币…

阿里云的成功,标志着技术和商业的关系再次改变。技术,可以就是业务本身。

在张建锋看来,在阿里,技术和业务相互驱动。「技术依赖于业务,业务依赖于技术,各个阶段比重不一样…早年的阿里巴巴是业务在推着技术走,因为业务增长太快。但是过去两年,已经是技术在推动业务。」

04 技术拓展商业边界

根据 QuestMobile 报告,2019 年 Q2 中国移动互联网用户净减 200 万,回落到 11.36 亿,而用户时长增速也已经降到 6%。

喊了这么多年「红利即将见顶」,中国互联网正式来到一个存量残杀的残酷世界。

在接受媒体采访时,张建锋说,靠商业模式突破已经非常困难,「以后的竞争门槛会抬高,这个门槛很多都是技术门槛」。

每年一度的云栖大会,是观察阿里技术沿革的最佳切口。

「DT 时代」、「五新」、「城市大脑」等概念深刻影响着数字经济的潮流风向,而在 2017 年云栖大会上张建锋宣布成立「达摩院」、2018 年云栖大会宣布成立「平头哥」入局芯片产业,则标志着阿里开始向人工智能的「无人区」全面进发。

时机成熟了。马云对达摩院提出了三个要求:活得要比阿里巴巴长;服务全世界至少 20 亿人口;必须面向未来、用科技解决未来的问题。

达摩院下设 4+X 实验室,即机器智能、数据计算、机器人、金融科技和 X 实验室,现在已经建成完善的机器智能算法体系,在国际顶级技术赛事上斩获 40 余项世界第一。磨剑 20 载的阿里技术长征开花结果。

今年 9 月 25 日的杭州云栖大会上,张建锋现场发布了阿里第一颗芯片,含光 800。在业界标准的 ResNet-50 测试中,含光 800AI 推理芯片的性能达到 78563IPS,比目前业界最好的 AI 芯片性能高 4 倍。



含光 800 正式发布


根据现场演示,在城市大脑中实时处理杭州主城区交通视频,传统 GPU 需要 40 颗,但含光 800 只需要 4 颗,延时也从 300ms 降低到 150ms,基于含光 800 的 AI 云服务也在当天上线。张建锋表示,「今天阿里巴巴有足够的信心,有足够的能力,去做传统硬件公司能做到的,包括他们不能做到的。」

面向数字经济时代,阿里正在成为「软硬件一体化的协同发展科技公司」。

结语

「阿里巴巴今天已经变成一家技术公司」。

今年的阿里 20 周年年会上,马云这样说到。

阿里 20 年的技术发展史,也是一部技术与商业关系的演进史。

技术从最开始的保障角色,因业务的迅猛发展迎头赶上,再到后来,云计算与中台向外开放,技术回过头来驱动业务增长。达摩院、平头哥开始向人类的技术边界举旗进发,并通过对外输出,带动全社会进入数字化、智能化的数字经济时代。

腾讯开始展望产业互联网时代,百度也不断在无人驾驶技术加码投入——从「互联网公司」向「技术公司」的转型,正在中国大型互联网企业身上相继发生。

实际上在美国并没有互联网公司的说法,Facebook、Google、Amazon 都统一被归类为 Technology Company,也就是科技(技术)公司。以阿里为代表的中国互联网公司的技术化转型,也说明,中国经济到了「向内求」的阶段,代表先进生产力的互联网公司首先完成了技术的自我觉察。

新经济的根本是新在技术。正如布莱恩·莱塞在《技术的本质》一书中所写道的,经济就是技术的一种表达。

- END -


版权声明
本文仅代表作者观点,不代表艾瑞立场。本文系作者授权艾瑞专栏发表,未经许可,不得转载。
  • 合作伙伴

  • 官方微信
    官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。
     关于艾瑞| 业务体系| 加入艾瑞| 服务声明| 信息反馈| 联系我们| 广告赞助| 友情链接

Copyright© 沪公网安备 31010402000581号沪ICP备15021772号-10