互联网

突破GPU瓶颈,百度昆仑芯片弯道超车,260TOPS性能惊人

2018/7/11 13:54:00

今年的百度AI开发者大会上,李彦宏的一句“芯片依赖进口曾是我们永远的痛!”让现场与会者感慨不已,被外国技术“卡脖子”的现状是中国科技、产业界耿耿于怀的短板。不久前的中兴事件更是令国人痛定思痛,不在核心技术上夺回自主权,中国的发展就永远无法摆脱受制于人的困境。这次大会上,李彦宏这句话并不是单纯的发感慨,他随即宣布百度推出的AI芯片“昆仑”令人眼前一亮,这款芯片不但以260万亿次/秒的运算速度成为业内算例最强的AI芯片,更重要的是,其非GPU架构也为国产芯片摆脱GPU领先者的压制,实现弯道超车带来希望。

目前,AI领域已经成为世界科技巨头争夺的制高点,软件领域的谷歌、Facbook,硬件厂商英伟达、英特尔等全都宣布了自己的芯片规划以及未来远景。在这个大背景下,以百度昆仑芯片为代表的国产技术,能够突破国际巨头技术体系的压制,已经成为国内业界普遍关注的问题。李彦宏在本次发布会上宣布,昆仑系列芯片可以提供推理以及训练量大功能,为AI应用提供了强大的 “中国芯”,值得期待。

突破GPU瓶颈

我们都知道,人工智能AI领域长期以来都被称为GPU的世界。最早的CPU计算并不能很好地满足AI应用在运算模式上的需求,自从英伟达独创地将GPU引入AI领域以来,GPU的并行计算模式就一起高性能形成了统治地位。由于GPU的广泛采用,已经令主要生产商英伟达成为了事实上的领导者。

但是GPU存在一个问题,就是在功耗与性能的平衡上效果并不够理想。尤其在AI应用大量需要云端计算、计算中心对处理器的需求量大量增加的情况下,GPU由于价格以及耗能方面的弱点,令业界纷纷开始寻求GPU以外的解决方案。

而这中趋势,正是百度昆仑芯片得以发展的机遇。据了解,百度昆仑芯片分内两种型号:专注于训练方面的是昆仑818-300。而专注于推理功能的是昆仑818-100。两种芯片采用的均为14nm工艺,内部聚合了数万个小核心。

昆仑芯片尤其令业界瞩目的,是其运算能力。与近期出现的基于FPGA架构的AI加速器相比较,昆仑的性能提升了惊人的30倍。业界普遍认为,昆仑芯片很可能是采用了ASIC架构。

这种新架构应用的推出,标志着中国AI技术正在朝着绕过GPU瓶颈,实现弯道超车的方向前进。

面向未来

百度的昆仑芯片,与不久前寒武纪发布的麒麟芯片经常被人们拿来做对比。事实上,这两种芯片的应用场景是不一样的。

麒麟搭载的寒武纪NPU主要面向本地小型设备,是将AI运算本地化、轻量化的设计。而百度昆仑则是面向云端的重计算AI应用,尤其是那些对深度学习有很大需求的厂商以及研究机构,更是急需昆仑这样的国产芯片。

未来,依托昆仑芯片世界一流的强大算力,百度的无人驾驶、图像识别等AI应用将会取得更多、更新的进展。在5G时代即将来临之际,云端AI计算所适用的场景也将越来越多见,百度厚积薄发的AI研发投入,也将帮助企业在未来的AI应用大爆发中取得先机。


版权声明
本文仅代表作者观点,不代表艾瑞立场。本文系作者授权艾瑞专栏发表,未经许可,不得转载。

专家介绍

  • 京比特

    总访问量:1275
    全部文章:47
关注前沿科技、重大事件、典型公司、话题人物,深度剖析商业背后的真相;
  • 合作伙伴

  • 官方微信
    官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。
     关于艾瑞| 业务体系| 加入艾瑞| 服务声明| 信息反馈| 联系我们| 广告赞助| 友情链接

Copyright© 沪公网安备 31010402000581号沪ICP备15057083号-1