【揭秘】全球首个手机AI芯片华为麒麟970是怎么来的?

送交者: 怡春院大掌柜 [举人] 于 2017-09-07 7:34 已读 1532 次 大字阅读 繁体阅读
2015 年 3 月 12 日,清华大学水木社区发布了一条不起眼的招聘信息,“中科院计算所-华为联合项目招聘 20 名智能芯片方向实习生”:

信息后半部分补充了招聘部门的详细资料,也披露了华为人工智能芯片的未来规划:

中国科学院计算技术研究所(简称计算所)创建于 1956 年,是中国第一个专门从事计算机科学技术综合性研究的学术机构。计算所研制成功了中国第一台通用数字电子计算机。计算所体系结构国家重点实验室是计算所最核心实验室之一,今年(注:2015 年)来先后产生十几位院士,孵化了联想、曙光等知名计算机企业。

华为联合项目新一代智能芯片,旨在开发新一代的用于人工智能方向的计算机芯片,主要用于大数据、搜索、语音等当前人工智能应用以及作为未来智能设备终端的核心部件。

计算所和华为的这一联合项目,直接催生了柏林 IFA 展上华为消费业务 CEO 余承东捏在手里供人膜拜的全球首款手机 AI 芯片——麒麟 970。粗略计算,这款芯片的开发历时两年半。此研发周期也可以反过来佐证近来流传的麒麟 980 已开始流片、麒麟 990 启动研发的消息。

实际上,华为和中科院计算所的合作由来已久,业界多有传言,华为早已成为中科院计算所的大金主。2011 年,双方便规划成立联合实验室,具体由先进计算机系统研究中心承担,该中心主要从事云计算、操作系统和体系结构的研究。它此前是从高性能计算机研究中心独立出来的。与华为合作的同年,先进计算机系统研究中心开始挂靠计算机体系结构国家重点实验室下,于 2014 年成为正式独立部门。

不过麒麟 970 的 AI 芯片并非来自于这一联合实验室,而是它此前曾挂靠的计算机体系结构国家重点实验室更确切地说,麒麟 970 的 AI 技术授权来源于该实验室后来孵化出的全球首个 AI 领域的独角兽——中科寒武纪科技有限公司,简称寒武纪。

寒武纪 Cambricon-1A 前期样片 寒武纪由计算所体系结构国家重点实验室的两位研究员陈云霁陈天石联合创立。两名创始人是亲兄弟,陈云霁生于 1983 年出生,陈天石生于 1985 年,均毕业于中科大少年班,都称得上是“天才”。进入计算机所后,哥哥主攻芯片,是研究“龙芯”的成员,目前仍在计算机所担任研究员,弟弟主攻人工智能,成立公司后任 CEO 一职。 陈云霁(右)与陈天石兄弟

2016 年 3 月份,寒武纪-1A(Cambricon-1A)问世,这也是全球首个商用深度神经网络处理器 IP(Intellectual Property),可集成至各类终端 SoC 芯片中,并在 11 月召开的世界互联网大会上获颁“领先科技成果”。官方表示,这款处理器每秒可处理 160 亿个虚拟神经元,每秒峰值运算能力达 2 万亿虚拟突触,性能比通用处理器高两个数量级,功耗降低了一个数量级(仅有原来的 1/10)。同期接受《中国科学报》采访时,陈天石透露,“寒武纪芯片在一年半左右的时间就会进入市场。”

在两个月后的一次演讲中,陈天石介绍了寒武纪的一系列研究成果:

PC 时代,CPU 做图形渲染能力不够,于是就诞生了 GPU。信号处理能力不够,于是就有了 DSP。同样,在智能时代,我们也会需要有一类专门的智能处理器芯片,而寒武纪公司就是这个领域的先行者。

寒武纪团队在 2013 年研制了全球首个深度学习处理器,相关工作获得了处理器架构领域顶级会议 ASPLOS 的最佳论文奖,是亚洲机构首次获得这样的荣誉。

2014 年,我们发表了全球首个多核深度学习处理器架构,再次拿到了处理器架构领域顶级会议 MICRO 的最佳论文奖,创造了国际学术界的新纪录。

2015 年,我们推出摄像头芯片上的视觉识别 IP。

2016 年将推出全球首个神经网络指令集——电脑语。我们的目标是通过这个全新的完全自主的指令集,构建未来智能时代的 x86 生态。

做个类比,寒武纪所采用的推广方式类似于 ARM,通过授权的方式推广 AI 指令集,短时内快速推动市场发展。数天前,寒武纪刚刚对外公布了 A 轮一亿美元的融资消息,由国投创业(A 轮领投方),阿里巴巴创投、联想创投、国科投资、中科图灵、元禾原点(天使轮领投方)、涌铧投资(天使轮投资方)联合投资,并称 2016 年便已盈利,营收规模在 1 亿元人民币。

而首款集成寒武纪芯片的商用产品就是麒麟 970,华为把它称之为 NPU(Neural Network Processing Unit)计算单元。NPU  也是继 CPU、GPU、Modem、ISP、RAM、ROM、协处理器、SE 后,移动 SoC 中的新模块。 Prisma 处理过的照片对比。

对你来说,AI 芯片意味着什么?

寒武纪芯片可以看作是一款集成了常量运算、向量运算、矩阵运算、逻辑运算、数据转换以及控制指令等功能的深度神经网络加速芯片架构,主要用于语音识别、图像识别和编辑等等。用具体的应用场景来解读可能更容易理解。

麒麟 970 还没发布,微博上就盛传它的一键美颜秘技。理论上来讲,它可以像 2016 年流行的图像编辑软件 Prisma 那样,智能编辑图片。不同之处在于,Prisma 把画面变为经典名画的样式,AI 芯片则可以识别画面内容后自动瘦腿、美颜,处理速度比现有方式大幅度提高。而且不必像 Prisma 那样上传云端处理再返回结果,即便后来改用手机端处理,Prisma 的速度也不是很理想,寒武纪芯片加持后可以本地快速处理。

华为官方专门列了一组数据表明 NPU 的强大,处理同样的 AI 应用任务时,新的异构计算架构拥有大约 50 倍能效和 25 倍性能优势,“图像识别速度上,可达到约 2000 张/分钟,远高于业界同期水平。”用过 Google Photos 应该有类似体验,当你拍人像照片后,它往往会隔几分钟甚至隔几小时几天提醒你,“相册新增了×××的照片,你可以分享给她。”

手机用上 AI 芯片的好处不必多言,专用 AI 芯片或许可以解决华为前期试水手机人工智能时遭遇的用户隐私问题。寒武纪联合创始人陈云霁早前接受采访时表示:

寒武纪 1A 可以解决两个方面的问题:一是显著提升计算机系统在人工智能领域的运算效能,可以超过传统中央处理器和图形处理器芯片两个数量级;二是终端产品的离线智能化,“尤其是后者,让很多用户数据不必上传,保证了信息安全。”

喜欢怡春院大掌柜朋友的这个帖子的话,👍 请点这里投票,"赞" 助支持!

[举报反馈] [ 怡春院大掌柜的个人频道 ] [-->>参与评论回复] [用户前期主贴] [手机扫描浏览分享] [返回数码家电首页]

帖子内容是网友自行贴上分享,如果您认为其中内容违规或者侵犯了您的权益,请与我们联系,我们核实后会第一时间删除。

所有跟帖: (主贴被主有权删除不文明回复,拉黑不受欢迎的用户)

打开微信,扫一扫[Scan QR Code]

进入内容页点击屏幕右上分享按钮

楼主本月热帖推荐:

    >>>查看更多帖主社区动态...