AI芯片对比:GPU/FPGA/ASIC/类脑芯片
|
2017年,“人工智能”俨然已经成为所有媒体的头条热点,在媒体和资本的推动下,AI以迅雷不及掩耳之势向我们汹涌奔来。从政策层面,2017年关于AI发生了三件大事,一是发布了人工智能发展规划;二是人工智能首次写入十九大报告;三是很多城市,如上海、重庆等都在进行人工智能规划。 从数据来看,2013年只有100多家组织机构研究深度学习和人工智能,而到了2015年,这个数字已经飙升到3409家,两年时间增长30多倍。就连以电动汽车起家的特斯拉也宣布开始设计AI芯片,马斯克请来了AMD公司Zen架构的开发者Jim Keller,担任自动驾驶硬件副总裁。 在AI热闹非凡的大背景下我们也需要认真思考:人工智能是否需要专门的芯片?现有的技术架构具有怎样的优势?近期,北京建广资产管理有限公司主办了一场以“构造’芯’生态”为主题的沙龙,赛迪智库半导体研究所副所长林雨从AI芯片定义、分类、生态环境、投资等方面做了分析。 人工智能如果按照架构进行划分,有三个重要元素:数据、算法和算例,其中算例就是芯片,算例是基础,算法是核心,数据是保障。先看人工智能的定义,从广义上讲只要能够运行人工智能算法的芯片都叫人工智能芯片。但是深入分析,林雨表示,“只有针对人工智能算法做了特殊加速设计的芯片才可以称作为人工智能芯片,市场上真正做到了对芯片里面的架构做了特殊加速设计的公司少之又少。” 三个维度对人工智能进行分类 分别从功能、应用场景和技术架构对人工智能进行了分类: 从功能上来看,人工智能包括推理和训练两个环节。在训练层面,通过大数据训练出一个复杂的神经网络模型。目前训练环节主要使用英伟达的GPU集群完成,谷歌的TPU2.0也支持训练环节和深度网络加速。推理环节是指利用训练好的模型,使用新数据推理出各种结论。总得来看,训练环节对芯片的性能要求比较高,推理环节对简单指定的重复计算和低延迟的要求很高。 从应用场景来看,人工智能芯片应用于云端和设备端,在深度学习的训练阶段需要极大的数据量和大运算量,单一处理器无法独立完成,因此训练环节只能在云端实现。在设备端,智能终端的数量庞大,而且需求差异较大,比如VR设备对于实时性要求很高,推理环节无法在云端完成,要求设备有独立的推理计算能力,因此专用芯片的需求还是很大。 从技术架构来看有四类:一是通用性芯片,如GPU;二是以FPGA为代表的半定制化芯片,如深鉴科技的DPU;第三,ASIC全定制化芯片,如谷歌的TPU;第四,类脑芯片。 GPU/FPGA/ASIC/类脑芯片,各有怎样的优势? 为了进行大数据处理,当前的方案一般采用高性能的处理器辅助MCU进行计算,但是随着摩尔定律时间周期拉长,处理器上可集成的器件数量会达到极限,而数据量还在不断增加,因此我们需要通过架构的变化来满足数据量的增长,这就是人工智能芯片推出的背景。 |





