嵌入式神经网路处理器(NPU)採用“数据驱动并行计算”的架构,特别擅长处理视频、图像类的海量多媒体数据。
基本介绍
- 中文名网路处理器
- 外文名Neural-network Processing Unit
简介
cpu=center process units
npu=neural-network process units
npu不是测试的项目,是网路处理器,可以把这个认为是一个组件(或者子系统),有的时候也可以称呼为NPU协处理器。
推进过程
2016年6 月 20 日,中星微数字多媒体晶片技术 国家重点实验室在北京宣布,已研发成功了中国首款嵌入式神经网路处理器(NPU)晶片,成为全球首颗具备深度学习人工智慧的嵌入式视频採集压缩编码系统级晶片,并取名“星光智慧型一号”。这款基于深度学习的晶片运用在人脸识别上,最高能达到98%的準确率,超过人眼的识别率。该晶片于今年3月6日实现量产,目前出货量为十几万件。
该实验室执行主任、中星微首席技术官张韵东在接受採访时表示,装备了神经网路处理器的晶片套用在监控摄像头上,摄影头由“眼睛”升级为“带有大脑的眼睛”,这是全球。 “数字多媒体晶片技术”国家重点实验室成立于2010年,依託于北京中星微电子有限公司,由科技部批准建立。据资料显示,中星微电子有限公司于1999年由原国家信息产业部直接投资创立,是专攻晶片技术的公司中的“国家队”,其研发的“星光系列晶片”曾打破国际市场上无“中国芯”的局面。 人工智慧的落地 “星光智慧型一号”是一款嵌入式NPU。神经网路处理器NPU(Neural Processing Unit)还未被熟知,却是晶片领域热门的技术。它与冯诺依曼架构中的CPU处理器相对,採用的是“数据驱动并行计算”这种颠覆性的新型架构。如果将冯诺依曼架构处理数据的方式类比成脚踏车道,那幺“数据驱动并行计算”是128条多车道并行,可以处理128个数据,利于处理视频、图像类的海量多媒体数据。
在业内,单位功耗的计算性能,也就是性能功耗比,被用来衡量处理器架构的优劣。据该实验室执行主任、中星微首席技术官张韵东介绍,“星光智慧型一号”的性能功耗比在传统的冯诺依曼架构上“至少提高了两三个数量级”,也就是几百倍。
高功耗是很多顶尖人工智慧技术被诟病的。IBM20世纪的“深蓝”和谷歌2016的AlphaGo因其需要由巨大的数据计算支撑,前者使用超级计算机,后者使用伺服器集群,无法脱离恆定温度和湿度的机房。AlphaGo下一盘棋光电费就需要3000美元。张韵东将它们称之为“一场科学实验”,离技术落地、投入套用还有较远的距离。
这凸显了嵌入式NPU的小型化、低功耗和低成本优势,加快人工智慧技术落地套用。例如无人机对摄像头的重量和功耗有很高的要求,否则会影响起飞和续航能力。而“星光智慧型一号”只有普通邮票大小,重量仅几十克,它的诞生让诸多监控摄像头等小型设备有了人工智慧化的可能,迈出了人工智慧从神秘的机房,跨向生活套用的一步。