智能

AI芯片到底是个神马 解读技术 AI基础 算力必备

概念

 

人工智能技术具有三大要素:算法、算力和数据。 由于AI技术的应用,对各种硬件设备的计算能力要求大大提高,AI芯片应运而生。 目前AI芯片发展的重点是神经网络等架构高速计算的核心硬件,即算力提升阶段。 未来AI技术成熟后,AI芯片有可能实现集算法和算力于一体的超脑能力。

现阶段的发展重点可以认为是:AI相关程序的高处理能力+低功耗

原理与探索

人工智能的许多数据处理涉及矩阵乘法和加法。 并行工作的大量 GPU 提供了一种廉价的方法,但以更高的功率为代价。 具有内置 DSP 模块和本地存储器的 FPGA 能效更高,但它们通常更昂贵。

应该用什么方法和原理来实现AI芯片,目前还存在不同意见。 这是新技术的特点。 探索台百花盛开。 这也与深度学习等算法模型研发不成熟有关,即人工智能的基础理论还存在很大差距。 空白的。 这是指导芯片设计的基本前提。 因此,当前的重点是如何更好地适应现有的数据流处理模式进行芯片优化设计。

在技​​术手段上,AI市场的第一颗芯片包括现成的CPU、GPU、FPGA、DSP的各种组合。 虽然英特尔、谷歌、英伟达、高通和 IBM 等公司正在开发新设计,但尚不清楚哪种方法会胜出。 似乎至少需要一个 CPU 来控制这些系统,但是当流式数据并行化时,需要各种类型的协处理器。

“如果你优化网络,优化问题,最小化位数,并为卷积神经网络使用定制硬件,那么你可以实现 2-3 倍的性能提升,”Deep 高级架构师兼总监 Samer Hijazi 说。 Cadence 的学习小组。 .效率来自于软件算法和硬件IP。”

谷歌正试图改变这个公式。 谷歌开发了 Tensor Processing Unit (TPU),这是一种专为机器学习打造的 ASIC。 为了加速人工智能的发展,谷歌在2015年开源了TensorFlow软件,很多公司都有自己的平台。 但这些都不是最终产品。 这是进化的过程,没有人能确定人工智能在未来十年会如何发展。 部分原因是人工智能技术的用例正在逐渐被发现。 适用于一个领域的 AI 技术(例如视觉处理)可能不一定适用于另一个领域(例如确定某种气味是危险的还是安全的,或者两者的结合)。

ai技术需要学什么_学技术到新东方+学嫖娼_学烘焙技术需要多长时间/

华为AI芯片麒麟970,在非AI芯片兼有CPU/GPU/ISP/DSP的基础上,首次集成NPU(Neural Network Processing Unit)专用硬件处理单元,创新设计HiAI移动计算架构,其AI 性能密度大幅提升 优于 CPU 和 GPU。 通过更高效灵活的异构计算最大限度发挥CPU/GPU/ISP/DSP/NPU的性能,同时首次集成专用于神经网络任务处理的NPU(Neural Network Processing Unit)计算单元,其加速性能和能效比CPU和GPU好很多。

学烘焙技术需要多长时间_学技术到新东方+学嫖娼_ai技术需要学什么/

与非AI芯片相比,华为的AI芯片麒麟970在加入嵌入式神经网络处理器(NPU)后,功耗和性能有了很大的提升。 其中,功耗降低20%,图形处理性能提升20%,能效提升50%。 处理器支持高性能手机。

ai技术需要学什么_学烘焙技术需要多长时间_学技术到新东方+学嫖娼/

英特尔此前收购了 Nervana。 Nervana 开发了一种 2.5D 深度学习芯片,该芯片利用高性能处理器内核将数据通过中介层移动到高带宽内存。 Nervana 的既定目标是,与基于 GPU 的解决方案相比,该芯片将训练深度学习模型所需的时间减少 100 倍。

量子计算为人工智能系统增加了另一种选择。 Leti CEO Marie Semeria 表示,量子计算是她团队未来的方向之一,尤其是在 AI 应用方面。 IBM Research 科学与解决方案组副总裁 Dario Gil 解释说,使用经典计算,如果有四张牌,三蓝一红,则有四分之一的机会猜到红牌。 使用量子计算机和量子比特的叠加和纠缠,通过反转纠缠,系统每次都给出正确答案。

主要公司

英伟达的GPU已经成为云服务器领域不可或缺的一部分,称其为龙头也不为过。 据报道,目前全球有超过3000家AI创业公司,其中大部分使用的是英伟达提供的硬件平台。

作为PC时代的绝对霸主,英特尔错过了移动互联网时代,也在即将到来的AI时代失去了先机,但它并没有放弃,而是在积极谋划和准备逆袭。 在云端,收购Altera后推出了专用的基于FPGA的深度学习加速卡,可以在云端使用; 此外,对Nervana的收购也瞄准了云。 移动端收购了Movidius。

IBM很早以前就发布了watson,也早就投入到很多实际应用中了。 此外,类人脑芯片的研发也已经启动,这就是TrueNorth。 TrueNorth 是 IBM 参与 DARPA 的研究项目 SyNapse 的最新成果。 SyNapse的全称是Systems of Neuromorphic Adaptive Plastic Sc​​alable Electronics(自适应塑料和可扩展电子神经系统,SyNapse只是突触的意思),其最终目标是开发突破冯·诺依曼系统的硬件。

2016年,谷歌宣布自主研发全新处理系统TPU。 TPU 是专为机器学习应用而设计的专用芯片。 通过降低芯片的计算精度,减少实现每个计算操作所需的晶体管数量,芯片每秒可以运行更高的操作次数,从而使经过微调的机器学习模型可以在芯片上高效运行。 更快,从而更快地为用户带来更智能的结果。 谷歌将TPU加速芯片嵌入电路板,利用现有的硬盘PCI-E接口连接数据中心服务器。

ARM 刚刚推出了 DynamIQ,一种新的芯片架构。 通过这项技术,人工智能的性能有望在未来三到五年内提高 50 倍。 ARM 的新 CPU 架构将通过为不同部分配置软件来汇集多个处理核心,其中包括专为 AI 算法设计的处理器。 芯片制造商将能够为新处理器配置多达八个内核。 同时,为了让主流AI更好地运行在自家处理器上,ARM也会发布一系列的软件库。

CEVA 是一家专注于 DSP 的 IP 供应商,拥有大量的产品线。 其中,图像与计算机视觉DSP产品CEVA-XM4是首款支持深度学习的可编程DSP,其新一代型号CEVA-XM6性能更优、计算能力更强大、能耗更低。

Eyeriss其实是MIT的一个项目,还不是一个公司,但是因为受到了很多媒体的报道,所以单独介绍一下。 从长远来看,如果进展顺利,很有可能孵化出新的公司。

中星微电子率先推出国内首款嵌入式神经网络处理器(NPU)芯片,这是全球首款具有深度学习人工智能的嵌入式视频采集压缩编码系统级芯片,命名为“星光智造”。 这种基于深度学习的芯片用于人脸识别,最高准确率可达98%,超过了人眼的识别率。 NPU采用“数据驱动”的并行计算架构,单颗NPU(28nm)能耗仅为400mW,大幅提升算力功耗比。

寒武纪拥有中科院背景,研发深度学习等人工智能关键技术专用芯片,可用于云服务器和智能终端上的图像识别、语音识别、人脸识别等应用。 寒武纪深度学习处理器所使用的指令集点脑语是由中科院计算所陈云霁、陈天石课题组提出的。 仿真实验表明,采用点脑语指令集的寒武纪深度学习处理器相比采用x86指令集的CPU有两个数量级的性能提升。

地平线(Horizo​​n Robotics)由原百度深度学习研究院院长于凯创立,致力于打造基于深度神经网络的人工智能“大脑”平台——包括软件和芯片,可实现低功耗消费及本地化解决方案 环境感知、人机交互、决策控制等问题。 其中,在软件方面,地平线开发了一套基于神经网络的OS,开发了自动驾驶“Hugo”平台和智能家居“Andersen”平台,并开始逐步落地。 在硬件方面,未来地平线还将为该平台设计芯片——NPU(Neural Processing Unit),以支持自家的OS。 届时,性能将提升2-3个数量级(100-1000倍)。

深鉴科技由清华团队创立。 它的产品叫做“深度处理单元”(Deep Processing Unit,DPU)。 目标是利用 ASIC 级别的功耗实现比 GPU 更好的性能。 目前,第一批产品是基于FPGA的。 平台。

发展前景

展望未来,能否在AI芯片中真正实现像人类DNA+大脑核心控制那样集“感知、处理、决策”为一体的核心控制硬件,还需要更先进的算法、大数据等技术相伴人工智能技术。 成熟后的同步提升属于更遥远的未来。 目前还处于算力提升阶段。

参考

唐氏二少爷:

埃德·斯珀林:

了解范泰迪:

用好智能之道:行业动态、技术前沿、产业服务,欢迎关注联系:九三智控

学技术到新东方+学嫖娼_学烘焙技术需要多长时间_ai技术需要学什么/