扫一扫关注我们

业务咨询

业务咨询×

怎么称呼您:

您的单位是:

您的手机号:

您的邮箱:

您对哪款产品感兴趣:

您想咨询的内容:

1.

Deep Learning Acceleration Solutions深度学习加速解决方案

最近几年数据量和可访问性的迅速增长,使得人工智能的算法设计理念发生了转变。人工建立算法的做法被计算机通过从大数据中自动学习的方法所取代,使得计算机视觉、语音识别、自然语言处理等关键领域都出现了重大突破。深度学习是这些领域中最常使用的技术,也被业界大为关注。然而,深度学习模型需要极为大量的数据和计算能力,只有更好的硬件加速条件,才能满足现有数据和模型规模继续扩大的需求。现有的解决方案使用图形处理单元(GPU),尽管 GPU 对深度学习算法而言在性能方面是一种更好的选择,但其功耗太高使得应用也受到很大限制。

因此,急需一种能够加速算法又不会显著增加功耗的处理平台。在这样的背景下,FPGA 似乎是一种理想的选择,可以实现60GFLOPS/W的超高性能功耗比,是GPU3倍以上。虽然个别的GPU提供峰值浮点性能,在深度神经网络的应用中,相比相同的性能水平,FPGA消耗更少的功率,并可以安装在刀片式服务器上,完全由连接在主板上的PCI Express总线供电。此外在FPGA方案中一个计算得到的结果可以被直接发送到下一个计算单元,而无需在主机侧存储器临时保存,因此对存储器带宽需求比使用GPU或CPU实现时低得多。