扫一扫关注我们

业务咨询

业务咨询×

怎么称呼您:

您的单位是:

您的手机号:

您的邮箱:

您对哪款产品感兴趣:

您想咨询的内容:

加速云发布会剧透,来一发~~

2018-04-06 21:34:05

加速云推出的一整套基于 FPGA 的深度学习加速方案,包括 SC-OPM /SC-OPF /SC-OPS加速卡 及 FDNN加速库,具有高性能功耗比、低延时、定制化等优点,快速满足深度学习大量并行计算的要求,提供更好的硬件加速环境,因此基于FPGA的深度学习方案成为未来技术发展方向。


最近几年大数据和计算力的快速增长使得深度学习技术有了质的飞跃,从而在计算机视觉、语音识别、自然语言处理等领域出现了重大突破。然而深度学习需要大量的并行计算,对硬件平台有极高的要求,传统的计算机是无法满足的。现有的解决方案是使用GPU来完成深度学习的训练,但GPU的功耗太高,性能功耗比差,处理延时大,对大规模推理部署和一些对延时敏感的场景并不适合。由于FPGA具有很高的性能功耗比,而且基于门级电路设计使得FPGA是一个超低延时和确定延时的方案FPGA的可编程性及动态可重构可以适应深度学习未来算法的变化,IO可编程性可以满足更多业务需求(网络加速,边缘计算),因此基于FPGA的深度学习方案成为未来技术发展方向。





为此加速云推出一整套基于FPGA的深度学习加速方案,包括SC-OPM /SC-OPF /SC-OPS加速卡 及 FDNN加速库,快速满足市场需求。


▷ SC-OPS

SC-OPS基于Intel最新14nm工艺的 Stratix10 FPGA,能够提供2800K LE及9.2T FLOPS的计算性能,支持8个DDR4控制器,提供高达150GB/S访存带宽,提供PCIe*16Lane接口,支持高达128Gbps的访问速度,是全球第一张最高性能FPGA加速卡,可以满足数据中心高性能深度学习加速。


▷ SC-OPM/SC-OPF

SC-OPM/SC-OPF基于Intel 20nm工艺的 Arria 10 FPGA,能够提供1150K~2*1150K LE及1.5~2T FLOPS计算性能,可以满足数据中心和边缘计算网关深度学习加速。


▷ RTL级深度神经网络加速库FDNN

为了满足客户对深度学习高性能、灵活性加速要求,加速云开发了一套基于RTL的深度神经网络加速库FDNN,可以实现参数可配置的CNN/DNN/LSTM,也提供高性能的常见网络模型加速库(包括Lenet,VGG16,Darknet19,YOLOV2, RestNet,DNN, LSTM)。为了方便客户使用高层语言开发,加速云提供基于FPGA完整的OpenCL异构开发环境,快速实现用户自定义的深度学习加速方案。同时加速云也提供快速深度神经网络定制加速服务。




基于FPGA的深度学习加速方案优势


A. 高性能集成IP,便于使用和二次开发

B. 丰富IO接口,方便灵活扩展

C. 模块化设计,支持各种应用场景

D. 高性能功耗比,降低运营成本

E.  超低延时及确定性延时,支持时间敏感型应用场景


性能指标



活动现场,加速云技术专家将会和大家分享大量经典案例,心动了嘛?有兴趣的小伙伴不容错过,一定要记得报名哦~~


点击:加速新科技,驱动智未来,加速云期待与您携手同行了解更多发布会咨询



微信扫一扫,立即报名


加速新科技,驱动智未来