雨林木风 > 新闻资讯 >

AMD涉足人工智能 Radeon Instinct公布

AMD涉足人工智能 Radeon Instinct公布

作者:佚名 来源:雨林木风 2016-12-13 18:55:00

近些年来,随着语音识别技术与图像识别技术迎来前所未有的突破,人工智能已经成为世界范围内最具发展前景的领域。智能机器人、无人驾驶、物联网等领域的大力发展,也对底层的硬件技术、计算能力、深度学习等提出了更高的要求。

    2016年12月12日,北京时间晚10点,AMD(纳斯达克股票代码:AMD)正式公布了人工智能新战略,即在服务器计算当中使用硬件和开源软件套件,加速机器智能新时代,从而大幅度提升深度学习性能和效率,同时让工作负载更易实施。

    AMD通过推出全新的Radeon Instinct加速卡,将为用户提供基于GPU加速计算的解决方案,主要用于深度学习推理和训练。伴随这款全新硬件平台,AMD还宣布推出MIOpe——GPU加速器的免费开源库,用于实施高性能的机器智能,为AMD ROCm软件提供全新优化的深度学习框架,为机器智能持续进化提供基础。

   据悉,Radeon Instinct共推出MI6、MI8以及MI25三个型号,其中最高端的MI25加速卡拥有16位半精度浮点25TFLOPs,32位单精度浮点12.5TFLOPs,TDP低于300W。采用了HBM2显存、16GB显存容量、带宽为512GB/s,并采用了AMD全新的Vega架构核心,而HBM2代显存赋予了它跟高的缓存和主控方案。

AMD涉足人工智能 Radeon Instinct公布 机器智能时代到来,并呈现快速增长趋势
 

    与以往相比,随着人工智能、万物互联时代的到来,传感器相关数据与用户生成的内容数据每时每刻都在呈现指数级增长,它们都在全球驱动数亿字节数据。在机器智能算法方面取得的最新进展和相关高性能GPU,让数据处理和理解呈现数量级加速,从而近似实时地产生见解。Radeon Instinct是针对机器智能的开放软件生态系统的蓝图,有助于加速推理洞察和算法训练。

AMD涉足人工智能 Radeon Instinct公布
AMD Radeon Instinct加速器被用于深度学习推理与训练

    AMD总裁兼首席执行官苏姿丰博士表示:“Radeon Instinct是一款高性能GPU加速器,结合MIOpen和ROCm之中免费开源软件,大大提高了机器智能发展步伐。结合高性能计算和图形能力以及我们的多代路线图实力,我们是唯一拥有GPU和x86硅芯片专业知识的公司,可以满足数据中心广泛需求,并帮助推动机器智能持续发展。”

    在上周举行的AMD技术峰会上,来自1026 Labs、Inventec、SuperMicro,多伦多大学CHIME无线电望远镜项目和Xilinx的客户和合作伙伴对Radeon Instinct推出赞赏不已,讨论了如何利用AMD机器智能和深度学习技术,以及它们如何从Radeon Instinct中受益。

AMD涉足人工智能 Radeon Instinct公布
Radeon Instinct机器学习训练演示

    Radeon Instinct采用被动式散热、符合SR-IOV(单根I/O虚拟化)行业标准的AMD MultiGPU(MxGPU)硬件虚拟化技术,并且具有大基址寄存器和64-bit PCIe寻址功能, 支持多GPU点对点运行。 
Radeon Instinct加速器用于处理各种机器智能应用:

    •Radeon Instinct MI6加速器基于备受欢迎的北极星GPU架构,采用被动散热,为工作/时间/功耗进行优化,板卡功耗150瓦,FP16峰值性能达到 5.7 TFLOPS,板载16GB GPU内存。

    •Radeon Instinct MI8 加速器利用高性能,高能源效率的“ Fiji”Nano GPU ,打造小尺寸HPC和推理加速器,FP16峰值性能达到 8.2 TFLOPS,板卡功耗低于175瓦,配备4GB高带宽内存(HBM)。

    •Radeon Instinct MI25加速器将使用AMD下一代高性能Vega GPU架构,专为深度学习训练而设计,针对求解整体时间进行了优化

    各种开源解决方案助力Radeon Instinct硬件:

    •MIOpen GPU加速库:为了帮助实施高性机器智能,免费的开源MIOpen GPU加速库计划于2017年第一季度上市,为卷积、池化、激活函数,归一化和张量格式等标准例程提供GPU优化。 

    •ROCm深度学习框架:优化ROCm平台,用于加速Caffe,Torch 7和Tensorflow *等流行的深度学习框架,允许程序员专注于训练神经网络,而不是通过ROCm丰富的集成进行底层性能调整。预期ROCm将作为基础,让机器智能问题集继续发展。除了开放的编译器和语言运行时,预计它也将具有专用编译器,用于线性代数和张量领域。

    AMD还投资开发超越当今PCIe Gen3标准的互连技术,以进一步提高未来机器智能应用性能。 AMD正在合作开发一些开放的高性能I/O标准,支持广泛的服务器CPU架构生态系统,包括X86、OpenPOWER和ARM AArch64。AMD是CCIX,Gen-Z和OpenCAPI创始成员,致力于为Radeon Instinct开发未来的25 Gbit/s phi加速器以及机架级互连。