华为详解昇腾AI芯片:自研达芬奇架构 算力和能效比大幅提升

作者: www.damwl.com 分类: 国内 发布时间: 2018-11-18 04:25
华为详解昇腾AI芯片:自研达芬奇架构 算力和能效比大幅提升 2018-10-13 09:54:27 出处:快科技 作者: 编辑:朝晖  评论点击可以复制本篇文章的标题和链接  

10月10日,华为在全联接大会2018上,首次宣布了华为的AI战略以及全栈解决方案。与此同时,华为发布了自研云端AI芯片 昇腾(Ascend ) 系列,基于达芬奇架构,首批推出7nm的昇腾910以及12nm的昇腾310。

其中,昇腾910是目前单芯片计算密度最大的芯片,计算力远超谷歌和英伟达。昇腾910半精度(FP16)运算能力为256TFLOPS,比NVIDIA的Tesla V100要高一倍,整数精度(INT8)512TOPS,支持128通道全高清视频解码(H.264/265),最大功耗350W。

昇腾310芯片的最大功耗仅为8W,主打极致高效计算低功耗AI芯片。半精度(FP16)运算能力8TFLOPS,整数精度(INT8)16TOPS,支持16通道全高清视频解码(H.264/265)。这两款AI芯片和大规模分布式训练系统都将在明年第二季度推出。

华为详解昇腾AI芯片:自研达芬奇架构 算力和能效比大幅提升

日前,华为终端手机产品线总裁何刚发布长图,详细介绍了昇腾310的用途以及设计细节。

何刚表示,昇腾310作为华为全栈全场景AI解决方案的关键部分, 是华为全面AI战略的重要支撑。在设计方面,突破了人工智能芯片设计的功耗、算力等约束,实现了能效比的大幅提升。未来将为平安城市、自动驾驶、云业务和IT智能、智能制造、机器人、便携机、智能手机、智能手表等应用场景提供全新的解决方案。

昇腾310采用华为自研达芬奇架构,使用了华为自研的高效灵活CISC指令集,每个AI核心可以在1个周期内完成4096次MAC计算,集成了张量、矢量、标量等多种运算单元,支持多种混合精度计算,支持训练及推理两种场景的数据精度运算。

统一架构可以适配多种场景,功耗范围从几十毫瓦到几百瓦,弹性多核堆叠,可在多种场景下提供最优能耗比。

华为详解昇腾AI芯片:自研达芬奇架构 算力和能效比大幅提升

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!