AI训练与推理芯片

2021/8/5 6:36:40

本文主要是介绍AI训练与推理芯片,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

AI训练与推理芯片

  1. 训练芯片

1.1.云燧T20

基于邃思2.0芯片打造的面向数据中心的第二代人工智能训练加速卡,具有模型覆盖面广、性能强、软件生态开放等特点,可支持多种人工智能训练场景。同时具备灵活的可扩展性,提供业界领先的人工智能算力集群方案。

 

 

 高密的计算芯片

57.5mm × 57.5mm超大封装尺寸提供高密的澎湃人工智能算力。

强劲的单精算力

最高达40TFLOPS(FP32)、160TFLOPS(TF32)的单精度算力。

先进的堆叠存储

基于HBM2E存储方案,最高可支持64GB容量,1.8TB/s带宽。

灵活的算力扩展

300GB/s的独立片间互联通道提供灵活的多芯片算力扩展方案。

邃思2.0芯片基于人工智能领域专用处理器架构设计,提供强劲的全精度人工智能算力、先进的存储方案、灵活的可扩展性,广泛支持视觉、语音语义、强化学习等各技术方向的模型训练。

 

 

 GCU-CARA 2.0架构

具有完全自主知识产权的通用计算架构,集成领先的计算引擎、数据引擎和互联引擎,提供高密的全精度人工智能算力,广泛支持各类型深度学习模型训练。

先进存储

搭载业界领先的HBM2E存储方案,具备超大存储容量和访存带宽,最高达到64GB和1.8TB/s,高效支持超大规模模型训练。

高速互联

燧原智能互联(GCU-LARE)是专为人工智能训练集群研发的互联技术,提供300GB/s互联带宽,支持数千张云燧加速卡互联,具备优异的线性加速比。

性能表现

 

 

 参数

 

1.2.云燧T21

基于OCP(开放计算项目)OAM(开放加速模组)标准设计、兼容OCP OAI标准(开放加速器基础设施)的高性能人工智能训练加速模组,基于邃思2.0芯片打造的,面向数据中心,可广泛应用于互联网、金融、教育、医疗、工业以及政务等行业。

 

 

 高密的计算芯片

57.5mm × 57.5mm超大封装尺寸提供高密的澎湃人工智能算力。

强劲的单精算力

最高达40TFLOPS(FP32)、160TFLOPS(TF32)的单精度算力。

先进的堆叠存储

基于HBM2E存储方案,最高可支持64GB容量,1.8TB/s带宽。

灵活的算力扩展

300GB/s的独立片间互联通道提供灵活的多芯片算力扩展方案。

邃思2.0芯片基于人工智能领域专用处理器架构设计,提供强劲的全精度人工智能算力、先进的存储方案、灵活的可扩展性,广泛支持视觉、语音语义、强化学习等各技术方向的模型训练。

 

 

 生态开放

基于OCP OAM标准(开放加速模组)

兼容OCP OAI标准(开放加速器基础设施)

提供更高效的服务器和数据中心设计。

 

 

 高速互联

燧原智能互联(GCU-LARE)是专为人工智能训练集群研发的互联技术,提供300GB/s互联带宽,支持数千张云燧加速卡互联,具备优异的线性加速比。

GCU-CARA 2.0架构

具有完全自主知识产权的通用计算架构,集成领先的计算引擎、数据引擎和互联引擎,提供高密的全精度人工智能算力,广泛支持各类型深度学习模型训练。

性能表现

 

 

 参数

 

 

 2. 推理芯片

云燧i10是一款面向云端数据中心的高性能人工智能推理加速卡,可广泛应用于计算机视觉、自然语言处理、语音识别与合成、知识图谱等多类型云端推理场景。

 

 

 

 

 性能表现

 

 

 参数

 

 

 3. 软件平台

 

 

 特性

 

 

 计算及编程平台

 

 

 产品应用

CLOUDBLAZER T20

云燧T20是基于邃思2.0芯片打造的面向数据中心的第二代人工智能训练加速卡,具有模型覆盖面广、性能强、软件生态开放等特点,可支持多种人工智能训练场景。同时具备灵活的可扩展性,提供业界领先的人工智能算力集群方案。

CLOUDBLAZER T21

云燧T21是基于OCP(开放计算项目)OAM(开放加速模组)标准设计、兼容OCP OAI标准(开放加速器基础设施)的高性能人工智能训练加速模组,基于邃思2.0芯片打造的,面向数据中心,可广泛应用于互联网、金融、教育、医疗、工业以及政务等行业。

 

 

 

参考链接:https://www.enflame-tech.com/



这篇关于AI训练与推理芯片的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程