大家好,欢迎来到IT知识分享网。
1. 引言
随着大模型的火热,越来越多的人希望可以购买一个硬件进行大模型的推理,特别是在3090和4090显卡的对比上,需求比较大。目前已有的显卡对比,大多面向于高端的A/H100或者800系列的对比和分析,如图所示。
项目 | A100 | H100 | L40S | H200 |
---|---|---|---|---|
架构 | Ampere | Hopper | Ada Lovelace | Hopper |
发布时间 | 2020 | 2022 | 2023 | 2024 |
FP64 | 9.7 TFLOPS | 34 TFLOPS | 暂无 | 34 TFLOPS |
FP32 | 19.5 TFLOPS | 67 TFLOPS | 91.6 TFLOPS | 67 TFLOPS |
FP64 向量核心 | 19.5 TFLOPS | 67 TFLOPS | 暂无 | 67 TFLOPS |
TF32 向量核心 | 312 TFLOPS | 989 TFLOPS | 183 TFLOPS | 366* TFLOPS |
BFLOAT16 向量核心 | 624 TFLOPS | 1,979 TFLOPS | 362.05 TFLOPS | 733* TFLOPS |
FP16 向量核心 | 624 TFLOPS | 1,979 TFLOPS | 362.05 TFLOPS | 733* TFLOPS |
FP8 向量核心 | 不适用 | 3,958 TFLOPS | 733 TFLOPS | 1,466* TFLOPS |
INT8 向量核心 | 1248 TOPS | 3,958 TOPS | 733 TFLOPS | 1,466* TFLOPS |
INT4 向量核心 | 暂无 | 暂无 | 733 TFLOPS | 1,466* TFLOPS |
GPU 内存 | 80 GB HBM2e | 80 GB | 48GB GDDR6,带有 ECC | 141GB HBM3e |
GPU 内存带宽 | 2,039 Gbps | 3.35 Tbps | 864 Gbps | 4.8 Tbps |
解码器 | Not applicable | 7 NVDEC, 7 JPEG | Not applicable | 7 NVDEC, 7 JPEG |
但是,对于消费级的显卡的计算能力的参数对比还比较少,更多的是对比游戏或者跑分的。由于工作需要,特地辗转了多方网站,整理了3090和4090的性能参数对比图,附带A100的参数用于衔接。
属性 | RTX 4090 | RTX 3090 | A100 (SMX4-80G) |
---|---|---|---|
GPU架构 | AD102 (Ada Lovelace) | GA102 (Ampere) | GA100(Ampere) |
GPCs (Graphics Processing Clusters) | 11 | 7 | 7 |
TPCs (Texture Processing Clusters) | 64 | 14 | 54 |
SMs (Streaming Multiprocessors) | 128 | 82 | 108 |
FP32 CUDA Cores | 16384 | 10496 | 6912 |
INT32 CUDA Cores | 8192 | 5248 | 6912 |
Tensor Cores | 512 | 328 | 432 |
RT Cores | 128 | 82 | N/A |
Geometry Units | 64 | 41 | N/A |
TMUs (Texture Units) | 512 | 328 | 432 |
ROPs (Raster Operation Units) | 176 | 112 | 160 |
INT4 (TOPS) | 1321.2/2642.4 | 568/1136 | 1248/2496 |
INT8 (TOPS) | 660.6/1321.2 | 284/568 | 624/1248 |
INT32 (TIPS) | 41.3 | 17.8 | 19.5 |
BF16 (TFLOPS) | 82.6 | 35.6 | 39 |
FP16 (TFLOPS) | 82.6 | 35.6 | 78 |
FP32 (TFLOPS) | 82.6 | 35.6 | 19.5 |
FP64 (TFLOPS) | 1.3 | 0.56 | 9.7 |
Tensor Core FP8 (TFLOPS) | 660.6/1321.2 | N/A | N/A |
Tensor Core FP16 (TFLOPS) | 330/660 | 142/284 | 312/624 |
Tensor Core TF32 (TFLOPS) | 82.6/165.2 | 35.6/71 | 156/312 |
参考文献
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/130027.html