En este tema vamos a hablar de las tarjetas gráficas centrándonos en las de la marca NVIDIA, aunque también existen otros fabricantes como AMD o Intel.
Una tarjeta gráfica está compuesta de lo siguiente:
Mas información:
Al igual que una CPU esta compuesta por núcleos, una GPU está compuesta por Streaming Multiprocessor o SM
La diferencia entre un Núcleo de una CPU y un Streaming Multiprocessor de una GPU es que una GPU es prácticamente muchisimas ALUs o FPUs.
La siguiente arquitectura es de una Tarjeta gŕafica "NVIDIA Quadro RTX 6000" con arquitectura Turing y GPU TU102
Cada SM tiene su propia cache L1
La tarjeta gráfica incluye una cache L2
Architecture | Pascal | Turing | Ampere | Lovelace | Blackwell | ||||
---|---|---|---|---|---|---|---|---|---|
Graphics Card | GeForce GTX 1080 | GeForce GTX 1080Ti | GeForce RTX 2080 | GeForce RTX 2080Ti | GeForce RTX 3060 | GeForce RTX 3090 Ti | GeForce RTX 4060 | GeForce RTX 4090 | GeForce RTX 5090 |
GPU | GP104 | GP102 | TU104 | TU102 | GA106 | GA102 | AD107 | AD102 | |
GPCs | 4 | 6 | 6 | 6 | 3 | 7 | 3 | 11 | |
TPCs | 20 | 28 | 23 | 34 | 14 | 42 | 12 | 64 | |
SMs | 20 | 28 | 46 | 68 | 28 | 84 | 24 | 128 | |
CUDA Cores/SM | 128 | 128 | 64 | 64 | 128 | 128 | 128 | 128 | |
CUDA Cores/GPU | 2.560 | 3.584 | 2.944 | 4.352 | 3.584 | 10.752 | 3.072 | 16.384 | |
FP32 TFLOPS | 8.9 | 11.3 | 10.6 | 14.2 | 12.74 | 40 | 15.11 | 82.6 | |
Tensor Cores/SM | N/A | N/A | 8 (2nd Gen) | 8 (2nd Gen) | 4 (3rd Gen) | 4 (3rd Gen) | 4 (4th Gen) | 4 (4th Gen) | |
Tensor Cores/GPU | N/A | N/A | 368 (2nd Gen) | 544 (2nd Gen) | 112 (3rd Gen) | 336 (3rd Gen) | 96 (4th Gen) | 512 (4th Gen) | |
RT Cores | N/A | N/A | 46 (1st Gen) | 68 (1st Gen) | 28 (2rd Gen) | 84 (2nd Gen) | 24 (3rd Gen) | 128 (3rd Gen) |
Veamos algunos ejemplos aunque a veces no hay cambios como de una Quadro P5000 a una GeForce GTX 1080 que no hay diferencia pero si de una Quadro P6000 a una GeForce GTX 1080Ti
GP104 | ||
---|---|---|
Quadro P5000 | GeForce GTX 1080 | |
TPCs | 20 | 20 |
SMs | 20 | 20 |
CUDA Cores/GPU | 2560 | 2560 |
GP102 | ||
---|---|---|
Quadro P6000 | GeForce GTX 1080Ti | |
TPCs | 30 | 28 |
SMs | 30 | 28 |
CUDA Cores/GPU | 3840 | 3584 |
TU104 | ||||
---|---|---|---|---|
Quadro RTX 5000 | GeForce RTX 2080 | GeForce RTX 2080 Super | NVIDIA T4 | |
TPCs | 24 | 23 | 24 | 20 |
SMs | 48 | 46 | 48 | 40 |
CUDA Cores/GPU | 3072 | 2944 | 3072 | 2650 |
TU102 | ||
---|---|---|
Quadro RTX 6000 | GeForce RTX 2080Ti | |
TPCs | 36 | 34 |
SMs | 72 | 68 |
CUDA Cores/GPU | 4608 | 4352 |
GA102 | |||
---|---|---|---|
GeForce RTX 3090 Ti | GeForce RTX 3080 Ti | NVIDIA A40 | |
TPCs | 42 | 40 | 42 |
SMs | 84 | 80 | 84 |
CUDA Cores/GPU | 10752 | 10240 | 10752 |
AD102 | |||
---|---|---|---|
GeForce RTX 4090 | NVIDIA L40 | GeForce RTX 4090 Ti | |
TPCs | 64 | 71 | 72 |
SMs | 128 | 142 | 144 |
CUDA Cores/GPU | 16384 | 18176 | 18432 |
Mas información:
Lo que hace un Tensor Core: Multiplicación mas Suma de Matrices.Se usan en inteligencia artificial (Redes neuronales).La aplicación mas utilizada para redes neuronales se llama TensorFlow. Un Tensor es como una matriz pero que puede tener mas de 2 dimensiones.
Mas información:
Al igual que los procesadores, las gráficas también tienen distintas generaciones de microarquitecturas, aunque en este caso se les suele llamar directamente arquitecturas.
Año | Microarquitecturas | Serie | Ejemplo de modelo | GPU |
---|---|---|---|---|
2010 | Fermi | GeForce 400 | GTX 480 | GF100,GF104,GF106,etc. |
2012 | Kepler | GeForce 600 | GTX 680 | GK104,GK106,GK107,etc. |
2014 | Maxwell | GeForce 900 | GTX 980 Ti | GM107,GM108 |
2016 | Pascal | GeForce 10 | GTX 1080 Ti | GP100,GP102,GP104,etc. |
2017 | Volta | No es una gráfica | Tesla V100 | GV100 |
2018 | Turing | GeForce 20 | RTX 2080 Ti | TU102,TU104,TU106,etc. |
2020 | Ampere | GeForce 30 | RTX 3060 | GA100,GA102,GA104,etc. |
2020 | Ampere | No es una gráfica | A100 | GA100 |
2022 | Hopper | No es una gráfica | H100 y H200 | GH100 y GH200 |
2022 | Lovelace | GeForce 40 | RTX 4060 | AD102, AD103, AD104, AD106 y AD107 |
2025 | Blackwell | GeForce 50 | RTX 5090 | GB102,GB103,etc. |
NOTA: Grace Hopper es el nombre de una mujer que ayudó a crear el lenguaje COBOL (Aun usado en bancos de todo el mundo). Acuñó el termino bug además de muchos otro méritos.
Los nombres de las tarjetas gráficas son las siguientes:
Ejemplos:
Mas información:
Las tarjetas gráficas usan memoria RAM pero no es DDR sino otros dos tipos de memoria.
En el artículo Sin solución en el horizonte: NVIDIA, la GDDR6X y su temperatura en RTX, vemos los problemas de temperatura de las RTX 3080 y RTX 3090. Estos problemas son inicialmente debidos a la mala calidad del Thermal pad pero también a que la memoria GDDR6X genera mas calor que la HBM2.
Mas información:
La salida de video es por donde la tarjeta gráfica saca la señal para el monitor.
Existen 5 conectores distintos en las tarjetas gráficas.
¿Recuerdas algo similar en los discos SATA?
Mas información:
Al igual que los procesadores, las gráficas también desprenden calor.Dicho calor hay que disiparlo y para ello las tarjetas gráficas incluyen disipadores y/o ventiladores.
Los parámetros que se especifican para saber el calor que generan son los siguientes:
Realmente el que nos interesa es el TBP pero como eso depende del ensamblador de la tarjeta , el fabricante de la GPU solo puede dar el TGP. Sin embargo da diferencia entre el TGP y TBP es muy poca ya que el ventilador o los leds generan muy poco calor.
Mas información:
Lee los siguientes artículos para comprobar que entiendes los conceptos que especifican las tarjetas gráficas:
Rellena la siguiente tabla:
RTX 2080 Ti | RTX 3060 | |
---|---|---|
Nº de Streaming Multiprocessor (SM) | ||
Nº total de CUDA Cores | ||
Nº de CUDA Cores en cada SM | ||
Nº total de Tensor Cores | ||
Nº de Tensor Cores en cada SM | ||
Nº total de RTX Cores | ||
Nº de RTX Cores en cada SM | ||
Tamaño de la memoria | ||
Tipo de la memoria | ||
TGP | ||
Precio |
Lee el siguiente artículo. ¿Cuánto rendimiento puede ganar una GPU dependiendo del bus de su memoria?
Mira si coinciden los cálculos hechos en el artículo de la AMD Radeon RX 5700 con los datos de de la siguiente página:
Ahora comprueba si coinciden los cálculos hechos en el artículo de la NVIDIA GeForce GTX 1060 con los datos de de la siguiente páginas:
Busca 10 tarjetas gráficas de diversos precios y que estén en la siguiente página PassMark Software - Video Card (GPU) Benchmark Charts - Video Card Model List. Anota para cada una de ellas, el valor de la columna "Passmark G3D Mark".
Haz una gráfica de puntos con lo siguiente.
Únicamente viendo la gráfica y basándote en la relación calidad/precio (Passmark G3D Mark y precio), explica:
Ejemplo de gráfica:
Haz una gráfica de puntos de tarjetas NVIDIA con lo siguiente.
Indica si hay relación entre los CUDA Cores y el "Passmark G3D Mark"
Rellena para la siguiente tabla, el Nº de CUDA cores que tiene cada modelo de tarjeta gŕaficas
Modelo | Nº CUDA Cores |
---|---|
GeForce GTX 1060 | |
GeForce GTX 1070 | |
GeForce GTX 1080 | |
GeForce RTX 2060 | |
GeForce RTX 2070 | |
GeForce RTX 2080 | |
GeForce RTX 3060 | |
GeForce RTX 3070 | |
GeForce RTX 3080 |
Muestra ahora esa misma información en la siguiente tabla:
Generación | |||
---|---|---|---|
GeForce 10 (Pascal) | GeForce 20 (Turing) | GeForce 30 (Ampere) | |
Modelo 60 | |||
Modelo 70 | |||
Modelo 80 |
¿Se cumple esa frase que se dice que una tarjeta gráfica de una generación es como la siguiente del modelo anterior? Es decir que una GeForce GTX 1070 es como GeForce RTX 2060.
Rellena la siguiente tabla:
Estándar | Velocidad (Gb/s) | Codificación | Ratio | Velocidad útil (Gb/s) |
---|---|---|---|---|
HDMI 2.1 | ||||
DisplayPort 2.0 |