Tabla de Contenidos

10. Tarjetas Gráficas

En este tema vamos a hablar de las tarjetas gráficas centrándonos en las de la marca NVIDIA, aunque también existen otros fabricantes como AMD o Intel.

Una tarjeta gráfica está compuesta de lo siguiente:

Mas información:

GPU

Al igual que una CPU esta compuesta por núcleos, una GPU está compuesta por Streaming Multiprocessor o SM

La diferencia entre un Núcleo de una CPU y un Streaming Multiprocessor de una GPU es que una GPU es prácticamente muchisimas ALUs o FPUs.

La siguiente arquitectura es de una Tarjeta gŕafica "NVIDIA Quadro RTX 6000" con arquitectura Turing y GPU TU102

Normalmente en las especificaciones no se suele indicar el número de ALUs o INT32 ya que como ya dijimos en las CPUs "ocupan" poco espacio en comparación con una FP32 o FP64 (o CUDA Core)
Los SM internamente se dividen en 4 Processing Blocks o Subcores. Por ello cada subcore consta de:
  • 16 CUDA Cores
  • 16 ALUs
  • 2 Tensor Cores
  • Registros
  • Cache L0 para instrucciones

Cada SM tiene su propia cache L1

La tarjeta gráfica incluye una cache L2

Architecture Pascal Turing Ampere Lovelace Blackwell
Graphics Card GeForce GTX 1080 GeForce GTX 1080Ti GeForce RTX 2080 GeForce RTX 2080Ti GeForce RTX 3060 GeForce RTX 3090 Ti GeForce RTX 4060 GeForce RTX 4090 GeForce RTX 5090
GPU GP104 GP102 TU104 TU102 GA106 GA102 AD107 AD102
GPCs 4 6 6 6 3 7 3 11
TPCs 20 28 23 34 14 42 12 64
SMs 20 28 46 68 28 84 24 128
CUDA Cores/SM 128 128 64 64 128 128 128 128
CUDA Cores/GPU 2.560 3.584 2.944 4.352 3.584 10.752 3.072 16.384
FP32 TFLOPS 8.9 11.3 10.6 14.2 12.74 40 15.11 82.6
Tensor Cores/SM N/A N/A 8 (2nd Gen) 8 (2nd Gen) 4 (3rd Gen) 4 (3rd Gen) 4 (4th Gen) 4 (4th Gen)
Tensor Cores/GPU N/A N/A 368 (2nd Gen) 544 (2nd Gen) 112 (3rd Gen) 336 (3rd Gen) 96 (4th Gen) 512 (4th Gen)
RT Cores N/A N/A 46 (1st Gen) 68 (1st Gen) 28 (2rd Gen) 84 (2nd Gen) 24 (3rd Gen) 128 (3rd Gen)
Las GPU tienen varias versiones (variantes), ocurre porque en el proceso de fabricación fallan algunas SMs entonces los venden con menos capacidad o simplemente bajan el rendimiento para ajustar el consumo.

Veamos algunos ejemplos aunque a veces no hay cambios como de una Quadro P5000 a una GeForce GTX 1080 que no hay diferencia pero si de una Quadro P6000 a una GeForce GTX 1080Ti

GP104
Quadro P5000 GeForce GTX 1080
TPCs 20 20
SMs 20 20
CUDA Cores/GPU 2560 2560
GP102
Quadro P6000 GeForce GTX 1080Ti
TPCs 30 28
SMs 30 28
CUDA Cores/GPU 3840 3584
TU104
Quadro RTX 5000 GeForce RTX 2080 GeForce RTX 2080 Super NVIDIA T4
TPCs 24 23 24 20
SMs 48 46 48 40
CUDA Cores/GPU 3072 2944 3072 2650
TU102
Quadro RTX 6000 GeForce RTX 2080Ti
TPCs 36 34
SMs 72 68
CUDA Cores/GPU 4608 4352
GA102
GeForce RTX 3090 Ti GeForce RTX 3080 Ti NVIDIA A40
TPCs 42 40 42
SMs 84 80 84
CUDA Cores/GPU 10752 10240 10752
AD102
GeForce RTX 4090 NVIDIA L40 GeForce RTX 4090 Ti
TPCs 64 71 72
SMs 128 142 144
CUDA Cores/GPU 16384 18176 18432

Mas información:

Tensor Core

Lo que hace un Tensor Core: Multiplicación mas Suma de Matrices.Se usan en inteligencia artificial (Redes neuronales).La aplicación mas utilizada para redes neuronales se llama TensorFlow. Un Tensor es como una matriz pero que puede tener mas de 2 dimensiones.

Mas información:

Arquitecturas de GPU

Al igual que los procesadores, las gráficas también tienen distintas generaciones de microarquitecturas, aunque en este caso se les suele llamar directamente arquitecturas.

Año Microarquitecturas Serie Ejemplo de modelo GPU
2010 Fermi GeForce 400 GTX 480 GF100,GF104,GF106,etc.
2012 Kepler GeForce 600 GTX 680 GK104,GK106,GK107,etc.
2014 Maxwell GeForce 900 GTX 980 Ti GM107,GM108
2016 Pascal GeForce 10 GTX 1080 Ti GP100,GP102,GP104,etc.
2017 Volta No es una gráfica Tesla V100 GV100
2018 Turing GeForce 20 RTX 2080 Ti TU102,TU104,TU106,etc.
2020 Ampere GeForce 30 RTX 3060 GA100,GA102,GA104,etc.
2020 Ampere No es una gráfica A100 GA100
2022 Hopper No es una gráfica H100 y H200 GH100 y GH200
2022 Lovelace GeForce 40 RTX 4060 AD102, AD103, AD104, AD106 y AD107
2025 Blackwell GeForce 50 RTX 5090 GB102,GB103,etc.
NVIDIA ha sacaco junto con la arquitectura Hopper , una gama de CPU llamada Grace. Y podemos comprar ambos productos juntos o separados:
  • NVIDIA Grace CPU Superchip: Procesador ARM con 144 núcleos
  • NVIDIA Grace Hopper: Procesador ARM Grace junto con gráfica Hopper.

NOTA: Grace Hopper es el nombre de una mujer que ayudó a crear el lenguaje COBOL (Aun usado en bancos de todo el mundo). Acuñó el termino bug además de muchos otro méritos.

Similar al caso de antes, NVIDIA ha sacado chips con 2 GPU Blackwell junto con un procesador ARM y los ha llamado B100 y B200, según la GPU que lleve

Nombres

Los nombres de las tarjetas gráficas son las siguientes:

Ejemplos:

Mas información:

Memoria

Las tarjetas gráficas usan memoria RAM pero no es DDR sino otros dos tipos de memoria.

  • AMD usa HBM2 ya que necesita bajar el consumo aunque sea mas cara.
  • HBM2 se usan en gráficas profesionales para servidores. La arquitectura Tesla de NVIDIA usa HBM2.
  • Para algunas tarjetas gráficas, no es necesario tanto ancho de banda como ofrecen las memorias HBM
GDDR6X: Es una variación del GDDR6 que no sigue el estandar del JEDEC. Creada por Micron y NVIDIA. La arquitectura Ampere usa GDDR6X

En el artículo Sin solución en el horizonte: NVIDIA, la GDDR6X y su temperatura en RTX, vemos los problemas de temperatura de las RTX 3080 y RTX 3090. Estos problemas son inicialmente debidos a la mala calidad del Thermal pad pero también a que la memoria GDDR6X genera mas calor que la HBM2.

Mas información:

Salida de video:Conectores

La salida de video es por donde la tarjeta gráfica saca la señal para el monitor.

Existen 5 conectores distintos en las tarjetas gráficas.

Antiguos

Modernos

De cara a ver las velocidades de cada estándar hay que tener en cuenta la codificación:
  • HDMI 2.1: Codificación 16b/18b
  • DisplayPort 2.0: Codificación 128b/132b

¿Recuerdas algo similar en los discos SATA?

Mas información:

Temperatura

Al igual que los procesadores, las gráficas también desprenden calor.Dicho calor hay que disiparlo y para ello las tarjetas gráficas incluyen disipadores y/o ventiladores.

Los parámetros que se especifican para saber el calor que generan son los siguientes:

Realmente el que nos interesa es el TBP pero como eso depende del ensamblador de la tarjeta , el fabricante de la GPU solo puede dar el TGP. Sin embargo da diferencia entre el TGP y TBP es muy poca ya que el ventilador o los leds generan muy poco calor.

Un TPD o similar mas alto no debe implicar obligatoriamente un mayor consumo eléctrico. Sin embargo al igual que pasaba con las fuentes de alimentación, un TPD mas alto si que implica una peor eficiencia energética. Eso significa que un TPD alto hace que "tiremos" dinero en electricidad al usarse dicha electricidad para generar calor.

Mas información:

Ejercicios

Ejercicio 1

Lee los siguientes artículos para comprobar que entiendes los conceptos que especifican las tarjetas gráficas:

Ejercicio 2

Rellena la siguiente tabla:

RTX 2080 Ti RTX 3060
Nº de Streaming Multiprocessor (SM)
Nº total de CUDA Cores
Nº de CUDA Cores en cada SM
Nº total de Tensor Cores
Nº de Tensor Cores en cada SM
Nº total de RTX Cores
Nº de RTX Cores en cada SM
Tamaño de la memoria
Tipo de la memoria
TGP
Precio

Ejercicio 3

Lee el siguiente artículo. ¿Cuánto rendimiento puede ganar una GPU dependiendo del bus de su memoria?

Mira si coinciden los cálculos hechos en el artículo de la AMD Radeon RX 5700 con los datos de de la siguiente página:

Ahora comprueba si coinciden los cálculos hechos en el artículo de la NVIDIA GeForce GTX 1060 con los datos de de la siguiente páginas:

Ejercicio 4

Busca 10 tarjetas gráficas de diversos precios y que estén en la siguiente página PassMark Software - Video Card (GPU) Benchmark Charts - Video Card Model List. Anota para cada una de ellas, el valor de la columna "Passmark G3D Mark".

Haz una gráfica de puntos con lo siguiente.

Únicamente viendo la gráfica y basándote en la relación calidad/precio (Passmark G3D Mark y precio), explica:

Ejemplo de gráfica:

Intentar que haya tarjetas con un precio elevado pero con poco rendimiento y/o viceversa. Lo digo porque así se verá cual merece la pena y cual no.Los precios no los debéis sacar de la propia página de PassMark sino en tiendas "normales" como amazon españa, pccomponentes, app ,etc. Es decir en sitios donde realmente podéis comprar la tarjeta.No hace falta que tengan venta online si son tiendas de aquí de Valencia. La idea no es tener los mejores precios sino aprender a comparar precios. Así que si veis en alguna tiene un precio excesivamente caro para su rendimiento es mejor que la pongáis
Para todas las gráficas recordar que siempre hay que incluir lo siguiente:
  • Títulos de los ejes
  • Unidades de los ejes
  • Título de la gráfica
  • A ser posible que el eje Y empiece en 0
  • No usar colores estrambóticos

Ejercicio 5

Haz una gráfica de puntos de tarjetas NVIDIA con lo siguiente.

Indica si hay relación entre los CUDA Cores y el "Passmark G3D Mark"

Ejercicio 6

Rellena para la siguiente tabla, el Nº de CUDA cores que tiene cada modelo de tarjeta gŕaficas

Modelo Nº CUDA Cores
GeForce GTX 1060
GeForce GTX 1070
GeForce GTX 1080
GeForce RTX 2060
GeForce RTX 2070
GeForce RTX 2080
GeForce RTX 3060
GeForce RTX 3070
GeForce RTX 3080

Muestra ahora esa misma información en la siguiente tabla:

Generación
GeForce 10 (Pascal) GeForce 20 (Turing) GeForce 30 (Ampere)
Modelo 60
Modelo 70
Modelo 80

¿Se cumple esa frase que se dice que una tarjeta gráfica de una generación es como la siguiente del modelo anterior? Es decir que una GeForce GTX 1070 es como GeForce RTX 2060.

Ejercicios 7

Rellena la siguiente tabla:

Estándar Velocidad (Gb/s) Codificación Ratio Velocidad útil (Gb/s)
HDMI 2.1
DisplayPort 2.0