clase:asir:fhw:2eval:tema10
no way to compare when less than two revisions
Diferencias
Muestra las diferencias entre dos versiones de la página.
| — | clase:asir:fhw:2eval:tema10 [2025/11/03 11:37] (actual) – creado - editor externo 127.0.0.1 | ||
|---|---|---|---|
| Línea 1: | Línea 1: | ||
| + | ====== 10. Tarjetas Gráficas ====== | ||
| + | En este tema vamos a hablar de las tarjetas gráficas centrándonos en las de la marca NVIDIA, aunque también existen otros fabricantes como AMD o Intel. | ||
| + | |||
| + | Una tarjeta gráfica está compuesta de lo siguiente: | ||
| + | * Placa o PCB: Donde se ensambla todo. | ||
| + | * Unidad de procesamiento gráfico o GPU (Graphics Processing Unit) | ||
| + | * Memoria | ||
| + | * Salida de video (Conectores) | ||
| + | * Ventiladores | ||
| + | |||
| + | |||
| + | Mas información: | ||
| + | * [[https:// | ||
| + | * {{ : | ||
| + | |||
| + | |||
| + | ===== GPU ===== | ||
| + | Al igual que una CPU esta compuesta por núcleos, una GPU está compuesta por Streaming Multiprocessor o SM | ||
| + | |||
| + | |||
| + | La diferencia entre un Núcleo de una CPU y un Streaming Multiprocessor de una GPU es que una GPU es prácticamente muchisimas ALUs o FPUs. | ||
| + | |||
| + | {{: | ||
| + | |||
| + | La siguiente arquitectura es de una Tarjeta gŕafica " | ||
| + | |||
| + | * 6 GPU Processing Clusters o GPC. Cache L2 | ||
| + | * 6 Texture Processing Clusters TPC | ||
| + | * 2 Streaming Multiprocessor o SM. Cache L1 | ||
| + | * 64 CUDA Cores: Cada CUDA Core es una FPU. Tambien llamado FP32. Ya que ejecutan operaciones con números en coma flotante de 32 bits. | ||
| + | * 64 ALUs: A las ALU se les llama INT32 ya que ejecutan operaciones con números enteros de 32 bits | ||
| + | * 8 Tensor Cores: Multiplicación y suma de matrices (ALUS o FPUs). Se usan en inteligencia artificial (Redes neuronales) | ||
| + | * 1 RTX core: Trazado de rayos en video juegos. | ||
| + | |||
| + | <note tip> | ||
| + | Normalmente en las especificaciones no se suele indicar el número de ALUs o INT32 ya que como ya dijimos en las CPUs " | ||
| + | </ | ||
| + | |||
| + | <note tip> | ||
| + | Los SM internamente se dividen en 4 Processing Blocks o Subcores. Por ello cada subcore consta de: | ||
| + | * 16 CUDA Cores | ||
| + | * 16 ALUs | ||
| + | * 2 Tensor Cores | ||
| + | * Registros | ||
| + | * Cache L0 para instrucciones | ||
| + | |||
| + | Cada SM tiene su propia cache L1 | ||
| + | |||
| + | La tarjeta gráfica incluye una cache L2 | ||
| + | </ | ||
| + | |||
| + | {{: | ||
| + | |||
| + | Los GPC actuan de manera independiente entre si, pidiendo cada uno dedicarse a una tarea distinta, | ||
| + | mientras que los TPC agrupan los SM para que sea más sencillo que los SM se coordinen entre si. | ||
| + | Es una arquitectura similar a los CCX y CCD de AMD (veáse [[clase: | ||
| + | |||
| + | {{: | ||
| + | |||
| + | {{: | ||
| + | |||
| + | {{: | ||
| + | |||
| + | |||
| + | |||
| + | ^ Architecture | ||
| + | ^ Graphics Card ^ GeForce GTX 1080 ^ GeForce GTX 1080Ti | ||
| + | | GPU | GP104 | GP102 | TU104 | TU102 | GA106 | GA102 | AD107 | AD102 | GB202 | | ||
| + | | GPCs | 4 | 6 | 6 | 6 | 3 | 7 | 3 | 11 | | | ||
| + | | TPCs | 20 | 28 | 23 | 34 | 14 | 42 | 12 | 64 | | | ||
| + | | SMs | 20 | 28 | 46 | 68 | 28 | 84 | 24 | 128 | 170 | | ||
| + | | CUDA Cores/ | ||
| + | | CUDA Cores/ | ||
| + | | FP32 TFLOPS | ||
| + | | Tensor Cores/ | ||
| + | | Tensor Cores/ | ||
| + | | RT Cores | N/A | N/A | 46 | 68 | 28 | 84 | 24 | 128 | 170 | | ||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | <note tip> | ||
| + | Las GPU tienen varias versiones (variantes), | ||
| + | |||
| + | Veamos algunos ejemplos aunque a veces no hay cambios como de una Quadro P5000 a una GeForce GTX 1080 que no hay diferencia pero si de una Quadro P6000 a una GeForce GTX 1080Ti | ||
| + | |||
| + | ^ ^ GP104 ^^ | ||
| + | ^ ^ Quadro P5000 ^ GeForce GTX 1080 ^ | ||
| + | | TPCs | 20 | 20 | | ||
| + | | SMs | 20 | 20 | | ||
| + | | CUDA Cores/ | ||
| + | |||
| + | ^ ^ GP102 ^^ | ||
| + | ^ ^ Quadro P6000 ^ GeForce GTX 1080Ti | ||
| + | | TPCs | 30 | 28 | | ||
| + | | SMs | 30 | 28 | | ||
| + | | CUDA Cores/ | ||
| + | |||
| + | |||
| + | ^ ^ TU104 ^^^^ | ||
| + | ^ ^ Quadro RTX 5000 ^ GeForce RTX 2080 ^ GeForce RTX 2080 Super ^ NVIDIA T4 ^ | ||
| + | | TPCs | 24 | 23 | 24 | 20 | | ||
| + | | SMs | 48 | 46 | 48 | 40 | | ||
| + | | CUDA Cores/ | ||
| + | |||
| + | |||
| + | ^ ^ TU102 ^^ | ||
| + | ^ ^ Quadro RTX 6000 ^ GeForce RTX 2080Ti | ||
| + | | TPCs | 36 | 34 | | ||
| + | | SMs | 72 | 68 | | ||
| + | | CUDA Cores/ | ||
| + | |||
| + | |||
| + | |||
| + | ^ ^ GA102 ^^^ | ||
| + | ^ ^ GeForce RTX 3090 Ti ^ GeForce RTX 3080 Ti ^ NVIDIA A40 ^ | ||
| + | | TPCs | 42 | 40 | 42 | | ||
| + | | SMs | 84 | 80 | 84 | | ||
| + | | CUDA Cores/ | ||
| + | |||
| + | |||
| + | ^ ^ AD102 ^^^ | ||
| + | ^ ^ GeForce RTX 4090 ^ NVIDIA L40 ^ GeForce RTX 4090 Ti ^ | ||
| + | | TPCs | 64 | 71 | 72 | | ||
| + | | SMs | 128 | 142 | 144 | | ||
| + | | CUDA Cores/ | ||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | </ | ||
| + | |||
| + | Mas información: | ||
| + | * {{ : | ||
| + | * {{ : | ||
| + | * {{ : | ||
| + | * [[https:// | ||
| + | * [[https:// | ||
| + | * [[https:// | ||
| + | |||
| + | |||
| + | ===== Tensor Core ===== | ||
| + | Lo que hace un Tensor Core: Multiplicación mas Suma de Matrices.Se usan en inteligencia artificial (Redes neuronales).La aplicación mas utilizada para redes neuronales se llama TensorFlow. Un Tensor es como una matriz pero que puede tener mas de 2 dimensiones. | ||
| + | |||
| + | {{: | ||
| + | |||
| + | {{: | ||
| + | |||
| + | Mas información: | ||
| + | * [[https:// | ||
| + | * [[https:// | ||
| + | * [[https:// | ||
| + | * [[https:// | ||
| + | |||
| + | ===== Arquitecturas de GPU ===== | ||
| + | Al igual que los procesadores, | ||
| + | |||
| + | ^ Año ^ Microarquitecturas | ||
| + | | 2010 | [[https:// | ||
| + | | 2012 | [[https:// | ||
| + | | 2014 | [[https:// | ||
| + | | 2016 | [[https:// | ||
| + | | 2017 | [[https:// | ||
| + | | 2018 | [[https:// | ||
| + | | 2020 | [[https:// | ||
| + | | 2020 | [[https:// | ||
| + | | 2022 | [[https:// | ||
| + | | 2022 | [[https:// | ||
| + | | 2025 | [[https:// | ||
| + | |||
| + | |||
| + | |||
| + | <note tip> | ||
| + | NVIDIA ha sacaco junto con la arquitectura Hopper , una gama de [[https:// | ||
| + | * NVIDIA Grace CPU Superchip: Procesador ARM con 144 núcleos | ||
| + | * NVIDIA Grace Hopper: Procesador ARM Grace junto con gráfica Hopper. | ||
| + | |||
| + | NOTA: [[https:// | ||
| + | Acuñó el termino //bug// además de muchos otro méritos. | ||
| + | </ | ||
| + | |||
| + | |||
| + | <note tip> | ||
| + | Similar al caso de antes, NVIDIA ha sacado chips con 2 GPU Blackwell junto con un procesador ARM y los ha llamado B100 y B200, según la GPU que lleve | ||
| + | </ | ||
| + | |||
| + | * NVIDIA H100 Hopper | ||
| + | {{ : | ||
| + | |||
| + | |||
| + | * NVIDIA Grace CPU Superchip | ||
| + | {{ : | ||
| + | |||
| + | |||
| + | * NVIDIA Grace Hopper | ||
| + | {{ : | ||
| + | |||
| + | * [[https:// | ||
| + | |||
| + | {{ : | ||
| + | |||
| + | {{ : | ||
| + | |||
| + | |||
| + | ===== Nombres ===== | ||
| + | Los nombres de las tarjetas gráficas son las siguientes: | ||
| + | |||
| + | * GeForce: Para tarjetas gráficas que se usan en videojuegos | ||
| + | * Prefijo: | ||
| + | * GT: Gama Baja | ||
| + | * GTX: Gama alta | ||
| + | * RTX: Gama alta pero con trazado de rayos | ||
| + | * Generación: | ||
| + | * Modelo: | ||
| + | * Gama Baja: 1, 2, 3 | ||
| + | * Gama media baja: 5 | ||
| + | * Gama media: 6 | ||
| + | * Gama Alta: 7, 8 y 9 | ||
| + | * Sufijo: Se añade el Ti si son aun mas potentes. | ||
| + | |||
| + | **Ejemplos: | ||
| + | |||
| + | * RTX 2080 Ti | ||
| + | * Prefijo: RTX | ||
| + | * Generación: | ||
| + | * Modelo: 80 | ||
| + | * Sufijo: Ti | ||
| + | * GT 630 | ||
| + | * Prefijo: GT | ||
| + | * Generación: | ||
| + | * Modelo: 30 | ||
| + | * GTX 960 | ||
| + | * Prefijo: GTX | ||
| + | * Generación: | ||
| + | * Modelo: 60 | ||
| + | |||
| + | |||
| + | |||
| + | |||
| + | |||
| + | Mas información: | ||
| + | * [[https:// | ||
| + | |||
| + | |||
| + | |||
| + | ===== Memoria ===== | ||
| + | Las tarjetas gráficas usan memoria RAM pero no es DDR sino otros dos tipos de memoria. | ||
| + | |||
| + | * Graphics Double Data Rate (GDDR): | ||
| + | * Hay 6 versiones (GDDR1, GDDR2, ... y GDDR6). | ||
| + | * Estandarizada por el JEDEC que es el mismo organismo que el de las DDR. | ||
| + | * Mas barata que la HBM por lo que a mismo precio tiene mas capacidad | ||
| + | * Mas lenta que una HBM | ||
| + | * Mayor consumo energético que una HBM | ||
| + | * Se calientan mas | ||
| + | * High Bandwidth Memory (HBM) | ||
| + | * Hay 3 versiones (HBM1, HBM2, | ||
| + | * Mas rápida que la GDDR. | ||
| + | * Menor consumo que la GDDR. | ||
| + | * Mas cara que la GDDR. | ||
| + | * Más difícil de fabricar que la GDDR. | ||
| + | |||
| + | <note tip> | ||
| + | * AMD usa HBM2 ya que necesita bajar el consumo aunque sea mas cara. | ||
| + | * HBM2 se usan en gráficas profesionales para servidores. La arquitectura Tesla de NVIDIA usa HBM2. | ||
| + | * Para algunas tarjetas gráficas, no es necesario tanto ancho de banda como ofrecen las memorias HBM | ||
| + | </ | ||
| + | |||
| + | <note tip> | ||
| + | |||
| + | En el artículo [[https:// | ||
| + | |||
| + | Mas información: | ||
| + | * [[https:// | ||
| + | * [[https:// | ||
| + | * [[https:// | ||
| + | |||
| + | ===== Salida de video: | ||
| + | La salida de video es por donde la tarjeta gráfica saca la señal para el monitor. | ||
| + | |||
| + | Existen 5 conectores distintos en las tarjetas gráficas. | ||
| + | |||
| + | ==== Antiguos ==== | ||
| + | * VGA: El conector mas antiguo. La señal es analógica. | ||
| + | |||
| + | {{: | ||
| + | |||
| + | * DVI: Es la evolución del VGA. La señal es digital pero tiene pines para sacar también la señal analógica del VGA. | ||
| + | |||
| + | {{: | ||
| + | |||
| + | ==== Modernos ==== | ||
| + | * HDMI: La señal es digital pero ademas de la señal de video soporta tambien Audio , Ethernet y hasta la pulsación de teclas de un mando a distancia. Tiene un coste por licencia. | ||
| + | * DisplayPort: | ||
| + | * USB-C: Es solo la forma del conector pero internamente se envía la información en DisplayPort. | ||
| + | |||
| + | {{: | ||
| + | |||
| + | |||
| + | <note tip> | ||
| + | De cara a ver las velocidades de cada estándar hay que tener en cuenta la codificación: | ||
| + | |||
| + | * HDMI 2.1: Codificación 16b/18b | ||
| + | * DisplayPort 2.0: Codificación 128b/132b | ||
| + | |||
| + | |||
| + | ¿Recuerdas algo similar en los discos SATA? | ||
| + | </ | ||
| + | |||
| + | |||
| + | Mas información: | ||
| + | * [[https:// | ||
| + | * [[https:// | ||
| + | * [[https:// | ||
| + | * [[https:// | ||
| + | |||
| + | |||
| + | ===== Temperatura ===== | ||
| + | Al igual que los procesadores, | ||
| + | |||
| + | Los parámetros que se especifican para saber el calor que generan son los siguientes: | ||
| + | |||
| + | * Thermal Design Parameter (TDP): GPU | ||
| + | * Total Graphic Power (TGP): GPU+RAM+PCB | ||
| + | * Total Board Power (TBP): GPU+RAM+PCB+Ventiladores+leds | ||
| + | |||
| + | Realmente el que nos interesa es el TBP pero como eso depende del ensamblador de la tarjeta , el fabricante de la GPU solo puede dar el TGP. Sin embargo da diferencia entre el TGP y TBP es muy poca ya que el ventilador o los leds generan muy poco calor. | ||
| + | |||
| + | |||
| + | <note important> | ||
| + | Un TPD o similar mas alto no debe implicar obligatoriamente un mayor consumo eléctrico. Sin embargo al igual que pasaba con las fuentes de alimentación, | ||
| + | </ | ||
| + | |||
| + | Mas información: | ||
| + | * [[https:// | ||
| + | * [[https:// | ||
| + | * [[https:// | ||
| + | |||
| + | |||
| + | |||
| + | ===== Ejercicios ===== | ||
| + | |||
| + | ==== Ejercicio 1 ==== | ||
| + | Lee los siguientes artículos para comprobar que entiendes los conceptos que especifican las tarjetas gráficas: | ||
| + | * [[https:// | ||
| + | * [[https:// | ||
| + | * [[https:// | ||
| + | * [[https:// | ||
| + | |||
| + | |||
| + | ==== Ejercicio 2 ==== | ||
| + | Rellena la siguiente tabla: | ||
| + | |||
| + | ^ ^ RTX 2080 Ti ^ RTX 3060 ^ | ||
| + | | Nº de Streaming Multiprocessor (SM) | | | | ||
| + | | Nº total de CUDA Cores | | | | ||
| + | | Nº de CUDA Cores en cada SM | | | | ||
| + | | Nº total de Tensor Cores | | | | ||
| + | | Nº de Tensor Cores en cada SM | | | | ||
| + | | Nº total de RTX Cores | | | | ||
| + | | Nº de RTX Cores en cada SM | | | | ||
| + | | Tamaño de la memoria | | | | ||
| + | | Tipo de la memoria | | | | ||
| + | | TGP | | | | ||
| + | | Precio | | | | ||
| + | |||
| + | |||
| + | |||
| + | ==== Ejercicio 3 ==== | ||
| + | Lee el siguiente artículo. [[https:// | ||
| + | |||
| + | |||
| + | Mira si coinciden los cálculos hechos en el artículo de la AMD Radeon RX 5700 con los datos de de la siguiente página: | ||
| + | * [[https:// | ||
| + | |||
| + | |||
| + | Ahora comprueba si coinciden los cálculos hechos en el artículo de la NVIDIA GeForce GTX 1060 con los datos de de la siguiente páginas: | ||
| + | * [[https:// | ||
| + | * [[https:// | ||
| + | |||
| + | |||
| + | ==== Ejercicio 4 ==== | ||
| + | Busca 10 tarjetas gráficas de diversos precios y que estén en la siguiente página [[https:// | ||
| + | |||
| + | Haz una gráfica de **puntos** con lo siguiente. | ||
| + | * El eje X mostrará el valor de " | ||
| + | * El eje Y mostrará el precio de la tarjeta gráfica. | ||
| + | * Demás en cada punto de la gráfica debe indicarse el nombre de la tarjeta gráfica a la que corresponde. | ||
| + | |||
| + | Únicamente viendo la gráfica y basándote en la relación calidad/ | ||
| + | * Que tarjeta/s comprarías teniendo un alto presupuesto | ||
| + | * Que tarjeta/s comprarías teniendo un bajo presupuesto | ||
| + | * Que tarjeta/s **NUNCA** comprarías teniendo un alto presupuesto | ||
| + | * Que tarjeta/s **NUNCA** comprarías teniendo un bajo presupuesto | ||
| + | |||
| + | Ejemplo de gráfica: | ||
| + | |||
| + | {{: | ||
| + | |||
| + | |||
| + | <note tip> | ||
| + | Intentar que haya tarjetas con un precio elevado pero con poco rendimiento y/o viceversa. Lo digo porque así se verá cual merece la pena y cual no.Los precios no los debéis sacar de la propia página de PassMark sino en tiendas | ||
| + | </ | ||
| + | |||
| + | <note important> | ||
| + | Para todas las gráficas recordar que siempre hay que incluir lo siguiente: | ||
| + | * Títulos de los ejes | ||
| + | * Unidades de los ejes | ||
| + | * Título de la gráfica | ||
| + | * A ser posible que el eje Y empiece en 0 | ||
| + | * No usar colores estrambóticos | ||
| + | </ | ||
| + | |||
| + | ==== Ejercicio 5 ==== | ||
| + | Haz una gráfica de **puntos** de tarjetas NVIDIA con lo siguiente. | ||
| + | * El eje X mostrará el número total de CUDA Cores | ||
| + | * El eje Y mostrará el valor de " | ||
| + | * Demás en cada punto de la gráfica debe indicarse el nombre de la tarjeta gráfica a la que corresponde. | ||
| + | |||
| + | Indica si hay relación entre los CUDA Cores y el " | ||
| + | |||
| + | |||
| + | ==== Ejercicio 6 ==== | ||
| + | |||
| + | Rellena para la siguiente tabla, el Nº de CUDA cores que tiene cada modelo de tarjeta gŕaficas | ||
| + | |||
| + | ^ Modelo | ||
| + | ^ GeForce GTX 1060 | | | ||
| + | ^ GeForce GTX 1070 | | | ||
| + | ^ GeForce GTX 1080 | | | ||
| + | ^ GeForce RTX 2060 | | | ||
| + | ^ GeForce RTX 2070 | | | ||
| + | ^ GeForce RTX 2080 | | | ||
| + | ^ GeForce RTX 3060 | | | ||
| + | ^ GeForce RTX 3070 | | | ||
| + | ^ GeForce RTX 3080 | | | ||
| + | |||
| + | Muestra ahora esa misma información en la siguiente tabla: | ||
| + | |||
| + | ^ ^ Generación | ||
| + | ^ ^ GeForce 10 (Pascal) | ||
| + | ^ Modelo 60 | | | | | ||
| + | ^ Modelo 70 | | | | | ||
| + | ^ Modelo 80 | | | | | ||
| + | |||
| + | |||
| + | ¿Se cumple esa frase que se dice que una tarjeta gráfica de una generación es como la siguiente del modelo anterior? | ||
| + | Es decir que una GeForce GTX 1070 es como GeForce RTX 2060. | ||
| + | |||
| + | ==== Ejercicios 7 ==== | ||
| + | Rellena la siguiente tabla: | ||
| + | |||
| + | ^ Estándar | ||
| + | | HDMI 2.1 | | | | | | ||
| + | | DisplayPort 2.0 | | | | | | ||
| + | |||
clase/asir/fhw/2eval/tema10.txt · Última modificación: por 127.0.0.1
