Herramientas de usuario

Herramientas del sitio


clase:asir:fhw:2eval:tema10

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anterior Revisión previa
Próxima revisión
Revisión previa
clase:asir:fhw:2eval:tema10 [2021/04/27 19:50]
admin [Ejercicios]
clase:asir:fhw:2eval:tema10 [2022/04/06 09:34] (actual)
admin [GPU]
Línea 25: Línea 25:
 La siguiente arquitectura es de una Tarjeta gŕafica "NVIDIA Quadro RTX 6000" con arquitectura Turing  y GPU **TU102** La siguiente arquitectura es de una Tarjeta gŕafica "NVIDIA Quadro RTX 6000" con arquitectura Turing  y GPU **TU102**
  
-  * GPU. Cache L2 +  * GPU Processing Clusters o GPC. Cache L2 
-    * 72 Streaming Multiprocessor o SM. Cache L1 +    * 6 Texture Processing Clusters TPC 
-      * 64 CUDA Cores: Cada CUDA Core es una FPU. Tambien llamado FP32. Ya que ejecutan operaciones con números en coma flotante de 32 bits. +      * 2 Streaming Multiprocessor o SM. Cache L1 
-      * 64 ALUs: A las ALU se les llama INT32 ya que ejecutan operaciones con números enteros de 32 bits +        * 64 CUDA Cores: Cada CUDA Core es una FPU. Tambien llamado FP32. Ya que ejecutan operaciones con números en coma flotante de 32 bits. 
-      * 8 Tensor Cores: Multiplicación y suma de matrices (ALUS o FPUs). Se usan en inteligencia artificial (Redes neuronales) +        * 64 ALUs: A las ALU se les llama INT32 ya que ejecutan operaciones con números enteros de 32 bits 
-      * 1 RTX core: Trazado de rayos en video juegos.+        * 8 Tensor Cores: Multiplicación y suma de matrices (ALUS o FPUs). Se usan en inteligencia artificial (Redes neuronales) 
 +        * 1 RTX core: Trazado de rayos en video juegos.
  
 <note tip> <note tip>
-Normalmente en las especificaciones no se suele indicar el número de ALUs o INT32 ya que como ya dijimos en las CPUs "ocupan" poco espacio en comparación con una FP32 (o CUDA Core)+Normalmente en las especificaciones no se suele indicar el número de ALUs o INT32 ya que como ya dijimos en las CPUs "ocupan" poco espacio en comparación con una FP32 o FP64 (o CUDA Core)
 </note> </note>
  
Línea 39: Línea 40:
 Los SM internamente se dividen en  4 Processing Blocks o Subcores. Por ello cada subcore consta de: Los SM internamente se dividen en  4 Processing Blocks o Subcores. Por ello cada subcore consta de:
   * 16 CUDA Cores   * 16 CUDA Cores
 +  * 16 ALUs
   * 2 Tensor Cores   * 2 Tensor Cores
   * Registros   * Registros
Línea 49: Línea 51:
  
 {{:clase:asir:fhw:2eval:arquitectura_nvidia.png|}} {{:clase:asir:fhw:2eval:arquitectura_nvidia.png|}}
 +
 +{{:clase:asir:fhw:2eval:tu102.png?direct&600|}}
  
 {{:clase:asir:fhw:2eval:streaming_multiprocessor.png?600|}} {{:clase:asir:fhw:2eval:streaming_multiprocessor.png?600|}}
Línea 55: Línea 59:
  
 {{:clase:asir:fhw:2eval:nvidia_comparacion.png|}} {{:clase:asir:fhw:2eval:nvidia_comparacion.png|}}
 +
  
 Mas información: Mas información:
Línea 60: Línea 65:
   * {{ :clase:asir:fhw:2eval:nvidia-ampere-ga-102-gpu-architecture-whitepaper-v2.pdf |}}   * {{ :clase:asir:fhw:2eval:nvidia-ampere-ga-102-gpu-architecture-whitepaper-v2.pdf |}}
   * {{ :clase:asir:fhw:2eval:nvidia-ampere-architecture-whitepaper.pdf |}}   * {{ :clase:asir:fhw:2eval:nvidia-ampere-architecture-whitepaper.pdf |}}
 +  * {{ :clase:asir:fhw:2eval:gtc22-whitepaper-hopper.pdf |}}
   * {{ :clase:asir:fhw:2eval:cuda_c_programming_guide.pdf |}}   * {{ :clase:asir:fhw:2eval:cuda_c_programming_guide.pdf |}}
   * [[https://hardzone.es/tutoriales/rendimiento/evolucion-arquitectura-nvidia-tesla-turing/|De Tesla a Turing, así ha cambiado NVIDIA su arquitectura en 14 años]]   * [[https://hardzone.es/tutoriales/rendimiento/evolucion-arquitectura-nvidia-tesla-turing/|De Tesla a Turing, así ha cambiado NVIDIA su arquitectura en 14 años]]
   * [[https://hardzone.es/reportajes/que-es/compute-units-gpu/|Tu GPU tiene cientos pero, ¿sabes cómo funcionan las Compute Units o SM?]]   * [[https://hardzone.es/reportajes/que-es/compute-units-gpu/|Tu GPU tiene cientos pero, ¿sabes cómo funcionan las Compute Units o SM?]]
-  * [[https://hardzone.es/reportajes/comparativas/rtx-3080-vs-rtx2080-ti-arquitectura/|RTX 3080 vs RTX 2080 Ti, ¿merece la pena el cambio de arquitectura?]] 
-  * [[https://hardzone.es/noticias/tarjetas-graficas/rtx-3050-ti-especificaciones-benchmarks/|Estás son las especificaciones de las RTX 3050 de NVIDIA]] 
   * [[https://hardzone.es/tutoriales/rendimiento/nucleo-gpu-real/|¿Qué es el núcleo de una GPU y por qué AMD y NVIDIA nos engañan?]]   * [[https://hardzone.es/tutoriales/rendimiento/nucleo-gpu-real/|¿Qué es el núcleo de una GPU y por qué AMD y NVIDIA nos engañan?]]
-  * [[https://hardzone.es/noticias/tarjetas-graficas/nvidia-lovelace-posible-arquitectura/|Esta podría ser la arquitectura de las GPUs NVIDIA RTX 4000 Lovelace]]+
  
 ===== Tensor Core ===== ===== Tensor Core =====
Línea 92: Línea 96:
 |  2018  |  [[https://en.wikipedia.org/wiki/Turing_(microarchitecture)|Turing]]  |  GeForce 20  |  RTX 2080 Ti  |  TU102,TU104,TU106,etc.  | |  2018  |  [[https://en.wikipedia.org/wiki/Turing_(microarchitecture)|Turing]]  |  GeForce 20  |  RTX 2080 Ti  |  TU102,TU104,TU106,etc.  |
 |  2020  |  [[https://en.wikipedia.org/wiki/Ampere_(microarchitecture)|Ampere]]  |  GeForce 30  |  RTX 3060  |  GA100,GA102,GA104,etc.  | |  2020  |  [[https://en.wikipedia.org/wiki/Ampere_(microarchitecture)|Ampere]]  |  GeForce 30  |  RTX 3060  |  GA100,GA102,GA104,etc.  |
-|  2022  |  Lovelace  |  GeForce 40  |  RTX 4060  |  AD102  |+|  2022   [[https://en.wikipedia.org/wiki/Hopper_(microarchitecture)|Hopper]]  |  //No es una gráfica//  |  [[https://www.nvidia.com/es-es/data-center/h100/|H100 Tensor Core]] y [[https://www.nvidia.com/es-es/data-center/h100cnx/|H100 CNX]] |  GH100 y GH202  | 
 +|  2023   Lovelace  |  GeForce 40  |  RTX 4060  |  AD102, AD103, AD104, AD10 y AD107  |
  
 +<note tip>
 +NVIDIA ha sacaco junto con la arquitectura Hopper , una gama de [[https://www.nvidia.com/es-es/data-center/grace-cpu/|CPU llamada Grace]]. Y podemos comprar ambos productos juntos o separados:
 +  * NVIDIA Grace CPU Superchip: Procesador ARM con 144 núcleos
 +  * NVIDIA Grace Hopper: Procesador ARM Grace junto con gráfica Hopper.
 +
 +NOTA: [[https://es.wikipedia.org/wiki/Grace_Murray_Hopper|Grace Hopper]] es el nombre de una mujer que ayudó a crear el lenguaje COBOL (Aun usado en bancos de todo el mundo).
 +Acuñó el termino //bug// además de muchos otro méritos.
 +</note>
 +
 +
 +  * NVIDIA H100 Hopper
 +{{ :clase:asir:fhw:2eval:nvidia-h100-hopper-es-presentado-con-16896-nucleos-cuda_2.jpg?direct&600 |}}
 +
 +
 +  * NVIDIA Grace CPU Superchip
 +{{ :clase:asir:fhw:2eval:grace-cpu-superchip-2c50-d.jpg?direct&600 |}}
 +
 +
 +  * NVIDIA Grace Hopper
 +{{ :clase:asir:fhw:2eval:grace-2c50-d.jpg?direct&600 |}}
 +
 +  * [[https://www.nvidia.com/es-es/data-center/dgx-h100/|NVIDIA DGX H100]]: Sistema completo de NVIDIA. Mas información:{{ :clase:asir:fhw:2eval:nvidia-dgx-h100-datasheet.pdf |}}
 +
 +{{ :clase:asir:fhw:2eval:nvidia-dgx-h100-og.jpg?direct&600 |}}
 +
 +{{ :clase:asir:fhw:2eval:nvidia-presenta-los-aceleradores-pcie-hopper-gh100-dgx-h100-dgx.png?direct&600 |}}
  
  
Línea 237: Línea 268:
  
 ==== Ejercicio 1 ==== ==== Ejercicio 1 ====
 +Lee  los siguientes artículos para comprobar que entiendes los conceptos que especifican las tarjetas gráficas:
 +  * [[https://hardzone.es/reportajes/comparativas/rtx-3080-vs-rtx2080-ti-arquitectura/|RTX 3080 vs RTX 2080 Ti, ¿merece la pena el cambio de arquitectura?]]
 +  * [[https://hardzone.es/noticias/tarjetas-graficas/rtx-3050-ti-especificaciones-benchmarks/|Estás son las especificaciones de las RTX 3050 de NVIDIA]]
 +  * [[https://hardzone.es/noticias/tarjetas-graficas/nvidia-rtx-3080-ti-fecha-lanzamiento/|Filtrada la fecha de lanzamiento y especificaciones de la RTX 3080 Ti]]
 +  * [[https://hardzone.es/noticias/tarjetas-graficas/nvidia-lovelace-posible-arquitectura/|Esta podría ser la arquitectura de las GPUs NVIDIA RTX 4000 Lovelace]]
 +
 +
 +==== Ejercicio 2 ====
 Rellena la siguiente tabla: Rellena la siguiente tabla:
  
Línea 254: Línea 293:
  
  
-==== Ejercicio ====+==== Ejercicio ====
 Lee el siguiente artículo. [[https://hardzone.es/tutoriales/rendimiento/rendimiento-gpu-bus-memoria/|¿Cuánto rendimiento puede ganar una GPU dependiendo del bus de su memoria?]] Lee el siguiente artículo. [[https://hardzone.es/tutoriales/rendimiento/rendimiento-gpu-bus-memoria/|¿Cuánto rendimiento puede ganar una GPU dependiendo del bus de su memoria?]]
  
  
-Mira si coinciden los cálculos hechos en el artículo de la AMD Radeon RX 580 con los datos de de la siguiente página:  +Mira si coinciden los cálculos hechos en el artículo de la AMD Radeon RX 5700 con los datos de de la siguiente página:  
-  * [[https://www.techpowerup.com/gpu-specs/radeon-rx-580.c2938|AMD Radeon RX 580 Specs - TechPowerUp GPU Database]]+  * [[https://www.techpowerup.com/gpu-specs/radeon-rx-5700.c3437|AMD Radeon RX 5700 Specs - TechPowerUp GPU Database]]
  
  
Línea 267: Línea 306:
  
  
-==== Ejercicio ====+==== Ejercicio ====
 Busca 10 tarjetas gráficas de diversos precios y que estén en la siguiente página [[https://www.videocardbenchmark.net/gpu_list.php|PassMark Software - Video Card (GPU) Benchmark Charts - Video Card Model List]]. Anota para cada una de ellas, el valor de la columna "Passmark G3D Mark". Busca 10 tarjetas gráficas de diversos precios y que estén en la siguiente página [[https://www.videocardbenchmark.net/gpu_list.php|PassMark Software - Video Card (GPU) Benchmark Charts - Video Card Model List]]. Anota para cada una de ellas, el valor de la columna "Passmark G3D Mark".
  
Línea 299: Línea 338:
 </note> </note>
  
-==== Ejercicio ====+==== Ejercicio ====
 Haz una gráfica de **puntos** de tarjetas NVIDIA con lo siguiente. Haz una gráfica de **puntos** de tarjetas NVIDIA con lo siguiente.
   * El eje X mostrará el número total de CUDA Cores   * El eje X mostrará el número total de CUDA Cores
Línea 308: Línea 347:
  
  
-==== Ejercicio ====+==== Ejercicio ====
  
 Rellena para la siguiente tabla, el Nº de CUDA cores que tiene cada modelo de tarjeta gŕaficas Rellena para la siguiente tabla, el Nº de CUDA cores que tiene cada modelo de tarjeta gŕaficas
Línea 335: Línea 374:
 Es decir que una GeForce GTX 1070 es como GeForce RTX 2060. Es decir que una GeForce GTX 1070 es como GeForce RTX 2060.
  
-==== Ejercicios ====+==== Ejercicios ====
 Rellena la siguiente tabla: Rellena la siguiente tabla:
  
clase/asir/fhw/2eval/tema10.1619545819.txt.gz · Última modificación: 2021/04/27 19:50 por admin