Diferencias

Muestra las diferencias entre dos versiones de la página.

--- clase:asir:fhw:2eval:tema10 [2021/04/27 19:50]
admin [Ejercicios]
+++ clase:asir:fhw:2eval:tema10 [2022/04/06 09:34] (actual)
admin [GPU]
@@ Línea 25: / Línea 25: @@
 La siguiente arquitectura es de una Tarjeta gŕafica "NVIDIA Quadro RTX 6000" con arquitectura Turing  y GPU **TU102**
-  * 1 GPU. Cache L2
+  * 6 GPU Processing Clusters o GPC. Cache L2
-    * 72 Streaming Multiprocessor o SM. Cache L1
+    * 6 Texture Processing Clusters TPC
-      * 64 CUDA Cores: Cada CUDA Core es una FPU. Tambien llamado FP32. Ya que ejecutan operaciones con números en coma flotante de 32 bits.
+      * 2 Streaming Multiprocessor o SM. Cache L1
-      * 64 ALUs: A las ALU se les llama INT32 ya que ejecutan operaciones con números enteros de 32 bits
+        * 64 CUDA Cores: Cada CUDA Core es una FPU. Tambien llamado FP32. Ya que ejecutan operaciones con números en coma flotante de 32 bits.
-      * 8 Tensor Cores: Multiplicación y suma de matrices (ALUS o FPUs). Se usan en inteligencia artificial (Redes neuronales)
+        * 64 ALUs: A las ALU se les llama INT32 ya que ejecutan operaciones con números enteros de 32 bits
-      * 1 RTX core: Trazado de rayos en video juegos.
+        * 8 Tensor Cores: Multiplicación y suma de matrices (ALUS o FPUs). Se usan en inteligencia artificial (Redes neuronales)
+        * 1 RTX core: Trazado de rayos en video juegos.
 <note tip>
-Normalmente en las especificaciones no se suele indicar el número de ALUs o INT32 ya que como ya dijimos en las CPUs "ocupan" poco espacio en comparación con una FP32 (o CUDA Core)
+Normalmente en las especificaciones no se suele indicar el número de ALUs o INT32 ya que como ya dijimos en las CPUs "ocupan" poco espacio en comparación con una FP32 o FP64 (o CUDA Core)
 </note>
@@ Línea 39: / Línea 40: @@
 Los SM internamente se dividen en  4 Processing Blocks o Subcores. Por ello cada subcore consta de:
   * 16 CUDA Cores
+  * 16 ALUs
   * 2 Tensor Cores
   * Registros
@@ Línea 49: / Línea 51: @@
 {{:clase:asir:fhw:2eval:arquitectura_nvidia.png|}}
+{{:clase:asir:fhw:2eval:tu102.png?direct&600|}}
 {{:clase:asir:fhw:2eval:streaming_multiprocessor.png?600|}}
@@ Línea 55: / Línea 59: @@
 {{:clase:asir:fhw:2eval:nvidia_comparacion.png|}}
 Mas información:
@@ Línea 60: / Línea 65: @@
   * {{ :clase:asir:fhw:2eval:nvidia-ampere-ga-102-gpu-architecture-whitepaper-v2.pdf |}}
   * {{ :clase:asir:fhw:2eval:nvidia-ampere-architecture-whitepaper.pdf |}}
+  * {{ :clase:asir:fhw:2eval:gtc22-whitepaper-hopper.pdf |}}
   * {{ :clase:asir:fhw:2eval:cuda_c_programming_guide.pdf |}}
   * [[https://hardzone.es/tutoriales/rendimiento/evolucion-arquitectura-nvidia-tesla-turing/|De Tesla a Turing, así ha cambiado NVIDIA su arquitectura en 14 años]]
   * [[https://hardzone.es/reportajes/que-es/compute-units-gpu/|Tu GPU tiene cientos pero, ¿sabes cómo funcionan las Compute Units o SM?]]
-  * [[https://hardzone.es/reportajes/comparativas/rtx-3080-vs-rtx2080-ti-arquitectura/|RTX 3080 vs RTX 2080 Ti, ¿merece la pena el cambio de arquitectura?]]
-  * [[https://hardzone.es/noticias/tarjetas-graficas/rtx-3050-ti-especificaciones-benchmarks/|Estás son las especificaciones de las RTX 3050 de NVIDIA]]
   * [[https://hardzone.es/tutoriales/rendimiento/nucleo-gpu-real/|¿Qué es el núcleo de una GPU y por qué AMD y NVIDIA nos engañan?]]
-  * [[https://hardzone.es/noticias/tarjetas-graficas/nvidia-lovelace-posible-arquitectura/|Esta podría ser la arquitectura de las GPUs NVIDIA RTX 4000 Lovelace]]
 ===== Tensor Core =====
@@ Línea 92: / Línea 96: @@
 |  2018  |  [[https://en.wikipedia.org/wiki/Turing_(microarchitecture)|Turing]]  |  GeForce 20  |  RTX 2080 Ti  |  TU102,TU104,TU106,etc.  |
 |  2020  |  [[https://en.wikipedia.org/wiki/Ampere_(microarchitecture)|Ampere]]  |  GeForce 30  |  RTX 3060  |  GA100,GA102,GA104,etc.  |
-|  2022  |  Lovelace  |  GeForce 40  |  RTX 4060  |  AD102  |
+|  2022  |  [[https://en.wikipedia.org/wiki/Hopper_(microarchitecture)|Hopper]]  |  //No es una gráfica//  |  [[https://www.nvidia.com/es-es/data-center/h100/|H100 Tensor Core]] y [[https://www.nvidia.com/es-es/data-center/h100cnx/|H100 CNX]] |  GH100 y GH202  |
+|  2023  |  Lovelace  |  GeForce 40  |  RTX 4060  |  AD102, AD103, AD104, AD10 y AD107  |
+<note tip>
+NVIDIA ha sacaco junto con la arquitectura Hopper , una gama de [[https://www.nvidia.com/es-es/data-center/grace-cpu/|CPU llamada Grace]]. Y podemos comprar ambos productos juntos o separados:
+  * NVIDIA Grace CPU Superchip: Procesador ARM con 144 núcleos
+  * NVIDIA Grace Hopper: Procesador ARM Grace junto con gráfica Hopper.
+NOTA: [[https://es.wikipedia.org/wiki/Grace_Murray_Hopper|Grace Hopper]] es el nombre de una mujer que ayudó a crear el lenguaje COBOL (Aun usado en bancos de todo el mundo).
+Acuñó el termino //bug// además de muchos otro méritos.
+</note>
+  * NVIDIA H100 Hopper
+{{ :clase:asir:fhw:2eval:nvidia-h100-hopper-es-presentado-con-16896-nucleos-cuda_2.jpg?direct&600 |}}
+  * NVIDIA Grace CPU Superchip
+{{ :clase:asir:fhw:2eval:grace-cpu-superchip-2c50-d.jpg?direct&600 |}}
+  * NVIDIA Grace Hopper
+{{ :clase:asir:fhw:2eval:grace-2c50-d.jpg?direct&600 |}}
+  * [[https://www.nvidia.com/es-es/data-center/dgx-h100/|NVIDIA DGX H100]]: Sistema completo de NVIDIA. Mas información:{{ :clase:asir:fhw:2eval:nvidia-dgx-h100-datasheet.pdf |}}
+{{ :clase:asir:fhw:2eval:nvidia-dgx-h100-og.jpg?direct&600 |}}
+{{ :clase:asir:fhw:2eval:nvidia-presenta-los-aceleradores-pcie-hopper-gh100-dgx-h100-dgx.png?direct&600 |}}
@@ Línea 237: / Línea 268: @@
 ==== Ejercicio 1 ====
+Lee  los siguientes artículos para comprobar que entiendes los conceptos que especifican las tarjetas gráficas:
+  * [[https://hardzone.es/reportajes/comparativas/rtx-3080-vs-rtx2080-ti-arquitectura/|RTX 3080 vs RTX 2080 Ti, ¿merece la pena el cambio de arquitectura?]]
+  * [[https://hardzone.es/noticias/tarjetas-graficas/rtx-3050-ti-especificaciones-benchmarks/|Estás son las especificaciones de las RTX 3050 de NVIDIA]]
+  * [[https://hardzone.es/noticias/tarjetas-graficas/nvidia-rtx-3080-ti-fecha-lanzamiento/|Filtrada la fecha de lanzamiento y especificaciones de la RTX 3080 Ti]]
+  * [[https://hardzone.es/noticias/tarjetas-graficas/nvidia-lovelace-posible-arquitectura/|Esta podría ser la arquitectura de las GPUs NVIDIA RTX 4000 Lovelace]]
+==== Ejercicio 2 ====
 Rellena la siguiente tabla:
@@ Línea 254: / Línea 293: @@
-==== Ejercicio 2 ====
+==== Ejercicio 3 ====
 Lee el siguiente artículo. [[https://hardzone.es/tutoriales/rendimiento/rendimiento-gpu-bus-memoria/|¿Cuánto rendimiento puede ganar una GPU dependiendo del bus de su memoria?]]
-Mira si coinciden los cálculos hechos en el artículo de la AMD Radeon RX 580 con los datos de de la siguiente página:
+Mira si coinciden los cálculos hechos en el artículo de la AMD Radeon RX 5700 con los datos de de la siguiente página:
-  * [[https://www.techpowerup.com/gpu-specs/radeon-rx-580.c2938|AMD Radeon RX 580 Specs - TechPowerUp GPU Database]]
+  * [[https://www.techpowerup.com/gpu-specs/radeon-rx-5700.c3437|AMD Radeon RX 5700 Specs - TechPowerUp GPU Database]]
@@ Línea 267: / Línea 306: @@
-==== Ejercicio 3 ====
+==== Ejercicio 4 ====
 Busca 10 tarjetas gráficas de diversos precios y que estén en la siguiente página [[https://www.videocardbenchmark.net/gpu_list.php|PassMark Software - Video Card (GPU) Benchmark Charts - Video Card Model List]]. Anota para cada una de ellas, el valor de la columna "Passmark G3D Mark".
@@ Línea 299: / Línea 338: @@
 </note>
-==== Ejercicio 4 ====
+==== Ejercicio 5 ====
 Haz una gráfica de **puntos** de tarjetas NVIDIA con lo siguiente.
   * El eje X mostrará el número total de CUDA Cores
@@ Línea 308: / Línea 347: @@
-==== Ejercicio 5 ====
+==== Ejercicio 6 ====
 Rellena para la siguiente tabla, el Nº de CUDA cores que tiene cada modelo de tarjeta gŕaficas
@@ Línea 335: / Línea 374: @@
 Es decir que una GeForce GTX 1070 es como GeForce RTX 2060.
-==== Ejercicios 6 ====
+==== Ejercicios 7 ====
 Rellena la siguiente tabla:

logongas

Herramientas de usuario

Herramientas del sitio

Diferencias

Herramientas de la página