Herramientas de usuario

Herramientas del sitio


clase:asir:fhw:2eval:tema10

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anterior Revisión previa
Próxima revisión
Revisión previa
clase:asir:fhw:2eval:tema10 [2021/05/26 19:04]
admin [Ejercicios]
clase:asir:fhw:2eval:tema10 [2022/04/06 09:34] (actual)
admin [GPU]
Línea 25: Línea 25:
 La siguiente arquitectura es de una Tarjeta gŕafica "NVIDIA Quadro RTX 6000" con arquitectura Turing  y GPU **TU102** La siguiente arquitectura es de una Tarjeta gŕafica "NVIDIA Quadro RTX 6000" con arquitectura Turing  y GPU **TU102**
  
-  * GPU. Cache L2 +  * GPU Processing Clusters o GPC. Cache L2 
-    * 72 Streaming Multiprocessor o SM. Cache L1 +    * 6 Texture Processing Clusters TPC 
-      * 64 CUDA Cores: Cada CUDA Core es una FPU. Tambien llamado FP32. Ya que ejecutan operaciones con números en coma flotante de 32 bits. +      * 2 Streaming Multiprocessor o SM. Cache L1 
-      * 64 ALUs: A las ALU se les llama INT32 ya que ejecutan operaciones con números enteros de 32 bits +        * 64 CUDA Cores: Cada CUDA Core es una FPU. Tambien llamado FP32. Ya que ejecutan operaciones con números en coma flotante de 32 bits. 
-      * 8 Tensor Cores: Multiplicación y suma de matrices (ALUS o FPUs). Se usan en inteligencia artificial (Redes neuronales) +        * 64 ALUs: A las ALU se les llama INT32 ya que ejecutan operaciones con números enteros de 32 bits 
-      * 1 RTX core: Trazado de rayos en video juegos.+        * 8 Tensor Cores: Multiplicación y suma de matrices (ALUS o FPUs). Se usan en inteligencia artificial (Redes neuronales) 
 +        * 1 RTX core: Trazado de rayos en video juegos.
  
 <note tip> <note tip>
-Normalmente en las especificaciones no se suele indicar el número de ALUs o INT32 ya que como ya dijimos en las CPUs "ocupan" poco espacio en comparación con una FP32 (o CUDA Core)+Normalmente en las especificaciones no se suele indicar el número de ALUs o INT32 ya que como ya dijimos en las CPUs "ocupan" poco espacio en comparación con una FP32 o FP64 (o CUDA Core)
 </note> </note>
  
Línea 39: Línea 40:
 Los SM internamente se dividen en  4 Processing Blocks o Subcores. Por ello cada subcore consta de: Los SM internamente se dividen en  4 Processing Blocks o Subcores. Por ello cada subcore consta de:
   * 16 CUDA Cores   * 16 CUDA Cores
 +  * 16 ALUs
   * 2 Tensor Cores   * 2 Tensor Cores
   * Registros   * Registros
Línea 49: Línea 51:
  
 {{:clase:asir:fhw:2eval:arquitectura_nvidia.png|}} {{:clase:asir:fhw:2eval:arquitectura_nvidia.png|}}
 +
 +{{:clase:asir:fhw:2eval:tu102.png?direct&600|}}
  
 {{:clase:asir:fhw:2eval:streaming_multiprocessor.png?600|}} {{:clase:asir:fhw:2eval:streaming_multiprocessor.png?600|}}
Línea 61: Línea 65:
   * {{ :clase:asir:fhw:2eval:nvidia-ampere-ga-102-gpu-architecture-whitepaper-v2.pdf |}}   * {{ :clase:asir:fhw:2eval:nvidia-ampere-ga-102-gpu-architecture-whitepaper-v2.pdf |}}
   * {{ :clase:asir:fhw:2eval:nvidia-ampere-architecture-whitepaper.pdf |}}   * {{ :clase:asir:fhw:2eval:nvidia-ampere-architecture-whitepaper.pdf |}}
 +  * {{ :clase:asir:fhw:2eval:gtc22-whitepaper-hopper.pdf |}}
   * {{ :clase:asir:fhw:2eval:cuda_c_programming_guide.pdf |}}   * {{ :clase:asir:fhw:2eval:cuda_c_programming_guide.pdf |}}
   * [[https://hardzone.es/tutoriales/rendimiento/evolucion-arquitectura-nvidia-tesla-turing/|De Tesla a Turing, así ha cambiado NVIDIA su arquitectura en 14 años]]   * [[https://hardzone.es/tutoriales/rendimiento/evolucion-arquitectura-nvidia-tesla-turing/|De Tesla a Turing, así ha cambiado NVIDIA su arquitectura en 14 años]]
Línea 91: Línea 96:
 |  2018  |  [[https://en.wikipedia.org/wiki/Turing_(microarchitecture)|Turing]]  |  GeForce 20  |  RTX 2080 Ti  |  TU102,TU104,TU106,etc.  | |  2018  |  [[https://en.wikipedia.org/wiki/Turing_(microarchitecture)|Turing]]  |  GeForce 20  |  RTX 2080 Ti  |  TU102,TU104,TU106,etc.  |
 |  2020  |  [[https://en.wikipedia.org/wiki/Ampere_(microarchitecture)|Ampere]]  |  GeForce 30  |  RTX 3060  |  GA100,GA102,GA104,etc.  | |  2020  |  [[https://en.wikipedia.org/wiki/Ampere_(microarchitecture)|Ampere]]  |  GeForce 30  |  RTX 3060  |  GA100,GA102,GA104,etc.  |
-|  2022  |  Lovelace  |  GeForce 40  |  RTX 4060  |  AD102  |+|  2022   [[https://en.wikipedia.org/wiki/Hopper_(microarchitecture)|Hopper]]  |  //No es una gráfica//  |  [[https://www.nvidia.com/es-es/data-center/h100/|H100 Tensor Core]] y [[https://www.nvidia.com/es-es/data-center/h100cnx/|H100 CNX]] |  GH100 y GH202  | 
 +|  2023   Lovelace  |  GeForce 40  |  RTX 4060  |  AD102, AD103, AD104, AD10 y AD107  | 
 + 
 +<note tip> 
 +NVIDIA ha sacaco junto con la arquitectura Hopper , una gama de [[https://www.nvidia.com/es-es/data-center/grace-cpu/|CPU llamada Grace]]. Y podemos comprar ambos productos juntos o separados: 
 +  * NVIDIA Grace CPU Superchip: Procesador ARM con 144 núcleos 
 +  * NVIDIA Grace Hopper: Procesador ARM Grace junto con gráfica Hopper. 
 + 
 +NOTA: [[https://es.wikipedia.org/wiki/Grace_Murray_Hopper|Grace Hopper]] es el nombre de una mujer que ayudó a crear el lenguaje COBOL (Aun usado en bancos de todo el mundo). 
 +Acuñó el termino //bug// además de muchos otro méritos. 
 +</note> 
 + 
 + 
 +  * NVIDIA H100 Hopper 
 +{{ :clase:asir:fhw:2eval:nvidia-h100-hopper-es-presentado-con-16896-nucleos-cuda_2.jpg?direct&600 |}} 
 + 
 + 
 +  * NVIDIA Grace CPU Superchip 
 +{{ :clase:asir:fhw:2eval:grace-cpu-superchip-2c50-d.jpg?direct&600 |}} 
 + 
 + 
 +  * NVIDIA Grace Hopper 
 +{{ :clase:asir:fhw:2eval:grace-2c50-d.jpg?direct&600 |}} 
 + 
 +  * [[https://www.nvidia.com/es-es/data-center/dgx-h100/|NVIDIA DGX H100]]: Sistema completo de NVIDIA. Mas información:{{ :clase:asir:fhw:2eval:nvidia-dgx-h100-datasheet.pdf |}} 
 + 
 +{{ :clase:asir:fhw:2eval:nvidia-dgx-h100-og.jpg?direct&600 |}}
  
 +{{ :clase:asir:fhw:2eval:nvidia-presenta-los-aceleradores-pcie-hopper-gh100-dgx-h100-dgx.png?direct&600 |}}
  
  
clase/asir/fhw/2eval/tema10.1622048654.txt.gz · Última modificación: 2021/05/26 19:04 por admin