Processing math: 100%

Herramientas de usuario

Herramientas del sitio


clase:iabd:pia:2eval:tema08.seleccion-metricas

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anterior Revisión previa
Próxima revisión
Revisión previa
clase:iabd:pia:2eval:tema08.seleccion-metricas [2025/02/15 18:37]
admin [Ejercicios]
clase:iabd:pia:2eval:tema08.seleccion-metricas [2025/04/14 10:42] (actual)
admin [Métricas para datos desbalaceados]
Línea 137: Línea 137:
 nMarkedness=VPP+VPN2 nMarkedness=VPP+VPN2
  
-===== Métricas para datos desbalaceados =====+===== Métricas para datos desbalanceados =====
 El último grupo de métricas que vamos a ver son las métrica para datos desbalanceados. Datos desbalanceados significa con prevalencias muy pequeñas o muy grandes aunque nos vamos a limitar a hablar cuando la prevalencia tiene un valor muy pequeño.  El último grupo de métricas que vamos a ver son las métrica para datos desbalanceados. Datos desbalanceados significa con prevalencias muy pequeñas o muy grandes aunque nos vamos a limitar a hablar cuando la prevalencia tiene un valor muy pequeño. 
  
Línea 352: Línea 352:
  
 ==== Ejercicio 4.B ==== ==== Ejercicio 4.B ====
-¿De que depende la prevalencia?+¿De que depende en este caso realmente la prevalencia? 
 + 
 +==== Ejercicio 5 ==== 
 +Dado los siguientes problemas de Kaggle: 
 +  * **Problema A**:[[https://www.kaggle.com/datasets/arashnic/hr-analytics-job-change-of-data-scientists|HR Analytics: Job Change of Data Scientists]]: Al contratar a alguien , averiguar si es persona va a buscar rápidamente cambiar de trabajo. 
 +  * **Problema B**:[[https://www.kaggle.com/datasets/adityakadiwal/water-potability/code|Water Quality]]: Averiguar si es base a cierto parámetros del agua , ésta es potable. 
 +  * **Problema C**:[[https://www.kaggle.com/datasets/hopesb/student-depression-dataset/data|Student Depression Dataset.]]: Predecir si un estudiante va a tener depresión. 
 + 
 +Responde a las siguientes cuestiones 
 + 
 +  * Indica la prevalencia del problema: 
 +    * Si no se sabe porque depende de donde se vaya a usar. 
 +    * Si es la de los datos 
 +    * Si es otro valor conocido. En ese caso di cual. 
 +  * En base a la prevalencia indica la métrica de rendimiento global más adecuada. 
 + 
 +Usando la métrica que has seleccionado, muestra para cada problema una gráfica en la que se muestre esa métrica en función del umbral (threshold). Y elige el umbral más adecuado. 
 + 
 + 
 + 
 + 
  
  
clase/iabd/pia/2eval/tema08.seleccion-metricas.1739641042.txt.gz · Última modificación: 2025/02/15 18:37 por admin