Processing math: 100%

Herramientas de usuario

Herramientas del sitio


clase:iabd:pia:2eval:tema08.seleccion-metricas

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anterior Revisión previa
Próxima revisión
Revisión previa
clase:iabd:pia:2eval:tema08.seleccion-metricas [2025/02/15 18:50]
admin [Ejercicios]
clase:iabd:pia:2eval:tema08.seleccion-metricas [2025/04/14 10:42] (actual)
admin [Métricas para datos desbalaceados]
Línea 137: Línea 137:
 nMarkedness=VPP+VPN2 nMarkedness=VPP+VPN2
  
-===== Métricas para datos desbalaceados =====+===== Métricas para datos desbalanceados =====
 El último grupo de métricas que vamos a ver son las métrica para datos desbalanceados. Datos desbalanceados significa con prevalencias muy pequeñas o muy grandes aunque nos vamos a limitar a hablar cuando la prevalencia tiene un valor muy pequeño.  El último grupo de métricas que vamos a ver son las métrica para datos desbalanceados. Datos desbalanceados significa con prevalencias muy pequeñas o muy grandes aunque nos vamos a limitar a hablar cuando la prevalencia tiene un valor muy pequeño. 
  
Línea 353: Línea 353:
 ==== Ejercicio 4.B ==== ==== Ejercicio 4.B ====
 ¿De que depende en este caso realmente la prevalencia? ¿De que depende en este caso realmente la prevalencia?
 +
 +==== Ejercicio 5 ====
 +Dado los siguientes problemas de Kaggle:
 +  * **Problema A**:[[https://www.kaggle.com/datasets/arashnic/hr-analytics-job-change-of-data-scientists|HR Analytics: Job Change of Data Scientists]]: Al contratar a alguien , averiguar si es persona va a buscar rápidamente cambiar de trabajo.
 +  * **Problema B**:[[https://www.kaggle.com/datasets/adityakadiwal/water-potability/code|Water Quality]]: Averiguar si es base a cierto parámetros del agua , ésta es potable.
 +  * **Problema C**:[[https://www.kaggle.com/datasets/hopesb/student-depression-dataset/data|Student Depression Dataset.]]: Predecir si un estudiante va a tener depresión.
 +
 +Responde a las siguientes cuestiones
 +
 +  * Indica la prevalencia del problema:
 +    * Si no se sabe porque depende de donde se vaya a usar.
 +    * Si es la de los datos
 +    * Si es otro valor conocido. En ese caso di cual.
 +  * En base a la prevalencia indica la métrica de rendimiento global más adecuada.
 +
 +Usando la métrica que has seleccionado, muestra para cada problema una gráfica en la que se muestre esa métrica en función del umbral (threshold). Y elige el umbral más adecuado.
 +
 +
 +
 +
 +
  
  
clase/iabd/pia/2eval/tema08.seleccion-metricas.1739641856.txt.gz · Última modificación: 2025/02/15 18:50 por admin