Tabla de Contenidos

8.b Métricas clasificación (Bayes)

En este apartado vamos a ver las métricas asociadas a problemas de clasificación en las redes neuronales. Como el apartado es muy amplio lo hemos dividido entre esta página y la siguientes:

Métricas de clasificación con 2 posibles valores

Clasificación con 2 posibles valores es cuando la salida de nuestra red neuronal solo puede tener 2 posibles valores.

Antes de entrar a ver las métricas , es necesario entender lo que son:

Estos 4 valores se pueden representar en una matriz llamada matriz de confusión.

Para distinguir:
  • predicho que es positivo de realmente es positivo
  • predicho que es negativo de realmente es negativo

para ello vamos a seguir la siguiente nomenclatura basada en un ejemplo de red neuronal que detectara enfermedades:

  • Predicho que es positivo=Positivo
  • Predicho que es negativo=Negativo
  • Realmente es positivo=Enfermo
  • Realmente es negativo=Sano

Por lo que podemos rehacer la lista inicial como:

  • TP: Positivo y Enfermo
  • TN: Negativo y Sano
  • FP: Positivo y Sano
  • FN: Negativo y Enfermo
Predicción
Positivo Negativo
Realidad Enfermo TP FN
Sano FP TN

Más información:

Umbral o Threshold

En la clasificación binaria los posibles valores son 1 y 0 o True y False. Sin embargo nuestra red neuronal suele sacar un valor entre 0 y 1. A ese valor se le llama y_score y en función de un threshold lo transformamos en el valor predicho o y_pred.

Si el valor del score es mayor que el threshold el valor predicho será un True mientras que si el valor del score es menor que el threshold el valor predicho será un False

Veamos un ejemplo de ello:

y_score=np.array([0.27, 0.45,  0.76,  0.55,  0.28, 0.04, 0.34,0.4, 0.66, 0.88, 0.94,0.47,0.2])
y_pred=y_score>0.5
print(y_pred)

Siendo el resultado

[False False  True  True False False False False  True  True  True False False]

Por ello la mayoría de nuestras métricas son dependientes del valor que indiquemos de threshold. Excepto la métrica de AUC que es independiente del valor de threshold.

Un ejemplo de lo que acabamos de ver está en las métricas de f1-score y AUC de sklearn. En https://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html los parámetros de entrada son y_true e y_pred mientras que en https://scikit-learn.org/stable/modules/generated/sklearn.metrics.roc_auc_score.html los parámetros de entrada son y_true e y_score ya que no necesita el umbral

Probabilidad condicional

La probabilidad condicional se expresa de la siguiente forma $P(A|B)$ que significa , la probabilidad de que ocurra A sabiendo que ya ocurrido B. ¿Y que tiene que ver ésto con las métricas? Realmente las métricas se pueden expresar como probabilidades condicionales. Lo bueno de usar probabilidades condicionales es que se entienden mejor.

Para explicar las métricas vamos a imaginar los test de COVID que comprobamos en las farmacias , que nos decían si teníamos o no COVID. El ejemplo es igual que si fuera una red neuronal que dado una radiografía nos dijera si teníamos o no COVID. Pero se usa el test de farmacia de COVID para hacer más comprensible la explicación.

Para poner la probabilidad condicional vamos a con la nomenclatura anterior

Veamos ahora unas probabilidades condicionales.

Detengámonos un momento. ¿Cual de las 2 probabilidades nos interesa?. $P(Positivo|Enferma)$ o $P(Enferma|Positivo)$. Si lo pensamos , ¿para que queremos saber $P(Positivo|Enferma)$? Si ya sabemos que la persona está enferma, ¿para que querríamos usar el test? ¡¡Ya sabemos que está enferma!!!! Así que realmente nos interesa $P(Enferma|Positivo)$

Cálculo de las métricas

Pongamos ahora todas las combinaciones de probabilidades posibles de las métricas que realmente nos interesan.


Mientras que las 4 siguientes aparentemente no nos interesan lo más mínimo:


Volvamos a la matriz de confusión:

Predicción
Positivo (PP) Negativo (PN)
Realidad Enfermo (P) TP FN
Sano (N) FP TN

$$ \begin{array} \\ E&=&TP+FN&=&Nº \; de \; enfermos \\ S&=&FP+TN&=&Nº \; de \; sanos \\ PP&=&TP+FP&=&Nº \; predichos \; positivos \\ PN&=&FN+TN&=&Nº \; predichos \; negativos \\ \end{array} $$

Y siendo un poco perspicaces podremos ver como se calculan las 8 probabilidades y los nombres que tienen:

$$ \begin{array} \\ P(Enfermo|Positivo)&=&\frac{TP}{PP}&=&\frac{TP}{TP+FP}&=&Positive \; Predictive \; Value \; (PPV)&=&Precisión& \\ P(Sano|Positivo)&=&\frac{FP}{PP}&=&\frac{FP}{TP+FP}&=&False \; Discovery \; Rate \; (FDR)&=&1-Precisión \\ \\ P(Sano|Negativo)&=&\frac{TN}{PN}&=&\frac{TN}{FN+TN}&=&Negative \; Predictive \; Value \; (NPV)&& \\ P(Enfermo|Negativo)&=&\frac{FP}{PN}&=&\frac{FP}{FN+TN}&=&False \; Omission \; Rate \; (FOR)&=&1-NPV \\ \end{array} $$

$$ \begin{array} \\ P(Positivo|Enfermo)&=&\frac{TP}{E}&=&\frac{TP}{TP+FN}&=&True \; Positive \; Rate (TPR) &=&Sensibilidad \\ P(Negativo|Enfermo)&=&\frac{FN}{E}&=&\frac{FN}{TP+FN}&=&False \; Negative \; Rate \; (FNR)&=&1-Sensibilidad \\ \\ P(Negativo|Sano)&=&\frac{TN}{S}&=&\frac{TN}{FP+TN}&=&True \; Negative \; Rate (TNR) &=&Especificidad \\ P(Positivo|Sano)&=&\frac{FP}{S}&=&\frac{FP}{FP+TN}&=&False \; Positive \; Rate \; (FPR)&=&1-Especificidad \\ \end{array} $$

Predicción
Positivo (PP) Negativo (PN) Métricas
Realidad Enfermo (E) TP FN $P(Positivo|Enfermo)=\frac{TP}{E}$ $P(Negativo|Enfermo)=\frac{FN}{E}$
Sano (S) FP TN $P(Positivo|Sano)=\frac{FP}{S}$ $P(Negativo|Sano)=\frac{TN}{S}$
Métricas $P(Enfermo|Positivo)=\frac{TP}{PP}$ $P(Enfermo|Negativo)=\frac{FN}{PN}$
$P(Sano|Positivo)=\frac{FP}{PP}$ $P(Sano|Negativo)=\frac{TN}{PN}$
Predicción
Positivo (PP) Negativo (PN) Métricas
Realidad Enfermo (E) TP FN $TPR=\frac{TP}{E}$ $FNR=\frac{FN}{E}$
Sano (S) FP TN $FPR=\frac{FP}{S}$ $TNR=\frac{TN}{S}$
Métricas $PPV=\frac{TP}{PP}$ $FOR=\frac{FN}{PN}$
$FDR=\frac{FP}{PP}$ $NPV=\frac{TN}{PN}$
Predicción
Positivo (PP) Negativo (PN) Métricas
Realidad Enfermo (E) TP FN $Sensibilidad=\frac{TP}{E}$ $FNR=\frac{FN}{E}$
Sano (S) FP TN $FPR=\frac{FP}{S}$ $Especificidad=\frac{TN}{S}$
Métricas $Precisión=\frac{TP}{PP}$ $FOR=\frac{FN}{PN}$
$FDR=\frac{FP}{PP}$ $NPV=\frac{TN}{PN}$

Selección de métricas

Volvamos ahora a recapacitar otra vez sobre el significado de las métricas. En un test perfecto realmente lo que nos interesa es:

A esas 2 métricas se les llama:

Se llaman así porque realmente son las 2 métricas que predicen si estás enfermo o sano cuando el test da positivo o negativo respectivamente. Y a la primera de ellas se le llama también precisión

Teorema de Bayes

El problema de calcular la precisión y el VPN es que sus valores dependen de la cantidad de enfermos y de sanos que tengamos al entrenar nuestra red. Por lo tanto del valor de E y S. Es decir que dependen de lo balanceados que tengamos nuestras clases.

Para calcular como de balanceadas están las clases se usa la $Prevalencia \; o \; P(Enfermo)$ , y es un dato muy importante que se calcula de la siguiente forma:

$$ Prevalencia=P(Enfermo)=\frac{TP+FN}{TP+FN+FP+TN}=\frac{E}{E+S} $$

Además están otras probabilidades que son:

$$ \begin{array} \\ P(Enfermo)&=&\frac{TP+FN}{TP+FN+FP+TN}&=&\frac{E}{E+S}&=&Prevalencia \\ P(Sano)&=&\frac{FP+TN}{TP+FN+FP+TN}&=&\frac{S}{E+S}&=&1-Prevalencia \\ P(Positivo)&=&\frac{TP+FP}{TP+FN+FP+TN}&=&\frac{PP}{PP+PN} \\ P(Negativo)&=&\frac{FN+TN}{TP+FN+FP+TN}&=&\frac{PN}{PP+PN}&=&1-P(Positivo) \end{array} $$

Recordar que: $$ E+S=PP+PN=Total $$

En la siguiente imagen vamos a obtener las métricas y vamos a ver como varían las métricas si aumenta o disminuye el número de positivos. Es decir vamos a ver como dependen la precisión y el VPN según la prevalencia.

Vemos que si aumentamos el número de positivos (por lo tanto aumentando la prevalencia), se modifican las métricas de Precisión (VPP) y VPN de la siguiente forma:

En la gráfica se puede ver como varían el VPP y el VPN según la prevalencia. Y la línea roja es con la prevalencia de los datos.

En la siguiente gráfica se ven varios ejemplos de $VPP$ y $VPN$ en función de la $Prevalencia$ para varios valores de $sensibilidad$ y la $especificidad$

Por lo tanto se podría hacer trampa y sin modificar el modelo pero variando la prevalencia de los datos de validación, conseguir mejorar el VPP o el PPN.

¿Cual es entonces la solución? Pues usar métricas que no dependan de la prevalencia. Y esas métricas son la $sensibilidad$ y la $especificidad$ que habíamos descartado. ¿Y para que las queremos? Pues esas 2 métricas nos dicen lo bueno que es nuestro modelo cuando lo estamos desarrollando ya que nos decían cuanto acertaban o fallaban cuando sabíamos lo que debía dar y son métricas independientes de la prevalencia de nuestros datos. Podemos ver que esas métricas no han variado aunque se haya modificado la prevalencia.

Vale, pero nosotros lo que queremos es saber la precisión y la VPN. Pues resulta que el teorema de bayes es una fórmula matemática que nos calcula la precisión y la VPN en base a la sensibilidad y la especificidad y además según la prevalencia. 😍😍😍😍😍😍

$$ P(Enfermo|Positivo)=\frac{P(Positivo|Enfermo)*P(Enfermo)}{P(Positivo|Enfermo)*P(Enfermo)+P(Positivo|Sano)*P(Sano)} $$

$$ P(Sano|Negativo)=\frac{P(Negativo|Sano)*P(Sano)}{P(Negativo|Sano)*P(Sano)+P(Negativo|Enfermo)*P(Enfermo)} $$

y usando los nombres normales de las métricas las fórmulas quedarían así:

$$ Precisión=VPP=\frac{Sensibilidad*Prevalencia}{Sensibilidad*Prevalencia+(1-Especificidad)*(1-Prevalencia)} $$

$$ VPN=\frac{Especificidad*(1-Prevalencia)}{Especificidad*(1-Prevalencia)+(1-sensibilidad)*Prevalencia} $$

Todo ellos nos lleva a que al desarrollar nuestra red neuronal solo nos interesan que los valores de $Sensibilidad$ y de $Especificidad$ sean lo más altos posibles. Y cuando vayamos a predecir, nos tendrán que indicar el valor de la prevalencia y en ese caso podremos calcular si ha salid positivo el valor de $Precisión \; (VPP)$ y si ha salido negativo calcularemos el valor de $VPN$.

Por ello en los prospectos de los test de covid, los valores que siempre se calculaban son el de $Sensibilidad$ y de $Especificidad$: sars-cov-2_rapid_antigen_test_es.pdf

¿Y como sabemos el valor de la prevalencia? Pues nos lo tiene que dar el que hace la predicción o sino en el peor de los casos usar la prevalencia que usamos en nuestros datos. Por lo que en ese caso serían los fórmulas originales de precisión y VPN.

En los siguientes 2 artículos vemos investigaciones para calcular la prevalencia del COVID según distintas circunstancias:

Mejores valores de las métricas

Ahora ya sabemos que VPP y VPN son las métricas que nos interesan realmente y que sus valores deben ser lo más cercanas a 1. Pero también sabemos que esas métricas dependen de la Prevalencia (que no depende de lo bueno que sea nuestro modelo ) y de las métricas de Sensibilidad y Especificidad (Que si que dependen de lo bueno que sea nuestro modelo). Así que para obtener los mejores valores del VPP y VPN tenemos que conseguir en nuestro modelo consigamos los mejores valores de Sensibilidad y Especificidad.

Como ya hemos visto hay las siguientes relaciones entre métricas:

$$ FNR=1-Sensibilidad $$
$$ FPR=1-Especificidad $$

Además de

$$ FDR=1-VPP $$
$$ FOR=1-VPN $$

Como esas métricas no son independientes de las anteriores, volvamos ahora a poner la tabla de confusión únicamente con las métricas que nos interesan y además los valores ideales que nos interesarían.

Predicción
Positivo (PP) Negativo (PN) Métricas
Realidad Enfermo (E) TP FN $Sensibilidad=1$
Sano (S) FP TN $Especificidad=1$
Métricas $VPP=1$
$VPN=1$

Y por lo tanto el resto de las métricas nos interesarían que fueran 0 pero al depender de la que hemos mostrado , ni las mediremos.

Resumen

Más información en:

Metricas en Keras

Veamos como calcular en Keras las métricas que necesitamos

Sensibilidad

La sensibilidad en inglés es Sensibility pero también se llama Recall que es como se usa en Keras.

Su uso en Keras es

metrics=[tf.keras.metrics.Recall()]
metrics=["recall"]

y usarla como

history.history['recall']
history.history['val_recall']

En versiones antiguas de Tensorflow, se llamaba Recall (Con la R en mayúscula)

Ejemplo:

y_true = np.array([1,1,1,1,1])
y_pred = np.array([0.9, 0.2, 0.3, 0.8,0.6])
metric = tf.keras.metrics.Recall()
metric(y_true, y_pred).numpy()

0.6

Más información:

Especificidad

Inexplicablemente esta métrica no existe en keras. Pero la podemos definir con el siguiente código:


from tensorflow.keras import backend as K

def specificity(y_true, y_score,threshold = 0.5):
    
    y_true = K.cast(y_true, dtype='float32')
    y_pred = K.cast(y_score > threshold, dtype='float32')



    y_true = tf.reshape(y_true, (-1, 1))
    y_pred = tf.reshape(y_pred, (-1, 1))


    TN = K.sum((1 - y_true) * (1 - y_pred))  
    FP = K.sum((1 - y_true) * y_pred)        

    specificity = TN / (TN + FP + K.epsilon())  

    return specificity

Su uso en Keras es

metrics=[specificity]

y usarla como

history.history['specificity']
history.history['val_specificity']

Ejemplo:

y_true = np.array([0,0,0,0,0])
y_pred = np.array([0.9, 0.7, 0.3, 0.3,0.6])
specificity(y_true, y_pred).numpy()

0.4

El motivo de éstas 2 líneas de código

TN = K.sum((1 - y_true) * (1 - y_pred))  
FP = K.sum((1 - y_true) * y_pred)   

se puede ver en la siguiente tabla de verdad:

Entradas Salidas
y_true y_pred TP TN FP FN
1 1 1 0 0 0
0 0 0 1 0 0
0 1 0 0 1 0
1 0 0 0 0 1

Y se puede calcular de 2 maneras distintas:

TP = sum(y_true * y_pred) 
TN = sum((1 - y_true) * (1 - y_pred))  
FP = sum((1 - y_true) * y_pred) 
FN = sum(y_true * (1 - y_pred))  

TP = sum((y_true==1) & (y_pred==1))
TN = sum((y_true==0) & (y_pred==0))
FN = sum((y_true==1) & (y_pred==0))
FP = sum((y_true==0) & (y_pred==1))

Métricas de clasificación con más de 2 posibles valores

Categorical Accuracy

Accuracy nos indica la proporción de aciertos que ha tenido. Es decir el porcentaje (en tanto por uno) de verdaderos positivos y verdaderos negativos

Su uso en keras es:

metrics=[tf.keras.metrics.CategoricalAccuracy()]
metrics=["categorical_accuracy"]

y usarla como

history.history['categorical_accuracy']
history.history['val_categorical_accuracy']

Mas información:

Ejercicios

Para mostrar la matriz de confusión se usará la siguiente función que usa de matplotlib
def plot_matriz_confusion(axes,TP=0,TN=0,FP=0,FN=0,fontsize=15,titulo=None,vpp=None,vpn=None,sensibilidad=None,especificidad=None,f1_score=None,mcc=None,auc=None,prevalencia=None):
    success_color=matplotlib.colors.to_rgb('#9EE548')
    failure_color=matplotlib.colors.to_rgb("#C32240")
    blanco_color=matplotlib.colors.to_rgb("#FFFFFF")


    if ((vpp is not None) | 
        (vpn is not None) | 
        (sensibilidad is not None) |
        (especificidad is not None) | 
        (prevalencia is not None) |
        (f1_score is not None) | 
        (mcc is not None) |
        (auc is not None) ):
        show_metrics=True
    else:
        show_metrics=False


    if show_metrics==False:
        axes.imshow([[success_color,failure_color],[failure_color,success_color]])
    else:
        axes.imshow([[success_color,failure_color,blanco_color],[failure_color,success_color,blanco_color],[blanco_color,blanco_color,blanco_color]])


    if titulo==None:
        titulo="Predicción"
    else:
        titulo=titulo+"\nPredicción"

    labels = ['Positivo','Negativo']
    xaxis = np.arange(len(labels))
    axes.set_xticks(xaxis)
    axes.set_yticks(xaxis)
    axes.set_xticklabels(labels, fontsize=13, color="#003B80")
    axes.set_yticklabels(labels, fontsize=13, color="#003B80")
    axes.text(0, 0, str(TP)+" TP",ha="center", va="center", color="#0A2102",fontsize=fontsize)
    axes.text(0, 1, str(FP)+" FP",ha="center", va="center", color="#FAEAEA",fontsize=fontsize) 
    axes.text(1, 0, str(FN)+" FN",ha="center", va="center", color="#FAEAEA",fontsize=fontsize)
    axes.text(1, 1, str(TN)+" TN",ha="center", va="center", color="#0A2102",fontsize=fontsize)         
    axes.xaxis.tick_top()
    axes.set_xlabel(titulo, fontsize=fontsize, color="#003B80") 
    axes.xaxis.set_label_position('top') 
    axes.set_ylabel('Realidad', fontsize=fontsize, color="#003B80") 


    if show_metrics==True:


        if (vpp is not None):
            axes.text(0, 2, f"Precision\n{vpp:.2f}",ha="center", va="center", color="#0A2102",fontsize=fontsize-4)
        if (vpn is not None):
            axes.text(1, 2, f"VPN\n{vpn:.2f}",ha="center", va="center", color="#0A2102",fontsize=fontsize-4)
        if (sensibilidad is not None):
            axes.text(2, 0, f"Sensibilidad\n{sensibilidad:.2f}",ha="center", va="center", color="#0A2102",fontsize=fontsize-4) 
        if (especificidad is not None):
            axes.text(2, 1, f"Especificidad\n{especificidad:.2f}",ha="center", va="center", color="#0A2102",fontsize=fontsize-4) 

        metricas_generales=""
        if (prevalencia is not None):
            metricas_generales=metricas_generales+f"Prevalencia\n{prevalencia:.2f}\n"        
        if (f1_score is not None):
            metricas_generales=metricas_generales+f"F1-score\n{f1_score:.2f}\n"   
        if (mcc is not None):
            metricas_generales=metricas_generales+f"MCC\n{mcc:.2f}\n"  
        if (auc is not None):
            metricas_generales=metricas_generales+f"AUC\n{auc:.2f}"             

        axes.text(2, 2, metricas_generales,ha="center", va="center", color="#0A2102",fontsize=fontsize-4)    

Ejercicio 1

Si una red neuronal para detectar si una radiografía es de un tórax ha predicho lo siguiente:

Indica el nº de:

Dibuja la matriz de confusión

Ejercicio 2.A

Seguimos con la red neuronal que predice si una radiografía es de tórax.

Si para 10 imágenes ha sacado los siguientes resultados:

y_score=np.array([0.27, 0.45,  0.76,  0.55,  0.28, 0.04, 0.34,0.4, 0.66, 0.88, 0.94,0.47,0.2])

Indica para cada valor predicho , si ha predicho que era una imagen de tórax o no.

Ejercicio 2.B

Seguimos con la red neuronal que predice si una radiografía es de tórax.

Si para 10 imágenes ha sacado los siguientes resultados:

y_score=np.array([0.27, 0.45,  0.76,  0.55,  0.28, 0.04, 0.34,0.4, 0.66, 0.88, 0.94,0.47,0.2])

Pero los valores verdaderos son los siguientes:

y_true=np.array([1,0,1,0,0,0,1,0,1,1,1,1,0])

Indica el nº de:

Dibuja la matriz de confusión

Ejercicio 2.C

Siguiendo con los datos anteriores y suponiendo que el umbral es 0.5:

y_true=np.array([1,0,1,0,0,0,1,0,1,1,1,1,0])
y_score=np.array([0.27, 0.45,  0.76,  0.55,  0.28, 0.04, 0.34,0.4, 0.66, 0.88, 0.94,0.47,0.2])

Calcula directamente las siguientes métricas:

Ejercicio 2.D

Calcula ahora los valores de:

pero usando el teorema de bayes en base a los valores de:

Ejercicio 2.E

Muestra ahora una gráfica con matplolib en la que se vea como evolucionan los valores de VPP y VPN según la prevalencia.

Esa misma gráfica se puede mostrar en Bayesian Clinical Diagnostic Model

Ejercicio 3.A

Crea una red neuronal con los datos de bread cancer con las siguientes características:

Muestra las siguientes métricas durante el entrenamiento y validación (para cada una de las épocas):

Separa los datos en 3 conjuntos:
  • Entrenamiento (60%)
  • Validación (20%)
  • Test (20%)

Ejercicio 3.B

En este ejercicio vamos a mostrar la matriz de confusión de la red que acabamos de crear.

Para ello vamos a usar los valores de validación que los tenemos en las siguientes variables del ejercicio anterior:

La variable y_validacion es lo que llamamos y_true mientras que con y_score obtendremos y_pred.

Para ello sigue los siguientes pasos:

Ejercicio 3.C

Crea una función llamada get_metrics(TP,TN,FP,FN,Prevalencia=None) que retorne las siguientes métricas:

Para calcular VPP y VPN se debe usar la prevalencia. Si no se pasa el valor de prevalencia ( Es decir 'prevalencia==None', se usará el de los datos y sino se usará la prevalencia que se pase como argumento.

Usando los valores de TP ,TN, FP y FN del ejercicio anterior, muestra las métricas que retorna get_metrics

Muestra todo en la matriz de confusión.

Ejercicio 3.D

Guarda el modelo a disco

Ejercicio 4:Validación

Ahora , vamos a calcular todas las métricas de nuevo pero de un modelo que no hemos entrenado sino que nos lo han "pasado". Es decir el equipo de desarrollo ha hecho el modelo y ahora lo vamos a testear..

Para ello en un nuevo jupyter notebook, carga el modelo que guardaste en el ejercicio anterior y vuelve a mostrar la matriz de confusión con todas las métricas.

Usa los datos de test para obtener las métricas.

Ejercicio 5.A: Umbral

Muestra ahora una gráfica, en la que se mostrará:

Usa los datos de test para obtener las métricas.

Ejercicio 5.B

Muestra varias matrices de confusión, una para cada uno de estos umbrales: [0.2,0.3,0.4,0.5,0.7,0.8]

¿Que es mejor una alta precisión alta (VPP) o un alto VPN? Elije el umbral adecuado.

Usa los datos de test para obtener las métricas.

Ejercicio 5.C

Ahora calcula una tabla similar a esta para ver resultado de 8 pacientes.

Paciente      y_score    Umbral  Resultado    Prob.      Realidad
                                 Test         Acierto
----------  ---------  --------  -----------  ---------  ----------
Nº 347      0.32628         0.3  Positivo     88% VPP    Enfermo
Nº 270      0.95804         0.3  Positivo     88% VPP    Enfermo
Nº 213      0.958995        0.3  Positivo     88% VPP    Sano
Nº 3        0.31489         0.3  Positivo     88% VPP    Sano
Nº 214      0.286227        0.3  Negativo     96% VPN    Sano
Nº 265      0               0.3  Negativo     96% VPN    Sano
Nº 92       0.0623996       0.3  Negativo     96% VPN    Enfermo
Nº 476      0.275804        0.3  Negativo     96% VPN    Enfermo

Responde ahora a estas preguntas:

Para saber con que pacientes debe probar concretamente en tu modelo, usa la función get_pacientes_a_probar(model) que retornará un array con los pacientes a probar.

def get_paciente_a_probar(indices,y_pred,order):
    y_pred_values = y_pred[indices]
    sorted_indices = indices[0][np.argsort(order*y_pred_values)]

    return sorted_indices[0]

def get_pacientes_a_probar(model):
    breast_cancer=load_breast_cancer()
    tolerancia=0.07
    desc=-1
    asc=1
    numeros_pacientes=[]

    y_pred=model.predict(breast_cancer.data,verbose=False).reshape(-1)

    #TP Malo:
    numeros_pacientes.append(get_paciente_a_probar(np.where((breast_cancer.target==1) & (y_pred>best_threshold) & (y_pred<best_threshold+tolerancia)),y_pred,asc))
    #TP Bueno
    numeros_pacientes.append(get_paciente_a_probar(np.where((breast_cancer.target==1) & (y_pred>1-tolerancia) & (y_pred<1)),y_pred,desc))

    #FP Malo
    numeros_pacientes.append(get_paciente_a_probar(np.where((breast_cancer.target==0) & (y_pred>1-tolerancia) & (y_pred<1)),y_pred,desc))
    #FP Casi bueno
    numeros_pacientes.append(get_paciente_a_probar(np.where((breast_cancer.target==0) & (y_pred>best_threshold) & (y_pred<best_threshold+tolerancia)),y_pred,asc))

    #TN Malo
    numeros_pacientes.append(get_paciente_a_probar(np.where((breast_cancer.target==0) & (y_pred>best_threshold-tolerancia) & (y_pred<best_threshold)),y_pred,desc))
    #TN Bueno
    numeros_pacientes.append(get_paciente_a_probar(np.where((breast_cancer.target==0) & (y_pred>0.0) & (y_pred<tolerancia)),y_pred,asc))

    #FN Malo
    numeros_pacientes.append(get_paciente_a_probar(np.where((breast_cancer.target==1) & (y_pred>0.0) & (y_pred<=tolerancia)),y_pred,desc))
    #FN Casi bueno
    numeros_pacientes.append(get_paciente_a_probar(np.where((breast_cancer.target==1) & (y_pred>best_threshold-tolerancia) & (y_pred<best_threshold)),y_pred,asc))

    return numeros_pacientes

Ejercicio 6

Indica en los siguientes problemas si es mejor una precisión alta (VPP) o un alto VPN