Herramientas de usuario

Herramientas del sitio


clase:iabd:pia:matematicas:probabilidad

¡Esta es una revisión vieja del documento!


Probabilidad

$$ \Omega_A = \{ A, \overline{A} \} $$

$$ \Omega_B = \{ B, \overline{B} \} $$

  • Si $A$ y $B$ son independiente

$$ \begin{array} \\ P(A \cup B)&=&P(A)+P(B) \\ P(A \cap B)&=&P(A)*P(B) \end{array} $$

  • Si $A$ y $B$ son dependientes

$$ \begin{array} \\ P(A \cup B)&=&P(A)+P(B)-P(A \cap B) \\ P(A \cap B)&=&P(A|B)*P(B) \\ P(A \cap B)&=&P(B|A)*P(A) \end{array} $$

$$ P(A|B)=\frac{|A \cap B|}{|B|} $$

$$ P(A \cap B)=\frac{|A \cap B|}{|A|+\overline{A}+{B}+\overline{B}} $$

Media de ratios

Acabamos de ver que según las operaciones que hacemos con nuestros datos, saldrá de forma natural una media u otra. Ahora veamos como podemos hacer medias de métricas en IA pero para introducirlo usaremos un ejemplo básico.

Imaginemos un estudiantes que durante un primer curso ha aprobado 0,25 exámenes que significa que ha aprobado 5 exámenes de 20 que ha hecho. Y en segundo curso ha aprobado 0,2 exámenes que significa que ha aprobado 5 exámenes de 25 que ha hecho. ¿Cual es la media de exámenes que ha aprobado el alumno en los 2 cursos?

$$ Total \; de \; exámenes \; aprobados=exámenes \; aprobados \; en \; el \; primer \; curso+exámenes \; aprobados \; en \; el \; segundo \; curso $$

Pero como sabemos que el número de exámenes aprobados en el primer curso es igual al número de exámenes aprobados en el segundo curso (y es importante que ésto sea así). Creamos una nueva variable llamada $exámenes \; aprobados \; por \; curso$

$$ \begin{array} \\ frecuencia \; exámenes \; aprobados \; primer curso=\frac{exámenes \; aprobados \; por \; curso}{exámenes \; realizados \; en \; el \; primer \; curso}=\frac{5}{20}=0,25 & exámenes \; realizados \; en \; el \; primer \; curso=\frac{exámenes \; aprobados \; por \; curso}{frecuencia \; exámenes \; aprobados \; primer \; curso}=\frac{5}{0,25}=20 \\ frecuencia \; exámenes \; aprobados \; segundo curso=\frac{exámenes \; aprobados \; por \; curso}{exámenes \; realizados \; en \; el \; segundo \; curso}=\frac{5}{25}=0,2 & exámenes \; realizados \; en \; el \; segundo \; curso=\frac{exámenes \; aprobados \; por \; curso}{frecuencia \; exámenes \; aprobados \; segundo \; curso}=\frac{5}{0,2}=25 \end{array} $$

$$ Total \; de \; exámenes \; aprobados=exámenes \; aprobados \; en \; el \; primer \; curso+exámenes \; aprobados \; en \; el \; segundo \; curso= \\ exámenes \; aprobados \; por \; curso+exámenes \; aprobados \; por \; curso=2*exámenes \; aprobados \; por \; curso $$

$$ Total \; de \; exámenes \; realizados=exámenes \; realizados \; en \; el \; primer \; curso+exámenes \; realizados \; en \; el \; segundo \; curso= \\ \frac{exámenes \; aprobados \; por \; curso}{frecuencia \; exámenes \; aprobados \; primer \; curso}+\frac{exámenes \; aprobados \; por \; curso}{frecuencia \; exámenes \; aprobados \; segundo \; curso} $$

La frecuencia de exámenes aprobados entre los 2 cursos es:

$$ frecuencia \; de \; exámenes \; aprobados \; entre \; los \; 2 \; cursos=\frac{Total \; de \; exámenes \; aprobados}{Total \; de \; exámenes \; realizados}=\frac{2*exámenes \; aprobados \; por \; curso}{\frac{exámenes \; aprobados \; por \; curso}{frecuencia \; exámenes \; aprobados \; primer \; curso}+\frac{exámenes \; aprobados \; por \; curso}{frecuencia \; exámenes \; aprobados \; segundo \; curso}} $$

Si nos fijamos vuelve a ser la misma que la fórmula $\mathbf{(1)}$ siendo $\alpha=2*exámenes \; aprobados \; por \; curso$ y $\beta=exámenes \; aprobados \; por \; curso$ , pero puesto que $\alpha=2\beta$ sabemos que $K=x$ por lo tanto se puede calcular con la fórmula $\mathbf{(2)}$ que corresponde a la media armónica y solo depende de la frecuencia de exámenes aprobados en cada curso y ya no del número de exámenes aprobados por curso.

$$ frecuencia \; de \; exámenes \; aprobados \; entre \; los \; 2 \; cursos=\frac{2}{\frac{1}{frecuencia \; exámenes \; aprobados \; primer \; curso}+\frac{1}{frecuencia \; exámenes \; aprobados \; segundo \; curso}}=\frac{2}{\frac{1}{0,25}+\frac{1}{0,20}}=0,222 $$

Es decir para sacar la media de 2 ratios (metricas de IA) se usa la media armónica siempre y cuando esos 2 ratios se hayan calculando usando el mismo numerador y $\alpha=2\beta$

f1-score

Y por eso en el f1-score se usa la media armónica , ya que se saca la media de los 2 ratios (sensibilidad y precisión) y ambos tienen el mismo numerador cuando se calculan que es $TP$.

$$ \begin{array} \\ Sensibilidad=\frac{TP}{TP+FN}&\frac{1}{Sensibilidad}=\frac{TP+FN}{TP} \\ Precisión=\frac{TP}{TP+FP}&\frac{1}{Precisión}=\frac{TP+FP}{TP} \end{array} $$

$$ f1-score=\frac{2}{\frac{1}{Sensibilidad} + \frac{1}{Precisión}}=\frac{2}{\frac{TP+FN}{TP}+\frac{TP+FP}{TP}}= $$

$$ =\frac{2}{\frac{TP+FN+TP+FP}{TP}}=\frac{2}{\frac{2TP+FN+FP}{TP}}=\frac{2TP}{2TP+FN+FP} $$

$$ f1-score=\frac{2TP}{2TP+FN+FP} \quad \mathbf{(3)} \quad \text{Formula de f1-score según la definición} $$

$$ \text{Media entre Sensibilidad y Precision}=\frac{Nº \; positivos}{Nº \; totales}=\frac{TP+TP}{(TP+FN) + (TP+FP)}=\frac{2TP}{2TP+FN+FP} $$

$$ f1-score=\frac{2TP}{2TP+FN+FP} \quad \mathbf{(4)} \quad \text{Formula de f1-score sabiendo que se suman los numeradores y los denominadores de ambas métricas} $$

Acabamos de ver que las fórmulas $\mathbf{(3)}$ y $\mathbf{(4)}$ son iguales y en un caso la hemos obtenido usando la definición de f1-score y en la otra sumando los numeradores y denominadores de ambas métricas.

Veamos ahora por último como la media armónica es la forma natural para obtener lo mismo.

$$ \begin{array} \\ Sensibilidad=\frac{a}{b} & b=\frac{a}{Sensibilidad} \\ Precisión=\frac{a}{c} & c=\frac{a}{Precisión} \end{array} $$

Hemos dicho que la media de dos métricas , es sumar los numeradores y los denominadores.

$$ \text{Media entre Sensibilidad y Precision}=\frac{a+a}{b+c}=\frac{2a}{\frac{a}{Sensibilidad}+\frac{a}{Precisión}}= $$

$$ =\frac{2a}{a(\frac{1}{Sensibilidad}+\frac{1}{Precisión})}=\frac{2}{(\frac{1}{Sensibilidad}+\frac{1}{Precisión})}=f1-score $$

Si nos fijamos vuelve a ser la misma que la fórmula $\mathbf{(1)}$ siendo $\alpha=2TP$ y $\beta=TP$ y como $\alpha=2\beta$ sabemos que se puede calcular también usando la fórmula $\mathbf{(2)}$ sin que dependa de $TP$ sino únicamente de la Sensibilidad y la precisión.

Es decir, el objetivo de toda esta página era demostrar que la media entre la sensibilidad y precisión (f1-score) obligatoriamente se tiene que calcular usando la media armónica.

Por lo tanto el motivo de usar la media armónica NO ES que la media armónica da más peso a los valores más pequeños de las dos métricas, penalizando los desequilibrios entre Sensibilidad y Precisión sino que simplemente es porque la media armónica calcula exactamente el valor correcto de la media entre la Sensibilidad y Precisión.

Es decir que dar más peso a los valores más pequeños de las dos métricas es una consecuencia de la necesidad de usar la media armónica y no un objetivo.

Es importante destacar que la media armónica entre las 2 métricas tiene sentido si ambas métricas tiene la forma:

$$ Metrica_1=\frac{a}{b} \quad Metrica_2=\frac{a}{c} $$

Es decir que ambas métricas tienen el mismo numerador

clase/iabd/pia/matematicas/probabilidad.1728211200.txt.gz · Última modificación: 2024/10/06 12:40 por admin