Muestra las diferencias entre dos versiones de la página.
Próxima revisión | Revisión previa | ||
clase:iabd:pia:matematicas:probabilidad [2024/10/06 09:23] admin creado |
clase:iabd:pia:matematicas:probabilidad [2024/12/07 22:33] (actual) admin |
||
---|---|---|---|
Línea 1: | Línea 1: | ||
- | ====== Probabilidad ====== | + | ====== |
- | ===== Media de ratios ===== | + | |
- | Acabamos de ver que según las operaciones que hacemos con nuestros datos, saldrá de forma natural una media u otra. Ahora veamos como podemos hacer medias de métricas en IA pero para introducirlo usaremos un ejemplo básico. | + | |
- | + | ||
- | Imaginemos un estudiantes que durante un primer curso ha aprobado | + | |
+ | * Si $A$ y $B$ son excluyentes | ||
$$ | $$ | ||
- | Total \; de \; exámenes | + | \begin{array} |
+ | \\ | ||
+ | P(A \cup B)&=& | ||
+ | \\ | ||
+ | \\ | ||
+ | P(A \cap B)& | ||
+ | \end{array} | ||
$$ | $$ | ||
- | Pero como sabemos que el número de exámenes aprobados en el primer curso es igual al número de exámenes aprobados en el segundo curso (**y es importante que ésto sea así**). Creamos una nueva variable llamada | + | |
$$ | $$ | ||
- | |||
\begin{array} | \begin{array} | ||
\\ | \\ | ||
- | frecuencia | + | P(A \cup B)&=&P(A)+P(B)-P(A |
\\ | \\ | ||
- | frecuencia | + | \\ |
+ | P(A \cap B)&>&0 | ||
\end{array} | \end{array} | ||
$$ | $$ | ||
+ | * Si $A$ y $B$ independientes. | ||
$$ | $$ | ||
- | Total \; de \; exámenes | + | \begin{array} |
+ | \\ | ||
+ | P(A \cup B)&=&P(A)+P(B)-P(A | ||
+ | \\ | ||
+ | P(A \cap B)&=&P(A)*P(B) | ||
+ | \end{array} | ||
$$ | $$ | ||
- | $$ | ||
- | Total \; de \; exámenes \; realizados=exámenes \; realizados \; en \; el \; primer \; curso+exámenes \; realizados \; en \; el \; segundo \; curso= \\ \frac{exámenes \; aprobados \; por \; curso}{frecuencia \; exámenes \; aprobados \; primer \; curso}+\frac{exámenes \; aprobados \; por \; curso}{frecuencia \; exámenes \; aprobados \; segundo \; curso} | ||
- | $$ | ||
- | + | * Si $A$ y $B$ son dependientes | |
- | La frecuencia de exámenes aprobados entre los 2 cursos es: | + | |
$$ | $$ | ||
- | frecuencia \; de \; exámenes \; aprobados \; entre \; los \; 2 \; cursos=\frac{Total \; de \; exámenes \; aprobados}{Total \; de \; exámenes \; realizados}=\frac{2*exámenes \; aprobados \; por \; curso}{\frac{exámenes \; aprobados \; por \; curso}{frecuencia \; exámenes \; aprobados \; primer \; curso}+\frac{exámenes \; aprobados \; por \; curso}{frecuencia \; exámenes \; aprobados \; segundo \; curso}} | ||
- | $$ | ||
- | |||
- | Si nos fijamos vuelve a ser la misma que la fórmula $\mathbf{(1)}$ siendo $\alpha=2*exámenes \; aprobados \; por \; curso$ y $\beta=exámenes \; aprobados \; por \; curso$ , pero puesto que $\alpha=2\beta$ sabemos que $K=x$ por lo tanto se puede calcular con la fórmula $\mathbf{(2)}$ | ||
- | |||
- | |||
- | $$ | ||
- | frecuencia \; de \; exámenes \; aprobados \; entre \; los \; 2 \; cursos=\frac{2}{\frac{1}{frecuencia \; exámenes \; aprobados \; primer \; curso}+\frac{1}{frecuencia \; exámenes \; aprobados \; segundo \; curso}}=\frac{2}{\frac{1}{0, | ||
- | $$ | ||
- | |||
- | Es decir para sacar la media de 2 ratios (metricas de IA) se usa la media armónica siempre y cuando esos 2 ratios se hayan calculando usando el mismo numerador y $\alpha=2\beta$ | ||
- | |||
- | |||
- | ===== f1-score ===== | ||
- | Y por eso en el f1-score se usa la media armónica , ya que se saca la media de los 2 ratios (sensibilidad y precisión) y ambos tienen el mismo numerador cuando se calculan que es $TP$. | ||
- | |||
- | |||
- | $$ | ||
- | |||
\begin{array} | \begin{array} | ||
\\ | \\ | ||
- | Sensibilidad=\frac{TP}{TP+FN}&\frac{1}{Sensibilidad}=\frac{TP+FN}{TP} | + | P(A \cup B)&=& |
\\ | \\ | ||
- | Precisión=\frac{TP}{TP+FP}&\frac{1}{Precisión}=\frac{TP+FP}{TP} | + | \\ |
+ | P(A \cap B)&=& | ||
+ | \\ | ||
+ | P(A \cap B)&=& | ||
+ | \\ | ||
+ | P(A \cap B)& | ||
\end{array} | \end{array} | ||
$$ | $$ | ||
+ | * Y según los valores absolutos: | ||
$$ | $$ | ||
- | f1-score=\frac{2}{\frac{1}{Sensibilidad} + \frac{1}{Precisión}}=\frac{2}{\frac{TP+FN}{TP}+\frac{TP+FP}{TP}}= | ||
- | $$ | ||
- | |||
- | $$ | ||
- | =\frac{2}{\frac{TP+FN+TP+FP}{TP}}=\frac{2}{\frac{2TP+FN+FP}{TP}}=\frac{2TP}{2TP+FN+FP} | ||
- | $$ | ||
- | |||
- | $$ | ||
- | f1-score=\frac{2TP}{2TP+FN+FP} \quad \mathbf{(3)} \quad \text{Formula de f1-score según la definición} | ||
- | $$ | ||
- | |||
- | $$ | ||
- | \text{Media | ||
- | $$ | ||
- | |||
- | $$ | ||
- | f1-score=\frac{2TP}{2TP+FN+FP} \quad \mathbf{(4)} \quad \text{Formula de f1-score sabiendo que se suman los numeradores y los denominadores de ambas métricas} | ||
- | $$ | ||
- | |||
- | Acabamos de ver que las fórmulas $\mathbf{(3)}$ y $\mathbf{(4)}$ son iguales y en un caso la hemos obtenido usando la definición de f1-score y en la otra sumando los numeradores y denominadores de ambas métricas. | ||
- | |||
- | Veamos ahora por último como la media armónica es la forma natural para obtener lo mismo. | ||
- | |||
- | $$ | ||
- | |||
\begin{array} | \begin{array} | ||
\\ | \\ | ||
- | Sensibilidad=\frac{a}{b} & b=\frac{a}{Sensibilidad} | + | \frac{|A \cap B|}{|B|}&=&P(A|B) |
\\ | \\ | ||
- | Precisión=\frac{a}{c} & c=\frac{a}{Precisión} | + | \frac{|A \cap B|}{|A|}&=& |
+ | \\ | ||
+ | \frac{|A \cap B|}{|A|+|\overline{A}|+|{B}|+|\overline{B}|}& | ||
\end{array} | \end{array} | ||
$$ | $$ | ||
- | |||
- | Hemos dicho que la media de dos métricas , es sumar los numeradores y los denominadores. | ||
- | |||
- | $$ | ||
- | \text{Media | ||
- | $$ | ||
- | |||
- | $$ | ||
- | =\frac{2a}{a(\frac{1}{Sensibilidad}+\frac{1}{Precisión})}=\frac{2}{(\frac{1}{Sensibilidad}+\frac{1}{Precisión})}=f1-score | ||
- | $$ | ||
- | |||
- | |||
- | Si nos fijamos vuelve a ser la misma que la fórmula $\mathbf{(1)}$ siendo $\alpha=2TP$ y $\beta=TP$ y como $\alpha=2\beta$ | ||
- | |||
- | |||
- | |||
- | Es decir, el objetivo de toda esta página era demostrar que la media entre la sensibilidad y precisión (**f1-score**) obligatoriamente se tiene que calcular usando la media armónica. | ||
- | |||
- | Por lo tanto el motivo de usar la media armónica **NO ES** que la media armónica da más peso a los valores más pequeños de las dos métricas, penalizando los desequilibrios entre Sensibilidad y Precisión sino que simplemente es porque la media armónica calcula exactamente el valor correcto de la media entre la Sensibilidad y Precisión. | ||
- | |||
- | Es decir que dar más peso a los valores más pequeños de las dos métricas es una consecuencia de la necesidad de usar la media armónica y no un objetivo. | ||
- | |||
- | <note important> | ||
- | Es importante destacar que la media armónica entre las 2 métricas tiene sentido si ambas métricas tiene la forma: | ||
- | |||
- | $$ | ||
- | Metrica_1=\frac{a}{b} \quad Metrica_2=\frac{a}{c} | ||
- | $$ | ||
- | |||
- | Es decir que **ambas métricas tienen el mismo numerador** | ||
- | </ | ||
- | |||
- | |||
- | |||
- | |||
- | |||