Herramientas de usuario

Herramientas del sitio


clase:iabd:pia:matematicas:medias

Medias

¿Que es la media? Cual deberíamos usar. Existen muchas medias pero una generalización de ellas en la Media generalizada. Que según un parámetro $m$ puede crear varias medias.

  • Si $m=2$ es la media cuadrática
  • Si $m=1$ es la media aritmética
  • Si $m=0$ es la media geométrica
  • Si $m=-1$ es la media armónica

¿Pero que media deberíamos usar? Se tiende a pensar que la media aritmética es la "oficial" y que las otras son las raras. Para resolver esa pregunta , veremos que es una media y para ello vamos a ver como se deducen distintos tipos de medias.

Media aritmética

Supongamos que tenemos una familia en la que trabajan 2 personas y cada uno tiene un sueldo mensual. El importe de estos dos sueldos los llamamos $A$ y $B$. El dinero que entra en la casa cada mes por lo tanto es $A+B=K$. ¿Que sería la media? Sería aquel valor $x$ tal que si las dos personas cobraran lo mismo , su suma volvería a dar $K$. Es decir $x+x=K$.

Por lo tanto, ¿como calculamos la media? $$A+B=K$$ $$x+x=K$$ $$x+x=A+B$$ $$2x=A+B$$ $$x=\frac{A+B}{2}$$

Nos ha salido que $x$ es la media aritmética de $A$ y $B$.

Media geométrica

Supongamos ahora que tenemos una superficie rectangular cuyos lados tiene de longitud $A$ y $B$. La superficie de ese rectángulo es $A*B=K$. ¿Que sería la media? Sería aquel valor $x$ tal que si los dos lados fueran iguales , su area volvería a dar $K$. Es decir $x*x=K$.

Por lo tanto, ¿como calculamos la media? $$A*B=K$$ $$x*x=K$$ $$x*x=A*B$$ $$x^2=A*B$$ $$x=\sqrt[2]{A*B}$$

Nos ha salido que $x$ es la media geométrica de $A$ y $B$.

Media armónica

Un calculo similar lo podemos hacer para la media armónica. Aunque en este caso es un poco menos intuitivo.

Si tenemos $A$ y $B$ cuya formula es:

$$\frac{ \alpha}{\frac{\beta}{A}+\frac{\beta}{B}}=K \;\; \mathbf{(1)}$$

Y queremos calcula el valor medio de $A$ y $B$.

$$\frac{ \alpha}{\frac{\beta}{x}+\frac{\beta}{x}}=K$$

$$\frac{ \alpha}{\frac{\beta}{A}+\frac{\beta}{B}}=\frac{ \alpha}{\frac{\beta}{x}+\frac{\beta}{x}}$$

$$\frac{ \alpha}{\frac{B\beta+A\beta}{A B}}=\frac{ \alpha}{\frac{2\beta}{x}}$$

$$\frac{\alpha A B}{\beta(A+B)}=\frac{\alpha x}{2\beta}$$

$$\frac{2 \alpha \beta A B}{\alpha \beta(A+B)}=x$$

$$x=\frac{2 A B}{A+B}$$

$$x=\frac{2}{\frac{A+B}{AB}}$$

$$x=\frac{2}{\frac{B}{AB}+\frac{A}{AB}}$$

$$x=\frac{2}{\frac{1}{A}+\frac{1}{B}} \; \; \mathbf{(2)}$$

Pudiendo ser $\alpha$ y $\beta$ cualquier número , aunque suele explicarse con $\alpha=\beta=1$ pero como vemos pueden tomar cualquier valor ya que no influyen.

Destacar que aunque $\alpha$ y $\beta$ pueden tomar cualquier valor destacar que $\beta$ tiene el mismo denominador en ambas fracciones en la que aparece $A$ y $B$ de denominador.

$$\frac{ \alpha}{\frac{\beta}{A}+\frac{\beta}{B}}=K$$

Hay veces que cuando $\alpha=2\beta$ el valor medio además de poder calcularse usando la fórmula $\mathbf{(2)}$ se puede calcular directamente con la fórmula $\mathbf{(1)}$ es decir que $K=x$.

Por lo tanto en esos casos cuando lo que buscamos es el valor de $K$ podemos obtenerlo más fácilmente usando la fórmula $\mathbf{(2)}$ y calcular $x$ ya que nos evitará la dependencia se saber $\alpha$ y $\beta$

La demostración es la siguiente:

$$ \frac{ \alpha}{\frac{\beta}{A}+\frac{\beta}{B}}=K $$

Pero sabemos que podemos substituir $A$ y $B$ por $x$ y debe dar el mismo valor:

$$ \frac{ \alpha}{\frac{\beta}{x}+\frac{\beta}{x}}=K $$

Sabiendo que: $$x=\frac{2}{\frac{1}{A}+\frac{1}{B}}$$

$$ \frac{ \alpha}{\frac{\beta}{\frac{2}{\frac{1}{A}+\frac{1}{B}}}+\frac{\beta}{\frac{2}{\frac{1}{A}+\frac{1}{B}}}}=K $$

$$ \frac{ \alpha}{\frac{2\beta}{\frac{2}{\frac{1}{A}+\frac{1}{B}}}}=K $$

$$ \frac{ \alpha}{\beta*(\frac{1}{A}+\frac{1}{B})}=K $$

Pero como hemos dicho que $\alpha=2\beta$

$$ \frac{ 2\beta}{\beta*(\frac{1}{A}+\frac{1}{B})}=K $$

$$ \frac{ 2}{(\frac{1}{A}+\frac{1}{B})}=x=K $$

Puede parecemos un poco raro que alguien quiera hacer sumas así, pero se usa al calcula la velocidad media en recorridos de la misma distancia pero a distinta velocidad.

Imaginemos ahora un vehículo que recorre $10 \; km$ a una velocidad de $20 \; km/h$ mientras que recorre otros $10 \; km$ a una velocidad de $30 \; km/h$. ¿Cual es la velocidad media?

Sabemos que:

$$e=vt$$

$$v=\frac{e}{t}$$ $$t=\frac{e}{v}$$

$$ \begin{array} \\ e_1=10 \; km & v_1=20 \; km/h & t_1=\frac{e_1}{v_1}=\frac{10}{20} \\ e_2=10 \; km & v_2=30 \; km/h & t_2=\frac{e_2}{v_2}=\frac{10}{30} \end{array} $$

Pero lo importante es que $e_1=e_2=10 \; km$ por lo tanto lo llamaremos $e=e_1=e_2=10\;km$.

$$ \begin{array} \\ e_{total}=e_1+e_2=2e & t_{total}=t_1+t_2=\frac{e}{v_1}+\frac{e}{v_2} \end{array} $$

$$Velocidad \; media=\frac{e_{total}}{t_{total}}=\frac{2e}{\frac{e}{v_1}+\frac{e}{v_2}}$$

Y podemos ver que esta formula para calcular la velocidad media es la misma que la fórmula $\mathbf{(1)}$ siendo $\alpha=2e$ y $\beta=e$ (pero puesto que $\alpha=2\beta$ sabemos que $K=x$ por lo tanto la velocidad media se puede calcular con la fórmula $\mathbf{(2)}$ ) por lo tanto podemos calcular la velocidad media:

$$Velocidad \; media=\frac{2}{\frac{1}{v_1}+\frac{1}{v_2}}=\frac{2}{\frac{1}{20}+\frac{1}{30}}=\frac{2}{0,05+0,0\overline{3}}=24 \; km/h$$

Es decir que hemos visto como la forma correcta de calcular la velocidad media es usando la media armónica cuyo resultado es $24 \; km/h$ pero destacar que solo funcionará la fórmula de la media armónica si ambas distancias son iguales. En este caso de $e_1=e_2=10 \; km/h$

Destacar también que no tiene sentido preguntarnos si la media armónica da un valor más bajo que la media aritmética o la media geométrica ya que la única media correcta que debemos usar para calcular media de velocidades debe ser la media armónica. Y dicha media no es que sea más baja que la aritmética sino que realmente la media armónica es el valor correcto para la media de dos velocidades.

Conclusión

Por lo tanto, ¿Que media deberíamos usar? Pues dependerá de la operación aritmética que hagamos con nuestros números y cuyo resultado queramos que sea constante.

  • Si queremos que $A^2+B^2=x^2+x^2$ es la media cuadrática
  • Si queremos que $A+B=x+x$ es la media aritmética
  • Si queremos que $A*B=x*x$ es la media geométrica
  • Etc.

Y se suele incidir en que la media geométrica tiene una valor menor que la aritmética. Realmente eso no es importante ya que la media geométrica tiene exactamente el valor que tiene que tener para que se mantenga constante la multiplicación de ambos números. Y lo mismo pasa con la armónica que tiene un valor más pequeño aun pero es exactamente el que tiene que tener.

Vamos a ver ahora otro ejemplo ficticio con porcentajes en el que se verá que se debe usar la media geométrica para las medias de porcentajes.

Imaginemos que una empresa tiene 200€ en el banco. El primer año gana un 30% de lo que tenía en el banco, el segundo año un 20% de lo tiene el año anterior y el tercer año un 50 de lo que tiene el año anterior.

El dinero total que tiene es:

$$((200€ + 30\%)+20\% )+50\%$$

Sabiendo un poco de porcentajes sabemos que eso se calcula de la siguiente forma:

$$200*(1+\frac{30}{100})*(1+\frac{20}{100})*(1+\frac{50}{100}) =468$$

$$200*1,3*1,2*1,5=468$$

¿Cuanto ha ganado de media cada año?

$$200*1,3*1,2*1,5=468$$ $$200*x*x*x=468$$

$$200*1,3*1,2*1,5=200*x*x*x$$

$$x^3=1,3*1,2*1,5$$

$$x=\sqrt[3]{1,3*1,2*1,5}$$

$$x=1,3276$$

Es decir, como media cada año ganó un 32,76% y es exactamente la media geométrica de los 3 datos.

¿Tiene sentido preguntarse por el valor de la media aritmética de los 3 valores? ¿Es importante que dicha media aritmética sea mayor o menor que la media geométrica? Para ambas preguntas la respuesta es No. Porque la media correcta en este caso es la media geométrica y no puede usarse ninguna otra media. Y por tanto la media geométrica es el valor correcto para la media de porcentajes.

Media de ratios

Acabamos de ver que según las operaciones que hacemos con nuestros datos, saldrá de forma natural una media u otra. Ahora veamos como podemos hacer medias de métricas en IA pero para introducirlo usaremos un ejemplo básico.

Imaginemos un estudiantes que durante un primer curso ha aprobado 0,25 exámenes que significa que ha aprobado 5 exámenes de 20 que ha hecho. Y en segundo curso ha aprobado 0,2 exámenes que significa que ha aprobado 5 exámenes de 25 que ha hecho. ¿Cual es la media de exámenes que ha aprobado el alumno en los 2 cursos?

$$ Total \; de \; exámenes \; aprobados=exámenes \; aprobados \; en \; el \; primer \; curso+exámenes \; aprobados \; en \; el \; segundo \; curso $$

Pero como sabemos que el número de exámenes aprobados en el primer curso es igual al número de exámenes aprobados en el segundo curso (y es importante que ésto sea así). Creamos una nueva variable llamada $exámenes \; aprobados \; por \; curso$

$$ \begin{array} \\ frecuencia \; exámenes \; aprobados \; primer curso=\frac{exámenes \; aprobados \; por \; curso}{exámenes \; realizados \; en \; el \; primer \; curso}=\frac{5}{20}=0,25 & exámenes \; realizados \; en \; el \; primer \; curso=\frac{exámenes \; aprobados \; por \; curso}{frecuencia \; exámenes \; aprobados \; primer \; curso}=\frac{5}{0,25}=20 \\ frecuencia \; exámenes \; aprobados \; segundo curso=\frac{exámenes \; aprobados \; por \; curso}{exámenes \; realizados \; en \; el \; segundo \; curso}=\frac{5}{25}=0,2 & exámenes \; realizados \; en \; el \; segundo \; curso=\frac{exámenes \; aprobados \; por \; curso}{frecuencia \; exámenes \; aprobados \; segundo \; curso}=\frac{5}{0,2}=25 \end{array} $$

$$ Total \; de \; exámenes \; aprobados=exámenes \; aprobados \; en \; el \; primer \; curso+exámenes \; aprobados \; en \; el \; segundo \; curso= \\ exámenes \; aprobados \; por \; curso+exámenes \; aprobados \; por \; curso=2*exámenes \; aprobados \; por \; curso $$

$$ Total \; de \; exámenes \; realizados=exámenes \; realizados \; en \; el \; primer \; curso+exámenes \; realizados \; en \; el \; segundo \; curso= \\ \frac{exámenes \; aprobados \; por \; curso}{frecuencia \; exámenes \; aprobados \; primer \; curso}+\frac{exámenes \; aprobados \; por \; curso}{frecuencia \; exámenes \; aprobados \; segundo \; curso} $$

La frecuencia de exámenes aprobados entre los 2 cursos es:

$$ frecuencia \; de \; exámenes \; aprobados \; entre \; los \; 2 \; cursos=\frac{Total \; de \; exámenes \; aprobados}{Total \; de \; exámenes \; realizados}=\frac{2*exámenes \; aprobados \; por \; curso}{\frac{exámenes \; aprobados \; por \; curso}{frecuencia \; exámenes \; aprobados \; primer \; curso}+\frac{exámenes \; aprobados \; por \; curso}{frecuencia \; exámenes \; aprobados \; segundo \; curso}} $$

Si nos fijamos vuelve a ser la misma que la fórmula $\mathbf{(1)}$ siendo $\alpha=2*exámenes \; aprobados \; por \; curso$ y $\beta=exámenes \; aprobados \; por \; curso$ , pero puesto que $\alpha=2\beta$ sabemos que $K=x$ por lo tanto se puede calcular con la fórmula $\mathbf{(2)}$ que corresponde a la media armónica y solo depende de la frecuencia de exámenes aprobados en cada curso y ya no del número de exámenes aprobados por curso.

$$ frecuencia \; de \; exámenes \; aprobados \; entre \; los \; 2 \; cursos=\frac{2}{\frac{1}{frecuencia \; exámenes \; aprobados \; primer \; curso}+\frac{1}{frecuencia \; exámenes \; aprobados \; segundo \; curso}}=\frac{2}{\frac{1}{0,25}+\frac{1}{0,20}}=0,222 $$

Es decir para sacar la media de 2 ratios (metricas de IA) se usa la media armónica siempre y cuando esos 2 ratios se hayan calculando usando el mismo numerador y $\alpha=2\beta$

f1-score

Y por eso en el f1-score se usa la media armónica , ya que se saca la media de los 2 ratios (sensibilidad y precisión) y ambos tienen el mismo numerador cuando se calculan que es $TP$.

$$ Sensibilidad=\frac{TP}{TP+FN} $$

$$ Precisión=\frac{TP}{TP+FP} $$

$$ Media \; entre \; Sensibilidad \; y \; Precision=\frac{TP+TP}{(TP+FN) + (TP+FP)}=\frac{2TP}{\frac{TP}{Sensibilidad} + \frac{TP}{Precisión}}=f1-score $$

Si nos fijamos vuelve a ser la misma que la fórmula $\mathbf{(1)}$ siendo $\alpha=2TP$ y $\beta=TP$ y como $\alpha=2\beta$ sabemos que se puede calcular también usando la fórmula $\mathbf{(2)}$ sin que dependa de $TP$ sino únicamente de la Sensibilidad y la precisión.

$$ f1-score=\frac{2}{\frac{1}{Sensibilidad} + \frac{1}{Precisión}} $$

Es decir, el objetivo de toda esta página era demostrar que la media entre la sensibilidad y precisión (f1-score) obligatoriamente se tiene que calcular usando la media armónica.

Por lo tanto el motivo de usar la media armónica NO ES que la media armónica da más peso a los valores más pequeños de las dos métricas, penalizando los desequilibrios entre Sensibilidad y Precisión sino que simplemente es porque la media armónica calcula exactamente el valor correcto de la media entre la Sensibilidad y Precisión.

Es decir que dar más peso a los valores más pequeños de las dos métricas es una consecuencia de la necesidad de usar la media armónica y no un objetivo.

En el caso de métricas que queremos calcular la media siempre se dará que $\alpha=2\beta$

Si tenemos 2 métricas $M_1$ y $M_2$ que obligatoriamente ambas tienen el mismo numerador:

$$ \begin{array} \\ M_1=\frac{N}{D_1}&D_1=\frac{N}{M_1} \\ M_2=\frac{N}{D_2}&D_2=\frac{N}{M_2} \end{array} $$

$$ Media \; de \; M_1 \; y \; M_2=\frac{N+N}{D_1+D_2}=\frac{2N}{\frac{N}{M_1}+\frac{N}{M_2}} $$

Por lo tanto $\alpha=2N$ y $\beta=N$ y se cumple siempre que $\alpha=2\beta$

clase/iabd/pia/matematicas/medias.txt · Última modificación: 2024/09/28 04:11 por admin