En esta página vamos a explicar como calcular medias para las métricas de clasificación.
Para ello vamos a empezar preguntándonos: ¿Que es la media? ¿Cual deberíamos usar?.
Existen muchas medias pero una generalización de ellas en la Media generalizada. Que según un parámetro $m$ puede crear varias medias.
$$ \text{media cuadrática}=\sqrt{\frac{1}{n}\sum_{i=1}^{n}x_i^2} $$
$$ \text{media aritmética}=\frac{1}{n}\sum_{i=1}^{n}x_i $$
$$ \text{media geométrica}=\sqrt[n]{\prod_{i=1}^{n}x_i} $$
$$ \text{media armónica}=\frac{n}{\sum_{i=1}^{n}\frac{1}{x_i}} $$
¿Pero que media deberíamos usar? Se tiende a pensar que la media aritmética es la "oficial" y que las otras son las raras. Para resolver esa pregunta , veremos que es una media y para ello vamos a ver como se deducen distintos tipos de medias.
$$ \text{media aritmética}=\frac{1}{n}\sum_{i=1}^{n}x_i $$
Supongamos que tenemos una familia en la que trabajan 2 personas y cada uno tiene un sueldo mensual. El importe de estos dos sueldos los llamamos $A$ y $B$. El dinero que entra en la casa cada mes por lo tanto es $A+B=K$. ¿Que sería la media? Sería aquel valor $x$ tal que si las dos personas cobraran lo mismo , su suma volvería a dar $K$. Es decir $x+x=K$.
Por lo tanto, ¿como calculamos la media? $$A+B=K$$ $$x+x=K$$ $$x+x=A+B$$ $$2x=A+B$$ $$x=\frac{A+B}{2}$$
Nos ha salido que $x$ es la media aritmética de $A$ y $B$.
$$ \text{media geométrica}=\sqrt[n]{\prod_{i=1}^{n}x_i} $$
Supongamos ahora que tenemos una superficie rectangular cuyos lados tiene de longitud $A$ y $B$. La superficie de ese rectángulo es $A*B=K$. ¿Que sería la media? Sería aquel valor $x$ tal que si los dos lados fueran iguales , su area volvería a dar $K$. Es decir $x*x=K$.
Por lo tanto, ¿como calculamos la media? $$A*B=K$$ $$x*x=K$$ $$x*x=A*B$$ $$x^2=A*B$$ $$x=\sqrt[2]{A*B}$$
Nos ha salido que $x$ es la media geométrica de $A$ y $B$.
Con estos dos ejemplos básicos podemos ver qué la media depende de cómo calculemos $K$.
Si $K$ es el dinero que entra cada mes en casa y se calcula sumando los dos sueldos, el sueldo medio se calcula usando la media aritmética. Pero si $K$ es el área de una superficie y se calcula multiplicando los dos lados, el lado medio se calcula usando la media geométrica.
Es decir, la media a usar depende de cómo calculemos $K$. El problema es que que a veces no somos conscientes de que es $K$ ni de cómo se calcula.
Si pensamos en 3 lápices cada uno con una longitud, ¿Cual es la longitud media? . En este caso $K$ sería la suma de las longitudes de los 3 lápices. Así que la media sería la aritmética.
$$ \text{media cuadrática}=\sqrt{\frac{1}{n}\sum_{i=1}^{n}x_i^2} $$
En el siguiente ejemplo vamos a calcular la longitud o módulo de un vector en 3 dimensiones.
$$ \overrightarrow{v}=(A,B,C) $$
$$ |\overrightarrow{v}|=\sqrt{A^2+B^2+C^2}=K $$
¿Cual sería el tamaño medio de las 3 componentes del vector para que este nuevo vector tuviera el mismo módulo.
$$ \sqrt{A^2+B^2+C^2}=K $$
$$ \sqrt{x^2+x^2+x^2}=K $$
$$ \sqrt{x^2+x^2+x^2}=\sqrt{A^2+B^2+C^2} $$
$$ x^2+x^2+x^2=A^2+B^2+C^2 $$
$$ 3x^2=A^2+B^2+C^2 $$
$$ x^2=\frac{1}{3}*(A^2+B^2+C^2) $$
$$ x=\sqrt{\frac{1}{3}*(A^2+B^2+C^2)} $$
Por lo que $x$ es la media cuadrática de $A, B, C$
Como en casos anteriores, ¿tiene sentido pensar en que la media pudiera ser la aritmética? ¿O hemos hecho la media cuadrática porque la media geométrica da un valor mayor que la aritmética?. Para ambas preguntas la respuesta es NO.
$$ \text{media armónica}=\frac{n}{\sum_{i=1}^{n}\frac{1}{x_i}} $$
Un calculo similar lo podemos hacer para la media armónica. Aunque en este caso es un poco menos intuitivo.
Si tenemos $A$ y $B$ y queremos obtener el valor $K$ mediante la formula:
$$\frac{ \alpha}{\frac{\beta}{A}+\frac{\beta}{B}}=K \;\; \mathbf{(1)}$$
¿Que valor de $x$ haría que el valor de $K$ sea el mismo que usando $A$ y $B$?
$$\frac{ \alpha}{\frac{\beta}{x}+\frac{\beta}{x}}=K$$
$$\frac{ \alpha}{\frac{\beta}{A}+\frac{\beta}{B}}=\frac{ \alpha}{\frac{\beta}{x}+\frac{\beta}{x}}$$
$$\frac{ \alpha}{\frac{B\beta+A\beta}{A B}}=\frac{ \alpha}{\frac{2\beta}{x}}$$
$$\frac{\alpha A B}{\beta(A+B)}=\frac{\alpha x}{2\beta}$$
$$\frac{2 \alpha \beta A B}{\alpha \beta(A+B)}=x$$
$$x=\frac{2 A B}{A+B}$$
$$x=\frac{2}{\frac{A+B}{AB}}$$
$$x=\frac{2}{\frac{B}{AB}+\frac{A}{AB}}$$
$$x=\frac{2}{\frac{1}{A}+\frac{1}{B}} \; \; \mathbf{(2)}$$
La demostración es la siguiente:
$$ K=\frac{ \alpha}{\frac{\beta}{A}+\frac{\beta}{B}}=\frac{ \alpha}{\beta(\frac{1}{A}+\frac{1}{B})} $$
Pero como hemos dicho que $\alpha=2\beta$
$$ \frac{ 2\beta}{\beta(\frac{1}{A}+\frac{1}{B})}=\frac{ 2}{(\frac{1}{A}+\frac{1}{B})}=x=K $$
¿Y que utilidad tiene? Hay veces que realmente lo que queremos es obtener el valor de $K$ pero para calcularlo con la fórmula $\mathbf{(1)}$ necesitamos saber el valor de $\alpha$ y $\beta$. Sin embargo si se cumple que $\alpha=2\beta$ entonces podremos calcula el valor de $K$ simplemente calculado el valor de $x$ usando fórmula $\mathbf{(2)}$ y eso es mejor ya que solo depende de $A$ y $B$.
Puede parecemos un poco raro que alguien quiera operar con $A$ y $B$ de una forma así, pero se usa al calcula la velocidad media en recorridos de la misma distancia pero a distinta velocidad.
Imaginemos ahora un vehículo que recorre $10 \; km$ a una velocidad de $20 \; km/h$ mientras que recorre otros $10 \; km$ a una velocidad de $30 \; km/h$. ¿Cual es la velocidad media?
Sabemos que:
$$e=vt$$
$$v=\frac{e}{t}$$ $$t=\frac{e}{v}$$
$$ \begin{array} \\ e_1=10 \; km & v_1=20 \; km/h & t_1=\frac{e_1}{v_1}=\frac{10}{20} \\ e_2=10 \; km & v_2=30 \; km/h & t_2=\frac{e_2}{v_2}=\frac{10}{30} \end{array} $$
Pero lo importante es que $e_1=e_2=10 \; km$ por lo tanto lo llamaremos $e=e_1=e_2=10\;km$.
$$ \begin{array} \\ e_{total}=e_1+e_2=2e & t_{total}=t_1+t_2=\frac{e}{v_1}+\frac{e}{v_2} \end{array} $$
$$Velocidad \; media=\frac{e_{total}}{t_{total}}=\frac{2e}{\frac{e}{v_1}+\frac{e}{v_2}}$$
Y podemos ver que esta formula para calcular la velocidad media es la misma que la fórmula $\mathbf{(1)}$ siendo $\alpha=2e$ y $\beta=e$ pero puesto que $\alpha=2\beta$ sabemos que $K=x$ y que entonces la velocidad media también se puede calcular con la fórmula $\mathbf{(2)}$. Y la fórmula $\mathbf{(2)}$ tiene la ventaja que solo usamos los valores de las velocidades y no depende de la distancia.
$$Velocidad \; media=\frac{2}{\frac{1}{v_1}+\frac{1}{v_2}}=\frac{2}{\frac{1}{20}+\frac{1}{30}}=\frac{2}{0,05+0,0\overline{3}}=24 \; km/h$$
Es decir que acabamos de ver como la forma correcta de calcular la velocidad media de dos velocidades cuando ambas velocidades recorren el mismo espacio es usando la media armónica. Pero insistir que solo funciona la fórmula de la media armónica si ambas distancias son iguales. En este caso de $e_1=e_2=10 \; km/h$
Destacar también que no tiene sentido preguntarnos si la media armónica da un valor más bajo que la media aritmética o la media geométrica ya que la única media correcta que debemos usar en este caso para calcular media de las velocidades. Y dicha media no es que sea más baja que la aritmética sino que realmente la media armónica es el valor correcto para la media de dos velocidades.
Por lo tanto, ¿Que media deberíamos usar? Pues dependerá de la operación aritmética que hagamos con nuestros números y cuyo resultado queramos que sea constante.
Y se suele incidir en que la media geométrica tiene una valor menor que la aritmética. Realmente eso no es importante ya que la media geométrica tiene exactamente el valor que tiene que tener para que se mantenga constante la multiplicación de ambos números. Y lo mismo pasa con la armónica que tiene un valor más pequeño aun pero es exactamente el que tiene que tener.
Vamos a ver ahora otro ejemplo ficticio con porcentajes en el que se verá que se debe usar la media geométrica para las medias de porcentajes.
Imaginemos que una empresa tiene 200€ en el banco. El primer año gana un 30% de lo que tenía en el banco, el segundo año un 20% de lo tiene el año anterior y el tercer año un 50 de lo que tiene el año anterior.
El dinero total que tiene es:
$$((200€ + 30\%)+20\% )+50\%$$
Sabiendo un poco de porcentajes sabemos que eso se calcula de la siguiente forma:
$$200*(1+\frac{30}{100})*(1+\frac{20}{100})*(1+\frac{50}{100}) =468$$
$$200*1,3*1,2*1,5=468$$
¿Cuanto ha ganado de media cada año?
$$200*1,3*1,2*1,5=468$$ $$200*x*x*x=468$$
$$200*1,3*1,2*1,5=200*x*x*x$$
$$x^3=1,3*1,2*1,5$$
$$x=\sqrt[3]{1,3*1,2*1,5}$$
$$x=1,3276$$
Es decir, como media cada año ganó un 32,76% y es exactamente la media geométrica de los 3 datos.
¿Tiene sentido preguntarse por el valor de la media aritmética de los 3 valores? ¿Es importante que dicha media aritmética sea mayor o menor que la media geométrica? Para ambas preguntas la respuesta es No. Porque la media correcta en este caso es la media geométrica y no puede usarse ninguna otra media. Y por tanto la media geométrica es el valor correcto para la media de porcentajes.