¡Esta es una revisión vieja del documento!
En esta página vamos a explicar como calcular medias para las métricas de clasificación.
Para ello vamos a empezar preguntándonos: ¿Que es la media? ¿Cual deberíamos usar? ¿Como se calcula?.
Existen muchas medias pero una generalización de ellas es la Media generalizada. Que según un parámetro $p$ puede crear varias medias.
$$ M_p(x_1, \dots ,x_n)=\left\{ \begin{array}{l} \left( \frac{1}{n} \sum_{i=1}^n x_i^p \right)^{\frac{1}{p}} & si & p \neq 0 \\ \left( \prod_{i=1}^n x_i \right)^{\frac{1}{n}} & si & p=0 \end{array} \right. $$
$$ \text{media cuadrática}=\sqrt{\frac{1}{n}\sum_{i=1}^{n}x_i^2} $$
$$ \text{media aritmética}=\frac{1}{n}\sum_{i=1}^{n}x_i $$
$$ \text{media geométrica}=\sqrt[n]{\prod_{i=1}^{n}x_i} $$
$$ \text{media armónica}=\frac{n}{\sum_{i=1}^{n}\frac{1}{x_i}} $$
¿Pero que media deberíamos usar? Se tiende a pensar que la media aritmética es la "oficial" y que las otras son las raras. Para resolver esa pregunta , veremos que es una media y para ello vamos a ver como se deducen distintos tipos de medias.
Y por otro lado está la métrica del f1-score que todo el mundo dice que se usa la media armónica porque se quiere un valor más bajo que la media aritmética porque así también se penalizan valores dispares ya que te tiende hacía el valor más bajo de ambos valores. Y de aquí vino todo, ¿porque no usar cualquier otra media que penalice más que la armónica o menos? ¿Porque se eligió la armónica?
$$ \text{media aritmética}=\frac{1}{n}\sum_{i=1}^{n}x_i $$
Supongamos que tenemos una empresa en la que trabajan 3 comerciales y cada uno de ellos vende cierto importe en productos un mes. Si el importe de lo que vende cada vendedor los llamamos $A$ , $B$ y $C$. El dinero que consigue al empresa ese mes es $A+B+C=K$. ¿Que sería la media? Sería aquel valor $m$ tal que si las dos personas vendieran lo mismo , su suma volvería a dar $K$. Es decir $m+m+m=K$. Ya que queremos que la empresa siga vendiendo el mismo importe.
Por lo tanto, ¿como calculamos la media? $$A+B+C=K$$ $$m+m+m=K$$ $$m+m+m=A+B+C$$ $$3m=A+B+C$$ $$m=\frac{A+B+C}{3}$$
Nos ha salido que $m$ es la media aritmética de $A$, $B$ y $C$.
$$ \text{media geométrica}=\sqrt[n]{\prod_{i=1}^{n}x_i} $$
Supongamos ahora que tenemos un paralelepípedo rectangular cuyos lados tiene de longitud $A$, $B$ y $C$. El volumen de ese paralelepípedos rectangular es $A \cdot B \cdot C=K$. ¿Que sería la media? Sería aquel valor $m$ tal que si todos los lados fueran iguales , su volumen volvería a dar $K$. Es decir $m \cdot m \cdot m=K$.
Por lo tanto, ¿como calculamos la media? $$A \cdot B \cdot C=K$$ $$m \cdot m \cdot m=K$$ $$m \cdot m \cdot m=A \cdot B \cdot C$$ $$m^3=A \cdot B \cdot C$$ $$m=\sqrt[3]{A \cdot B \cdot C}$$
Nos ha salido que $m$ es la media geométrica de $A$, $B$ y $C$.
Si pensamos en 3 lápices cada uno con una longitud, ¿Cual es la longitud media? .
En este caso $K$ sería la suma de las longitudes de los 3 lápices. Así que la media sería la aritmética.
Pero en este caso de los lápices no es intuitivo pensar en como se calcula K. Podríamos pensar en la cantidad de madera que hace falta para fabricar los lápices y en ese caso ya tiene sentido.
Dejo al lector explicar el sentido de usar la media aritmética para calcular la nota media de un alumno en base a la nota de varios exámenes.
$$ \text{media cuadrática}=\sqrt{\frac{1}{n}\sum_{i=1}^{n}x_i^2} $$
Ejemplo 1: En el siguiente ejemplo vamos a calcular la longitud o módulo de un vector en 3 dimensiones.
$$ \overrightarrow{v}=(A,B,C) $$
$$ |\overrightarrow{v}|=\sqrt{A^2+B^2+C^2}=K $$
¿Cual sería el tamaño medio de las 3 componentes del vector para que este nuevo vector tuviera el mismo módulo?
$$ \sqrt{A^2+B^2+C^2}=K $$
$$ \sqrt{m^2+m^2+m^2}=K $$
$$ \sqrt{m^2+m^2+m^2}=\sqrt{A^2+B^2+C^2} $$
$$ m^2+m^2+m^2=A^2+B^2+C^2 $$
$$ 3m^2=A^2+B^2+C^2 $$
$$ m^2=\frac{1}{3} \cdot (A^2+B^2+C^2) $$
$$ m=\sqrt{\frac{1}{3} \cdot (A^2+B^2+C^2)} $$
Por lo que $m$ es la media cuadrática de $A, B, C$
$$ \overrightarrow{v}=(A,B,C) $$
Y ahora se da una curiosidad, para el mismo objeto (el paralelepípedo rectangular) si queremos un nuevo paralelepípedo rectangular que tenga los 3 lados iguales, la media a usar depende que lo que queramos mantener invariante.
Ejemplo 2: Vamos a suponer un ejemplo básico de un gas ideal en el que todas son moléculas son iguales. La energía térmica de ese gas sigue la siguiente fórmula:
$$ \text{Energía Térmica Total}=\frac{1}{2}\sum_{i=1}^{n}m \cdot v_i^2=K $$
Siendo:
¿Cuál sería la velocidad media $v_m$?
Sabemos que si todas las moléculas tuvieran la misma velocidad, la energía térmica total, debe seguir siendo la misma. Por lo tanto:
$$ \text{Energía Térmica Total}=\frac{1}{2}\sum_{i=1}^{n}m \cdot v_i^2=K $$
$$ \text{Energía Térmica Total}=\frac{1}{2}\sum_{i=1}^{n}m \cdot v_m^2=K $$
Igualando las ecuaciones:
$$ \frac{1}{2}\sum_{i=1}^{n}m \cdot v_i^2=\frac{1}{2}\sum_{i=1}^{n}m \cdot v_m^2 $$
Ahora vamos a despejar $v_m$:
$$ \frac{m}{2}\sum_{i=1}^{n}v_i^2=\frac{m}{2}\sum_{i=1}^{n}v_m^2 $$
$$ \sum_{i=1}^{n}v_i^2=\sum_{i=1}^{n}v_m^2 $$
$$ \sum_{i=1}^{n}v_i^2=n \cdot v_m^2 $$
$$ \frac{1}{n}\sum_{i=1}^{n}v_i^2=v_m^2 $$
$$ v_m=\sqrt{\frac{1}{n}\sum_{i=1}^{n}v_i^2} $$
Por lo que $v_m$ es la media cuadrática de $v_1, v_2, \dots , v_n$
$$ \text{media armónica}=\frac{n}{\sum_{i=1}^{n}\frac{1}{x_i}} $$
Un calculo similar lo podemos hacer para la media armónica. Aunque en este caso es un poco menos intuitivo.
Si tenemos $A$ y $B$ y queremos obtener el valor $K$ mediante la formula:
$$\frac{ \alpha}{\frac{\beta}{A}+\frac{\beta}{B}}=K \;\; \mathbf{(1)}$$
¿Que valor de $m$ haría que el valor de $K$ sea el mismo que usando $A$ y $B$?
$$\frac{ \alpha}{\frac{\beta}{m}+\frac{\beta}{m}}=K$$
$$\frac{ \alpha}{\frac{\beta}{A}+\frac{\beta}{B}}=\frac{ \alpha}{\frac{\beta}{m}+\frac{\beta}{m}}$$
$$\frac{ \alpha}{\frac{B\beta+A\beta}{A B}}=\frac{ \alpha}{\frac{2\beta}{m}}$$
$$\frac{\alpha A B}{\beta(A+B)}=\frac{\alpha m}{2\beta}$$
$$\frac{2 \alpha \beta A B}{\alpha \beta(A+B)}=m$$
$$m=\frac{2 A B}{A+B}$$
$$m=\frac{2}{\frac{A+B}{AB}}$$
$$m=\frac{2}{\frac{B}{AB}+\frac{A}{AB}}$$
$$m=\frac{2}{\frac{1}{A}+\frac{1}{B}} \; \; \mathbf{(2)}$$
La demostración es la siguiente:
$$ K=\frac{ \alpha}{\frac{\beta}{A}+\frac{\beta}{B}}=\frac{ \alpha}{\beta(\frac{1}{A}+\frac{1}{B})} $$
Pero como hemos dicho que $\alpha=2\beta$
$$ \frac{ 2\beta}{\beta(\frac{1}{A}+\frac{1}{B})}=\frac{ 2}{(\frac{1}{A}+\frac{1}{B})}=m=K $$
¿Y que utilidad tiene? Hay veces que realmente lo que queremos es obtener el valor de $K$ pero para calcularlo con la fórmula $\mathbf{(1)}$ necesitamos saber el valor de $\alpha$ y $\beta$. Sin embargo si se cumple que $\alpha=2\beta$ entonces podremos calcula el valor de $K$ simplemente calculado el valor de $m$ usando fórmula $\mathbf{(2)}$ y eso es mejor ya que solo depende de $A$ y $B$.
Ejemplo Velocidades:
Puede parecemos un poco raro que alguien quiera operar con $A$ y $B$ de una forma así, pero se usa al calcula la velocidad media en recorridos de la misma distancia pero a distinta velocidad.
Imaginemos ahora un vehículo que recorre $10 \; km$ a una velocidad de $20 \; km/h$ mientras que recorre otros $10 \; km$ a una velocidad de $30 \; km/h$. ¿Cual es la velocidad media?
Sabemos que:
$$e=v \cdot t$$
$$v=\frac{e}{t}$$ $$t=\frac{e}{v}$$
$$ \begin{array} \\ e_1=10 \; km & v_1=20 \; km/h & t_1=\frac{e_1}{v_1}=\frac{10}{20} \\ e_2=10 \; km & v_2=30 \; km/h & t_2=\frac{e_2}{v_2}=\frac{10}{30} \end{array} $$
Pero lo importante es que $e_1=e_2=10 \; km$ por lo tanto lo llamaremos $e=e_1=e_2=10\;km$.
$$ \begin{array} \\ e_{total}=e_1+e_2=2e & t_{total}=t_1+t_2=\frac{e}{v_1}+\frac{e}{v_2} \end{array} $$
$$Velocidad \; media=\frac{e_{total}}{t_{total}}=\frac{2e}{\frac{e}{v_1}+\frac{e}{v_2}}$$
Y podemos ver que esta formula para calcular la velocidad media es la misma que la fórmula $\mathbf{(1)}$ siendo $\alpha=2e$ y $\beta=e$ pero puesto que $\alpha=2\beta$ sabemos que $K=m$ y que entonces la velocidad media también se puede calcular con la fórmula $\mathbf{(2)}$. Y la fórmula $\mathbf{(2)}$ tiene la ventaja que solo usamos los valores de las velocidades y no depende de la distancia.
$$Velocidad \; media=\frac{2}{\frac{1}{v_1}+\frac{1}{v_2}}=\frac{2}{\frac{1}{20}+\frac{1}{30}}=\frac{2}{0,05+0,0\overline{3}}=24 \; km/h$$
Es decir que acabamos de ver como la forma correcta de calcular la velocidad media de dos velocidades cuando ambas velocidades recorren el mismo espacio es usando la media armónica. Pero insistir que solo funciona la fórmula de la media armónica si ambas distancias son iguales. En este caso de $e_1=e_2=10 \; km/h$
Supongamos un viaje del punto A al punto B y del punto B al punto C. Es decir que el viaje total es del punto A al punto C.
¿Cual es la velocidad media del punto A al punto C?
Si usamos la media armónica sería:
$$ Velocidad \; media=\frac{2}{\frac{1}{v_{AB}}+\frac{1}{v_{BC}}}=\frac{2}{\frac{1}{10}+\frac{1}{16}}=\frac{2}{0,1+0,0625}=12,308 \: m/s $$
Y calculándolo usando la formula de $e=v \cdot t$
$$ t_{AB}=\frac{e_{AB}}{v_{AB}} $$
$$ t_{BC}=\frac{e_{BC}}{v_{BC}} $$
$$ Velocidad \; media=\frac{e_{AB}+e_{BC}}{t_{AB}+t_{BC}}=\frac{e_{AB}+e_{BC}}{\frac{e_{AB}}{v_{AB}}+\frac{e_{BC}}{v_{BC}}}=\frac{20+64}{\frac{20}{10}+\frac{64}{16}}=14 \: m/s $$
Es decir que dan distintos valores
Ejemplo resistencias eléctricas:
Veamos ahora otro ejemplo de media armónica. En electricidad, las resistencias eléctricas se pueden poner en serie o en paralelo. Y un cálculo que suele hacerse mucho es averiguar la resistencia equivalente (no vamos a deducir aquí la fórmula).
Tenemos dos resistencias eléctricas $R1$ y $R2$, que se pueden substituir por una única resistencia equivalente llamada $Re$. La fórmula para calcular la resistencia equivalente es la siguiente:
$$ Re=\frac{1}{\frac{1}{R1}+\frac{1}{R2}} $$
Ahora la pregunta que nos hacemos es: ¿Que dos resistencias del mismo valor (llamado $R$) podríamos poner para que dieran la misma resistencia equivalente? Es decir:
$$ Re=\frac{1}{\frac{1}{R}+\frac{1}{R}}=K $$
En el valor de $R$ es la media armónica de $R1$ y $R2$ y el valor de $K$ es la resistencia equivalente $Re$.
Veamos el mismo ejemplo ahora con números:
$$ R1=10 \; \Omega \\ R2=20 \; \Omega $$
La resistencia equivalente $Re$ es:
$$ Re=K=\frac{1}{\frac{1}{R1}+\frac{1}{R2}}=\frac{1}{\frac{1}{10}+\frac{1}{20}}=6,667 \; \Omega $$
Pero nosotros no queremos saber el valor de la resistencia equivalente $Re$ o $K$ sino que dos resistencias en paralelo que tengan el mismo valor $R$ darán la misma resistencia equivalente.
$$ Re=K=\frac{1}{\frac{1}{R1}+\frac{1}{R2}}=\frac{1}{\frac{1}{R}+\frac{1}{R}} $$
El valor de R se calcula usando la media armónica:
$$ R=\frac{2}{\frac{1}{R1}+\frac{1}{R2}}=\frac{2}{\frac{1}{10}+\frac{1}{20}}=13,34 \; \Omega $$
Y por último vamos a comprobar si poniendo la misma resitencia $R=13,34$ realmente dan la misma resistencia equivalente
$$ Re=\frac{1}{\frac{1}{R}+\frac{1}{R}}=\frac{1}{\frac{1}{13,34}+\frac{1}{13,34}}=6,667 \; \Omega $$
Y si que da el mismo valor, por lo tanto la "media" de dos resistencia en paralelo en la media armónica de las 2 resistencias.
La resistencia equivalente de 2 resistencias puestas en serie es la suma de ambas:
$$ Re=R1+R2=K $$
Por lo tanto la resistencia media sería la media aritmética.
$$ R=\frac{R1+R2}{2} $$
Y por eso no tiene sentido la pregunta ¿cual es la resistencia media de 2 resistencias? Pues depende de si están en serie o en paralelo. Porque se usará la media aritmética o la armónica
Vuelvo a insistir que R y Re no son lo mismo. R=m es la media de las 2 resistencias y Re=K es la resistencia equivalente a las 2 resistencias.
La entropía de la información se calcula con la siguiente fórmula:
$$ H=-{\sum_{i=1}^{n}p_i\ln p_i} $$
Habiendo $n$ estados posibles y cada uno de ellos ocurre con una probabilidad $p_i$.
Si quisiéramos hacernos la pregunta de cual es la probabilidad media de los $n$ eventos, tendríamos que hacer lo siguiente:
$$ H=-{\sum_{i=1}^{n}p_i\ln p_i}=K $$
$$ H=-{\sum_{i=1}^{n}p_m\ln p_m}=-n \cdot p_m \ln p_m=K $$
Igualando ambas expresiones se obtiene que:
$$ -{\sum_{i=1}^{n}p_i\ln p_i}=-n \cdot p_m \ln p_m $$
$$ \frac{{\sum_{i=1}^{n}p_i\ln p_i}}{n}=p_m \ln p_m $$
$$ a=x \ln x $$
La solución de esta ecuación no se puede expresar de forma algebraica sino usando la función de Lambert que se expresa como $W$
Siendo entonces el valor de $x$ el siguiente:
$$ x=e^{W(a)} $$
Y por lo tanto en nuestro caso es:
$$ p_m=e^{\LARGE {W(\frac{{\sum_{i=1}^{n}p_i\ln p_i}}{n})}} $$
Por lo tanto hemos obtenido una nueva función de Media para el caso de la entropía que no es ninguna de las anteriores ni coincide con la media generalizada.
Para este caso tan "extraño" vamos a definir 2 conceptos que usaremos en el apartado siguiente:
$$ p_m=e^{\LARGE {W(\frac{{\sum_{i=1}^{n}p_i\ln p_i}}{n})}} $$
$$ H=-{\sum_{i=1}^{n}p_i\ln p_i} $$
Entonces, al final que ¿era media?. Pues es una función matemática (que vamos a llamar función de Media) pero que tiene que cumplir unas condiciones y es una función matemática que lo es respecto a otra (Función medidora). Así que vamos a definir formalmente que es una Función de Media y una Función Medidora
La función $ f: \mathbb{A}^n \to \mathbb{B} $, es una función invariante bajo permutaciones.
Si
para toda permutación $ \pi $ del conjunto de índices $ \{1, 2, \dots, n\} $ se cumple que
$$ f(a_1, a_2, \dots, a_n) = f(a_{\pi(1)}, a_{\pi(2)}, \dots, a_{\pi(n)}) \quad \forall (a_1, a_2, \dots, a_n) \in \mathbb{A}^n $$
La función invariante bajo permutaciones $f: \mathbb{A}^n \to \mathbb{B}$, es una función medidora si
$$ \forall (a_1, a_2, \dots, a_n) \in \mathbb{A}^n \quad \exists \: m \in \mathbb{A} $$
tal que
$$ f(a_1, a_2, \dots, a_n) = K \quad K \in \mathbb{B} $$
$$ f(m, m, \dots, m) = K \quad K \in \mathbb{B} $$
Siendo:
$$ m \in \mathbb{A} \; \text{el valor de la media} $$
$$ K \in \mathbb{B} \; \text{el valor de la medición} $$
La función $g: \mathbb{A}^n \to \mathbb{A}$, es una función idempotente
Si
$$ g(a, a, \dots, a) = a \quad \forall a \in \mathbb{A} $$
La función idempotente $g: \mathbb{A}^n \to \mathbb{A}$ es una Función de Media respecto a una función medidora $f: \mathbb{A}^n \to \mathbb{B}$
Si
$$ g(a_1, a_2, \dots, a_n) = m \quad \forall (a_1, a_2, \dots, a_n) \in \mathbb{A}^n $$
Y podemos decir que $g$ genera o calcula la media de $f$.
Si $K=m$ entonces la función medidora $f$ es idempotente y la función $f$ es una función de Media respecto a la función medidora $f$
Demostración:
$$ f(a_1, a_2, \dots, a_n) = K = m $$
$$ f(m, m, \dots, m) = K = m $$
$$ g(a_1, a_2, \dots, a_n) = m = K $$
Y por lo tanto
$$ f(a_1, a_2, \dots, a_n) = K = m = g(a_1, a_2, \dots, a_n) $$
Y $f$ es idempotente ya que
$$ f(m, m, \dots, m) = m = K $$
En este caso la media $m$ y el valor medido $K$ coinciden
Si la función medidora $f$ es idempotente entonces la función $f$ es una función de Media respecto a la función medidora $f$
Demostración:
Si $f$ es idempotente
$$ f(m, m, \dots, m) = m = K $$
Y por lo tanto
$$ f(a_1, a_2, \dots, a_n) = K = m $$
Al ser $K=m$ queda demostrado por el corolario 1.A.
En este caso la media $m$ y el valor medido $K$ coinciden
$g$ puede ser la Función de Media respecto a infinitas funciones medidoras $f_n$.
Sea
$$ g=\frac{x_1+x_2}{2} $$
$g$ es una Función de Media respeto a $f_n$
siendo
$$ f_n=n \cdot (x_1+x_2) \quad n \in \mathbb{A} $$
$$ \sqrt{\frac{1}{n}\sum_{i=1}^{n}x_i^2} $$
Que era media de la función
$$ \text{Energía Térmica Total}=\frac{1}{2}\sum_{i=1}^{n}m \cdot v_i^2=K $$
pero también lo sería para otras como:
$$ \sum_{i=1}^{n}v_i^2=K $$
Pueden existir infinitas funciones $g_n$ que sean todas ellas funciones de Media respecto a la función Medidora $f$ y por lo tanto haber infinitos $m_n$
Sea
$$ f(x_1,x_2)=cos(x_1+x_2) $$
entonces
$$ g_n(x_1,x_2)=m_n=\left\{ \begin{array}{l} \frac{x_1+x_2}{2} & si & x_1=x_2 & \\ \frac{x_1+x_2}{2}+n \cdot 2\pi & si & x_1 \neq x_2 & \forall n \in \mathbb{Z} \end{array} \right. $$
Puede parecer extraño que haya más de una media pero porque al resolver la siguiente ecuación, hay más de un valor de $m$.
$$ f(a_1, a_2, \dots , a_n)=f(m, m, \dots, m) $$
En el caso del $cos$ es consecuencia de resolver la siguiente ecuación, que tiene infinitas soluciones.
$$ cos(x_1+x_2)=cos(m+m) $$
Otro caso es el siguiente (Media cuadrática):
$$ x_1^2+x_2^2=m^2+m^2 $$
cuya media es la siguiente:
$$ m = \pm \sqrt{\frac{x_1^2 + x_2^2}{2}} $$
que tiene 2 soluciones y una de ellas es negativa.
Normalmente ésto se arregla cambiando el dominio de la función $f$. En nuestros ejemplos sería:
Dado la Función de Media $g$, definimos el conjunto de todas las funciones medidoras $f_n$ tal que $g$ es función de media respecto a $f_n$
$$ \mathcal{F_g}=\{ f | f: \mathbb{A}^n \to \mathbb{B}, f \: \text{es una función medidora} \;\text{y}\; g \: \text{es una función de media respecto a } \: f \} $$
Dado la Función de Medidora $f$, definimos el conjunto de todas las funciones de Medias $g_n$ tal que $g_i$ es función de media respecto a $f$
$$ \mathcal{G_f}=\{ g | g: \mathbb{A}^n \to \mathbb{A}, g \: \text{es una función de media respecto a } \: f \;\text{y}\; f \: \text{es una función medidora} \} $$
El conjunto de funciones $\mathcal{G_f}$ son Funciones de Media respecto al conjunto de funciones medidoras $\mathcal{F_g}$ Si
$$ g_i \: \text{es función de media respecto a} \: f_i \quad \forall g_i \in \mathcal{G_f} , f_i \in \mathcal{F_g} $$
Un ejemplo sería
$$ f_n(x_1,x_2)=cos(n \cdot (x_1+x_2)) $$
$$ g_n(x_1,x_2)==\left\{ \begin{array}{l} \frac{x_1+x_2}{2} & si & x_1=x_2 & \\ \frac{x_1+x_2}{2}+n \cdot 2\pi & si & x_1 \neq x_2 & \forall n \in \mathbb{Z} \end{array} \right. $$
Cualquier $g_n$ es función de Media de cualquier $f_n$ con $n \neq 0$
Vamos ahora a complicar un poco más el problema.
Imaginemos que queremos calcular la temperatura de un gas. Para ello se usa la fórmula:
$$ \langle E_k \rangle=\frac{3}{2}k_bT $$
Siendo:
Si despejamos
$$ T=\frac{2}{3}\frac{\langle E_k \rangle}{k_b} $$
¿Cómo calculamos $E_k$, pues usando la fórmula de la energía cinética:
$$ \langle E_k \rangle=\frac{1}{2}mv_{m}^{2} $$
Siendo:
Ahora lo que tenemos que calcula es $v_{m}$.
Vamos a suponer que las velocidades de cada una de las partículas individuales es:
$$ v_1,v_2, ... , v_n $$
Entonces se tiene que la energía cinética total del gas es:
$$ E_k=\frac{1}{n}\sum_{i=1}^{n}m \cdot v_i^2 $$
Entonces, ¿cuánto vale $v_m$? Pues es simplemente aquel valor que si todas las moléculas tuvieran la misma velocidad, la energía cinética total del gas fuera la misma: $$ E_k=\frac{1}{n}\sum_{i=1}^{n}m \cdot v_m^2 $$
Por lo tanto:
$$ \frac{1}{n}\sum_{i=1}^{n}m \cdot v_i^2=\frac{1}{n}\sum_{i=1}^{n}m \cdot v_m^2 $$
$$ v_m=\sqrt{\frac{1}{n}\sum_{i=1}^{n}v_i^2} $$
Por lo que $v_m$ es la media cuadrática de $v_1, v_2, \dots , v_n$
Pero ahora imaginemos que realmente no tenemos $v_1,v_2, ... , v_n$ (que son todas las velocidades de todas las molécules) sino que solo hemos podido medir unos cuantos valores a los que llamaremos:
$$ v_1,v_2, ... , v_s $$
Siendo $n \gg s$.
Lo que vamos a hacer ahora es un análisis estadístico de nuestros valores.
Mostramos la distribución de las velocidades y se obtiene la siguiente gráfica
Los datos $v_1,v_2, ... , v_s$ siguen una distribución normal y por lo tanto podemos calcular para dicha distribución a partir de los parámetros:
¿Qué significa ahora $\mu$, porque resulta que también es la media de las velocidades. ¿Hay alguna relación entre $\mu$ y $v_m$
Resulta que:
$$ v_m=\sqrt{\mu^2+v_m^2} $$
¿Porqué hay 2 medias de la velocidad?
y ahora supongamos que hay otro gás de $O_2$ a la misma presión y temperatura cuyas velocidades tienen la siguiente distribución:
Mostramos la distribución de las velocidades y se obtiene la siguiente gráfica
Lo datos $v_1,v_2, ... , v_s$ ahora siguen una distribución Beta (desplazada) y por lo tanto podemos calcular para dicha distribución a partir de los parámetros:
Ahora ya no aparece la media (aunque podríamos calcularla)
$ Media \; Beta=\frac{\alpha}{\alpha+\beta} $
Por lo tanto, ¿Que media deberíamos usar? Pues dependerá de la operación aritmética que hagamos con nuestros números y cuyo resultado queramos que sea constante. Siendo $A$ y $B$ los dos números de los que queremos calcular la media y siendo $m$ dicha media.
Y se suele incidir en que la media geométrica tiene una valor menor que la aritmética. Realmente eso no es importante ya que la media geométrica tiene exactamente el valor que tiene que tener para que se mantenga constante la multiplicación de ambos números. Y lo mismo pasa con la armónica que tiene un valor más pequeño aun pero es exactamente el que tiene que tener.
Vamos a ver ahora otro ejemplo ficticio con porcentajes en el que se verá que se debe usar la media geométrica para las medias de porcentajes.
Imaginemos que una empresa tiene 200€ en el banco. El primer año gana un 30% de lo que tenía en el banco, el segundo año un 20% de lo tiene el año anterior y el tercer año un 50 de lo que tiene el año anterior.
El dinero total que tiene es:
$$((200€ + 30\%)+20\% )+50\%$$
Sabiendo un poco de porcentajes sabemos que eso se calcula de la siguiente forma:
$$200*(1+\frac{30}{100})*(1+\frac{20}{100})*(1+\frac{50}{100}) =468$$
$$200*1,3*1,2*1,5=468$$
¿Cuanto ha ganado de media cada año?
$$200*1,3*1,2*1,5=468$$ $$200*m*m*m=468$$
$$200*1,3*1,2*1,5=200*m*m*m$$
$$m^3=1,3*1,2*1,5$$
$$m=\sqrt[3]{1,3*1,2*1,5}$$
$$m=1,3276$$
Es decir, como media cada año ganó un 32,76% y es exactamente la media geométrica de los 3 datos.
¿Tiene sentido preguntarse por el valor de la media aritmética de los 3 valores? ¿Es importante que dicha media aritmética sea mayor o menor que la media geométrica? Para ambas preguntas la respuesta es No. Porque la media correcta en este caso es la media geométrica y no puede usarse ninguna otra media. Y por tanto la media geométrica es el valor correcto para la media de porcentajes.
Por último vamos a ver una gráfica en la que se muestra la distribución de varias de las medias.
import numpy as np import matplotlib.pyplot as plt from scipy.stats import gaussian_kde def medias_generalizadas(x1, x2, p): if p == 0: return np.sqrt(x1 * x2) else: return ((x1**p + x2**p) / 2) ** (1 / p) ps=np.arange(-3,6,1) rangos=np.linspace(0,1,2000) x1, x2 = np.meshgrid(rangos, rangos) x1 = x1.ravel() x2 = x2.ravel() figure=plt.figure(figsize=(6.5,5)) axes = figure.add_subplot() for index,p in enumerate(ps): resultados=medias_generalizadas(x1,x2,p) calc_kde = gaussian_kde(resultados) x=np.linspace(-0.15,1.15,1000) prob_x=calc_kde(x) axes.plot(x,prob_x,lw=1,label=f"p={p}") axes.fill_between(x,prob_x, alpha=0.3) axes.legend()
Como a nosotros lo que nos interesa son medias de métricas y éstas tienen un valor de [0,1], hemos calculado para cada media , todos los valores entre 0 y 1 (x1
) con todos los valores entre 0 y 1 (x2
).
Y con esos datos ( que llamamos en el código resultados
), hemos mostrado la distribución.
Para medias con valores:
En la siguiente figura han graficado las conclusiones y se ve como varían , la $moda$, $P(resultado)<0.5$ y $P(resultado)>0.5$ para cada valor de $p$ de la media generalizada.
Entonces vemos que la única métrica que es simétrica y centrada en 0.5 es la media aritmética ($p=1$). ¿podríamos decir que la media aritmética está en medio de las medias generalizadas? ¿Es la mejor de las medias?¿tiene algo de especial? Todas esas preguntas no se responderlas.