====== Qué es la media y cuál usar ====== En esta página se van a resolver las preguntas de * ¿Qué es la media? * ¿Cuál deberíamos usar? Existen muchas medias pero una generalización de ellas es la [[https://es.wikipedia.org/wiki/Media_generalizada|Media generalizada]]. Que según un parámetro $p$ puede crear varias medias. $$ M_p(x_1, \dots ,x_n)=\left\{ \begin{array}{l} \left( \frac{1}{n} \sum_{i=1}^n x_i^p \right)^{\frac{1}{p}} & si & p \neq 0 \\ \left( \prod_{i=1}^n x_i \right)^{\frac{1}{n}} & si & p=0 \end{array} \right. $$ * Si $p=2$ es la media cuadrática $$ \text{media cuadrática}=\sqrt{\frac{1}{n}\sum_{i=1}^{n}x_i^2} $$ * Si $p=1$ es la media aritmética $$ \text{media aritmética}=\frac{1}{n}\sum_{i=1}^{n}x_i $$ * Si $p=0$ es la media geométrica $$ \text{media geométrica}=\sqrt[n]{\prod_{i=1}^{n}x_i} $$ * Si $p=-1$ es la media armónica $$ \text{media armónica}=\frac{n}{\sum_{i=1}^{n}\frac{1}{x_i}} $$ ¿Pero que media deberíamos usar? Se tiende a pensar que la media aritmética es la "oficial" y que las otras son las raras. Para resolver esa pregunta , veremos que es una media y para ello vamos a ver como se deducen distintos tipos de medias. Tambien se dice erroneamente que se usa una media u otra en función de si quieres penalizar el valor de la media. Por ejemplo, tuve un profesor que en vez de hacer la media aritmética de las notas , hacía la media geométrica porque quería penalizar si las notas de los exámenes eran muy dispares. Y por otro lado está la métrica del [[clase:iabd:pia:2eval:tema08.metricas_derivadas#f1-score]] que todo el mundo dice que se usa la media armónica porque se quiere un valor más bajo que la media aritmética porque así también se penalizan valores dispares ya que te //tiende// hacía el valor más bajo de ambos valores. Y de aquí vino todo, ¿porque no usar cualquier otra media que penalice más que la armónica o menos? ¿Porque se eligió la armónica? Mas información: * [[https://en.wikipedia.org/wiki/Quasi-arithmetic_mean|media Quasi-arithmetic o f-media generalizada o generalizada Kolmogorov-Nagumo-de Finetti ]] * {{ :clase:iabd:pia:matematicas:what_does_the_mean_really_mean.pdf |What Does the “Mean” Really Mean?}} * [[https://en.wikipedia.org/wiki/Chisini_mean|Chisini mean]] ===== Media aritmética ===== $$ \text{media aritmética}=\frac{1}{n}\sum_{i=1}^{n}x_i $$ Supongamos que tenemos una empresa en la que trabajan 3 comerciales y cada uno de ellos vende cierto importe en productos un mes. Si el importe de lo que vende cada vendedor los llamamos $A$ , $B$ y $C$. El dinero que consigue al empresa ese mes es $A+B+C=K$. ¿Que sería la media? Sería aquel valor $m$ tal que si las tres personas vendieran lo mismo , su suma volvería a dar $K$. Es decir $m+m+m=K$. Ya que queremos que la empresa siga vendiendo el mismo importe. Por lo tanto, ¿como calculamos la media? $$A+B+C=K$$ $$m+m+m=K$$ $$m+m+m=A+B+C$$ $$3m=A+B+C$$ $$m=\frac{A+B+C}{3}$$ Nos ha salido que $m$ es la media aritmética de $A$, $B$ y $C$. ===== Media geométrica ===== $$ \text{media geométrica}=\sqrt[n]{\prod_{i=1}^{n}x_i} $$ Supongamos ahora que tenemos un [[https://es.wikipedia.org/wiki/Ortoedro|paralelepípedo rectangular]] cuyos lados tiene de longitud $A$, $B$ y $C$. {{:clase:iabd:pia:matematicas:parallelepipede.png?400|}} El volumen de ese paralelepípedos rectangular es $A \cdot B \cdot C=K$. ¿Que sería la media? Sería aquel valor $m$ tal que si todos los lados fueran iguales , su volumen volvería a dar $K$. Es decir $m \cdot m \cdot m=K$. Por lo tanto, ¿como calculamos la media? $$A \cdot B \cdot C=K$$ $$m \cdot m \cdot m=K$$ $$m \cdot m \cdot m=A \cdot B \cdot C$$ $$m^3=A \cdot B \cdot C$$ $$m=\sqrt[3]{A \cdot B \cdot C}$$ Nos ha salido que $m$ es la media geométrica de $A$, $B$ y $C$. Con estos dos ejemplos básicos podemos ver qué la media depende de cómo calculemos $K$. Si $K$ es el importe de las ventas de una empresa, se calcula sumando lo que venden los tres vendedores y las ventas medias se calcula usando la media aritmética. Pero si $K$ es el volumen de un paralelepípedo rectangular y se calcula multiplicando los tres lados, el lado medio se calcula usando la media geométrica. Es decir, la media a usar depende de cómo calculemos $K$. El problema es que que a veces no somos conscientes de que es $K$ ni de cómo se calcula. \\ Si pensamos en 3 lápices cada uno con una longitud, ¿Cual es la longitud media? . En este caso $K$ sería la suma de las longitudes de los 3 lápices. Así que la media sería la aritmética. Pero en este caso de los lápices no es intuitivo pensar en como se calcula K. Podríamos pensar en la cantidad de madera que hace falta para fabricar los lápices y en ese caso ya tiene sentido. \\ Dejo al lector explicar el sentido de usar la media aritmética para calcular la nota media de un alumno en base a la nota de varios exámenes. ===== Media cuadrática ===== $$ \text{media cuadrática}=\sqrt{\frac{1}{n}\sum_{i=1}^{n}x_i^2} $$ **Ejemplo 1:** En el siguiente ejemplo vamos a calcular la [[https://es.wikipedia.org/wiki/M%C3%B3dulo_(vector)|longitud o módulo de un vector]] en 3 dimensiones. $$ \overrightarrow{v}=(A,B,C) $$ $$ |\overrightarrow{v}|=\sqrt{A^2+B^2+C^2}=K $$ ¿Cual sería el tamaño medio de las 3 componentes del vector para que este nuevo vector tuviera el mismo módulo? $$ \sqrt{A^2+B^2+C^2}=K $$ $$ \sqrt{m^2+m^2+m^2}=K $$ $$ \sqrt{m^2+m^2+m^2}=\sqrt{A^2+B^2+C^2} $$ $$ m^2+m^2+m^2=A^2+B^2+C^2 $$ $$ 3m^2=A^2+B^2+C^2 $$ $$ m^2=\frac{1}{3} \cdot (A^2+B^2+C^2) $$ $$ m=\sqrt{\frac{1}{3} \cdot (A^2+B^2+C^2)} $$ Por lo que $m$ es la media cuadrática de $A, B, C$ El vector anterior podría usarse para definir el paralelepípedo rectangular anterior. Para ello, tomas el paralelepípedo rectangular con un vértice en el origen $(0,0,0)$ y sus dimensiones a lo largo de los ejes $X$, $Y$, y $Z$ son $A$, $B$ y $C$ respectivamente, el vector que conecta la esquina del origen $(0,0,0)$ con la esquina opuesta del paralelepípedo $(A,B,C)$ es simplemente el vector de la diagonal: $$ \overrightarrow{v}=(A,B,C) $$ Y ahora se da una curiosidad, para el mismo objeto (el paralelepípedo rectangular) si queremos un nuevo paralelepípedo rectangular que tenga los 3 lados iguales, la media a usar depende que lo que queramos mantener invariante. * Si queremos mantener el volumen : Usaremos la media geométrica * Si queremos mantener la distancia entre las esquina opuestas : Usaremos la media cuadrática **Ejemplo 2:** Vamos a suponer un ejemplo básico de un gas ideal en el que todas son moléculas son iguales. La energía térmica de ese gas sigue la siguiente fórmula: $$ \text{Energía Térmica Total}=\frac{1}{2}\sum_{i=1}^{n}m \cdot v_i^2=K $$ Siendo: * $v_i$ la velocidad de cada una de las moléculas. * $m$: La masa de cada molécula. Suponemos que el gas es de un único tipo de molécula ¿Cuál sería la velocidad media $v_m$? Sabemos que si todas las moléculas tuvieran la misma velocidad, la energía térmica total, debe seguir siendo la misma. Por lo tanto: $$ \text{Energía Térmica Total}=\frac{1}{2}\sum_{i=1}^{n}m \cdot v_i^2=K $$ $$ \text{Energía Térmica Total}=\frac{1}{2}\sum_{i=1}^{n}m \cdot v_m^2=K $$ Igualando las ecuaciones: $$ \frac{1}{2}\sum_{i=1}^{n}m \cdot v_i^2=\frac{1}{2}\sum_{i=1}^{n}m \cdot v_m^2 $$ Ahora vamos a despejar $v_m$: $$ \frac{m}{2}\sum_{i=1}^{n}v_i^2=\frac{m}{2}\sum_{i=1}^{n}v_m^2 $$ $$ \sum_{i=1}^{n}v_i^2=\sum_{i=1}^{n}v_m^2 $$ $$ \sum_{i=1}^{n}v_i^2=n \cdot v_m^2 $$ $$ \frac{1}{n}\sum_{i=1}^{n}v_i^2=v_m^2 $$ $$ v_m=\sqrt{\frac{1}{n}\sum_{i=1}^{n}v_i^2} $$ Por lo que $v_m$ es la media cuadrática de $v_1, v_2, \dots , v_n$ En física a la $v_{m}$ se le llama $v_{rms}$, siendo **rms=root mean square** que es como se se llama en inglés a la media cuadrática. Como en casos anteriores, ¿tiene sentido pensar en que la media de las velocidades pudiera ser la aritmética? ¿O hemos hecho la media cuadrática porque la media geométrica da un valor mayor que la aritmética?. Para ambas preguntas la respuesta es NO. ===== Media armónica ===== $$ \text{media armónica}=\frac{n}{\sum_{i=1}^{n}\frac{1}{x_i}} $$ Un calculo similar lo podemos hacer para la media armónica. Aunque en este caso es un poco menos intuitivo. Si tenemos $A$ y $B$ y queremos obtener el valor $K$ mediante la formula: $$\frac{ \alpha}{\frac{\beta}{A}+\frac{\beta}{B}}=K \;\; \mathbf{(1)}$$ ¿Que valor de $m$ haría que el valor de $K$ sea el mismo que usando $A$ y $B$? $\alpha$ y $\beta$ pueden ser número distinto de cero, ya que sus valores no influyen en el valor de $m$ $$\frac{ \alpha}{\frac{\beta}{m}+\frac{\beta}{m}}=K$$ $$\frac{ \alpha}{\frac{\beta}{A}+\frac{\beta}{B}}=\frac{ \alpha}{\frac{\beta}{m}+\frac{\beta}{m}}$$ $$\frac{ \alpha}{\frac{B\beta+A\beta}{A B}}=\frac{ \alpha}{\frac{2\beta}{m}}$$ $$\frac{\alpha A B}{\beta(A+B)}=\frac{\alpha m}{2\beta}$$ $$\frac{2 \alpha \beta A B}{\alpha \beta(A+B)}=m$$ $$m=\frac{2 A B}{A+B}$$ $$m=\frac{2}{\frac{A+B}{AB}}$$ $$m=\frac{2}{\frac{B}{AB}+\frac{A}{AB}}$$ $$m=\frac{2}{\frac{1}{A}+\frac{1}{B}} \; \; \mathbf{(2)}$$ Se da la circunstancia que cuando $\alpha=2\beta$ resulta que $K=m$ es decir que el resultado de la fórmula $\mathbf{(1)}$ es el mismo que el de la fórmula $\mathbf{(2)}$ por lo que realmente las 2 fórmulas son la misma. La demostración es la siguiente: $$ K=\frac{ \alpha}{\frac{\beta}{A}+\frac{\beta}{B}}=\frac{ \alpha}{\beta(\frac{1}{A}+\frac{1}{B})} $$ Pero como hemos dicho que $\alpha=2\beta$ $$ \frac{ 2\beta}{\beta(\frac{1}{A}+\frac{1}{B})}=\frac{ 2}{(\frac{1}{A}+\frac{1}{B})}=m=K $$ ¿Y que utilidad tiene? Hay veces que realmente lo que queremos es obtener el valor de $K$ pero para calcularlo con la fórmula $\mathbf{(1)}$ necesitamos saber el valor de $\alpha$ y $\beta$. Sin embargo si se cumple que $\alpha=2\beta$ entonces podremos calcula el valor de $K$ simplemente calculado el valor de $m$ usando fórmula $\mathbf{(2)}$ y eso es mejor ya que solo depende de $A$ y $B$. **Ejemplo Velocidades:** Puede parecemos un poco raro que alguien quiera operar con $A$ y $B$ de una forma así, pero se usa al calcula la velocidad media en recorridos de la misma distancia pero a distinta velocidad. Imaginemos ahora un vehículo que recorre $10 \; km$ a una velocidad de $20 \; km/h$ mientras que recorre otros $10 \; km$ a una velocidad de $30 \; km/h$. ¿Cual es la velocidad media? Sabemos que: $$e=v \cdot t$$ $$v=\frac{e}{t}$$ $$t=\frac{e}{v}$$ $$ \begin{array} \\ e_1=10 \; km & v_1=20 \; km/h & t_1=\frac{e_1}{v_1}=\frac{10}{20} \\ e_2=10 \; km & v_2=30 \; km/h & t_2=\frac{e_2}{v_2}=\frac{10}{30} \end{array} $$ Pero lo importante es que $e_1=e_2=10 \; km$ por lo tanto lo llamaremos $e=e_1=e_2=10\;km$. $$ \begin{array} \\ e_{total}=e_1+e_2=2e & t_{total}=t_1+t_2=\frac{e}{v_1}+\frac{e}{v_2} \end{array} $$ $$Velocidad \; media=\frac{e_{total}}{t_{total}}=\frac{2e}{\frac{e}{v_1}+\frac{e}{v_2}}$$ Y podemos ver que esta formula para calcular la velocidad media es la misma que la fórmula $\mathbf{(1)}$ siendo $\alpha=2e$ y $\beta=e$ pero puesto que $\alpha=2\beta$ sabemos que $K=m$ y que entonces la velocidad media también se puede calcular con la fórmula $\mathbf{(2)}$. Y la fórmula $\mathbf{(2)}$ tiene la ventaja que solo usamos los valores de las velocidades y no depende de la distancia. $$Velocidad \; media=\frac{2}{\frac{1}{v_1}+\frac{1}{v_2}}=\frac{2}{\frac{1}{20}+\frac{1}{30}}=\frac{2}{0,05+0,0\overline{3}}=24 \; km/h$$ Es decir que acabamos de ver como la forma correcta de calcular la velocidad media de dos velocidades cuando ambas velocidades recorren el mismo espacio es usando la media armónica. Pero insistir que solo funciona la fórmula de la media armónica si ambas distancias son iguales. En este caso de $e_1=e_2=10 \; km/h$ Vamos a comprobar con un contraejemplo que si los espacios no son iguales la media de las velocidades no es la media armónica. Supongamos un viaje del punto A al punto B y del punto B al punto C. Es decir que el viaje total es del punto A al punto C. * Viaje de A a B: * Espacio (Distancia): 20 m * Velocidad: 10 m/s * Viaje del B a C * Espacio (Distancia): 64 m * Velocidad: 16 m/s ¿Cual es la velocidad media del punto A al punto C? Si usamos la media armónica sería: $$ Velocidad \; media=\frac{2}{\frac{1}{v_{AB}}+\frac{1}{v_{BC}}}=\frac{2}{\frac{1}{10}+\frac{1}{16}}=\frac{2}{0,1+0,0625}=12,308 \: m/s $$ Y calculándolo usando la formula de $e=v \cdot t$ $$ t_{AB}=\frac{e_{AB}}{v_{AB}} $$ $$ t_{BC}=\frac{e_{BC}}{v_{BC}} $$ $$ Velocidad \; media=\frac{e_{AB}+e_{BC}}{t_{AB}+t_{BC}}=\frac{e_{AB}+e_{BC}}{\frac{e_{AB}}{v_{AB}}+\frac{e_{BC}}{v_{BC}}}=\frac{20+64}{\frac{20}{10}+\frac{64}{16}}=14 \: m/s $$ Es decir que dan distintos valores **Ejemplo resistencias eléctricas:** Veamos ahora otro ejemplo de media armónica. En electricidad, las resistencias eléctricas se pueden poner en serie o en paralelo. Y un cálculo que suele hacerse mucho es averiguar la resistencia equivalente (no vamos a deducir aquí la fórmula). {{:clase:iabd:pia:matematicas:resistencias.png|}} Tenemos dos resistencias eléctricas $R1$ y $R2$, que se pueden substituir por una única resistencia equivalente llamada $Re$. La fórmula para calcular la resistencia equivalente es la siguiente: $$ Re=\frac{1}{\frac{1}{R1}+\frac{1}{R2}} $$ Ahora la pregunta que nos hacemos es: ¿Que dos resistencias del mismo valor (llamado $R$) podríamos poner para que dieran la misma resistencia equivalente? Es decir: {{:clase:iabd:pia:matematicas:media_resistencias.png|}} $$ Re=\frac{1}{\frac{1}{R}+\frac{1}{R}}=K $$ En el valor de $R$ es la media armónica de $R1$ y $R2$ y el valor de $K$ es la resistencia equivalente $Re$. Veamos el mismo ejemplo ahora con números: $$ R1=10 \; \Omega \\ R2=20 \; \Omega $$ La resistencia equivalente $Re$ es: $$ Re=K=\frac{1}{\frac{1}{R1}+\frac{1}{R2}}=\frac{1}{\frac{1}{10}+\frac{1}{20}}=6,667 \; \Omega $$ Pero nosotros no queremos saber el valor de la resistencia equivalente $Re$ o $K$ sino que dos resistencias en paralelo que tengan el mismo valor $R$ darán la misma resistencia equivalente. $$ Re=K=\frac{1}{\frac{1}{R1}+\frac{1}{R2}}=\frac{1}{\frac{1}{R}+\frac{1}{R}} $$ El valor de R se calcula usando la media armónica: $$ R=\frac{2}{\frac{1}{R1}+\frac{1}{R2}}=\frac{2}{\frac{1}{10}+\frac{1}{20}}=13,34 \; \Omega $$ Y por último vamos a comprobar si poniendo la misma resitencia $R=13,34$ realmente dan la misma resistencia equivalente $$ Re=\frac{1}{\frac{1}{R}+\frac{1}{R}}=\frac{1}{\frac{1}{13,34}+\frac{1}{13,34}}=6,667 \; \Omega $$ Y si que da el mismo valor, por lo tanto la "media" de dos resistencia en paralelo en la media armónica de las 2 resistencias. Notar que si las resistencia fueran en **SERIE** la fórmula sería distinta y se usaría otra media. La resistencia equivalente de 2 resistencias puestas en serie es la suma de ambas: $$ Re=R1+R2=K $$ Por lo tanto la resistencia media sería la media aritmética. $$ R=\frac{R1+R2}{2} $$ Y por eso no tiene sentido la pregunta ¿cual es la resistencia media de 2 resistencias? Pues depende de si están en serie o en paralelo. Porque se usará la media aritmética o la armónica Vuelvo a insistir que **R** y **Re** no son lo mismo. **R=m** es la media de las 2 resistencias y **Re=K** es la resistencia equivalente a las 2 resistencias. ===== La media de la entropía de la información ===== La [[https://es.wikipedia.org/wiki/Entrop%C3%ADa_(informaci%C3%B3n)|entropía de la información]] se calcula con la siguiente fórmula: $$ H=-{\sum_{i=1}^{n}p_i\ln p_i} $$ Habiendo $n$ estados posibles y cada uno de ellos ocurre con una probabilidad $p_i$. Si quisiéramos hacernos la pregunta de cual es la probabilidad media de los $n$ eventos, tendríamos que hacer lo siguiente: $$ H=-{\sum_{i=1}^{n}p_i\ln p_i}=K $$ $$ H=-{\sum_{i=1}^{n}p_m\ln p_m}=-n \cdot p_m \ln p_m=K $$ Igualando ambas expresiones se obtiene que: $$ -{\sum_{i=1}^{n}p_i\ln p_i}=-n \cdot p_m \ln p_m $$ $$ \frac{{\sum_{i=1}^{n}p_i\ln p_i}}{n}=p_m \ln p_m $$ Para resolver la ecuación anterior, la podemos simplificar a resolver una ecuación como ésta: $$ a=x \ln x $$ La solución de esta ecuación no se puede expresar de forma algebraica sino usando la [[https://es.wikipedia.org/wiki/Funci%C3%B3n_W_de_Lambert|función de Lambert]] que se expresa como $W$ Siendo entonces el valor de $x$ el siguiente: $$ x=e^{W(a)} $$ Y por lo tanto en nuestro caso es: $$ p_m=e^{\LARGE {W(\frac{{\sum_{i=1}^{n}p_i\ln p_i}}{n})}} $$ Por lo tanto hemos obtenido una nueva función de Media para el caso de la entropía que no es ninguna de las anteriores ni coincide con la media generalizada. Para este caso tan "extraño" vamos a definir 2 conceptos que usaremos en el apartado siguiente: * La función de Media es: $$ p_m=e^{\LARGE {W(\frac{{\sum_{i=1}^{n}p_i\ln p_i}}{n})}} $$ * La función medidora es: $$ H=-{\sum_{i=1}^{n}p_i\ln p_i} $$ ===== Función de Media y Función Medidora ===== Entonces, al final que ¿era media?. Pues es una función matemática (que vamos a llamar función de Media) pero que tiene que cumplir unas condiciones y es una función matemática que lo es respecto a otra (Función medidora). Así que vamos a definir formalmente que es una **Función de Media** y una **Función Medidora** ==== Definición 1: f es invariante bajo permutaciones ==== La función $ f: \mathbb{A}^n \to \mathbb{B} $, es una función invariante bajo permutaciones. Si para toda permutación $ \pi $ del conjunto de índices $ \{1, 2, \dots, n\} $ se cumple que $$ f(a_1, a_2, \dots, a_n) = f(a_{\pi(1)}, a_{\pi(2)}, \dots, a_{\pi(n)}) \quad \forall (a_1, a_2, \dots, a_n) \in \mathbb{A}^n $$ ==== Definición 2: Función medidora ==== La función invariante bajo permutaciones $f: \mathbb{A}^n \to \mathbb{B}$, es una función medidora si $$ \forall (a_1, a_2, \dots, a_n) \in \mathbb{A}^n \quad \exists \: m \in \mathbb{A} $$ tal que $$ f(a_1, a_2, \dots, a_n) = K \quad K \in \mathbb{B} $$ $$ f(m, m, \dots, m) = K \quad K \in \mathbb{B} $$ Siendo: $$ m \in \mathbb{A} \; \text{el valor de la media} $$ $$ K \in \mathbb{B} \; \text{el valor de la medición} $$ ==== Definición 3: Función idempotente ==== La función $g: \mathbb{A}^n \to \mathbb{A}$, es una función idempotente Si $$ g(a, a, \dots, a) = a \quad \forall a \in \mathbb{A} $$ ==== Definición 4: g es una función de media ==== La función idempotente $g: \mathbb{A}^n \to \mathbb{A}$ es una **Función de Media** respecto a una función medidora $f: \mathbb{A}^n \to \mathbb{B}$ Si $$ g(a_1, a_2, \dots, a_n) = m \quad \forall (a_1, a_2, \dots, a_n) \in \mathbb{A}^n $$ Y podemos decir que $g$ genera o calcula la media de $f$. ==== Corolario 1.A: ==== Si $K=m$ entonces la función medidora $f$ es idempotente y la función $f$ es una función de Media respecto a la función medidora $f$ Demostración: $$ f(a_1, a_2, \dots, a_n) = K = m $$ $$ f(m, m, \dots, m) = K = m $$ $$ g(a_1, a_2, \dots, a_n) = m = K $$ Y por lo tanto $$ f(a_1, a_2, \dots, a_n) = K = m = g(a_1, a_2, \dots, a_n) $$ Y $f$ es idempotente ya que $$ f(m, m, \dots, m) = m = K $$ En este caso la media $m$ y el valor medido $K$ coinciden ==== Corolario 1.B: ==== Si la función medidora $f$ es idempotente entonces la función $f$ es una función de Media respecto a la función medidora $f$ Demostración: Si $f$ es idempotente $$ f(m, m, \dots, m) = m = K $$ Y por lo tanto $$ f(a_1, a_2, \dots, a_n) = K = m $$ Al ser $K=m$ queda demostrado por el corolario 1.A. En este caso la media $m$ y el valor medido $K$ coinciden ==== Corolario 2.A: ==== $g$ puede ser la Función de Media respecto a infinitas funciones medidoras $f_n$. Sea $$ g=\frac{x_1+x_2}{2} $$ $g$ es una Función de Media respeto a $f_n$ \\ siendo $$ f_n=n \cdot (x_1+x_2) \quad n \in \mathbb{A} $$ Un ejemplo de esta propiedad la podemos ver en la media cuadrática $$ \sqrt{\frac{1}{n}\sum_{i=1}^{n}x_i^2} $$ Que era media de la función $$ \text{Energía Térmica Total}=\frac{1}{2}\sum_{i=1}^{n}m \cdot v_i^2=K $$ pero también lo sería para otras como: $$ \sum_{i=1}^{n}v_i^2=K $$ ==== Corolario 2.B: ==== Pueden existir infinitas funciones $g_n$ que sean todas ellas funciones de Media respecto a la función Medidora $f$ y por lo tanto haber infinitos $m_n$ Sea $$ f(x_1,x_2)=cos(x_1+x_2) $$ entonces $$ g_n(x_1,x_2)=m_n=\left\{ \begin{array}{l} \frac{x_1+x_2}{2} & si & x_1=x_2 & \\ \frac{x_1+x_2}{2}+n \cdot 2\pi & si & x_1 \neq x_2 & \forall n \in \mathbb{Z} \end{array} \right. $$ Puede parecer extraño que haya más de una media pero porque al resolver la siguiente ecuación, hay más de un valor de $m$. $$ f(a_1, a_2, \dots , a_n)=f(m, m, \dots, m) $$ En el caso del $cos$ es consecuencia de resolver la siguiente ecuación, que tiene infinitas soluciones. $$ cos(x_1+x_2)=cos(m+m) $$ Otro caso es el siguiente (Media cuadrática): $$ x_1^2+x_2^2=m^2+m^2 $$ cuya media es la siguiente: $$ m = \pm \sqrt{\frac{x_1^2 + x_2^2}{2}} $$ que tiene 2 soluciones y una de ellas es negativa. Normalmente ésto se arregla cambiando el dominio de la función $f$. En nuestros ejemplos sería: * $x_i \in [0,2 \pi[$ * $x_i \in \mathbb{R}^+$ * etc. ==== Definición 5: Conjunto de Funciones medidoras ==== Dado la Función de Media $g$, definimos el conjunto de todas las funciones medidoras $f_n$ tal que $g$ es función de media respecto a $f_n$ $$ \mathcal{F_g}=\{ f | f: \mathbb{A}^n \to \mathbb{B}, f \: \text{es una función medidora} \;\text{y}\; g \: \text{es una función de media respecto a } \: f \} $$ ==== Definición 6: Conjunto de Funciones de Medias ==== Dado la Función de Medidora $f$, definimos el conjunto de todas las funciones de Medias $g_n$ tal que $g_i$ es función de media respecto a $f$ $$ \mathcal{G_f}=\{ g | g: \mathbb{A}^n \to \mathbb{A}, g \: \text{es una función de media respecto a } \: f \;\text{y}\; f \: \text{es una función medidora} \} $$ Siendo la cardinalidad del conjunto $\mathcal{G_f}$, el numero de medias que existen para la función medidora $f$ ==== Definición 7: Conjuntos de Funciones Medias y Medidoras ==== El conjunto de funciones $\mathcal{G_f}$ son **Funciones de Media** respecto al conjunto de funciones medidoras $\mathcal{F_g}$ Si $$ g_i \: \text{es función de media respecto a} \: f_i \quad \forall g_i \in \mathcal{G_f} , f_i \in \mathcal{F_g} $$ Un ejemplo sería $$ f_n(x_1,x_2)=cos(n \cdot (x_1+x_2)) $$ $$ g_n(x_1,x_2)==\left\{ \begin{array}{l} \frac{x_1+x_2}{2} & si & x_1=x_2 & \\ \frac{x_1+x_2}{2}+n \cdot 2\pi & si & x_1 \neq x_2 & \forall n \in \mathbb{Z} \end{array} \right. $$ Cualquier $g_n$ es función de Media de cualquier $f_n$ con $n \neq 0$ ===== Medias y Medias ===== Vamos ahora a complicar un poco más el problema. Imaginemos que queremos calcular la temperatura de un gas. Para ello se usa la fórmula: $$ \langle E_k \rangle=\frac{3}{2}k_bT $$ Siendo: * $T$: La temperatura del gas en $K$ * $\langle E_k \rangle$:La energía cinética promedia en $J$ * $k_b$:La constante de Boltzmann cuyo valor es $1,380649 \times 10^{-23} \: J/K$ Si despejamos $$ T=\frac{2}{3}\frac{\langle E_k \rangle}{k_b} $$ ¿Cómo calculamos $E_k$, pues usando la fórmula de la energía cinética: $$ \langle E_k \rangle=\frac{1}{2}mv_{m}^{2} $$ Siendo: * $v_{m}$: La velocidad media de las partículas, también llamada $v_{rms}$. Nombre éste, que es importante y que luego volveremos a él. Ahora lo que tenemos que calcula es $v_{m}$. Vamos a suponer que las velocidades de cada una de las partículas individuales es: $$ v_1,v_2, ... , v_n $$ Entonces se tiene que la energía cinética total del gas es: $$ E_k=\frac{1}{n}\sum_{i=1}^{n}m \cdot v_i^2 $$ Entonces, ¿cuánto vale $v_m$? Pues es simplemente aquel valor que si todas las moléculas tuvieran la misma velocidad, la energía cinética total del gas fuera la misma: $$ E_k=\frac{1}{n}\sum_{i=1}^{n}m \cdot v_m^2 $$ Por lo tanto: $$ \frac{1}{n}\sum_{i=1}^{n}m \cdot v_i^2=\frac{1}{n}\sum_{i=1}^{n}m \cdot v_m^2 $$ $$ v_m=\sqrt{\frac{1}{n}\sum_{i=1}^{n}v_i^2} $$ Por lo que $v_m$ es la media cuadrática de $v_1, v_2, \dots , v_n$ En inglés media cuadratica se dice //Root mean square// o RMS por eso la $v_m$ se le llama $v_{rms}$ Pero ahora imaginemos que realmente no tenemos $v_1,v_2, ... , v_n$ (que son todas las velocidades de todas las molécules) sino que solo hemos podido medir unos cuantos valores a los que llamaremos: $$ v_1,v_2, ... , v_s $$ Siendo $n \gg s$. Lo que vamos a hacer ahora es un análisis estadístico de nuestros valores. Mostramos la distribución de las velocidades y se obtiene la siguiente gráfica {{:clase:iabd:pia:matematicas:histograma_velocidades-gas.png|}} Los datos $v_1,v_2, ... , v_s$ siguen una distribución normal y por lo tanto podemos calcular para dicha distribución a partir de los parámetros: *$\mu$: La media de las velocidades *$\sigma$: La desviación de las velocidades. ¿Qué significa ahora $\mu$, porque resulta que también es la media de las velocidades. ¿Hay alguna relación entre $\mu$ y $v_m$ * $\mu$: La media aritmética de las velocidades * $v_m$: La media cuadrática de las velocidades Resulta que para una distribución normal: $$ v_m=\sqrt{\mu^2+\sigma^2} $$ Ahora supongamos que hay otro gás de $O_2$ a la misma presión y temperatura pero con distintas velocidades $v'_1,v'_2, ... , v'_s$ Mostramos la distribución de las velocidades y se obtiene la siguiente gráfica {{:clase:iabd:pia:matematicas:histograma_velocidades-gas-beta.png|}} Lo datos $v'_1,v'_2, ... , v'_s$ ahora siguen una distribución Beta (desplazada) y por lo tanto podemos definir dicha distribución Beta a partir de los parámetros $\alpha$ y $Beta$. Ahora ya no aparece la media ya que no nos es necesaria para definir a la distribución beta. Resumiendo , en estos problemas que hemos creado tenemos dos tipos de medias: * Aquella media exacta que nos es útil en nuestro problema real y cuya función de media lo es respecto a una función medidora. En nuestro ejemplo $v_m$ * Aquella media que nos ayuda a determinar o especificaar como es una distribución estadística. En nuestro ejemplo $\mu$. ===== Conclusión ===== Por lo tanto, ¿Que media deberíamos usar? Pues dependerá de la operación aritmética que hagamos con nuestros números y cuyo resultado queramos que sea constante. Siendo $A$ y $B$ los dos números de los que queremos calcular la media y siendo $m$ dicha media. * Si queremos que $A^2+B^2=m^2+m^2$ entonces debemos usar la media cuadrática * Si queremos que $A+B=m+m$ entonces debemos usar la media aritmética * Si queremos que $A*B=m*m$ entonces debemos usar la media geométrica * Etc. Y se suele incidir en que la media geométrica tiene una valor menor que la aritmética. Realmente eso no es importante ya que la media geométrica tiene exactamente el valor que tiene que tener para que se mantenga constante la multiplicación de ambos números. Y lo mismo pasa con la armónica que tiene un valor más pequeño aun pero es exactamente el que tiene que tener. Vamos a ver ahora otro ejemplo ficticio con porcentajes en el que se verá que se debe usar la media geométrica para las medias de porcentajes. Imaginemos que una empresa tiene 200€ en el banco. El primer año gana un 30% de lo que tenía en el banco, el segundo año un 20% de lo tiene el año anterior y el tercer año un 50 de lo que tiene el año anterior. El dinero total que tiene es: $$((200€ + 30\%)+20\% )+50\%$$ Sabiendo un poco de porcentajes sabemos que eso se calcula de la siguiente forma: $$200*(1+\frac{30}{100})*(1+\frac{20}{100})*(1+\frac{50}{100}) =468$$ $$200*1,3*1,2*1,5=468$$ ¿Cuanto ha ganado de media cada año? $$200*1,3*1,2*1,5=468$$ $$200*m*m*m=468$$ $$200*1,3*1,2*1,5=200*m*m*m$$ $$m^3=1,3*1,2*1,5$$ $$m=\sqrt[3]{1,3*1,2*1,5}$$ $$m=1,3276$$ Es decir, como media cada año ganó un 32,76% y es exactamente la media geométrica de los 3 datos. ¿Tiene sentido preguntarse por el valor de la media aritmética de los 3 valores? ¿Es importante que dicha media aritmética sea mayor o menor que la media geométrica? Para ambas preguntas la respuesta es **No**. Porque la media correcta en este caso es la media geométrica y no puede usarse ninguna otra media. Y por tanto la media geométrica es el valor correcto para la media de porcentajes. ===== Distribución de las medias ===== Por último vamos a ver una gráfica en la que se muestra la distribución de varias de las medias. import numpy as np import matplotlib.pyplot as plt from scipy.stats import gaussian_kde def medias_generalizadas(x1, x2, p): if p == 0: return np.sqrt(x1 * x2) else: return ((x1**p + x2**p) / 2) ** (1 / p) ps=np.arange(-3,6,1) rangos=np.linspace(0,1,2000) x1, x2 = np.meshgrid(rangos, rangos) x1 = x1.ravel() x2 = x2.ravel() figure=plt.figure(figsize=(6.5,5)) axes = figure.add_subplot() for index,p in enumerate(ps): resultados=medias_generalizadas(x1,x2,p) calc_kde = gaussian_kde(resultados) x=np.linspace(-0.15,1.15,1000) prob_x=calc_kde(x) axes.plot(x,prob_x,lw=1,label=f"p={p}") axes.fill_between(x,prob_x, alpha=0.3) axes.legend() {{:clase:iabd:pia:matematicas:densidad_medias_generalizadas.png|}} Como a nosotros lo que nos interesa son medias de métricas y éstas tienen un valor de [0,1], hemos calculado para cada media , todos los valores entre 0 y 1 (''x1'') con todos los valores entre 0 y 1 (''x2''). Y con esos datos ( que llamamos en el código ''resultados''), hemos mostrado la distribución. Para medias con valores: * $p<1$ : La moda de esas medias son menores que 0.5. Y la probabilidad de que el resultado sea menor que 0.5 es mayor de que el resultado sea mayor que 0.5 * $p>1$ : La moda de esas medias son mayores que 0.5. Y la probabilidad de que el resultado sea mayor que 0.5 es mayor de que el resultado sea menor que 0.5 * $p=1$ : La moda de esta media (la media aritmética) es justamente 0.5 y la probabilidad de que el resultado sea menor que 0.5 y mayor que 0.5 es la misma ya que es simétrica. En la siguiente figura han graficado las conclusiones y se ve como varían , la $moda$, $P(resultado)<0.5$ y $P(resultado)>0.5$ para cada valor de $p$ de la media generalizada. {{:clase:iabd:pia:matematicas:medias_generalizadas_moda_probabilidad.png|}} Entonces vemos que la única métrica que es **simétrica y centrada en 0.5 es la media aritmética** ($p=1$). ¿podríamos decir que la media aritmética está //en medio// de las medias generalizadas? ¿Es la mejor de las medias?¿tiene algo de especial? Todas esas preguntas no se responderlas. Existe otra característica de la media aritmética. Tambien es el valor que minimiza las desviaciones de los datos. Vamos a poner un ejemplo: Supongamos que tenemos tres valores observados: $$ x_1 = 2, \quad x_2 = 4, \quad x_3 = 6 $$ Su media aritmética es $4$: $$ \bar{x} = \frac{2 + 4 + 6}{3} = \frac{12}{3} = 4 $$ Pero ahora vamos a calcular la suma de los cuadrados de las desviaciones con respecto a un punto $𝑐$: $$ S(c) = (c - 2)^2 + (c - 4)^2 + (c - 6)^2= $$ $$ = (c^2 - 4c + 4) + (c^2 - 8c + 16) + (c^2 - 12c + 36)= $$ $$ = 3c^2 - 24c + 56 $$ Para minimizar esta función, derivamos respecto de $𝑐$, igualandolo a cero: $$ \frac{\partial S(c)}{\partial c} =\frac{\partial 3c^2 - 24c + 56}{\partial c}= 6c - 24 = 0 $$ $$ c=\frac{24}{6}=4 $$ Que era la media aritmética