En esta página se van a resolver las preguntas de
Existen muchas medias pero una generalización de ellas es la Media generalizada. Que según un parámetro p puede crear varias medias.
Mp(x1,…,xn)={(1n∑ni=1xpi)1psip≠0(∏ni=1xi)1nsip=0
media cuadrática=√1nn∑i=1x2i
media aritmética=1nn∑i=1xi
media geométrica=n√n∏i=1xi
media armónica=n∑ni=11xi
¿Pero que media deberíamos usar? Se tiende a pensar que la media aritmética es la "oficial" y que las otras son las raras. Para resolver esa pregunta , veremos que es una media y para ello vamos a ver como se deducen distintos tipos de medias.
Y por otro lado está la métrica del f1-score que todo el mundo dice que se usa la media armónica porque se quiere un valor más bajo que la media aritmética porque así también se penalizan valores dispares ya que te tiende hacía el valor más bajo de ambos valores. Y de aquí vino todo, ¿porque no usar cualquier otra media que penalice más que la armónica o menos? ¿Porque se eligió la armónica?
Mas información:
media aritmética=1nn∑i=1xi
Supongamos que tenemos una empresa en la que trabajan 3 comerciales y cada uno de ellos vende cierto importe en productos un mes. Si el importe de lo que vende cada vendedor los llamamos A , B y C. El dinero que consigue al empresa ese mes es A+B+C=K. ¿Que sería la media? Sería aquel valor m tal que si las tres personas vendieran lo mismo , su suma volvería a dar K. Es decir m+m+m=K. Ya que queremos que la empresa siga vendiendo el mismo importe.
Por lo tanto, ¿como calculamos la media? A+B+C=K m+m+m=K m+m+m=A+B+C 3m=A+B+C m=A+B+C3
Nos ha salido que m es la media aritmética de A, B y C.
media geométrica=n√n∏i=1xi
Supongamos ahora que tenemos un paralelepípedo rectangular cuyos lados tiene de longitud A, B y C.
El volumen de ese paralelepípedos rectangular es A⋅B⋅C=K. ¿Que sería la media? Sería aquel valor m tal que si todos los lados fueran iguales , su volumen volvería a dar K. Es decir m⋅m⋅m=K.
Por lo tanto, ¿como calculamos la media? A⋅B⋅C=K m⋅m⋅m=K m⋅m⋅m=A⋅B⋅C m3=A⋅B⋅C m=3√A⋅B⋅C
Nos ha salido que m es la media geométrica de A, B y C.
Si pensamos en 3 lápices cada uno con una longitud, ¿Cual es la longitud media? .
En este caso K sería la suma de las longitudes de los 3 lápices. Así que la media sería la aritmética.
Pero en este caso de los lápices no es intuitivo pensar en como se calcula K. Podríamos pensar en la cantidad de madera que hace falta para fabricar los lápices y en ese caso ya tiene sentido.
Dejo al lector explicar el sentido de usar la media aritmética para calcular la nota media de un alumno en base a la nota de varios exámenes.
media cuadrática=√1nn∑i=1x2i
Ejemplo 1: En el siguiente ejemplo vamos a calcular la longitud o módulo de un vector en 3 dimensiones.
→v=(A,B,C)
|→v|=√A2+B2+C2=K
¿Cual sería el tamaño medio de las 3 componentes del vector para que este nuevo vector tuviera el mismo módulo?
√A2+B2+C2=K
√m2+m2+m2=K
√m2+m2+m2=√A2+B2+C2
m2+m2+m2=A2+B2+C2
3m2=A2+B2+C2
m2=13⋅(A2+B2+C2)
m=√13⋅(A2+B2+C2)
Por lo que m es la media cuadrática de A,B,C
→v=(A,B,C)
Y ahora se da una curiosidad, para el mismo objeto (el paralelepípedo rectangular) si queremos un nuevo paralelepípedo rectangular que tenga los 3 lados iguales, la media a usar depende que lo que queramos mantener invariante.
Ejemplo 2: Vamos a suponer un ejemplo básico de un gas ideal en el que todas son moléculas son iguales. La energía térmica de ese gas sigue la siguiente fórmula:
Energía Térmica Total=12n∑i=1m⋅v2i=K
Siendo:
¿Cuál sería la velocidad media vm?
Sabemos que si todas las moléculas tuvieran la misma velocidad, la energía térmica total, debe seguir siendo la misma. Por lo tanto:
Energía Térmica Total=12n∑i=1m⋅v2i=K
Energía Térmica Total=12n∑i=1m⋅v2m=K
Igualando las ecuaciones:
12n∑i=1m⋅v2i=12n∑i=1m⋅v2m
Ahora vamos a despejar vm:
m2n∑i=1v2i=m2n∑i=1v2m
n∑i=1v2i=n∑i=1v2m
n∑i=1v2i=n⋅v2m
1nn∑i=1v2i=v2m
vm=√1nn∑i=1v2i
Por lo que vm es la media cuadrática de v1,v2,…,vn
media armónica=n∑ni=11xi
Un calculo similar lo podemos hacer para la media armónica. Aunque en este caso es un poco menos intuitivo.
Si tenemos A y B y queremos obtener el valor K mediante la formula:
αβA+βB=K(1)
¿Que valor de m haría que el valor de K sea el mismo que usando A y B?
αβm+βm=K
αβA+βB=αβm+βm
αBβ+AβAB=α2βm
αABβ(A+B)=αm2β
2αβABαβ(A+B)=m
m=2ABA+B
m=2A+BAB
m=2BAB+AAB
m=21A+1B(2)
La demostración es la siguiente:
K=αβA+βB=αβ(1A+1B)
Pero como hemos dicho que α=2β
2ββ(1A+1B)=2(1A+1B)=m=K
¿Y que utilidad tiene? Hay veces que realmente lo que queremos es obtener el valor de K pero para calcularlo con la fórmula (1) necesitamos saber el valor de α y β. Sin embargo si se cumple que α=2β entonces podremos calcula el valor de K simplemente calculado el valor de m usando fórmula (2) y eso es mejor ya que solo depende de A y B.
Ejemplo Velocidades:
Puede parecemos un poco raro que alguien quiera operar con A y B de una forma así, pero se usa al calcula la velocidad media en recorridos de la misma distancia pero a distinta velocidad.
Imaginemos ahora un vehículo que recorre 10km a una velocidad de 20km/h mientras que recorre otros 10km a una velocidad de 30km/h. ¿Cual es la velocidad media?
Sabemos que:
e=v⋅t
v=et t=ev
e1=10kmv1=20km/ht1=e1v1=1020e2=10kmv2=30km/ht2=e2v2=1030
Pero lo importante es que e1=e2=10km por lo tanto lo llamaremos e=e1=e2=10km.
etotal=e1+e2=2ettotal=t1+t2=ev1+ev2
Velocidadmedia=etotalttotal=2eev1+ev2
Y podemos ver que esta formula para calcular la velocidad media es la misma que la fórmula (1) siendo α=2e y β=e pero puesto que α=2β sabemos que K=m y que entonces la velocidad media también se puede calcular con la fórmula (2). Y la fórmula (2) tiene la ventaja que solo usamos los valores de las velocidades y no depende de la distancia.
Velocidadmedia=21v1+1v2=2120+130=20,05+0,0¯3=24km/h
Es decir que acabamos de ver como la forma correcta de calcular la velocidad media de dos velocidades cuando ambas velocidades recorren el mismo espacio es usando la media armónica. Pero insistir que solo funciona la fórmula de la media armónica si ambas distancias son iguales. En este caso de e1=e2=10km/h
Supongamos un viaje del punto A al punto B y del punto B al punto C. Es decir que el viaje total es del punto A al punto C.
¿Cual es la velocidad media del punto A al punto C?
Si usamos la media armónica sería:
Velocidadmedia=21vAB+1vBC=2110+116=20,1+0,0625=12,308m/s
Y calculándolo usando la formula de e=v⋅t
tAB=eABvAB
tBC=eBCvBC
Velocidadmedia=eAB+eBCtAB+tBC=eAB+eBCeABvAB+eBCvBC=20+642010+6416=14m/s
Es decir que dan distintos valores
Ejemplo resistencias eléctricas:
Veamos ahora otro ejemplo de media armónica. En electricidad, las resistencias eléctricas se pueden poner en serie o en paralelo. Y un cálculo que suele hacerse mucho es averiguar la resistencia equivalente (no vamos a deducir aquí la fórmula).
Tenemos dos resistencias eléctricas R1 y R2, que se pueden substituir por una única resistencia equivalente llamada Re. La fórmula para calcular la resistencia equivalente es la siguiente:
Re=11R1+1R2
Ahora la pregunta que nos hacemos es: ¿Que dos resistencias del mismo valor (llamado R) podríamos poner para que dieran la misma resistencia equivalente? Es decir:
Re=11R+1R=K
En el valor de R es la media armónica de R1 y R2 y el valor de K es la resistencia equivalente Re.
Veamos el mismo ejemplo ahora con números:
R1=10ΩR2=20Ω
La resistencia equivalente Re es:
Re=K=11R1+1R2=1110+120=6,667Ω
Pero nosotros no queremos saber el valor de la resistencia equivalente Re o K sino que dos resistencias en paralelo que tengan el mismo valor R darán la misma resistencia equivalente.
Re=K=11R1+1R2=11R+1R
El valor de R se calcula usando la media armónica:
R=21R1+1R2=2110+120=13,34Ω
Y por último vamos a comprobar si poniendo la misma resitencia R=13,34 realmente dan la misma resistencia equivalente
Re=11R+1R=1113,34+113,34=6,667Ω
Y si que da el mismo valor, por lo tanto la "media" de dos resistencia en paralelo en la media armónica de las 2 resistencias.
La resistencia equivalente de 2 resistencias puestas en serie es la suma de ambas:
Re=R1+R2=K
Por lo tanto la resistencia media sería la media aritmética.
R=R1+R22
Y por eso no tiene sentido la pregunta ¿cual es la resistencia media de 2 resistencias? Pues depende de si están en serie o en paralelo. Porque se usará la media aritmética o la armónica
Vuelvo a insistir que R y Re no son lo mismo. R=m es la media de las 2 resistencias y Re=K es la resistencia equivalente a las 2 resistencias.
La entropía de la información se calcula con la siguiente fórmula:
H=−n∑i=1pilnpi
Habiendo n estados posibles y cada uno de ellos ocurre con una probabilidad pi.
Si quisiéramos hacernos la pregunta de cual es la probabilidad media de los n eventos, tendríamos que hacer lo siguiente:
H=−n∑i=1pilnpi=K
H=−n∑i=1pmlnpm=−n⋅pmlnpm=K
Igualando ambas expresiones se obtiene que:
−n∑i=1pilnpi=−n⋅pmlnpm
∑ni=1pilnpin=pmlnpm
a=xlnx
La solución de esta ecuación no se puede expresar de forma algebraica sino usando la función de Lambert que se expresa como W
Siendo entonces el valor de x el siguiente:
x=eW(a)
Y por lo tanto en nuestro caso es:
pm=eW(∑ni=1pilnpin)
Por lo tanto hemos obtenido una nueva función de Media para el caso de la entropía que no es ninguna de las anteriores ni coincide con la media generalizada.
Para este caso tan "extraño" vamos a definir 2 conceptos que usaremos en el apartado siguiente:
pm=eW(∑ni=1pilnpin)
H=−n∑i=1pilnpi
Entonces, al final que ¿era media?. Pues es una función matemática (que vamos a llamar función de Media) pero que tiene que cumplir unas condiciones y es una función matemática que lo es respecto a otra (Función medidora). Así que vamos a definir formalmente que es una Función de Media y una Función Medidora
La función f:An→B, es una función invariante bajo permutaciones.
Si
para toda permutación π del conjunto de índices {1,2,…,n} se cumple que
f(a1,a2,…,an)=f(aπ(1),aπ(2),…,aπ(n))∀(a1,a2,…,an)∈An
La función invariante bajo permutaciones f:An→B, es una función medidora si
∀(a1,a2,…,an)∈An∃m∈A
tal que
f(a1,a2,…,an)=KK∈B
f(m,m,…,m)=KK∈B
Siendo:
m∈Ael valor de la media
K∈Bel valor de la medición
La función g:An→A, es una función idempotente
Si
g(a,a,…,a)=a∀a∈A
La función idempotente g:An→A es una Función de Media respecto a una función medidora f:An→B
Si
g(a1,a2,…,an)=m∀(a1,a2,…,an)∈An
Y podemos decir que g genera o calcula la media de f.
Si K=m entonces la función medidora f es idempotente y la función f es una función de Media respecto a la función medidora f
Demostración:
f(a1,a2,…,an)=K=m
f(m,m,…,m)=K=m
g(a1,a2,…,an)=m=K
Y por lo tanto
f(a1,a2,…,an)=K=m=g(a1,a2,…,an)
Y f es idempotente ya que
f(m,m,…,m)=m=K
En este caso la media m y el valor medido K coinciden
Si la función medidora f es idempotente entonces la función f es una función de Media respecto a la función medidora f
Demostración:
Si f es idempotente
f(m,m,…,m)=m=K
Y por lo tanto
f(a1,a2,…,an)=K=m
Al ser K=m queda demostrado por el corolario 1.A.
En este caso la media m y el valor medido K coinciden
g puede ser la Función de Media respecto a infinitas funciones medidoras fn.
Sea
g=x1+x22
g es una Función de Media respeto a fn
siendo
fn=n⋅(x1+x2)n∈A
√1nn∑i=1x2i
Que era media de la función
Energía Térmica Total=12n∑i=1m⋅v2i=K
pero también lo sería para otras como:
n∑i=1v2i=K
Pueden existir infinitas funciones gn que sean todas ellas funciones de Media respecto a la función Medidora f y por lo tanto haber infinitos mn
Sea
f(x1,x2)=cos(x1+x2)
entonces
gn(x1,x2)=mn={x1+x22six1=x2x1+x22+n⋅2πsix1≠x2∀n∈Z
Puede parecer extraño que haya más de una media pero porque al resolver la siguiente ecuación, hay más de un valor de m.
f(a1,a2,…,an)=f(m,m,…,m)
En el caso del cos es consecuencia de resolver la siguiente ecuación, que tiene infinitas soluciones.
cos(x1+x2)=cos(m+m)
Otro caso es el siguiente (Media cuadrática):
x21+x22=m2+m2
cuya media es la siguiente:
m=±√x21+x222
que tiene 2 soluciones y una de ellas es negativa.
Normalmente ésto se arregla cambiando el dominio de la función f. En nuestros ejemplos sería:
Dado la Función de Media g, definimos el conjunto de todas las funciones medidoras fn tal que g es función de media respecto a fn
Fg={f|f:An→B,fes una función medidorayges una función de media respecto a f}
Dado la Función de Medidora f, definimos el conjunto de todas las funciones de Medias gn tal que gi es función de media respecto a f
Gf={g|g:An→A,ges una función de media respecto a fyfes una función medidora}
Siendo la cardinalidad del conjunto Gf, el numero de medias que existen para la función medidora f
El conjunto de funciones Gf son Funciones de Media respecto al conjunto de funciones medidoras Fg Si
gies función de media respecto afi∀gi∈Gf,fi∈Fg
Un ejemplo sería
fn(x1,x2)=cos(n⋅(x1+x2))
gn(x1,x2)=={x1+x22six1=x2x1+x22+n⋅2πsix1≠x2∀n∈Z
Cualquier gn es función de Media de cualquier fn con n≠0
Vamos ahora a complicar un poco más el problema.
Imaginemos que queremos calcular la temperatura de un gas. Para ello se usa la fórmula:
⟨Ek⟩=32kbT
Siendo:
Si despejamos
T=23⟨Ek⟩kb
¿Cómo calculamos Ek, pues usando la fórmula de la energía cinética:
⟨Ek⟩=12mv2m
Siendo:
Ahora lo que tenemos que calcula es vm.
Vamos a suponer que las velocidades de cada una de las partículas individuales es:
v1,v2,...,vn
Entonces se tiene que la energía cinética total del gas es:
Ek=1nn∑i=1m⋅v2i
Entonces, ¿cuánto vale vm? Pues es simplemente aquel valor que si todas las moléculas tuvieran la misma velocidad, la energía cinética total del gas fuera la misma: Ek=1nn∑i=1m⋅v2m
Por lo tanto:
1nn∑i=1m⋅v2i=1nn∑i=1m⋅v2m
vm=√1nn∑i=1v2i
Por lo que vm es la media cuadrática de v1,v2,…,vn
Pero ahora imaginemos que realmente no tenemos v1,v2,...,vn (que son todas las velocidades de todas las molécules) sino que solo hemos podido medir unos cuantos valores a los que llamaremos:
v1,v2,...,vs
Siendo n≫s.
Lo que vamos a hacer ahora es un análisis estadístico de nuestros valores.
Mostramos la distribución de las velocidades y se obtiene la siguiente gráfica
Los datos v1,v2,...,vs siguen una distribución normal y por lo tanto podemos calcular para dicha distribución a partir de los parámetros:
¿Qué significa ahora μ, porque resulta que también es la media de las velocidades. ¿Hay alguna relación entre μ y vm
Resulta que para una distribución normal:
vm=√μ2+σ2
Ahora supongamos que hay otro gás de O2 a la misma presión y temperatura pero con distintas velocidades v′1,v′2,...,v′s
Mostramos la distribución de las velocidades y se obtiene la siguiente gráfica
Lo datos v′1,v′2,...,v′s ahora siguen una distribución Beta (desplazada) y por lo tanto podemos definir dicha distribución Beta a partir de los parámetros α y Beta.
Ahora ya no aparece la media ya que no nos es necesaria para definir a la distribución beta.
Resumiendo , en estos problemas que hemos creado tenemos dos tipos de medias:
Por lo tanto, ¿Que media deberíamos usar? Pues dependerá de la operación aritmética que hagamos con nuestros números y cuyo resultado queramos que sea constante. Siendo A y B los dos números de los que queremos calcular la media y siendo m dicha media.
Y se suele incidir en que la media geométrica tiene una valor menor que la aritmética. Realmente eso no es importante ya que la media geométrica tiene exactamente el valor que tiene que tener para que se mantenga constante la multiplicación de ambos números. Y lo mismo pasa con la armónica que tiene un valor más pequeño aun pero es exactamente el que tiene que tener.
Vamos a ver ahora otro ejemplo ficticio con porcentajes en el que se verá que se debe usar la media geométrica para las medias de porcentajes.
Imaginemos que una empresa tiene 200€ en el banco. El primer año gana un 30% de lo que tenía en el banco, el segundo año un 20% de lo tiene el año anterior y el tercer año un 50 de lo que tiene el año anterior.
El dinero total que tiene es:
((200€+30%)+20%)+50%
Sabiendo un poco de porcentajes sabemos que eso se calcula de la siguiente forma:
200∗(1+30100)∗(1+20100)∗(1+50100)=468
200∗1,3∗1,2∗1,5=468
¿Cuanto ha ganado de media cada año?
200∗1,3∗1,2∗1,5=468 200∗m∗m∗m=468
200∗1,3∗1,2∗1,5=200∗m∗m∗m
m3=1,3∗1,2∗1,5
m=3√1,3∗1,2∗1,5
m=1,3276
Es decir, como media cada año ganó un 32,76% y es "exactamente" la media geométrica de los 3 datos.
¿Tiene sentido preguntarse por el valor de la media aritmética de los 3 valores? ¿Es importante que dicha media aritmética sea mayor o menor que la media geométrica? Para ambas preguntas la respuesta es No. Porque la media correcta en este caso es la media geométrica y no puede usarse ninguna otra media. Y por tanto la media geométrica es el valor correcto para la media de porcentajes.
El problema anterior se puede generalizar expresándolo de la siguiente forma.
Imaginemos que el dinero inicial es d y que cada uno de los porcentajes es x1,x2,…,xn .
Entonces el dinero ganado es:
DineroGanado=d⋅(1+x1100)⋅(1+x2100)…(1+xn100)=d⋅n∏i=11+xi100
Sabiendo que queremos mantener constante la cantidad de dinero ganado resulta que:
DineroGanado=d⋅(1+m100)⋅(1+m100)…(1+m100)=d⋅n∏i=11+m100
Igualando ambas ecuaciones y despejando m
d⋅n∏i=11+m100=d⋅n∏i=11+xi100
n∏i=11+m100=n∏i=11+xi100
(1+m100)n=n∏i=11+xi100
1+m100=n√n∏i=11+xi100
m100=n√n∏i=11+xi100−1
Se obtiene que:
m=100⋅(n√n∏i=11+xi100−1)
Por último vamos a ver una gráfica en la que se muestra la distribución de varias de las medias.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 |
import numpy as np import matplotlib.pyplot as plt from scipy.stats import gaussian_kde def medias_generalizadas(x1, x2, p): if p = = 0 : return np.sqrt(x1 * x2) else : return ((x1 * * p + x2 * * p) / 2 ) * * ( 1 / p) ps = np.arange( - 3 , 6 , 1 ) rangos = np.linspace( 0 , 1 , 2000 ) x1, x2 = np.meshgrid(rangos, rangos) x1 = x1.ravel() x2 = x2.ravel() figure = plt.figure(figsize = ( 6.5 , 5 )) axes = figure.add_subplot() for index,p in enumerate (ps): resultados = medias_generalizadas(x1,x2,p) calc_kde = gaussian_kde(resultados) x = np.linspace( - 0.15 , 1.15 , 1000 ) prob_x = calc_kde(x) axes.plot(x,prob_x,lw = 1 ,label = f "p={p}" ) axes.fill_between(x,prob_x, alpha = 0.3 ) axes.legend() |
Como a nosotros lo que nos interesa son medias de métricas y éstas tienen un valor de [0,1], hemos calculado para cada media , todos los valores entre 0 y 1 (x1
) con todos los valores entre 0 y 1 (x2
).
Y con esos datos ( que llamamos en el código resultados
), hemos mostrado la distribución.
Para medias con valores:
En la siguiente figura han graficado las conclusiones y se ve como varían , la moda, P(resultado)<0.5 y P(resultado)>0.5 para cada valor de p de la media generalizada.
Entonces vemos que la única métrica que es simétrica y centrada en 0.5 es la media aritmética (p=1). ¿podríamos decir que la media aritmética está en medio de las medias generalizadas? ¿Es la mejor de las medias?¿tiene algo de especial? Todas esas preguntas no se responderlas.
Supongamos que tenemos tres valores observados:
x1=2,x2=4,x3=6
Su media aritmética es 4:
ˉx=2+4+63=123=4
Pero ahora vamos a calcular la suma de los cuadrados de las desviaciones con respecto a un punto 𝑐:
S(c)=(c−2)2+(c−4)2+(c−6)2=
=(c2−4c+4)+(c2−8c+16)+(c2−12c+36)=
=3c2−24c+56
Para minimizar esta función, derivamos respecto de 𝑐, igualándolo a cero:
∂S(c)∂c=0
∂S(c)∂c=∂3c2−24c+56∂c=6c−24
∂S(c)∂c=6c−24=0
6c−24=0
c=246=4
Que era la media aritmética