Herramientas de usuario

Herramientas del sitio


clase:iabd:pia:matematicas:medias

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anterior Revisión previa
Próxima revisión
Revisión previa
clase:iabd:pia:matematicas:medias [2025/02/28 22:11]
admin [Función de Media y Función Medidora]
clase:iabd:pia:matematicas:medias [2025/03/10 12:48] (actual)
admin [Qué es la media y cuál usar]
Línea 1: Línea 1:
-====== Medias ====== +====== Qué es la media y cuál usar ====== 
-En esta página vamos explicar como calcular medias para las métricas de clasificación.  +En esta página se van resolver las preguntas de  
- +  * ¿Qué es la media?  
-Para ello vamos a empezar preguntándonos: ¿Que es la media? ¿Cual deberíamos usar? ¿Como se calcula?+  * ¿Cuál deberíamos usar?  
  
 Existen muchas medias pero una generalización de ellas es la [[https://es.wikipedia.org/wiki/Media_generalizada|Media generalizada]]. Que según un parámetro $p$ puede crear varias medias. Existen muchas medias pero una generalización de ellas es la [[https://es.wikipedia.org/wiki/Media_generalizada|Media generalizada]]. Que según un parámetro $p$ puede crear varias medias.
Línea 45: Línea 45:
 Y por otro lado está la métrica del [[clase:iabd:pia:2eval:tema08.metricas_derivadas#f1-score]] que todo el mundo dice que se usa la media armónica porque se quiere un valor más bajo que la media aritmética porque así también se penalizan valores dispares ya que te //tiende// hacía el valor más bajo de ambos valores. Y de aquí vino todo, ¿porque no usar  cualquier otra media que penalice más que la armónica o menos? ¿Porque se eligió la armónica? Y por otro lado está la métrica del [[clase:iabd:pia:2eval:tema08.metricas_derivadas#f1-score]] que todo el mundo dice que se usa la media armónica porque se quiere un valor más bajo que la media aritmética porque así también se penalizan valores dispares ya que te //tiende// hacía el valor más bajo de ambos valores. Y de aquí vino todo, ¿porque no usar  cualquier otra media que penalice más que la armónica o menos? ¿Porque se eligió la armónica?
 </note> </note>
 +
 +Mas información:
 +  * [[https://en.wikipedia.org/wiki/Quasi-arithmetic_mean|media Quasi-arithmetic o  f-media generalizada o generalizada Kolmogorov-Nagumo-de Finetti ]]
 +  * {{ :clase:iabd:pia:matematicas:what_does_the_mean_really_mean.pdf |What Does the “Mean” Really Mean?}}
 +  * [[https://en.wikipedia.org/wiki/Chisini_mean|Chisini mean]]
 +  * {{ :clase:iabd:pia:matematicas:mean_what_do_you_mean.pdf |Mean, What do you Mean?}}
 +
 +
 ===== Media aritmética ===== ===== Media aritmética =====
  
Línea 51: Línea 59:
 $$ $$
  
-Supongamos que tenemos una empresa en la que trabajan 3 comerciales y cada uno de ellos vende cierto importe en productos un mes. Si el importe de lo que vende cada vendedor los llamamos $A$ , $B$ y $C$. El dinero que consigue al empresa ese mes es $A+B+C=K$. ¿Que sería la media? Sería aquel valor $m$ tal que si las dos personas vendieran lo mismo , su suma volvería a dar $K$. Es decir $m+m+m=K$. Ya que queremos que la empresa siga vendiendo el mismo importe.+Supongamos que tenemos una empresa en la que trabajan 3 comerciales y cada uno de ellos vende cierto importe en productos un mes. Si el importe de lo que vende cada vendedor los llamamos $A$ , $B$ y $C$. El dinero que consigue al empresa ese mes es $A+B+C=K$. ¿Que sería la media? Sería aquel valor $m$ tal que si las tres personas vendieran lo mismo , su suma volvería a dar $K$. Es decir $m+m+m=K$. Ya que queremos que la empresa siga vendiendo el mismo importe.
  
 Por lo tanto, ¿como calculamos la media? Por lo tanto, ¿como calculamos la media?
Línea 68: Línea 76:
  
  
-Supongamos ahora que tenemos un [[https://es.wikipedia.org/wiki/Ortoedro|paralelepípedo rectangular]] cuyos lados tiene de longitud $A$, $B$ y $C$. El volumen de ese paralelepípedos rectangular es $A \cdot B \cdot C=K$. ¿Que sería la media? Sería aquel valor $m$ tal que si todos los lados fueran iguales , su volumen volvería a dar $K$. Es decir $m \cdot m \cdot m=K$.+Supongamos ahora que tenemos un [[https://es.wikipedia.org/wiki/Ortoedro|paralelepípedo rectangular]] cuyos lados tiene de longitud $A$, $B$ y $C$. 
 + 
 +{{:clase:iabd:pia:matematicas:parallelepipede.png?400|}} 
 + 
 +El volumen de ese paralelepípedos rectangular es $A \cdot B \cdot C=K$. ¿Que sería la media? Sería aquel valor $m$ tal que si todos los lados fueran iguales , su volumen volvería a dar $K$. Es decir $m \cdot m \cdot m=K$.
  
 Por lo tanto, ¿como calculamos la media? Por lo tanto, ¿como calculamos la media?
Línea 885: Línea 897:
 Lo datos $v'_1,v'_2, ... , v'_s$ ahora siguen una distribución Beta (desplazada) y por lo tanto podemos definir dicha distribución Beta a partir de los parámetros $\alpha$ y $Beta$. Lo datos $v'_1,v'_2, ... , v'_s$ ahora siguen una distribución Beta (desplazada) y por lo tanto podemos definir dicha distribución Beta a partir de los parámetros $\alpha$ y $Beta$.
  
-Ahora ya no aparece la media ya que no nos es necesaria para nuestro problema.+Ahora ya no aparece la media ya que no nos es necesaria para definir a la distribución beta.
  
 Resumiendo , en estos problemas que hemos creado tenemos dos tipos de medias: Resumiendo , en estos problemas que hemos creado tenemos dos tipos de medias:
   * Aquella media exacta que nos es útil en nuestro problema real y cuya función de media lo es respecto a una función medidora. En nuestro ejemplo $v_m$   * Aquella media exacta que nos es útil en nuestro problema real y cuya función de media lo es respecto a una función medidora. En nuestro ejemplo $v_m$
-  * Aquella media que nos ayuda a determinar como es una distribución estadística. En nuestro ejemplo $\mu$.+  * Aquella media que nos ayuda a determinar o especificaar como es una distribución estadística. En nuestro ejemplo $\mu$.
 ===== Conclusión ===== ===== Conclusión =====
 Por lo tanto, ¿Que media deberíamos usar? Pues dependerá de la operación aritmética que hagamos con nuestros números y cuyo resultado queramos que sea constante.  Por lo tanto, ¿Que media deberíamos usar? Pues dependerá de la operación aritmética que hagamos con nuestros números y cuyo resultado queramos que sea constante. 
Línea 932: Línea 944:
 $$m=1,3276$$ $$m=1,3276$$
  
-Es decir, como media cada año ganó un 32,76% y es exactamente la media geométrica de los 3 datos.+Es decir, como media cada año ganó un 32,76% y es "exactamentela media geométrica de los 3 datos.
  
 ¿Tiene sentido preguntarse por el valor de la media aritmética de los 3 valores? ¿Es importante que dicha media aritmética sea mayor o menor que la media geométrica? Para ambas preguntas la respuesta es **No**. Porque la media correcta en este caso es la media geométrica y no puede usarse ninguna otra media. Y por tanto la media geométrica es el valor correcto para la media de porcentajes. ¿Tiene sentido preguntarse por el valor de la media aritmética de los 3 valores? ¿Es importante que dicha media aritmética sea mayor o menor que la media geométrica? Para ambas preguntas la respuesta es **No**. Porque la media correcta en este caso es la media geométrica y no puede usarse ninguna otra media. Y por tanto la media geométrica es el valor correcto para la media de porcentajes.
 +
 +El problema anterior se puede generalizar expresándolo de la siguiente forma.
 +
 +Imaginemos que el dinero inicial es $d$ y que cada uno de los porcentajes es $x_1, x_2, \ldots, x_n$ .
 +
 +Entonces el dinero ganado es:
 +
 +$$
 +Dinero \; Ganado=d \cdot (1+\frac{x_1}{100}) \cdot (1+\frac{x_2}{100})  \ldots  (1+\frac{x_n}{100})=d \cdot \prod_{i=1}^{n} 1+\frac{x_i}{100}
 +$$
 +
 +Sabiendo que queremos mantener constante la cantidad de dinero ganado resulta que:
 +
 +$$
 +Dinero \; Ganado=d \cdot (1+\frac{m}{100}) \cdot (1+\frac{m}{100})  \ldots  (1+\frac{m}{100})=d \cdot \prod_{i=1}^{n} 1+\frac{m}{100}
 +$$
 +
 +
 +Igualando ambas ecuaciones y despejando $m$
 +
 +$$
 +d \cdot \prod_{i=1}^{n} 1+\frac{m}{100}=d \cdot \prod_{i=1}^{n} 1+\frac{x_i}{100}
 +$$
 +
 +$$
 +\prod_{i=1}^{n} 1+\frac{m}{100}=\prod_{i=1}^{n} 1+\frac{x_i}{100}
 +$$
 +
 +$$
 +(1+\frac{m}{100})^n=\prod_{i=1}^{n} 1+\frac{x_i}{100}
 +$$
 +
 +
 +$$
 +1+\frac{m}{100}=\sqrt[n]{\prod_{i=1}^{n} 1+\frac{x_i}{100}}
 +$$
 +
 +$$
 +\frac{m}{100}=\sqrt[n]{\prod_{i=1}^{n} 1+\frac{x_i}{100}}-1
 +$$
 +
 +Se obtiene que:
 +
 +$$
 +m=100 \cdot \left( \sqrt[n]{\prod_{i=1}^{n} 1+\frac{x_i}{100}}-1 \right)
 +$$
 +
 +
  
 ===== Distribución de las medias ===== ===== Distribución de las medias =====
Línea 990: Línea 1050:
 ¿podríamos decir que la media aritmética está //en medio// de las medias generalizadas? ¿Es la mejor de las medias?¿tiene algo de especial? Todas esas preguntas no se responderlas. ¿podríamos decir que la media aritmética está //en medio// de las medias generalizadas? ¿Es la mejor de las medias?¿tiene algo de especial? Todas esas preguntas no se responderlas.
  
 +<note tip>
 +Existe otra característica de la media aritmética. Tambien es el valor que minimiza las desviaciones de los datos. Vamos a poner un ejemplo:
  
 +Supongamos que tenemos tres valores observados:
 +
 +$$
 +x_1 = 2, \quad x_2 = 4, \quad x_3 = 6
 +$$
 +
 +Su media aritmética es $4$:
 +
 +$$
 +\bar{x} = \frac{2 + 4 + 6}{3} = \frac{12}{3} = 4
 +$$
 +
 +Pero ahora vamos a calcular la suma de los cuadrados de las desviaciones con respecto a un punto $𝑐$:
 +
 +$$
 +S(c) = (c - 2)^2 + (c - 4)^2 + (c - 6)^2=
 +$$
 +
 +$$
 += (c^2 - 4c + 4) + (c^2 - 8c + 16) + (c^2 - 12c + 36)=
 +$$
 +
 +$$
 += 3c^2 - 24c + 56
 +$$
 +
 +Para minimizar esta función, derivamos respecto de $𝑐$, igualándolo a cero:
 +
 +$$
 +\frac{\partial S(c)}{\partial c} = 0
 +$$
 +
 +
 +$$
 +\frac{\partial S(c)}{\partial c} =\frac{\partial 3c^2 - 24c + 56}{\partial c}= 6c - 24 
 +$$
 +
 +$$
 +\frac{\partial S(c)}{\partial c} = 6c - 24 = 0
 +$$
 +
 +$$
 +6c - 24 = 0
 +$$
 +
 +$$
 +c=\frac{24}{6}=4
 +$$
 +
 +Que era la media aritmética
 +
 +</note>
  
clase/iabd/pia/matematicas/medias.1740777067.txt.gz · Última modificación: 2025/02/28 22:11 por admin