Tabla de Contenidos

Mean Absolute Error (MAE)
Mean Squared Error (MSE)
Distancia del coseno
Root Mean Squared Error (RMSE)
Coeficiente de determinación o R²
Coeficiente de determinación ajustado o R²ajustado
Selección de métricas de regresión

8.a Métricas regresión

Son las métricas que se usan en problemas de regresión. Son casi las mismas que usábamos como funciones de coste.

Mean Absolute Error (MAE)
Mean Squared Error (MSE)
Distancia del coseno
Root Mean Squared Error (RMSE)
Coeficiente de determinación o R²

Hay métricas que son exactamente iguales a las funciones de coste como MEA o MSE en los problemas de regresión MAE, MSE. Si ya las usamos como función de coste y queremos usarlas como métricas no es necesario indicarlas como métricas, se puede acceder a ellas de la siguiente forma:

Para mostrar la función de coste en el entrenamiento:

history.history['loss']

Para mostrar la función de coste en la validación:

history.history['val_loss']

Mean Absolute Error (MAE)

Es igual que la función de coste de Mean Absolute Error (MAE), así que no explicaremos nada mas sobre ella excepto como se usa en Keras como métrica

Se define como:

metrics=[tf.keras.metrics.MeanAbsoluteError()]
metrics=["mean_absolute_error"]

metrics=["mae"]

y usarla como

history.history['mean_absolute_error']
history.history['val_mean_absolute_error']

history.history["mae"]
history.history["val_mae"]

Mas información:

MeanAbsoluteError class

Mean Squared Error (MSE)

Es igual que la función de coste de Mean Squared Error (MSE), así que no explicaremos nada mas sobre ella excepto como se usa en Keras como métrica

Se define como:

metrics=[tf.keras.metrics.MeanSquaredError()]
metrics=["mean_squared_error"]

metrics=["mse"]

y usarla como

history.history['mean_squared_error']
history.history['val_mean_squared_error']

history.history["mse"]
history.history["val_mse"]

Mas información:

MeanSquaredError class

Distancia del coseno

Es igual que la función de coste de Distancia del coseno, así que no explicaremos nada mas sobre ella excepto como se usa en Keras como métrica

Se define en Keras como:

metrics=[tf.keras.metrics.CosineSimilarity()]
metrics=["cosine_similarity"]

y se usa como

history.history['cosine_similarity']
history.history['val_cosine_similarity']

Mas información:

CosineSimilarity class

Root Mean Squared Error (RMSE)

La Root Mean Squared Error (RMSE) o Raiz cuadrada del error cuadrático medio se calcula igual que el MSE pero se le aplica la raíz cuadrada.

Por lo tanto su fórmula es

$$RMSE = \sqrt{MSE}= \sqrt{\frac{1}{N} \sum\limits_{i=1}^{N}(y_{i} - \hat{y_{i}})^2}$$

Ahora vamos a explicar algunas cosas de RMSE.

¿Por qué se hace la raíz cuadrada? Pues porque antes habíamos elevado al cuadrado los errores
¿Pero que ventaja tiene esa raíz cuadrada? La raíz cuadrada se hace para que el error esté en las mismas unidades que los datos. Es para que como humanos entendamos mejor el valor. Es decir que nosotros entendemos mejor el resultado de RMSE que el de MSE
¿Por qué no existe la RMSE como función de coste? Por ahorrarnos el trabajo de hacer la raíz cuadrada. Como función de coste nos da igual el valor de MSE que la raíz cuadrada de MSE, la red va a funcionar igual.
¿Por qué no existe RMAE? Por que con MAE no elevábamos nada al cuadrado así que no tiene sentido RMAE
A veces se intenta comprar los resultados de RMSE con MAE ya que ambos están en las mismas unidades.
Por lo que si queremos usar MSE como métrica es mejor usar RMSE y como función de coste es mejor MSE

Se define en Keras como:

metrics=[tf.keras.metrics.RootMeanSquaredError()]

y se usa como

history.history['root_mean_squared_error']
history.history['val_root_mean_squared_error']

Mas información:

RootMeanSquaredError class

Coeficiente de determinación o R²

El coeficiente de determinación o R² se calcula de la siguiente forma:

$$R^{2} = 1- \frac {\sum\limits_{i=1}^{N} (y_{i} - \hat{y_{i}})^2} {\sum\limits_{i=1}^{N} (y_{i} - \bar{y})^2}$$ $$\bar{y}=\frac {1}{N} \sum\limits_{i=1}^{N} y_{i}$$

Siendo:

Ahora vamos a explicar algunas cosas de R²

MAE, MSE y RMSE son mejor cuanto menor es el valor, mientras que R² es mejor cuanto más se acerca a 1.
Un problema de R² es que aumenta su valor cuantas más variables tengamos de entrada (es decir el tamaño del vector de cada muestra) por eso se suele usar la métrica de R² ajustada.

Se define en Keras como:

metrics=[tf.keras.metrics.R2Score()]

y se usa como

history.history['r2_score']

Mas información:

Coeficiente de determinación ajustado o R²ajustado

Como acabamos de comentar el Coeficiente de determinación tiene el problema de que tiende a 1 cuantos más características haya es decir cuantas más columnas tenga la hay. Se suele expresar como que hay una alta dimensionalidad.

Para evitar el problema del cálculo de R² en entornos de alta dimensionalidad (que suele ser lo normal en problemas de IA y Machine Learning) existe una nueva métrica que se llama R² ajustado y se escribe $\bar{R^2}$ o $R^2_{ajustado}$

La fórmula ahora es:

$$ \bar{R^2}=1-(1-R^2)\frac{n-1}{n-p-1} $$

Siendo:

$p$: El número de características x.shape[1]
$n$: El número de muestras s.shape[1]

Para usarlo en keras se usa también tf.keras.metrics.R2Score() pero se le pasa el argumento num_regressors. Siendo num_regressors el número de características, es decir x.shape[1].

metrics=[tf.keras.metrics.R2Score(num_regressors=x.shape[1])]

Si a R2Score() no se le pasa ninguna valor a num_regressors su valor por defecto es 0. Y eso no significa que haya 0 características sino que en ese caso no hay que calcular el valor de $\bar{R^2}$ sino $R^2$

Selección de métricas de regresión

La elección de una métrica u otra se puede ver en MAE, MSE, RMSE, Coefficient of Determination, Adjusted R Squared — Which Metric is Better? y Know The Best Evaluation Metrics for Your Regression Model

RMSE es mejor que MSE ya que está en las mismas unidades que el resultado y no al cuadrado.
MAE vs MSE:
- MAE es mas robusto que MSE ante datos anómalos, es decir que los tiene menos en cuenta
- MSE eleva el error al cuadrado y la regresión al intentar minimizar dicho error , tiende a ir hacia ese dato anómalo. Por lo que MSE tiene más en cuenta los datos anómalos.
- Por contra si los datos "anómalos" realmente no son anómalos sino situaciones "normales" pero poco frecuentes, deberíamos usar MSE.
Mejor usar $R^2$ pero como suele haber mucha características, es mejor usar $\bar{R^2}$
Entre RMSE y $\bar{R^2}$ se debe usar RMSE si estamos comparando distintos modelos con los mismos datos ya que en ese caso no nos afecta que haya alta dimensionalidad.

Recordar que como función de coste es mejor usar MSE que MAE ya que en MAE la derivada es constante.

logongas

Barra lateral

Tabla de Contenidos

8.a Métricas regresión

Mean Absolute Error (MAE)

Mean Squared Error (MSE)

Distancia del coseno

Root Mean Squared Error (RMSE)

Coeficiente de determinación o R²

Coeficiente de determinación ajustado o R²ajustado

Selección de métricas de regresión

logongas

Herramientas de usuario

Herramientas del sitio

Barra lateral

Tabla de Contenidos

8.a Métricas regresión

Mean Absolute Error (MAE)

Mean Squared Error (MSE)

Distancia del coseno

Root Mean Squared Error (RMSE)

Coeficiente de determinación o R²

Coeficiente de determinación ajustado o R²ajustado

Selección de métricas de regresión

Herramientas de la página