Loading [MathJax]/jax/output/CommonHTML/jax.js

Tabla de Contenidos

9.b Apendices

Regularización

Vamos a suponer la siguiente función de pérdida:

Error=1nni=1(yiyi)2

L1 (Lasso)

Hace que los pesos tiendan a ser cero

Error=1nni=1(yiyi)2+α1mmj=1|wj|1

El uso del valor absoluto hace que cuanto mas pequeño sea el valor de w, menos sea el error.

Sirve para:

L2 (Ridge)

Hace que los pesos tiendan a tener un valor bajo pero no es necesario que sena tan bajos como con L1

Error=1nni=1(yiyi)2+α12mmj=1|wj|2

El uso de elevar al cuadrado hace que para valores entre -1 y 1, se hagan aun mas pequeños los w por lo que no es necesario que sena tan cercanos a cero.

Sirve para:

Podemos ver la difrencia entre la función del valor absoluto (L1) y elevar al cuadrado (L2) aquí: GeoGebra L1 y L2

L1 y L2 (ElasticNet)

Es la unión de L1 y L2.

Parece un nuevo hiperparámetro r que indica si queremos que se de mas importancia a L1 o a L2.

Error=1nni=1(yiyi)2+rα1mmj=1|wj|1+(1r)α12mmj=1|wj|2