Muestra las diferencias entre dos versiones de la página.
Ambos lados, revisión anterior Revisión previa Próxima revisión | Revisión previa Próxima revisión Ambos lados, revisión siguiente | ||
clase:iabd:pia:1eval:tema06-apendices [2022/02/27 19:25] admin [Tipos de funciones de activación en capas ocultas] |
clase:iabd:pia:1eval:tema06-apendices [2022/03/30 08:53] admin [Tipos de funciones de activación en capas ocultas] |
||
---|---|---|---|
Línea 134: | Línea 134: | ||
===== Tipos de funciones de activación en capas ocultas ===== | ===== Tipos de funciones de activación en capas ocultas ===== | ||
+ | |||
+ | ==== sigmoid ==== | ||
+ | La fórmula de la sigmoide se obtiene a partir de la función $logit$ o $log odds$. | ||
+ | |||
+ | $$odds(p) = \frac{p}{1-p} $$ | ||
+ | $$logit(p) = log(odds(p))=log(\frac{p}{1-p}) $$ | ||
+ | |||
+ | Ahora: | ||
+ | |||
+ | $$logit(p) = ax+b $$ | ||
+ | $$log(\frac{p}{1-p}) = ax+b $$ | ||
+ | |||
+ | Si despejamos $p$ de la anterior fórmula: | ||
+ | |||
+ | $$ | ||
+ | log(\frac{p}{1-p}) = ax+b \\ | ||
+ | e^{log(\frac{p}{1-p})} = e^{ax+b} \\ | ||
+ | \frac{p}{1-p}=e^{ax+b} \\ | ||
+ | p=e^{ax+b}*(1-p) \\ | ||
+ | p=e^{ax+b}-pe^{ax+b} \\ | ||
+ | p+pe^{ax+b}=e^{ax+b} \\ | ||
+ | p(1+e^{ax+b})=e^{ax+b} \\ | ||
+ | p=\frac{e^{ax+b}}{1+e^{ax+b}} \\ | ||
+ | |||
+ | |||
+ | p=\frac{ | ||
+ | |||
+ | |||
+ | p=\frac{ | ||
+ | p=\frac{ | ||
+ | $$ | ||
+ | |||
+ | Que es exactamente la función sigmoide | ||
+ | |||
+ | * Más información | ||
+ | * [[https:// | ||
+ | * [[https:// | ||
+ | * [[https:// | ||
==== ReLU y Leaky ReLU ==== | ==== ReLU y Leaky ReLU ==== | ||
Línea 268: | Línea 306: | ||
</ | </ | ||
- | === Tiempos | + | ===== Tiempo de cálculo |
Para cada problema puede que una función sea mejor que otra, es decir que cosiga entrenar en un menor número de épocas. Aun así a veces no puede preocupar el tiempo de CPU/GPU que usa cada función de activación. | Para cada problema puede que una función sea mejor que otra, es decir que cosiga entrenar en un menor número de épocas. Aun así a veces no puede preocupar el tiempo de CPU/GPU que usa cada función de activación. | ||