Muestra las diferencias entre dos versiones de la página.
Ambos lados, revisión anterior Revisión previa Próxima revisión | Revisión previa | ||
clase:iabd:pia:1eval:tema05 [2022/01/26 15:58] admin [Estadística] |
clase:iabd:pia:1eval:tema05 [2022/02/06 21:02] (actual) admin [Ejercicios] |
||
---|---|---|---|
Línea 84: | Línea 84: | ||
</ | </ | ||
- | * Cargar los datos des un fichero de texto llamado " | + | * Cargar los datos desde un fichero de texto llamado " |
<sxh python> | <sxh python> | ||
Línea 90: | Línea 90: | ||
</ | </ | ||
+ | |||
+ | < | ||
+ | Si al guardar los datos **NO** se añadió el parámetro '' | ||
+ | <sxh python> | ||
+ | df.to_csv(" | ||
+ | df=pd.read_csv(" | ||
+ | </ | ||
+ | |||
+ | </ | ||
* Cargar los datos desde una base de datos relacional | * Cargar los datos desde una base de datos relacional | ||
Línea 189: | Línea 198: | ||
<sxh base> | <sxh base> | ||
| | ||
- | count | + | count |
- | mean | + | mean |
- | std 5.049022 | + | std 5.209273 |
min | min | ||
- | 25% 0.506000 | + | 25% 0.512000 |
- | 50% 1.000000 | + | 50% 1.750000 |
- | 75% 4.500000 | + | 75% 5.250000 |
max 18.000000 | max 18.000000 | ||
</ | </ | ||
Línea 206: | Línea 215: | ||
<sxh base> | <sxh base> | ||
- | 150.7 | + | 157.42 |
</ | </ | ||
Línea 215: | Línea 224: | ||
</ | </ | ||
- | <sxh base> | + | <sxh base>158.87</ |
- | 155.617601610597 | + | |
- | </ | + | |
* Suma de una columna | * Suma de una columna | ||
Línea 225: | Línea 232: | ||
</ | </ | ||
- | <sxh base> | + | <sxh base>4408.0</ |
- | 4521 | + | |
- | </ | + | |
* Máximo de una columna | * Máximo de una columna | ||
Línea 235: | Línea 240: | ||
</ | </ | ||
- | <sxh base> | + | <sxh base>612.0</ |
- | 612 | + | |
- | </ | + | |
* Mínimo de una columna | * Mínimo de una columna | ||
Línea 245: | Línea 248: | ||
</ | </ | ||
- | <sxh base> | + | <sxh base>22.0</ |
- | 22 | + | |
- | </ | + | |
* Correlación entre columnas | * Correlación entre columnas | ||
Línea 257: | Línea 258: | ||
<sxh base> | <sxh base> | ||
| | ||
- | capacidad | + | capacidad |
- | precio | + | precio |
</ | </ | ||
Línea 597: | Línea 598: | ||
* ¿Como se borrarían aquellas filas que tienen algún datos que es null? | * ¿Como se borrarían aquellas filas que tienen algún datos que es null? | ||
+ | ==== Ejercicio 1.E ==== | ||
+ | Siguiendo con el DataFrame anterior y usando [[https:// | ||
+ | * Muestra un scatter plot del ancho del pétalo en el eje X y el ancho del sépalo en el eje Y según el tipo de flor. | ||
+ | * Muestra el gráfico KDE de la distribución del largo del pétalo y del largo del sépalo. | ||
+ | * Muestra el gráfico KDE de la distribución del largo del pétalo y del largo del sépalo pero separado por el tipo de flor. | ||
+ | * Muestra un // | ||
+ | |||
+ | ==== Ejercicio 2.A ==== | ||
+ | Descarga el siguiente fichero {{ : | ||
+ | |||
+ | * Abre el fichero con un editor de texto y comprueba que formato tiene | ||
+ | * Carga el fichero con pandas | ||
+ | * Muestra las columnas que tiene | ||
+ | * Renombra la columna '' | ||
+ | * Muestra cuantas filas hay | ||
+ | * Muestra cuantos valores son null o NaN en cada columna | ||
+ | * Muestra el % de valores a null o NaN en cada columna | ||
+ | * Borra las filas que tengan algún valor a null o NaN | ||
+ | * Muestra las estadísticas de cada columna. ¿Podrías borrar alguna? ¿Explica porqué? En caso afirmativo borra la columna | ||
+ | * Indica que funciones de activación se han usado | ||
+ | * Indica hasta cuantas épocas se ha entrenado la red | ||
+ | * Indica la función de activación que ha tenido el mayor tiempo en la última época | ||
+ | |||
+ | ==== Ejercicio 2.B ==== | ||
+ | Siguiendo con el DataFrame anterior: | ||
+ | |||
+ | * Muestra un scatter plot | ||
+ | * Eje X:Época | ||
+ | * Eje Y:Tiempo | ||
+ | * Separa los datos por colores según la función de activación | ||
+ | * Añade un título al gráfico y a los 2 ejes. | ||
+ | |||
+ | ¿Ves algo raro en los datos? | ||
+ | |||
+ | {{: | ||
+ | |||
+ | ==== Ejercicio 2.C ==== | ||
+ | Siguiendo con el DataFrame anterior: | ||
+ | |||
+ | * Haz una regresión lineal de los datos para cada tipo de activación. | ||
+ | * Haz un gráfico que: | ||
+ | * Muestre la recta de la regresión de cada función de activación. | ||
+ | * En la etiqueta de cada función de activación se muestre también el valor de R² para cada uno de ellos. | ||
+ | |||
+ | {{: | ||
+ | |||
+ | |||
+ | ==== Ejercicio 2.D ==== | ||
+ | Siguiendo con el DataFrame anterior: | ||
+ | |||
+ | La gráfica no deja claro cda una de las rectas. Para mejorarlo se podría anotar al final de cada recta el nombre de la función de activación tal y como se muestra en el siguiente gráfico: | ||
+ | |||
+ | {{: | ||
+ | |||
+ | Para poner texto en una gráfica se usa el método [[https:// | ||
+ | |||
+ | |||
+ | ==== Ejercicio 3.A ==== | ||
+ | Usando la función '' | ||
+ | |||
+ | ^ Nº Neuronas en cada capa ^ | ||
+ | | 2, | ||
+ | | 4, | ||
+ | | 8, | ||
+ | | 4, | ||
+ | | 8, | ||
+ | | 16, | ||
+ | | 32, | ||
+ | | 64, | ||
+ | | 8, | ||
+ | |||
+ | Además: | ||
+ | * Deberás mostrar los 9 subplots en la disposición de 9x1 (9 filas y 1 columna) | ||
+ | * El título de cada subplot será el nº de neuronas por capa | ||
+ | |||
+ | |||
+ | |||
+ | ==== Ejercicio 3.B ==== | ||
+ | Siguiendo con el DataFrame anterior: | ||
+ | |||
+ | * Para las 4 columnas de las características de las flores y el tipo de flor, crea 5 nuevas columnas que se llamen igual pero con el prefijo '' | ||
+ | |||
+ | $$ | ||
+ | valor = \frac {X-min}{max-min} | ||
+ | $$ | ||
+ | |||
+ | * Para las 4 columnas de las características de las flores y el tipo de flor, crea 5 nuevas columnas que se llamen igual pero con el prefijo '' | ||
+ | |||
+ | $$ | ||
+ | valor = \frac {X-media}{desviación} | ||
+ | $$ | ||
+ | |||
+ | |||
+ | |||
+ | ==== Ejercicio 3.C ==== | ||
+ | Usando la función '' | ||
+ | |||
+ | ^ Nº Neuronas en cada capa ^ | ||
+ | | 2, | ||
+ | | 4, | ||
+ | | 8, | ||
+ | | 4, | ||
+ | | 8, | ||
+ | | 16, | ||
+ | | 32, | ||
+ | | 64, | ||
+ | | 8, | ||
+ | |||
+ | Pero para cada tipo de red ,deberás entrenarla 3 veces distintas y obtener resultado distintos con: | ||
+ | * Los datos originales | ||
+ | * Los datos normalizados | ||
+ | * Los datos estandarizados | ||
+ | |||
+ | Además: | ||
+ | * Deberás mostrar los 9 subplots en la disposición de 9x3 (9 filas y 3 columnas) | ||
+ | * En la primera columna se mostrarán el resultado de entrenar la red con los datos originales | ||
+ | * En la segunda columna se mostrarán el resultado de entrenar la red con los datos normalizados | ||
+ | * En la tercera columna se mostrarán el resultado de entrenar la red con los datos estandarizados | ||
+ | * El título de cada subplot: | ||
+ | * En la primera columna se mostrarán nº de neuronas por capa y el texto " | ||
+ | * En la segunda columna se mostrarán nº de neuronas por capa y el texto " | ||
+ | * En la tercera columna se mostrarán nº de neuronas por capa y el texto " | ||
+ | |||
+ | ¿Hay diferencias al usar los datos normalizados o estandarizado? | ||