Muestra las diferencias entre dos versiones de la página.
Ambos lados, revisión anterior Revisión previa Próxima revisión | Revisión previa | ||
clase:iabd:pia:1eval:tema05 [2022/01/26 22:21] admin [Estadística] |
clase:iabd:pia:1eval:tema05 [2022/02/06 21:02] (actual) admin [Ejercicios] |
||
---|---|---|---|
Línea 84: | Línea 84: | ||
</ | </ | ||
- | * Cargar los datos des un fichero de texto llamado " | + | * Cargar los datos desde un fichero de texto llamado " |
<sxh python> | <sxh python> | ||
Línea 90: | Línea 90: | ||
</ | </ | ||
+ | |||
+ | < | ||
+ | Si al guardar los datos **NO** se añadió el parámetro '' | ||
+ | <sxh python> | ||
+ | df.to_csv(" | ||
+ | df=pd.read_csv(" | ||
+ | </ | ||
+ | |||
+ | </ | ||
* Cargar los datos desde una base de datos relacional | * Cargar los datos desde una base de datos relacional | ||
Línea 589: | Línea 598: | ||
* ¿Como se borrarían aquellas filas que tienen algún datos que es null? | * ¿Como se borrarían aquellas filas que tienen algún datos que es null? | ||
+ | ==== Ejercicio 1.E ==== | ||
+ | Siguiendo con el DataFrame anterior y usando [[https:// | ||
+ | * Muestra un scatter plot del ancho del pétalo en el eje X y el ancho del sépalo en el eje Y según el tipo de flor. | ||
+ | * Muestra el gráfico KDE de la distribución del largo del pétalo y del largo del sépalo. | ||
+ | * Muestra el gráfico KDE de la distribución del largo del pétalo y del largo del sépalo pero separado por el tipo de flor. | ||
+ | * Muestra un // | ||
+ | |||
+ | ==== Ejercicio 2.A ==== | ||
+ | Descarga el siguiente fichero {{ : | ||
+ | |||
+ | * Abre el fichero con un editor de texto y comprueba que formato tiene | ||
+ | * Carga el fichero con pandas | ||
+ | * Muestra las columnas que tiene | ||
+ | * Renombra la columna '' | ||
+ | * Muestra cuantas filas hay | ||
+ | * Muestra cuantos valores son null o NaN en cada columna | ||
+ | * Muestra el % de valores a null o NaN en cada columna | ||
+ | * Borra las filas que tengan algún valor a null o NaN | ||
+ | * Muestra las estadísticas de cada columna. ¿Podrías borrar alguna? ¿Explica porqué? En caso afirmativo borra la columna | ||
+ | * Indica que funciones de activación se han usado | ||
+ | * Indica hasta cuantas épocas se ha entrenado la red | ||
+ | * Indica la función de activación que ha tenido el mayor tiempo en la última época | ||
+ | |||
+ | ==== Ejercicio 2.B ==== | ||
+ | Siguiendo con el DataFrame anterior: | ||
+ | |||
+ | * Muestra un scatter plot | ||
+ | * Eje X:Época | ||
+ | * Eje Y:Tiempo | ||
+ | * Separa los datos por colores según la función de activación | ||
+ | * Añade un título al gráfico y a los 2 ejes. | ||
+ | |||
+ | ¿Ves algo raro en los datos? | ||
+ | |||
+ | {{: | ||
+ | |||
+ | ==== Ejercicio 2.C ==== | ||
+ | Siguiendo con el DataFrame anterior: | ||
+ | |||
+ | * Haz una regresión lineal de los datos para cada tipo de activación. | ||
+ | * Haz un gráfico que: | ||
+ | * Muestre la recta de la regresión de cada función de activación. | ||
+ | * En la etiqueta de cada función de activación se muestre también el valor de R² para cada uno de ellos. | ||
+ | |||
+ | {{: | ||
+ | |||
+ | |||
+ | ==== Ejercicio 2.D ==== | ||
+ | Siguiendo con el DataFrame anterior: | ||
+ | |||
+ | La gráfica no deja claro cda una de las rectas. Para mejorarlo se podría anotar al final de cada recta el nombre de la función de activación tal y como se muestra en el siguiente gráfico: | ||
+ | |||
+ | {{: | ||
+ | |||
+ | Para poner texto en una gráfica se usa el método [[https:// | ||
+ | |||
+ | |||
+ | ==== Ejercicio 3.A ==== | ||
+ | Usando la función '' | ||
+ | |||
+ | ^ Nº Neuronas en cada capa ^ | ||
+ | | 2, | ||
+ | | 4, | ||
+ | | 8, | ||
+ | | 4, | ||
+ | | 8, | ||
+ | | 16, | ||
+ | | 32, | ||
+ | | 64, | ||
+ | | 8, | ||
+ | |||
+ | Además: | ||
+ | * Deberás mostrar los 9 subplots en la disposición de 9x1 (9 filas y 1 columna) | ||
+ | * El título de cada subplot será el nº de neuronas por capa | ||
+ | |||
+ | |||
+ | |||
+ | ==== Ejercicio 3.B ==== | ||
+ | Siguiendo con el DataFrame anterior: | ||
+ | |||
+ | * Para las 4 columnas de las características de las flores y el tipo de flor, crea 5 nuevas columnas que se llamen igual pero con el prefijo '' | ||
+ | |||
+ | $$ | ||
+ | valor = \frac {X-min}{max-min} | ||
+ | $$ | ||
+ | |||
+ | * Para las 4 columnas de las características de las flores y el tipo de flor, crea 5 nuevas columnas que se llamen igual pero con el prefijo '' | ||
+ | |||
+ | $$ | ||
+ | valor = \frac {X-media}{desviación} | ||
+ | $$ | ||
+ | |||
+ | |||
+ | |||
+ | ==== Ejercicio 3.C ==== | ||
+ | Usando la función '' | ||
+ | |||
+ | ^ Nº Neuronas en cada capa ^ | ||
+ | | 2, | ||
+ | | 4, | ||
+ | | 8, | ||
+ | | 4, | ||
+ | | 8, | ||
+ | | 16, | ||
+ | | 32, | ||
+ | | 64, | ||
+ | | 8, | ||
+ | |||
+ | Pero para cada tipo de red ,deberás entrenarla 3 veces distintas y obtener resultado distintos con: | ||
+ | * Los datos originales | ||
+ | * Los datos normalizados | ||
+ | * Los datos estandarizados | ||
+ | |||
+ | Además: | ||
+ | * Deberás mostrar los 9 subplots en la disposición de 9x3 (9 filas y 3 columnas) | ||
+ | * En la primera columna se mostrarán el resultado de entrenar la red con los datos originales | ||
+ | * En la segunda columna se mostrarán el resultado de entrenar la red con los datos normalizados | ||
+ | * En la tercera columna se mostrarán el resultado de entrenar la red con los datos estandarizados | ||
+ | * El título de cada subplot: | ||
+ | * En la primera columna se mostrarán nº de neuronas por capa y el texto " | ||
+ | * En la segunda columna se mostrarán nº de neuronas por capa y el texto " | ||
+ | * En la tercera columna se mostrarán nº de neuronas por capa y el texto " | ||
+ | |||
+ | ¿Hay diferencias al usar los datos normalizados o estandarizado? | ||