[MÚSICA] [MÚSICA] Veamos ahora cómo podemos realizar algunas correcciones sobre los Dataframes, de modo que podamos utilizarlos de forma adecuada. Continuaremos usando los datos de los peajes en Colombia cuyas columnas apararecen en este momento en pantalla. Aplicaremos algunas funciones de corrección para preparar los datos, para posteriormente poder realizar mejores análisis sobre estos. you tenemos nuestros datos cargados, así que vamos ejecutando en terminar las instrucciones que tengo en el editor para analizar y luego corregir los datos. Ejecutemos un info, y vemos que los datos presentan valores nulos en el código de la vía, las categorías cuatro y cinco, las tarifas de categoría cuatro y cinco, y en la fecha de inicio de operaciones. También podemos ver que la fecha inicio operaciones está representada es como un object en vez de como un datetime. Vamos entonces a realizar algunas operaciones para corregir esto. Entonces, primero vamos a manejar los nulos, y luego corregir el tipo de dato de la fecha incluyendo una nueva columna que sí sea de tipo datetime. Empecemos llenando los nulos para el código de vía, cambiaremos los nulos por un valor más entendible. Pondré, sin código en este caso. Para esto vamos a utilizar la función fillna. Lo tomaremos aquí y nos queda así. Asignamos a nuestra columna, la columna, pero you con los valores nulos cambiados por la cadena sin código. Ejecutamos y los habremos llenado. Ahora, con las tarifas de las categorías cuatro y cinco que hacen falta. Agregaremos un cero en estas posiciones, de nuevo usamos el fillna. Tomar estos dos de una vez y las ejecutaremos para poder llenar los espacios nulos que teníamos en categorías cuatro y cinco. Ahora con las fechas faltantes. Estudiemos primero un poco los registros donde están los nulos para ver qué valor podríamos ingresar en dichas fechas. Para esto filtramos usando el método isna, esta vez lo tomaré de acá. Ejecutamos y creamos una variable llamada fechas nulas. Y luego obtenemos nombre, fecha de inicio de operación y generación de las vías donde están estos peajes. Entonces, lo tomaremos con esta línea de acá. [SONIDO] [SONIDO] Listo, ahí vemos el resultado. Entonces, aquí es interesante observar que ambos peajes pertenecen a la generación 4G de concesiones, así que podemos usar una fecha aproximada del inicio de operación de los peajes 4G. Investigando, he encontrado que en las concesiones 4G han iniciado operación en su mayoría en 2019, así que como fecha aproximada podemos usar el 1 de enero de 2019. Asignaré este valor usando fillna. Aquí tomamos de nuevo el fillna para llenar la columna Inic oper. [SONIDO] Listo, you con eso habremos llenado los nulos. Ahora veamos de nuevo con un info, que you no tendremos valores faltantes en ninguna de nuestras columnas. Lo tomaremos de acá, y vemos que you todos tienen los 101 registros no nulos. Creemos ahora la columna con las fechas como datetime, las llamaré fecha, inicio, op. Y usando la función to datetime, realizamos la conversión de la columna Inic oper. Recordemos que es muy importante incluir el parámetro infer datetime format en True. Lo tomamos de acá entonces, para crear la nueva columna a partir de la que tenemos como las fechas como object. [SONIDO] Esperamos que ejecute, y listo, tendremos la nueva columna you como tipo datetime. Para verificarlo, entonces, ejecutemos un info. Nuevamente, tomamos peaje punto info. [SONIDO] Y además que efectivamente se incluye nuestra nueva columna, que nos indica que tiene sus valores, los 101 valores, y es de tipo datetime 64. Para con head tomemos algunos de los valores, solamente para observar el formato en el que quedaron. Tomar entonces de acá, head, solamente en la columna, fecha, inicio, op. Y vemos aquí como quedaron nuestras fechas en ese formato, y que son de nuevo de tipo datetime 64. [MÚSICA]