Planteamiento del problema
Estás trabajando en algunos proyectos de análisis de datos y recibes archivos que tienen encabezados incorrectos. El problema es que, sin abrir el archivo, ¿cómo puede cambiar los encabezados de las columnas que contiene?
Para empezar, vamos a ver el archivo que queremos cambiar, a continuación es una captura de pantalla de los datos con sus cabeceras contenidas en el interior:
Como puede ver, tenemos nombres y direcciones. Pero, ¿qué pasa si queremos cambiar la dirección1, la dirección2, la dirección3 y la dirección4 por algo diferente?
Esto puede deberse a varias razones:
(A) Vas a utilizar esas columnas como parte de una sentencia SQL para insertar en una tabla de la base de datos , por lo que necesitas cambiar las cabeceras para que esa sentencia SQL no falle.
(B) Alguna otra parte de su código está utilizando esos datos, pero requiere que los nombres sean corregidos para que no fallen.
(C) Su organización tiene una convención de nomenclatura que requiere que todos los nombres de las columnas tengan una estructura determinada.
(D) Todos los datos de un tipo similar tienen que tener el mismo formato, para que puedan ser fácilmente identificados.
¿Cuál sería entonces la forma de implementar esto en Python?
A continuación verás el código que he utilizado para esto, buscando mantenerlo simple:
import pandas as pd
#df = pd.read_csv("csv_import.csv",skiprows=1) #==> use to skip first row (header if required)
df = pd.read_csv("csv_import.csv") #===> Include the headers
correct_df = df.copy()
correct_df.rename(columns={'Name': 'Name', 'Address1': 'Address_1','Address2': 'Address_2','Address3': 'Address_3','Address4': 'Address_4'}, inplace=True)
print(correct_df)
#Exporting to CSV file
correct_df.to_csv(r'csv_export', index=False,header=True)
Como puede verse, hay ocho filas en total. Los pasos son los siguientes:
- Importar el archivo CSV .
2. Haga una copia del marco de datos.
3. En el nuevo marco de datos, utilice la función de renombrar para cambiar cualquiera de los encabezados de columna que necesite, Dirección1, Dirección2, Dirección3, Dirección4.
4. Una vez completadas las actualizaciones, vuelva a exportar el archivo con las cabeceras corregidas a la carpeta que desee.
Como resultado de los pasos anteriores, la salida aparecerá así:
Y ahí lo tienes. Si tuvieras un proceso automatizado, podrías incorporar esto para asegurarte de que no hubiera fallos en la carga de ningún dato.
¿Otro artículo que puede interesarle? Cómo contar el número de filas y columnas en un archivo CSV