Pandas groupby usando valores de columna
En este segundo vídeo sobre cómo agruparse usando pandas y como parte de la ampliación de la información de análisis de datos de este sitio web, queremos explicar cómo se puede usar una selección de groupby pero usando sólo los valores de las columnas y no los nombres de las columnas.
A continuación, importamos nuestros datos a un marco de datos y los agrupamos de la siguiente manera:
- Función agregada
- Usando la función de corte y asignando valores a los contenedores.
- Asignando etiquetas a la salida del marco de datos en base a los valores de la ubicación.
¿Por qué querrías usar Pandas groupby y valores de columna?
Este vídeo pretende ayudar a entender por qué es más fácil ir por valores que por nombres de columnas:
- Los nombres de las columnas pueden cambiar de un proyecto a otro, el uso de valores by permite una fácil implementación de la obtención de la salida independientemente de los nombres utilizados.
- Puedes aplicar esto a cualquier clase de Python, y siempre que puedas heredar permitirá que el código se ejecute sin problemas.
- La implementación por valor permite una clara comprensión del resultado deseado ya que los valores se entienden claramente para generar lo que se requiere.
- Necesitas entender cómo los datos dentro de tu conjunto de datos caen dentro de una cohorte particular:
- Este uso de valores en diferentes programas sólo necesita cambiar, la lógica subyacente sigue siendo la misma.
- El uso de nombres de columna sigue significando que para agruparlos, la lógica todavía tiene que ser escrita.