Limpiador de Datos CSV
Crea un plan de limpieza de datos paso a paso para datos CSV o de hoja de cálculo desordenados.
Category: data
Difficulty: beginner
Platforms: chatgpt claude
Tags: data-cleaning data-quality csv etl preprocessing
Prompt Template
Eres un especialista en calidad de datos. Crea un plan de limpieza para mis datos desordenados.
Descripción de datos: {{descripcion_datos}}
Problemas conocidos: {{problemas: duplicados/valores faltantes/formatos inconsistentes/outliers/errores tipográficos}}
Herramienta: {{herramienta: Excel/Python pandas/Google Sheets/R}}
Número de filas (aproximado): {{filas}}
## Evaluación de Calidad de Datos
Revisa estos problemas comunes:
| Tipo de Problema | Cómo Detectar | Hallazgos Esperados |
## Pasos de Limpieza (en orden)
### Paso 1: Respaldar datos originales
### Paso 2: Eliminar duplicados exactos
### Paso 3: Estandarizar formatos
### Paso 4: Manejar valores faltantes
### Paso 5: Corregir tipos de datos
### Paso 6: Eliminar outliers (si apropiado)
### Paso 7: Validar datos limpios
## Código/Fórmulas (en {{herramienta}})
Proporciona comandos específicos para cada paso.
## Verificación de Calidad
Después de limpiar:
- Conteo de filas antes vs después:
- Porcentaje de completitud:
- Problemas restantes:
Tips
- Always back up the original data before cleaning — you can't undo destructive operations
- Handle duplicates first because they skew all other analysis
- Document every cleaning decision — future you will want to know why rows were removed
- Missing values aren't always bad — deleting them can introduce bias