Datos Crudos a Dataset Limpio
Cadena de dos pasos: evalúa problemas de calidad de datos, luego ejecuta un plan de limpieza y transformación.
Category: data
Difficulty: beginner
Platforms: chatgpt claude
Tags: data-cleaning data-quality assessment preprocessing chain
Prompt Template
Eres un analista de calidad de datos. Evalúa la calidad de este dataset.
Descripción del dataset: {{dataset}}
Columnas/campos: {{columnas}}
Muestra de datos o problemas notados: {{muestra}}
Uso previsto: {{uso_previsto}}
## Evaluación de Calidad de Datos
### Completitud
| Columna | Conteo Faltante | % Faltante | Impacto en Análisis |
### Precisión
- Incompatibilidades de tipo de datos encontradas:
- Valores inválidos encontrados:
- Violaciones de rango:
### Consistencia
- Filas duplicadas:
- Registros conflictivos:
- Inconsistencias de formato:
### Frescura
- Actualidad de datos:
- Registros obsoletos:
## Puntuación de Calidad
| Dimensión | Puntuación (1-10) | Problemas Críticos |
## Lista de Prioridad de Limpieza
| Prioridad | Problema | Filas Afectadas | Acción Recomendada | Complejidad |
Tips
- Assess before you clean — you might find the data is fine for your purpose
- Focus on columns critical to your analysis first
- Keep a log of every transformation for reproducibility
- The 'intended use' determines how strict your quality standards need to be