Sesión 1: Introducción a la Calidad de Datos
- Definición de calidad de datos.
- Importancia de la calidad de datos en la toma de decisiones.
- Desafíos comunes en la calidad de datos.
Sesión 2: Fundamentos de Python para Control de Calidad de Datos
- Introducción a Python y su ecosistema.
- Manipulación de datos con bibliotecas como Pandas y NumPy.
- Lectura y escritura de datos en diferentes formatos.
Sesión 3: Herramientas para la Validación de Datos
- Validación de datos con expresiones regulares.
- Validación de formato y tipo de datos.
- Detección y manejo de valores nulos o atípicos.
Sesión 4: Limpieza y Transformación de Datos
- Estrategias para limpiar datos inconsistentes.
- Normalización y estandarización de datos.
- Transformación de datos para cumplir con requisitos específicos.
Sesión 5: Automatización del Control de Calidad
- Creación de funciones y scripts reutilizables.
- Desarrollo de pipelines de calidad de datos.
- Programación de tareas automatizadas.
Sesión 6: Casos Prácticos y Buenas Prácticas
- Resolución de problemas específicos de calidad de datos.
- Implementación en entornos de Big Data.
- Buenas prácticas en el control de calidad de datos.