Introducción al Control de calidad de datos con Python

Aprenda a realizar controles de calidad para todo tipo de datos en Python.
Este curso explora los conceptos y algoritmos que se utilizan para la lectura, graficación y control de calidad de datos.

Fecha de inicio: 26 de febrero del 2024.
Horario: 19 a 23 horas (UTC-5).
Clases en vivo: 6 sesiones (curso sincrónico de lunes a sábado).
Beneficios:
  • Certificado del curso por 24 horas lectivas.
  • Suscripción durante 30 días a un grupo de Whatsapp para resolver consultas.
  • Acceso a las grabaciones de las clases en vivo.

$ 103.0

Contenido

Sesión 1: Introducción a la Calidad de Datos

  • Definición de calidad de datos.
  • Importancia de la calidad de datos en la toma de decisiones.
  • Desafíos comunes en la calidad de datos.

Sesión 2: Fundamentos de Python para Control de Calidad de Datos

  • Introducción a Python y su ecosistema.
  • Manipulación de datos con bibliotecas como Pandas y NumPy.
  • Lectura y escritura de datos en diferentes formatos.

Sesión 3: Herramientas para la Validación de Datos

  • Validación de datos con expresiones regulares.
  • Validación de formato y tipo de datos.
  • Detección y manejo de valores nulos o atípicos.

Sesión 4: Limpieza y Transformación de Datos

  • Estrategias para limpiar datos inconsistentes.
  • Normalización y estandarización de datos.
  • Transformación de datos para cumplir con requisitos específicos.

Sesión 5: Automatización del Control de Calidad

  • Creación de funciones y scripts reutilizables.
  • Desarrollo de pipelines de calidad de datos.
  • Programación de tareas automatizadas.

Sesión 6: Casos Prácticos y Buenas Prácticas

  • Resolución de problemas específicos de calidad de datos.
  • Implementación en entornos de Big Data.
  • Buenas prácticas en el control de calidad de datos.