Este Programa esta disponible en Modalidad:
Online
FECHAS DE INICIO
DURACIÓN:
Al finalizar el programa estarás en la capacidad de:
Diseñar e implementar flujos de integración de datos utilizando Python y bibliotecas como Pandas para manejar y transformar datos.
Crear procesos ETL básicos y medianos que consuman datos desde fuentes como archivos CSV, bases de datos SQL y sistemas NoSQL como Cassandra y MongoDB.
Implementar soluciones ETL complejas utilizando herramientas como Apache Nifi, Talend y Spark, tanto en procesos batch como streaming.
Aplicar técnicas avanzadas de preprocesamiento de datos, incluyendo manejo de datos faltantes, outliers y la creación de nuevas características.
Optimizar los procesos ETL en entornos distribuidos utilizando PySpark, mejorando la eficiencia de la memoria y el rendimiento de las consultas.
El curso está dirigido a:
Ingenieros de datos, desarrolladores de software, analistas de datos y profesionales del área tecnológica interesados en especializarse en la integración de datos y procesos ETL utilizando Python. Este curso es ideal para quienes desean aprender a crear flujos de datos escalables y optimizados, utilizando herramientas avanzadas como Spark, Apache Nifi, Talend y sistemas de bases de datos SQL y NoSQL. También es adecuado para aquellos que buscan profundizar en el preprocesamiento de datos, manejo de datos faltantes y outliers, y la ingeniería de características para proyectos de Machine Learning.
ETL Básico
ETL mediana complejidad
ETL Complejos
Las clases se desarrollarán de forma virtual, con una frecuencia Semanal en el siguiente horario (*):
Lunes: 20:00 a 23:00 horas. (Hora Perú y Colombia)
Lunes: 19:00 a 22:00 horas. (Hora México)
Lunes: 22:00 a 01:00 horas. (Hora de verano Chile)
(*) Para más detalle sobre fechas y horarios solicita el cronograma de clases.
Registra tus datos para que un asesor especializado pueda ayudarte en todo lo que requieras.
Los participantes que completen exitosamente el programa, recibirán la siguiente certificación:
ALBERTO DE OBESO
Mexico
PhD en Informática por la universidad Sussex – Brighton, Reino Unido. Especialización en Modelación Cognitiva ACT-R por la universidad Carnegie Mellon – Pensilvania, Estados Unidos. Actualmente se desempeña como Director de la División de Big Data para Intersys Consulting. Cuenta con más de 15 años de experiencia Desarrollando y Diseñando Softwares principalmente con tecnologías .NET y Java (evaluación de requisitos, análisis, diseño, desarrollo, pruebas, implementación y mantenimiento) y en el Desarrollo de Soluciones de Business Intelligence (ciencia de datos, modelado de datos, visualización de datos, sistemas expertos, modelado cognitivo). Ha ocupado cargos importantes como Data Scientist en Luxoft, Chief Data Scientist en Daylight Intelligence, entre otros.
NOTA: No necesariamente todos los expositores mencionados participarán en el dictado del programa o sesiones webinar, asimismo se podrá contar con la participación de otros expositores adicionales a los mencionados.
PAGAR a través de nuestro sitio web, solo tiene que solicitar su código de pago a uno de nuestros asesores.
PAGAR a través de nuestro sitio web con los siguientes medios de pago: