Contenido del bootcamp
Módulo 1. Introducción al Big Data
En este módulo introductorio del curso, los estudiantes tendrán la oportunidad de sumergirse en el fascinante mundo de la Inteligencia Artificial (IA) y Big Data. A través de una combinación de teoría y ejemplos prácticos, los estudiantes aprenderán cómo la IA y el Big Data están transformando la forma en que vivimos, trabajamos y nos relacionamos con el mundo.
Comenzando por una exploración de los conceptos fundamentales de la IA y el Big Data, los estudiantes aprenderán sobre las técnicas y algoritmos más importantes utilizados en la industria. También se discutirán los desafíos éticos y sociales asociados con la implementación de la IA y el Big Data.
Los estudiantes asimilarán en este módulo una comprensión sólida de los principios fundamentales de la IA y el Big Data, así como de las aplicaciones prácticas de estas tecnologías en el mundo real. Además, estarán preparados para explorar temas más avanzados en módulos posteriores del curso.
Módulo 2. Python para Data Science
En este módulo, los estudiantes tendrán la oportunidad de aprender uno de los lenguajes de programación más importantes y útiles en el mundo de la ciencia de datos: Python. A través de una combinación de lecciones teóricas y proyectos prácticos, los estudiantes adquirirán una comprensión sólida de los fundamentos de Python y su aplicación en el análisis de datos.
A medida que avancen, se centrarán en temas más avanzados como la manipulación de datos, la visualización y el análisis de datos con Python. Además, los estudiantes también tendrán la oportunidad de trabajar en proyectos prácticos en los que aplicarán sus habilidades de programación en Python para resolver problemas del mundo real. A lo largo del módulo, los estudiantes también recibirán una visión general de las herramientas de Python más importantes para el análisis de datos, como Pandas, Numpy y Matplotlib.
Módulo 3. Ingeniería de Datos
En este módulo, los estudiantes explorarán el fascinante mundo del web scraping en el contexto de la ingeniería de datos. El web scraping es una técnica utilizada para extraer datos de sitios web y transformarlos en un formato estructurado para su posterior análisis.
A través de una combinación de lecciones teóricas y proyectos prácticos, los estudiantes aprenderán cómo diseñar y desarrollar soluciones de web scraping efectivas. Se explorarán temas como la identificación de fuentes de datos, la selección de herramientas y técnicas de extracción de datos, y la limpieza y transformación de los datos extraídos.
Además, los estudiantes también aprenderán sobre las mejores prácticas para el scraping ético y responsable, y se discutirán los desafíos y consideraciones éticas asociados con la extracción de datos de sitios web. Utilizamos herramientas como requests, selenium o beautifulsoup.
Al final del módulo, los estudiantes tendrán una comprensión sólida de los fundamentos del web scraping y estarán equipados con las habilidades necesarias para diseñar y desarrollar soluciones de web scraping efectivas en el contexto de la ingeniería de datos. Este módulo proporcionará una base sólida para los estudiantes que deseen continuar en el campo de la ciencia de datos y la ingeniería de datos en módulos posteriores del curso.
Módulo 4. Arquitecturas Big Data
En este módulo, los estudiantes explorarán las arquitecturas Big Data utilizadas para manejar grandes volúmenes de datos en organizaciones de todo el mundo. A través de una combinación de lecciones teóricas y proyectos prácticos, los estudiantes adquirirán una comprensión profunda de las arquitecturas Big Data y las herramientas utilizadas para manejarlas.
Los estudiantes comenzarán aprendiendo sobre las características y desafíos de Big Data, así como sobre las arquitecturas Big Data tradicionales, como Databricks y Spark. A medida que avancen en el módulo, los estudiantes explorarán arquitecturas más modernas, como Lambda y Kappa, y aprenderán sobre herramientas y técnicas importantes para el manejo de Big Data, como Apache Kafka y Apache Cassandra.
Módulo 5. Exploración y Visualización de Datos
En este módulo, los estudiantes explorarán la disciplina de la exploración y visualización de datos. A través de una combinación de lecciones teóricas y proyectos prácticos, los estudiantes adquirirán una comprensión sólida de cómo visualizar datos y descubrir patrones y relaciones ocultas.
Los estudiantes comenzarán aprendiendo sobre los principios fundamentales de la exploración y visualización de datos, incluyendo las diferentes técnicas de visualización y cómo elegir la visualización adecuada para diferentes tipos de datos. A medida que avancen en el módulo, los estudiantes también aprenderán sobre herramientas y técnicas importantes para la exploración y visualización de datos, como matplotlib o seaborn.
Módulo 6. Business Intelligence
En el módulo 6, los estudiantes explorarán el campo del Business Intelligence, donde aprenderán a utilizar técnicas de análisis de datos para mejorar la toma de decisiones empresariales. A través de lecciones teóricas y proyectos prácticos, los estudiantes aprenderán a identificar oportunidades de mejora, recopilar y preparar datos para el análisis y presentar los resultados de manera efectiva.
Además, aprenderán a utilizar herramientas y técnicas como SQL, Power BI y Tableau para realizar análisis de tendencias, pronósticos y análisis de varianza. Este módulo les proporcionará una base sólida para continuar en el campo del Business Intelligence.
Módulo 7. Machine Learning
En el módulo 7, los estudiantes explorarán el campo del Machine Learning, donde aprenderán a desarrollar algoritmos y modelos que permitan a las máquinas aprender de los datos, incluyendo aprendizaje supervisado, no supervisado y de refuerzo. A través de lecciones teóricas y proyectos prácticos, los estudiantes adquirirán habilidades importantes en el desarrollo de modelos de Machine Learning utilizando bibliotecas de Python como Scikit-learn y PyTorch.
Al final del módulo, los estudiantes tendrán una comprensión sólida de los principios fundamentales del Machine Learning y estarán equipados con las habilidades necesarias para desarrollar modelos de Machine Learning efectivos en el mundo real.
Módulo 8. Deep Learning
Los estudiantes explorarán el emocionante campo del Deep Learning, que se enfoca en el desarrollo de algoritmos y modelos de aprendizaje profundo. A través de lecciones teóricas y proyectos prácticos, los estudiantes adquirirán habilidades importantes en el desarrollo de modelos de Deep Learning utilizando bibliotecas de Python como TensorFlow y Keras.
Al final del módulo, los estudiantes tendrán una comprensión sólida de los principios fundamentales del Deep Learning y estarán equipados con las habilidades necesarias para desarrollar modelos de Deep Learning efectivos en el mundo real.
Módulo 9. LLMs.
Sumérgete en el mundo de los modelos de lenguaje basados en aprendizaje profundo. Aprenderás cómo los modelos de lenguaje generativos han revolucionado el procesamiento del lenguaje natural, como ChatGPT, y cómo utilizarlos en aplicaciones prácticas.
Módulo 10. MLOps / DataOps
En el módulo de Introducción al MLOps, los estudiantes explorarán la implementación, monitoreo y gestión de modelos de Machine Learning en producción. A través de lecciones teóricas y proyectos prácticos, los estudiantes aprenderán las mejores prácticas y herramientas utilizadas en la implementación de modelos de Machine Learning en entornos empresariales.
Usaremos herramientas como Docker, Git, MLFlow, GitHub Actions. Al final del módulo, los estudiantes tendrán una comprensión sólida de los principios fundamentales de MLOps y estarán equipados con las habilidades necesarias para implementar y gestionar modelos de Machine Learning en producción.
Proyecto Final
En este curso, los estudiantes tendrán la oportunidad de poner en práctica sus conocimientos y habilidades de ciencia de datos a través de un proyecto realista y desafiante. Trabajarán en equipos para identificar oportunidades de mejora de datos y aplicar modelos de Machine Learning en situaciones del mundo real. El proyecto final les permitirá demostrar su capacidad de trabajo en equipo, comunicación efectiva y aplicación efectiva de la ciencia de datos, además de recibir retroalimentación del instructor y compañeros. Al final del curso, contarán con un proyecto sólido para su portafolio y estarán preparados para destacar ante futuros empleadores, integrando de manera integral sus conocimientos en un proyecto práctico y emocionante.