Data Science

Le Wagon logo

Contenido del bootcamp

Python para Data Science

Aprende programación en Python, cómo trabajar con Jupyter Notebook y cómo usar las potentes bibliotecas de Python como Pandas y NumPy para explorar y analizar grandes series de datos. Recopila datos de varias fuentes, incluyendo archivos CSV, consultas SQL en bases de datos relacionales, Google Big Query, APIs y web scraping.

Base de datos relacional y SQL

Aprende a formular una buena pregunta y a cómo responderla creando la consulta SQL apropiada. En este módulo vamos a cubrir arquitectura modelo y luego nos vamos a adentrar en la manipulación avanzada de SELECT para extraer información útil de una base de datos autónoma o usando un software de cliente SQL como DBeaver.

Visualización de datos

Haz tus análisis de datos más visuales y comprensibles incluyendo visualizaciones de datos en tu Notebook. Aprende a trazar tus marcos de datos usando bibliotecas de Python como matplotlib and seaborn y transforma tus datos en información útil.

Estadística, probabilidad, álgebra lineal

Entiende las matemáticas subyacentes detrás de todas las bibliotecas y modelos usados en el bootcamp. Familiarízate con los conceptos básicos de estadística y probabilidad (promedio, varianza, variable aleatoria, teorema de Bayes, etc.) y con las matrices en la computación, el núcleo de las operaciones numéricas en bibliotecas como Pandas y Numpy.

Interferencias estadísticas

Aprenderás a estructurar un repositorio de Python con programación orientada a objetos para limpiar el código y que sea reutilizable, cómo sobrevivir a la fase de preparación de un gran conjunto de datos, y cómo encontrar e interpretar resultados estadísticos significativos basados en modelos de regresión multivariada.

Comunicación

Los analistas de datos deben comunicar sus resultados a una audiencia no técnica: aprenderás a crear impacto explicando información técnica y a convertirla en decisiones empresariales usando análisis de coste y beneficio. Podrás compartir tus progresos, presentarlos y comparar tus resultados con tus compañeros de equipo.

Preprocesamiento y aprendizaje supervisado

Aprende a explorar, limpiar y preparar tu conjunto de datos a través de técnicas de preprocesamiento como la vectorización. Familiarízate con los modelos clásicos de aprendizaje supervisado: las regresiones lineales y logísticas. Aprende a resolver tareas de predicción y clasificación con scikit-learn de la biblioteca de Python usando algoritmos de aprendizaje como KNN (k-nearest neighbors).

Generalización y sobreajuste

Implementa fases de ensayo y pruebas para asegurar que tu modelo se pueda generalizar a datos no vistos e implementar a producción con una precisión predecible. Aprende a evitar el sobreajuste usando métodos de regularización y cómo elegir la función de pérdida adecuada para mejorar la precisión de tu modelo.

Métricas de rendimiento

Evalúa el rendimiento de tu modelo definiendo qué optimizar y las métricas de error adecuadas para poder evaluar el impacto de tu negocio. Mejora el rendimiento de tu modelo con métodos de validación como la validación cruzada o la optimización de hiperparámetros. Por último, descubre un poderoso método de aprendizaje supervisado llamado SVM (máquinas de soporte vectorial).

Aprendizaje no supervisado y métodos avanzados

Avanza al aprendizaje no supervisado e implementa métodos como el PCA para reducción de la dimensionalidad o la agrupación para descubrir grupos en un conjunto de datos. Completa tus herramientas con métodos conjuntos que combinan otros modelos para mejorar el rendimiento, como Random Forest o Gradient Boosting.

Redes neuronales

Entiende la arquitectura de las redes neuronales (neuronas, capas y grupos) y sus parámetros (funciones de activación, función de pérdida, optimizador). Capacítate para crear tus propias redes, como la red neuronal convolucional (para imágenes), la red neuronal recurrente (para series temporales) y redes de procesamiento de lenguaje natural (para texto).

Visión Artificial

Profundiza en visión artificial con redes neuronales covolucionales – arquitecturas diseñadas para aprovechar al máximo las imágenes. Mejora la generalización de tu modelo gracias a las técnicas de aumento de datos e implementa métodos avanzados para beneficiarse de arquitecturas de última generación gracias a los métodos de transferencia de aprendizaje.

Series Temporales y Text Data

Aprende a gestionar datos secuenciales y texto (secuencia de palabras) transformándolos en entradas apropiadas. Utiliza el poder de las Redes Neuronales Recurrentes para pronosticar valores futuros y realizar el procesamiento de lenguaje natural.

Deep Learning con Keras

Descubre una nueva librería llamada Keras, que es un wrapper ajustado a desarrolladores para TensorFlow, una biblioteca de aprendizaje automático creada por Google. Te enseñaremos las técnicas fundamentales para crear tu primer modelo de aprendizaje profundo con Keras.

Tubería de aprendizaje automático

Avanza de Jupyter Notebook a un editor de código y aprende cómo configurar un proyecto de aprendizaje automático correctamente para iterar de forma rápida y segura. Aprende a convertir un modelo de aprendizaje automático en un modelo con una tubería robusta y escalable con sklearn-pipeline, usando codificadores y transformadores.

Workflow de aprendizaje automático con MLflow

Crear un modelo de aprendizaje automático de principio a fin requiere mucha preparación de datos, experimentación, iteración y ajuste. Te enseñaremos cómo llevar a cabo la ingeniería y la optimización de hiperparámetros para crear el mejor modelo. Para esto, usarás una biblioteca llamada MLflow.

Despliegue a producción con Google Cloud Platform

Por último, te enseñaremos cómo implementar el código y el modelo a producción. Usando Google Cloud AI Platform y Airflow, podrás entrenar tu modelo a escala, empaquetarlo y ponerlo al alcance de todos. Por si fuera poco, usarás un entorno Docker para implementar tu propio RESTful Flask API, que podría conectarse a cualquier interfaz front-end.

Comparte este Bootcamp
Compartir en facebook
Compartir en linkedin
Compartir en twitter
Compartir en email