Contenido:
Prep Course
Fundamentos Python
Introducción a Python. Entender los flujos de control, iteradores e iterables, las clases & OOP, la creación de variables, tipos de datos y operadores y, el error handling.
Fundamentos GIT
Introducción a comandos básicos de GIT. Aprender a utilizar funcionalidades como forking y cloning de repositorios, controles de versiones. Utilizar correctamente los comandos git: status, add, commit, push.
Fundamentos Math
Introducción a conceptos matemáticos. Entender las funcionalidades como el análisis matemático, el análisis multivariable y el álgebra lineal.
Módulo 1
Intro to Data
Introducción al pensamiento computacional. Computer Science. Circuitos eléctricos. Half Adder. Sistemas de numeración.
Numpy
Introducción a la librería NumPy. Concepto de arrays y matrices. Estadística, rendimiento y máscaras.
Pandas
Introducción a Pandas. Tipos de datos. Concepto de Series y DataFrames.
Estructura de Datos
Concepto de pilas y colas, listas enlazadas, Hash Tables, árboles, Heap y otras estructuras de datos.
Algoritmos
Conceptos de algoritmos. Manejo eficiente de algoritmos. Lógica de algoritmos. Algoritmos de ordenamiento y de búsqueda.
Módulo 2.
Into to DBMS/SQLI
Introducción a sistemas de gestión de bases de datos. Introducción a SQL. Conceptos de base de datos.
DML – ORM
Introducción a DML y ORM. Interacción con bases de datos.
KPIs & Business Applications – DML
Concepto de KPI & Business Applications. Funciones en SQL. Agregaciones.
Estadística y probabilidad de datos
Introducción a la teoría de la probabilidad. Estadística vs Probabilidad. Espacios muestrales y sucesos. Distribuciones de probabilidad. Tests estadísticos.
Módulo 3.
Deep Dive SQL
Optimización de consultas. Aplicación de índices en RDBMS. Modelo de datos. Variables y funciones. SQL Joins. Subconsultas.
Data Description
La calidad del Dato y sus criterios. Preparación del dato.
Data Cleansing
Limpieza, valores faltantes y normalización de los datos.
ETL
Extracción, transformación y carga – ETL.
Módulo 4.
Big Data (frameworks Hadoop)
3 V’s de Big Data. Hadoop. Frameworks Hadoop. Hive. Formatos de almacenamiento.
Procesamiento Batch y Streaming
Apache Spark. Procesamiento Batch vs Streaming.
NO-SQL
Concepto de NO-SQL. Tipo de Motores de Bases de Datos.
Orquestación de flujos de datos
Concepto de Flujos de Trabajo.
Módulo 5.
Reportes y dashboards
Introducción al reporting y dashboards. PowerBI y DAX.
Visualización
Concepto de Data Visualization. Gráficos, mapas y otros tipos de visualizaciones. Matplotlib y Seaborn.
Storytelling
Entender cómo contar historias a través de los datos. Expresión oral.
Módulo 6.
Ingeniería de features
Intro a modelling. Stochastic Modelling & Parameter Estimation. Feature Selection.
Modelos Machine Learning
Introducción al machine learning. Modelos de regresión, clasificación, supervisados y no supervisados.
Evaluación performance modelos
Concepto de performance. Evaluación de modelos. Time Series.
Deep Learning
Concepto de redes neuronales.