Científico de Datos de Transformación Digital
TEMARIO [ELI]
Módulo 12: Análisis y Analíticas de Big Data Avanzados
Este módulo proporciona una visión a profundidad de las áreas temáticas esenciales y avanzadas relacionadas con las técnicas de ciencia de datos y análisis relevantes y exclusivas de Big Data, con énfasis en la forma en que el análisis y las analíticas deben llevarse a cabo individual y colectivamente para apoyar las características, requisitos y retos particulares asociados con los conjuntos de datos de Big Data.
Se cubren los siguientes temas principales:
- Análisis exploratorio de datos, estadísticas esenciales, incluyendo las categorías de variables y las matemáticas relevantes
- Análisis de estadísticas, incluyendo descriptiva, inferencial, covarianza, prueba de hipótesis, etc.
- Medidas de variación o dispersión, rango intercuartil y valores atípicos, puntuación Z, etc.
- Probabilidad, frecuencia, estimadores estadísticos, intervalo de confianza, etc.
- Variables y notaciones matemáticas básicas, medidas estadísticas e inferencia estadística
- Análisis confirmatorio de datos (CDA)
- Discretización de datos, Binning y agrupamiento
- Técnicas de visualización, incluyendo gráfica de barra, gráfica de línea, histrograma, polígonos de frecuencia, etc.
- Regresión lineal de predicción, error cuadrático medio y coeficiente de determinación R2, etc.
- Resúmenes numéricos, modelización, evaluación de modelos, ajuste de modelos y sobreajuste de modelos
- Modelos estadísticos, medidas de evaluación de modelos
- Validación cruzada, varianza del sesgo, matriz de confusión y puntuación F
- Reglas de asociación y algoritmo apriori
- Reducción de datos, selección dimensional de características
- Extracción de características, discretización de datos (Binning y agrupamiento)
- Paramétrico versus no paramétrico, agrupamiento versus no agrupamiento
- Basado en distancia, supervisado versus semisupervisado
- Regresión lineal y regresión logística para Big Data
- Regresión de logísticas, Naïve Bayes, Suavizado de Laplace, etc.
- Árboles de decisiones para Big Data
- Identificación de patrones, reglas de asociación, algoritmo apriori
- Análisis de series temporales, tendencia, estacionalidad, K vecinos cercanos (kNN), K-medias
- Analíticas de textos para Big Data y detección de atípicos para Big Data
- Técnicas de estadísticas, basadas en distancia, supervisadas y semisupervisadas
Módulo 13: Machine Learning Avanzado
Este módulo profundiza en la amplia variedad de algoritmos, métodos y modelos de las prácticas contemporáneas de Machine Learning para explorar cómo se pueden resolver muchos de los diferentes problemas de negocio utilizando y combinando técnicas probadas de Machine Learning.
Se cubren los siguientes temas principales:
- Patrones de exploración de datos
- Cálculo de tendencia central, cálculo de variabilidad
- Cálculo de asociatividad, cálculo de resumen gráfico
- Patrones de reducción de datos
- Selección de características, extracción de características
- Patrones de manipulación de datos
- Imputación de características, codificación de características
- Discretización de características, estandarización de características
- Patrones de aprendizaje supervisado
- Predicción numérica, predicción de categorías
- Patrones de aprendizaje no supervisado
- Descubrimiento de categorías, descubrimiento de patrones
- Patrones de evaluación de modelos, modelado de referencia
- Evaluación del desempeño de entrenamiento, evaluación del
- desempeño de predicción
- Patrones de optimización de modelos
- Aprendizaje conjunto, Reentrenamiento frecuente del modelo
- Implementación de modelos ligeros, aprendizaje incremental del modelo
Módulo 14: Inteligencia Artificial Avanzada
Este módulo cubre una serie de prácticas para preparar y trabajar con datos para entrenar y correr sistemas y redes neuronales de IA contemporáneos. Proporciona además técnicas para diseñar y optimizar redes neuronales, incluyendo enfoques para la medición y el ajuste del desempeño de los modelos de redes neuronales. Las prácticas y técnicas están documentadas como patrones de diseño que pueden ser aplicados individualmente o en diferentes combinaciones para abordar una variedad de problemas y requerimientos comunes de los sistemas de IA. Además, los patrones son mapeados a los enfoques de aprendizaje, áreas funcionales y tipos de redes neuronales que se presentaron en el Módulo 11: Fundamentos de Inteligencia Artificial (IA).
Se cubren los siguientes temas principales:
- Patrones de manipulación de datos para preparar los datos para la entrada de la red neuronal
- Codificación de características para convertir características categóricas
- Imputación de características para inferir valores de las características
- Escalamiento de características para conjuntos de datos de entrenamiento con características amplias
- Representación de textos para convertir datos preservando las propiedades semánticas y de sintaxis
- Reducción de la dimensionalidad para reducir el espacio de características para la entrada de la red neuronal
- Patrones de aprendizaje supervisado para entrenar modelos de redes neuronales
- Configuración de redes supervisadas para establecer el número de neuronas en las capas de la red
- Identificación de imágenes para usar una red neuronal convolucional
- Identificación de secuencias para usar una red neuronal de memoria de corto/largo plazo
- Patrones de aprendizaje no supervisado para el entrenamiento de modelos de redes neuronales
- Identificación de patrones para identificar visualmente patrones mediante un mapa autoorganizado
- Filtrado de contenidos para generar recomendaciones Patrones de evaluación de modelos para medir el desempeño de las redes neuronales
- Evaluación del desempeño de entrenamiento para evaluar el desempeño de las redes neuronales
- Evaluación del desempeño de predicción para predecir el desempeño de las redes neuronales en la producción
- Modelado de referencia para evaluar y comparar redes neuronales complejas
- Patrones de optimización de modelos para refinar y adaptar redes neuronales
- Evitar el sobreajuste para ajustar una red neuronal
- Reentrenamiento frecuente del modelo para mantener una red neuronal en sincronía con los datos actuales
- Aprendizaje por transferencia para acelerar el entrenamiento de redes neuronales