Científico de Datos de Transformación Digital

TEMARIO [ELI]

  • Módulo 12: Análisis y Analíticas de Big Data Avanzados

    Este módulo proporciona una visión a profundidad de las áreas temáticas esenciales y avanzadas relacionadas con las técnicas de ciencia de datos y análisis relevantes y exclusivas de Big Data, con énfasis en la forma en que el análisis y las analíticas deben llevarse a cabo individual y colectivamente para apoyar las características, requisitos y retos particulares asociados con los conjuntos de datos de Big Data.

    Se cubren los siguientes temas principales:

    • Análisis exploratorio de datos, estadísticas esenciales, incluyendo las categorías de variables y las matemáticas relevantes
    • Análisis de estadísticas, incluyendo descriptiva, inferencial, covarianza, prueba de hipótesis, etc.
    • Medidas de variación o dispersión, rango intercuartil y valores atípicos, puntuación Z, etc.
    • Probabilidad, frecuencia, estimadores estadísticos, intervalo de confianza, etc.
    • Variables y notaciones matemáticas básicas, medidas estadísticas e inferencia estadística
    • Análisis confirmatorio de datos (CDA)
    • Discretización de datos, Binning y agrupamiento
    • Técnicas de visualización, incluyendo gráfica de barra, gráfica de línea, histrograma, polígonos de frecuencia, etc.
    • Regresión lineal de predicción, error cuadrático medio y coeficiente de determinación R2, etc.
    • Resúmenes numéricos, modelización, evaluación de modelos, ajuste de modelos y sobreajuste de modelos
    • Modelos estadísticos, medidas de evaluación de modelos
    • Validación cruzada, varianza del sesgo, matriz de confusión y puntuación F
    • Reglas de asociación y algoritmo apriori
    • Reducción de datos, selección dimensional de características
    • Extracción de características, discretización de datos (Binning y agrupamiento)
    • Paramétrico versus no paramétrico, agrupamiento versus no agrupamiento
    • Basado en distancia, supervisado versus semisupervisado
    • Regresión lineal y regresión logística para Big Data
    • Regresión de logísticas, Naïve Bayes, Suavizado de Laplace, etc.
    • Árboles de decisiones para Big Data
    • Identificación de patrones, reglas de asociación, algoritmo apriori
    • Análisis de series temporales, tendencia, estacionalidad, K vecinos cercanos (kNN), K-medias
    • Analíticas de textos para Big Data y detección de atípicos para Big Data
    • Técnicas de estadísticas, basadas en distancia, supervisadas y semisupervisadas

  • Módulo 13: Machine Learning Avanzado

    Este módulo profundiza en la amplia variedad de algoritmos, métodos y modelos de las prácticas contemporáneas de Machine Learning para explorar cómo se pueden resolver muchos de los diferentes problemas de negocio utilizando y combinando técnicas probadas de Machine Learning.

    Se cubren los siguientes temas principales:

    • Patrones de exploración de datos
    • Cálculo de tendencia central, cálculo de variabilidad
    • Cálculo de asociatividad, cálculo de resumen gráfico
    • Patrones de reducción de datos
    • Selección de características, extracción de características
    • Patrones de manipulación de datos
    • Imputación de características, codificación de características
    • Discretización de características, estandarización de características
    • Patrones de aprendizaje supervisado
    • Predicción numérica, predicción de categorías
    • Patrones de aprendizaje no supervisado
    • Descubrimiento de categorías, descubrimiento de patrones
    • Patrones de evaluación de modelos, modelado de referencia
    • Evaluación del desempeño de entrenamiento, evaluación del
    • desempeño de predicción
    • Patrones de optimización de modelos
    • Aprendizaje conjunto, Reentrenamiento frecuente del modelo
    • Implementación de modelos ligeros, aprendizaje incremental del modelo

  • Módulo 14: Inteligencia Artificial Avanzada

    Este módulo cubre una serie de prácticas para preparar y trabajar con datos para entrenar y correr sistemas y redes neuronales de IA contemporáneos. Proporciona además técnicas para diseñar y optimizar redes neuronales, incluyendo enfoques para la medición y el ajuste del desempeño de los modelos de redes neuronales. Las prácticas y técnicas están documentadas como patrones de diseño que pueden ser aplicados individualmente o en diferentes combinaciones para abordar una variedad de problemas y requerimientos comunes de los sistemas de IA. Además, los patrones son mapeados a los enfoques de aprendizaje, áreas funcionales y tipos de redes neuronales que se presentaron en el Módulo 11: Fundamentos de Inteligencia Artificial (IA).

    Se cubren los siguientes temas principales:

    • Patrones de manipulación de datos para preparar los datos para la entrada de la red neuronal
    • Codificación de características para convertir características categóricas
    • Imputación de características para inferir valores de las características
    • Escalamiento de características para conjuntos de datos de entrenamiento con características amplias
    • Representación de textos para convertir datos preservando las propiedades semánticas y de sintaxis
    • Reducción de la dimensionalidad para reducir el espacio de características para la entrada de la red neuronal
    • Patrones de aprendizaje supervisado para entrenar modelos de redes neuronales
    • Configuración de redes supervisadas para establecer el número de neuronas en las capas de la red
    • Identificación de imágenes para usar una red neuronal convolucional
    • Identificación de secuencias para usar una red neuronal de memoria de corto/largo plazo
    • Patrones de aprendizaje no supervisado para el entrenamiento de modelos de redes neuronales
    • Identificación de patrones para identificar visualmente patrones mediante un mapa autoorganizado
    • Filtrado de contenidos para generar recomendaciones Patrones de evaluación de modelos para medir el desempeño de las redes neuronales
    • Evaluación del desempeño de entrenamiento para evaluar el desempeño de las redes neuronales
    • Evaluación del desempeño de predicción para predecir el desempeño de las redes neuronales en la producción
    • Modelado de referencia para evaluar y comparar redes neuronales complejas
    • Patrones de optimización de modelos para refinar y adaptar redes neuronales
    • Evitar el sobreajuste para ajustar una red neuronal
    • Reentrenamiento frecuente del modelo para mantener una red neuronal en sincronía con los datos actuales
    • Aprendizaje por transferencia para acelerar el entrenamiento de redes neuronales