Machine Learning para usuarios de negocio (15 horas)

La transformación digital, implica desarrollar capacidades de analítica avanzada en todos los niveles de los negocios. Con esa finalidad desarrollamos este taller integral de machine learning que le permita.

▪ Desarrollar modelos de machine learning bajo una metodología integral CRISP DM, haciendo muchísimo énfasis en el conocimiento de los problemas de negociosy en la parte de preparación de datos para desarrollar modelos robustos y sólidos

▪ Desarrollar diversos algoritmos avanzados de Machine learning que permitan construir sólidos y modelos más predictivos.

Objetivos de aprendizaje

Al finalizar el taller, los alumnos deben ser capaces de:

▪ Dominar, de forma integral, el desarrollo de modelos de machine learning de datos y machine learning, usando la herramienta líderes y orientadas al usuario de negocio y gratuitas como Knime.

o Cargar información desde diferentes fuentes de datos, realizando cruces de fuentes (“joins”).

o Preparar los datos para  el modelamiento: fusionar, limpiar, analizar distribuciones de variables y transformar, crear nuevas variables para el análisis (feature engineering).

o Desarrollar modelos de clasificación (scorings) con diversos algoritmos (random forest, máquina de vectores, arboles de decisión, redes neuronales, redes bayesianas, regresión logística, etc) y hacer competir los modelos y combinarlos para obtener un modelo optimizado 

o Añadir nuevos y más sofisticados modelos de Machine Learning como Random Forest, modelo Boosting.

o Medir y seleccionar modelos y operativizarlos en los sistemas a través de la exportación en códigos PMML en algunos algoritmos

o Desarrollar diversos algoritmos de segmentación y metodologías que aseguren su éxito

Metodología de aprendizaje

“Learning by doing” es clave para el desarrollo del programa. El profesor llevara un set de datos, presentaciones para el marco teórico y desarrollarán ejercicios que cumplan con los objetivos de aprendizaje de cada sesión, mezclado con trabajos, relacionados al sector, para desarrollar.

Dirigido a

El taller estará dirigido a unos analistas con conocimientos de Excel, estadística básica y de SQL o manejo de tablas a nivel usuario

Temario

1. Minería de Datos-Machine Learning

▪ Definiciones y ejemplos de aplicación en la Banca

▪ Tipos de Modelos. Analítica descriptiva / predictiva

1.1. Análisis exploratorio de datos

▪ Conexión con bases de datos via ODBC,

▪ Manipulación de datos (sumarizaciones, pivoteo, agragacion, RFM)

▪ Resumen de datos: indicadores de tendencia central, de dispersión, percentiles

▪ Visualización de distribuciones: boxplot, histogramas, distribución, asimetria

▪ Análisis de correlación

▪ Joins de tablas

1.2. Preparación de variables

▪ Cambio de escala

▪ Imputación de datos

▪ Recodificación

▪ Limpieza de data: Valores perdidos, tratamiento de valores extremos

▪ Muestreo y selección de muestras

▪ Equilibrado de muestras

▪ Reducción de dimensionalidad y multi-colinealidad.

2. Modelos Clustering (No Supervisados)

▪ Segmentación RFM

▪ Algoritmos: K-Medias, K-mediodes, modelos jerárquicos

▪ Perfilamiento de cluster

▪ Medidas de calidad del modelo cluster

3. Árboles de decisión

▪ Árboles de regresión

▪ Árboles de clasificación

▪ Principales algoritmos de arboles: C5.0, C&RT, Chaid, etc

▪ Exportación de reglas de decisión

4. Modelos de clasificación (Modelos Supervisados)

▪ Regresión Logística,

▪ Redes Neuronales

▪ Naive Bayes

▪ Modelos avanzados: Randon Forest, Modelos boosting

5. Evaluación de Performance de modelos

• Tasa de error

• Verdaderos y falsos positivos y negativos

• Sensibilidad y Especificidad

• Matriz de confusión

• Gráficos de Riesgo

• Grafico ROC

6. Implementación

• Exportación de modelos a código PMML

• Implementación de modelos a nuevos registros

Herramientas que usaremos:

Principalmente usaremos software libre: Knime desktop.

Cada alumno debe venir con su PC con Knime instalado


Duración: 18 horas, 6 sesiones de 3 horas

Precio: 500 euros

Martes y jueves de 16 a 19 hrs. a partir del 7 de septiembre

Coordina: Ing. Julio Quiñonez