Módulo 1. Conceptos básicos iniciales (Un mes)
Lógica. Conceptos básicos de probabilidad. Probabilidad Bayesiana. Algoritmos y estructuras de datos. Entornos de desarrollo en Python y R.
Módulo 2. Data mining (Un mes)
Introducción al data mining (DM). Limpieza de datos. Patrones secuenciales. Reglas de asociación. Soporte y confianza. Clustering. Regresión lineal.
Módulo 3. Aprendizaje automático (Un mes)
Árboles de decisión. Sobreajuste – poda. Estimación e intervalos de confianza. Aprendizaje Bayesiano.
Módulo 4. Text mining (Dos semanas)
Categorización de textos. Clustering de textos. Modelización de tópicos. Sumarización de textos.
Módulo 5. Visualización de datos (Dos semanas)
Cabe destacar que, durante el transcurso de cada uno de los módulos de la diplomatura se irá desarrollando un proyecto de aplicación en ciencia de datos (data/text mining).