Periodo académico 2024-1S
Actividad | Grupo | Periodos | Horarios | Aula | Profesor/Tutor |
---|
No existen datos de grupos de esta asignatura, en este plan de estudios.
El Análisis de Datos se refiere a la obtención de patrones o modelos
matemáticos para la interpretación de datos. En este campo convergen la
estadística, bases de datos y el aprendizaje automático.
El Aprendizaje Automático (Machine Learning) es el estudio de cómo
construir sistemas de computación que aprendan y se adapten de la experiencia.
De forma más concreta, se trata de crear programas capaces de construir
modelos a partir de datos, provenientes de bases de datos convencionales o de
datos no estructurados, en diversos tipos de problemas que incluyen de manera
general el aprendizaje supervisado (predicción y clasificación) y no
supervisado (agrupamiento, reducción de dimensiones, asociación), teniendo
como meta optimizar la capacidad de generalizar comportamientos a nuevos
conjuntos de datos. Incluyen técnicas de Inteligencia Artificial (IA),
estadística y probabilidades, teoría de computación y optimización, y en
general estrategias matemáticas y computacionales que permitan crear modelos
adaptativos a partir de los datos.
Estas áreas están transformando la forma como las organizaciones en
todos los sectores de la economía se administran. Ser capaz de comprender las
tendencias y patrones en datos complejos es fundamental para el éxito de estas
organizaciones.
Conocer y aprender técnicas de aprendizaje de máquina para analizar datos con el fin desarrollar aplicaciones que apoyen la toma de decisiones.
PARTE I: Conceptos Básicos
¿Qué es aprendizaje de máquina? Aprendizaje supervisado (clasificación y
predicción, incluyendo series temporales) y no supervisado (agrupamiento,
reducción de dimensiones y asociación). Aplicaciones.
Minería de Datos. Proceso CRISP-DM
PARTE II: Herramientas de software
Herramientas de Aprendizaje Automático. R, Python, otros. Librerías para
conexiones a bases de datos.
Laboratorio. Carga y pre-procesamiento de datos (normalización,
escalamiento, imputación de datos, discretización, conversión de factores a
variables binarias, etc)
PARTE III: Clasificación y Regresión de datos
Regresión. Regresión pesada (Risco, Lasso, Lars, Ransac, Elastic Net).
Laboratorio regresión.
Clasificación. Problemas de dos clases. Regresión logística. Bayes
ingenuo. Análisis ROC. Problema Multi-clases.
Laboratorio Clasificación
Arboles de clasificación y regresión. Bosques aleatorios. Métodos de
agregación: Adaboosting. Máquinas de soporte vectorial para clasificación y
regresión.
Laboratorio de métodos avanzados de clasificación y regresión.
PARTE IV: Aprendizaje No supervisado
Agrupamiento de datos (Clustering). K-medias, K-medoides. Clusterización
jerárquica. Clusterización espectral.
Laboratorio de agrupamiento.
Asociación. Algoritmo a priori. Reducción de dimensionalidad: análisis
de componentes principales (ACP).
1. Mitchell, T. M. (1997). Machine learning. Computer Science Series
(McGraw-Hill, Burr Ridge, 1997).
2. Richert, W. (2013). Building machine learning systems with python.
Packt Publishing Ltd.
3. Raschka, Sebastian.Python Machine Learning. ISBN-10: 1783555130
.ISBN-13: 978-1783555130
4. Han, Jiawei.(2006). Data mining: Concepts and Techniques. Morgan
Kaufman Publishers.
5. Hernández Orallo, J., Ramírez Quintana, M., Ferri Ramírez, C. (2004).
Introducción a la Minería de Datos. Editorial Pearson.
6. Kantardzic, Mehmed. (2003). Data Mining concepts, models, methods and
techniquees. Wiley-Interscience.
7. Witten, Ian H. (2011). Data mining : Practical machine learning tools
and techniques Morgan Kaufmann Publishers.
8. Gareth James,Daniela Witten, Trevor Hastie, Robert Tibshirani (2014).
An Introduction to Statistical Learning with Applications in R. Springer.
Aplicar técnicas matemáticas y estadísticas para interpretar y analizar datos, extraer información significativa y proponer soluciones a problemas reales, desde la perspectiva moderna del aprendizaje automático y la Inteligencia Artificial
• Simuladores y laboratorios virtuales disponibles en AVATA
• El manejo de lenguajes de programación como R o Python.
28/08/2023