Periodo académico 2024-1S
Actividad | Grupo | Periodos | Horarios | Aula | Profesor/Tutor |
---|
No existen datos de grupos de esta asignatura, en este plan de estudios.
En la actualidad y en el futuro, los datos que almacenan las organizaciones
crecen de manera importante, provienen de diferentes fuentes, y se distribuyen
en distintos formatos y presentaciones, ya sea internas o externas, propios o
de terceros, resultandos diferentes en estructura y contenido.
Esta revolución basada en los datos, toca a nuestras puertas y tenemos
la oportunidad de comprender y aplicar las técnicas mas utilizadas por
empresas como Google, Facebook, Netflix, Amazon, en nuestro entorno
corporativo, negocios y emprendimientos.
De ahí que sea importante conocer los métodos y técnicas para encontrar
información en estos datos que aunque no sean evidentes, pueden ser de gran
valor La Ciencia de datos es entonces un enfoque en el que se reúne la
estadística, algoritmia, aprendizaje de máquina, bases de datos, programación,
que nos permite implementar soluciones de perfilamiento, predictivas basadas
en datos siempre para mejores decisiones.
Al finalizar las sesiones del curso el alumno conocerá, aprenderá e
implementará algunas de las técnicas mas importantes para analizar datos
provenientes de bodegas y bases de datos, utilizando para ello modelos de
estadística y aprendizaje maquinal, con el fin desarrollar aplicaciones
que apoyen la toma de decisiones.
Semana 1
Introducción a ciencia de datos
Conceptos, Metodología, Aplicaciones
Introducción/nivelación Python, anaconda
CRISP – DM Proceso de ciencia de datos Marco para la ejecución de
proyectos de DS
Semana 2
Análisis exploratorio
Medidas de tendencia central, concentración, curtósis, asimetría
Gráficas
Prueba de hipótesis
Practica.
Semana 3
Preparación de datos
Acceso a bases de datos
Tratamiento de Valores faltantes
Ruido
Transformación de datos
Práctica
Semana 4
Análisis de canasta
Conceptos y taller práctico sistema recomendación
Predicción
Regresión lineal
Correlación
Inferencia
Semana 5 Árboles de decisión y bosques aleatorios
Entrenamiento, prueba, validación y despliegue de modelo
Práctica
Semana 6
Segmentación
Conceptos.
Métricas de similitud, algoritmos, enfoques jerárquico, particional,
incremental
Práctica
Presentación Proyecto final de curso
Géron, Aurélien (2019) Hands On Machine learning with scikit – learn, keras &
tensorflow. Concepts, tools and techniques to build intelligent systems.
Oreilly
Han, Jiawei.(2001). Data mining: Concepts and Techniques. Morgan Kaufman
Publishers
Kantardzic, Mehmed. (2003). Data Mining concepts, models, methods and
techniques.
Wiley-Interscience.
Margaret H. Dunham.(2003). Data Mining: Introductory and Advanced
Topics. Prentice
Hall.
Michael J.A. Berry, Gordon S. Linoff. (2004). Data Mining Techniques For
Marketing,
Sales, and Customer Relationship Management. Second Edition. Online.
Witten, Ian H. (2011). Data mining : practical machine learning tools
and techniques
Morgan Kaufmann,