Periodo académico 2023-1S

(010684) CIENCIA DE LOS DATOS APLICADA

Datos generales

Grupos

Tabla información sobre los grupos de la asignatura
Actividad Grupo Periodos Horarios Aula Profesor/Tutor
CLASE VIRTUAL (P-1BG) - CLASE VIRTUAL - GRUPO 1 - BOGOTÁ 21/03/2023 - 02/05/2023 MARTES 18:30 - 21:30 - -
(P-3SM) - CLASE VIRTUAL - GRUPO 3 - SANTA MARTA 21/03/2023 - 02/05/2023 MARTES 18:30 - 21:30 - -
SALAS ESPECIALIZADAS DE CÓMPUTO (P-1BG.1) - SALAS ESPECIALIZADAS DE CÓMPUTO - GRUPO 1.1 - BOGOTÁ 18/03/2023 - 18/03/2023 SÁBADO 11:00 - 14:00 AULA WINDOWS - 306 - M2 -
25/03/2023 - 25/03/2023 SÁBADO 11:00 - 14:00 AULA WINDOWS - 306 - M2 -
01/04/2023 - 01/04/2023 SÁBADO 11:00 - 14:00 AULA WINDOWS - 306 - M2 -
15/04/2023 - 15/04/2023 SÁBADO 11:00 - 14:00 AULA WINDOWS - 306 - M2 -
22/04/2023 - 22/04/2023 SÁBADO 11:00 - 14:00 AULA WINDOWS - 306 - M2 -
29/04/2023 - 29/04/2023 SÁBADO 11:00 - 14:00 AULA WINDOWS - 306 - M2 -
(P-3SM.1) - SALAS ESPECIALIZADAS DE CÓMPUTO - GRUPO 3.1 - SANTA MARTA 18/03/2023 - 18/03/2023 SÁBADO 11:00 - 14:00 - -
25/03/2023 - 25/03/2023 SÁBADO 11:00 - 14:00 - -
01/04/2023 - 01/04/2023 SÁBADO 11:00 - 14:00 - -
15/04/2023 - 15/04/2023 SÁBADO 11:00 - 14:00 - -
22/04/2023 - 22/04/2023 SÁBADO 11:00 - 14:00 - -
29/04/2023 - 29/04/2023 SÁBADO 11:00 - 14:00 - -

Contenidos

PROGRAMA DE LA ASIGNATURA

Presentación

En la actualidad y en el futuro, los datos que almacenan las organizaciones crecen de manera importante, provienen de diferentes fuentes, y se distribuyen en distintos formatos y presentaciones, ya sea internas o externas, propios o de terceros, resultandos diferentes en estructura y contenido.
Esta revolución basada en los datos, toca a nuestras puertas y tenemos la oportunidad de comprender y aplicar las técnicas mas utilizadas por empresas como Google, Facebook, Netflix, Amazon, en nuestro entorno corporativo, negocios y emprendimientos.
De ahí que sea importante conocer los métodos y técnicas para encontrar información en estos datos que aunque no sean evidentes, pueden ser de gran valor La Ciencia de datos es entonces un enfoque en el que se reúne la estadística, algoritmia, aprendizaje de máquina, bases de datos, programación, que nos permite implementar soluciones de perfilamiento, predictivas basadas en datos siempre para mejores decisiones.

Objetivo de Aprendizaje

Al finalizar las sesiones del curso el alumno conocerá, aprenderá e implementará algunas de las técnicas mas importantes para analizar datos provenientes de bodegas y bases de datos, utilizando para ello modelos de estadística y aprendizaje maquinal, con el fin desarrollar aplicaciones que apoyen la toma de decisiones.

Contenidos Temáticos

Semana 1
Introducción a ciencia de datos
Conceptos, Metodología, Aplicaciones
Introducción/nivelación Python, anaconda
CRISP – DM Proceso de ciencia de datos Marco para la ejecución de proyectos de DS
Semana 2
Análisis exploratorio
Medidas de tendencia central, concentración, curtósis, asimetría
Gráficas
Prueba de hipótesis
Practica.
Semana 3
Preparación de datos
Acceso a bases de datos
Tratamiento de Valores faltantes
Ruido
Transformación de datos
Práctica
Semana 4

Análisis de canasta
Conceptos y taller práctico sistema recomendación
Predicción
Regresión lineal
Correlación
Inferencia
Semana 5 Árboles de decisión y bosques aleatorios
Entrenamiento, prueba, validación y despliegue de modelo
Práctica
Semana 6
Segmentación
Conceptos.
Métricas de similitud, algoritmos, enfoques jerárquico, particional, incremental
Práctica
Presentación Proyecto final de curso

Evaluación Formativa

• La evaluación del curso engloba los distintos saberes, aptitudes, actitudes que se evidenciarán a través de:
• Desarrollo de talleres prácticos en clase y extraclase.
• Participación en foros
• Participación y comunicación en clase
• Implementación de proyecto final de curso

Bibliografía Básica Obligatoria

Géron, Aurélien (2019) Hands On Machine learning with scikit – learn, keras &
tensorflow. Concepts, tools and techniques to build intelligent systems. Oreilly
Han, Jiawei.(2001). Data mining: Concepts and Techniques. Morgan Kaufman
Publishers
Kantardzic, Mehmed. (2003). Data Mining concepts, models, methods and techniques.
Wiley-Interscience.
Margaret H. Dunham.(2003). Data Mining: Introductory and Advanced Topics. Prentice
Hall.
Michael J.A. Berry, Gordon S. Linoff. (2004). Data Mining Techniques For Marketing,
Sales, and Customer Relationship Management. Second Edition. Online.
Witten, Ian H. (2011). Data mining : practical machine learning tools and techniques
Morgan Kaufmann,



Carrera 4 # 22-61 Teléfono: (+57 1) 242 7030 - 018000111022 Fax: (+57 1) 561 2107 Bogotá D.C., Colombia
Institución de Educación Superior sujeta a inspección y vigilancia por el Ministerio de Educación Nacional.