Periodo académico 2023-1S

(010867) DATA VISUALIZATION & DATA ANALYSIS - FCNI

Datos generales

Grupos

Tabla información sobre los grupos de la asignatura
Actividad Grupo Periodos Horarios Aula Profesor/Tutor
CLASE PRÁCTICA - VIRTUAL (1) - CLASE PRÁCTICA VIRTUAL- GRUPO.1 - BOGOTÁ 23/01/2023 - 15/05/2023 LUNES 09:00 - 11:00 - JAVIER RIASCOS OCHOA
MIGUEL ANGEL PINZÓN BUITRAGO
(2) - CLASE PRÁCTICA VIRTUAL- GRUPO 2 - BOGOTÁ 23/01/2023 - 15/05/2023 LUNES 11:00 - 13:00 - JAVIER RIASCOS OCHOA
MIGUEL ANGEL PINZÓN BUITRAGO
(3) - CLASE PRÁCTICA VIRTUAL- GRUPO 3 - BOGOTÁ 23/01/2023 - 15/05/2023 LUNES 11:00 - 13:00 - ORLANDO AYA CORREDOR
(4) - CLASE PRÁCTICA VIRTUAL- GRUPO 4 - BOGOTÁ NOCTURNO 23/01/2023 - 15/05/2023 LUNES 18:00 - 20:00 - VEIMAR DANIEL REY CASTILLO
(5) - CLASE PRÁCTICA VIRTUAL- GRUPO 5 - BOGOTÁ NOCTURNO 23/01/2023 - 15/05/2023 LUNES 18:00 - 20:00 - MARCELA DIAZ OSORIO

Contenidos

PROGRAMA DE LA ASIGNATURA

Presentación

El conocimiento moderno reconoce la importancia de los datos como fuente de producción de ideas y el planteamiento de conjeturas acerca de cómo es la realidad. En este sentido resulta importante entender cómo se extrae valor de fuentes de datos, en especial de aquella que contienen grandes cantidades de información, visualizar de una manera práctica lo que se puede esconder en los mismos y calcular e interpretar diferentes mediciones sobre los mismos que permitan comunicar hallazgos interesantes. Es por eso por lo que se plantea un curso de visualización y análisis de datos en el que los estudiantes sean capaces de hacer una lectura analítica de información numérica y gráfica, de crear representaciones gráficas propias a partir de datos estructurados. Se propone un trabajo basado en estudio de casos reales, cercanos a la realidad de los estudiantes y a sus intereses profesionales, con el que se pueda comprender y dar significado a conceptos básicos y habituales en la divulgación de información tales como porcentajes, promedios, desviaciones, casos per cápita, probabilidades y tendencias.

Objetivo de Aprendizaje

Crear visualización, mediciones numéricas de conjuntos de datos estructurados para extraer conclusiones y mejorar el conocimiento de fenómenos relacionados con la agroecología, la biología, la ingeniería, el modelado y la simulación.

Contenidos Temáticos

1. Introducción a bases de datos estructurados. Archivos separados por comas, Hojas de cálculo: Google Sheets y Excel
2. Tablas y gráficos dinámicos. Tabulación automática de la información y generación de medidas numéricas de resumen.
3. Introducción a Google Colaboratory y el concepto de Máquina virtual
4. Introducción a la librería Pandas de Python
5. Exploración de un Data Frame
6. Filtros por casos y por variables en un Data Frame
7. Consultas básicas con Pandas
8. Estadísticas básicas
9. Agrupación de casos
10. Visualización de datos con Matplotlib
11. Construcción de gráficos por agrupación de variables
12. Gráficos de dispersión con Matplotlib
13. Visualización de datos con Seaborn – Strips, Heat maps – Boxes – Pair plots

Evaluación Formativa

 Esta es una clase que es ciento por ciento práctica y que se desarrolla en salas de cómputo en todas sus sesiones.
 Se utilizan herramientas gratuitas en la nube que no requieren la instalación de programas on premise a excepción de la Suite de Office con la que cuenta la Universidad.

Bibliografía Básica Obligatoria

Libro de acceso gratuito: González, L. Análisis Exploratorio de datos. Editorial Utadeo. 2018.
Fuentes de información recomendadas:
https://www.kaggle.com/nicholasjhana/energy-consumption-generation-prices-and-weather
https://www.kaggle.com/jennlsmith/biodiversity-by-county
https://www.kaggle.com/zhangjuefei/birds-bones-and-living-habits
https://www.kaggle.com/shivamb/netflix-shows



Carrera 4 # 22-61 Teléfono: (+57 1) 242 7030 - 018000111022 Fax: (+57 1) 561 2107 Bogotá D.C., Colombia
Institución de Educación Superior sujeta a inspección y vigilancia por el Ministerio de Educación Nacional.