Datos generales
- Plan de estudios: 0330 - ESP. DESARROLLO DE BASES DE DATOS. 2014-2S
- Créditos: 2.0
Grupos
Tabla información sobre los grupos de la asignatura
Actividad |
Grupo |
Periodos |
Horarios |
Aula |
Profesor/Tutor |
SALAS ESPECIALIZADAS CÓMPUTO |
(1) - NO REQUIERE ESPACIO - GRUPO 1 - BOGOTÁ |
10/09/2019 - 22/10/2019 |
MARTES 18:30 - 21:30 |
- |
- |
JUEVES 18:30 - 21:30 |
- |
- |
Contenidos
PROGRAMA DE LA ASIGNATURA
Presentación
Las Bases de Datos Relacionales (BD) se consideran una tecnología genérica, y su éxito se evidencia en la utilización de las mismas. Prácticamente todas las actividades económicas requieren el procesamiento de información. Sin embargo, el auge en el uso de Internet desde el principio de este siglo, y otros factores como el uso de dispositivos que generan datos todo el tiempo, ha creado desafíos en tres dimensiones: volumen, velocidad y variedad (denominados las tres Vs).
El volumen es un factor clave ya que en el mundo se generan 2.5 quintillones de bytes de datos diariamente. Debido al incremento en el volumen de datos que se están generando (sobre todo de forma automatizada), el 90% de los datos que existen en el mundo han sido creados en los últimos 2 años. La velocidad se debe a que es necesario procesar flujos de datos (streams) sin demora y de forma confiable (por ejemplo, para detectar fraude en las transacciones de las tarjetas de crédito).
La variedad se refiere al hecho que los datos generados hoy-en-día son cada más heterogéneos y complejos: comprenden texto libre, datos semi-estructurados, BD relacionales e incluso flujos de video.
Las herramientas convencionales, aunque siguen siendo vigentes para la mayoría de los casos de uso, se ven limitadas ante semejantes desafíos.
Objetivo de Aprendizaje
En este curso, la primera parte está dedicada a temas avanzadas de BD relacionales, en especial las distribuidas. La segunda parte del mismo se dedica familiarizar a los estudiantes con las denominadas tecnologías Big Data y NoSQL, que representan un nuevo paradigma en el procesamiento de la información.
Al finalizar la asignatura el estudiante debe estar en capacidad de:
- Identificar, proponer y emplear factores involucrados relacionados con las arquitecturas de las BDs distribuidas, la fragmentación de datos, la optimización de consultas, y la integración de datos.
- Apreciar las ventajas y limitaciones tanto como de las BD relacionales como las tecnologías NoSQL.
- Desarrollar una sensibilidad de la diversidad de aplicaciones de procesamiento de datos que han surgido en los últimos años, y sus requerimientos no funcionales, como la escalabilidad y la disponibilidad.
- Desarrollar nociones para determinar en cuáles casos es más apropiada la tecnología tradicional, relacional, o la tecnología NoSQL.
- Realizar prácticas en el laboratorio usando herramientas disponibles en el mercado y de código abierto.
Contenidos Temáticos
PARTE I: BD RELACIONALES DISTRIBUIDAS
Evaluación Formativa
Aspectos a evaluar:
- Identificación y apropiación conceptual de los temas relacionados con las arquitecturas de las BDs distribuidas, la fragmentación de datos, la optimización de consultas, y la integración de datos
- Conocimiento y comprensión de aspectos básicos inherentes de las tecnologías Big Data y NoSQL
- Capacidad de desarrollar aplicaciones de procesamiento de datos usando herramientas NoSQL
Bibliografía Básica Obligatoria
- Tamer Özsu, M., & Valduriez, P. (2011). Principles of distributed database systems. Springer.
- Ullman, J. D., Garcia-Molina, H., & Widom, J. (2001). Database systems: the complete book. Upper Saddle River: Prentice Hall.
- Kossmann, D. (2000). The state of the art in distributed query processing. ACM Computing Surveys (CSUR), 32(4), 422-469.
- DeCandia, G., Hastorun, D., Jampani, M., Kakulapati, G., Lakshman, A., Pilchin, A., ... & Vogels, W. (2007, October). Dynamo: Amazon¿s highly available key-value store. In SOSP (Vol. 7, pp. 205-220).
- Ghemawat, S., Gobioff, H., & Leung, S. T. (2003, October). The Google File System. In ACM SIGOPS Operating Systems Review (Vol. 37, No. 5, pp. 29-43). ACM.
- Pritchett, D. (2008). BASE: An ACID alternative. ACM Queue, 6(3), 48-55.
- Dean, J., & Ghemawat, S. (2010). MapReduce: A flexible data processing tool. Communications of the ACM, 53(1), 72-77.
- Ian Robinson, Jim Webber, Emil Eifrem (2013). Graph Databases. O¿Reilly.