Maestría en Bioinformática. Bases de Datos y Sistemas de Información. Bases de Datos. Ing. Alfonso Vicente, PMP alfonso.vicente@logos.com.

Documentos relacionados
Maestría en Bioinformática. Bases de Datos y Sistemas de Información. Diseño Lógico. Ing. Alfonso Vicente, PMP alfonso.vicente@logos.com.

BASES DE DATOS, MODELOS DE DATOS Y DBMS

Maestría en Bioinformática. Bases de Datos y Sistemas de Información SQL: DDL. Ing. Alfonso Vicente, PMP alfonso.vicente@logos.com.

[CASI v.0110] Pág. 1

CLOUD & BIG DATA. Trabajando el CLOUD, explotando BIG DATA. Cómo pueden ayudarnos estas tecnologías?. Convivimos con ellas?.

Créditos Participantes. Participantes en la Cátedra e investigadores del área de Sistemas Distribuidos

Big Data. Rodolfo Campos

Software Libre para Aplicaciones de Big Data

Introducción a los sistemas de bases de datos

Bases de datos NoSQL. Hugo González Noviembre 17, 2011

Base de datos relacional

Sistemas de Información II Tema 1. El enfoque de bases de datos

BASE DE DATOS RELACIONALES

Conceptos básicos Oracle 10g Introducción - Administración de Oracle - Orasite.com

1- UNIVERSIDAD DE CIENCIAS EMPRESARIALES Y SOCIALES FACULTAD DE CIENCIAS EMPRESARIALES. Tecnicatura en Programación de Sistemas

Tema 1. Conceptos básicos

Resumen. El rol del lenguaje SQL en los SGBDR y en la Relacional. cjimenez@inf.udec.cl, tamrstro@inf.udec.cl

UNIVERSIDAD SIMÓN BOLÍVAR Vicerrectorado Académico

T ema 2. S is tem as ges tores de bas es de datos

Introducción a los Sistemas de Gestión de Bases de Datos

1.1.- Objetivos de los sistemas de bases de datos Administración de los datos y administración de bases de datos Niveles de Arquitectura

BIG DATA. Jorge Mercado. Software Quality Engineer

Carrera: SCS Participantes. Representantes de la academia de sistemas y computación de los Institutos Tecnológicos.

Conectores Pentaho Big Data Community VS Enterprise

Tema 11 Bases de datos. Fundamentos de Informática

Introducción a Bases de Datos

Estructura de Bases de datos. Leonardo Víquez Acuña

IWG-101: Introducción a la Ingeniería. Departamento de Informática, UTFSM 1

BASES DE DATOS TEMA 1

Introducción. Campos de Aplicación SGBD. Índice. Aplicaciones Representativas. Aplicaciones Representativas

Bases de Datos Modelo Relacional

UNIVERSIDAD DE LOS LLANOS Facultad de Ciencias Básicas e Ingeniería Programa Ingeniería de Sistemas

DEPARTAMENTO: Computación y diseño NOMBRE DEL CURSO: Base de datos I CLAVE: ACADEMIA A LA QUE PERTENECE: Base de datos I

Carrera: SCS Participantes. Representantes de la academia de sistemas y computación de los Institutos Tecnológicos.


rg.o El l c i c c i l c o l o de d vi v d i a d a cm a l@ rza e de d u n u n si s s i t s e t ma m a de d in i f n or o ma m c a i c ó i n ó b

Carrera: IFM Participantes. Representantes de la academia de sistemas y computación de los Institutos Tecnológicos.

Petabytes de información: Repensando el modelamiento de base de datos. Ernesto Quiñones Azcárate Presidencia Apesol

República Bolivariana de Venezuela Ministerio Popular de Educación y Deportes UNEFA Cátedra: Base de Datos Unidad I. Introducción

QUÉ ES UNA BASE DE DATOS Y CUÁLES SON LOS PRINCIPALES TIPOS? EJEMPLOS: MYSQL, SQLSERVER, ORACLE, POSTGRESQL, INFORMIX (DV00204A)

PostgreSQL Una Alternativa de DBMS Open Source. Humberto Espinoza Gerente de Soporte

CURSOS Y DESCRIPCIÓN / ADMINISTRACIÓN DE BASE DE DATOS

SYLLABUS. NUMERO DE ESTUDIANTES: NÚMERO DE CREDITOS: Tres (3) TIPO DE CURSO: TEÓRICO ( ) PRACTICO ( ) TEO-PRAC (X)

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES ACATLÁN LICENCIATURA EN MATEMÁTICAS APLICADAS Y COMPUTACIÓN

Bases de Datos Sistemas gestores de bases de datos (DBMS)

UNIVERSIDAD NACIONAL DE INGENIERÍA CENTRO DE EXTENSIÓN Y PROYECCIÓN SOCIAL AREA DE CURSOS DE ESPECIALIZACIÓN EN TECNOLOGÍAS DE LA INFORMACIÓN

UNIVERSIDAD RICARDO PALMA FACULTAD DE INGENIERIA EAP INGENIERIA INFORMATICA. Ciclo Académico 2003 II SILABO

acenswhitepapers Bases de datos NoSQL. Qué son y tipos que nos podemos encontrar

Las bases de datos pueden dividirse en dos grupos, considerando su función primordial, a saber:

ADMINISTRACIÓN DE BASES DE DATOS DISTRIBUIDAS

Universidad de Cantabria

TEMA 5.- ESTRUCTURA DE DATOS RELACIONAL.

Bases de Datos. Sistemas de Gestión de Bases de Datos

SISTEMA DE GESTIÓN DE BASE DE DATOS (Database Management System (DBMS))

Arquitectura de sistema de alta disponibilidad

HOJA DE ASIGNATURA CON DESGLOSE DE UNIDADES TEMÁTICAS

Diseño de Bases de Datos

CARTA AL ESTUDIANTE. EIF211: Diseño e Implementación de Bases de Datos EIF212: Sistemas Operativos

Es una colección de datos operativos almacenados y utilizados por los programadores de aplicaciones y por usuarios finales de muy diversa índole!

Ernesto Quiñones A.

Capítulo 1: Introducción a los Sistemas de Gestión de Bases de Datos (SGBD)

Adquisición y Procesamiento de la Información

IN ST IT UT O POLIT ÉCN ICO N A CION A L SECRETARÍA ACADÉMICA DIRECCIÓN DE ESTUDIOS PROFESIONALES EN INGENIERÍA Y CIENCIAS FÍSICO MATEMÁTICAS

Unidad I: Sistemas Gestores de Bases de Datos. 1.1 Objetivo de las Bases de Datos

1 Conceptos iniciales

ASIGNATURA: BASE DE DATOS II

Bases de Datos: Teoría General y Aplicaciones

UNIVERSIDAD DR. JOSE MATIAS DELGADO

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES ACATLÁN LICENCIATURA EN MATEMÁTICAS APLICADAS Y COMPUTACIÓN

Escuela de Ingeniería en Informática Empresarial SYLLABUS

Generaciones de Bases de Datos

Actualización de un Producto. Estandarizar el proceso de acompañamiento para la ejecución de un producto de software.

Guía de Laboratorio Base de Datos I.

El autor del presente documento lo ha publicado bajo las condiciones que especifica la licencia

Asignación de Procesadores

Maestría en Bioinformática. Bases de Datos y Sistemas de Información. Diseño Conceptual. Ing. Alfonso Vicente, PMP alfonso.vicente@logos.com.

SQL Server 2000 está diseñado para trabajar con dos tipos de bases de datos :

Alumna: Adriana Elizabeth Mendoza Martínez. Grupo: 303. P.S.P. Miriam De La Rosa Díaz. Carrera: PTB. en Informática 3er Semestre.

CAPÍTULO 5. DESARROLLO Y PRUEBAS

Microsoft SQL Server Conceptos.

INTRODUCCION. entidades. Modelo lógico de la base de datos. Matricula. carne. codigo_curso. año semestre nota. propiedades

Instituto Profesional DuocUC Escuela de Ingeniería Visión Global Plataforma Oracle

1

Registro y Comunicación Automatizada a Bases de Datos

Bases de Datos: Introducción

Fundamentos de la Inteligencia de Negocios

UNIVERSIDAD AUTÓNOMA DE CHIAPAS LICENCIATURA EN SISTEMAS COMPUTACIONALES

1 GLOSARIO. Actor: Es un consumidor (usa) del servicio (persona, sistema o servicio).

Big data A través de una implementación

PONTIFICIA UNIVERSIDAD JAVERIANA ANEXO 6: DOCUMENTACIÓN OBJETOS VIRTUALES DE APRENDIZAJE CREADOS Y SUS CORRESPONDIENTES ESPECIFICACIONES

GRID GRIDS. ING. DE INFORMACION II Ing. Alfredo Ramos

Sistema de Gestión de Proyectos Estratégicos.

Instituto Tecnológico Superior de Lerdo

IMPLEMENTACION DE SISTEMAS DE INFORMACION CONTABLE

UNIVERSIDAD ALBERT EINSTEIN FACULTAD DE INGENIERIA

Unidad didáctica 2: Metodologías de desarrollo de Bases de Datos. Unidad didáctica 1: Fase de análisis de requisitos Modelo E/R

DBMS (Data Base Management System) Un Sistema de Gestión de Base de Datos, consiste en una colección de datos interrelacionados y un conjunto de

Bases de Datos I Introducción

Universidad de Los Andes Escuela de Ingeniería de Sistemas Departamento de Computación. Tema 2. Los sistemas de gestión de bases de datos

Tabla de contenidos Historia del modelo ORDBMS Definición del modelo ORDBMS Descripción del modelo Sobre el diseño del

Transcripción:

Maestría en Bioinformática Bases de Datos y Sistemas de Información Bases de Datos Ing. Alfonso Vicente, PMP alfonso.vicente@logos.com.uy

Agenda Conceptos Historia Motivación Base de datos DBMS Tipos de DBMSs RDBMSs

Agenda Conceptos Historia Motivación Breve historia de la disciplina

Agenda Conceptos Historia Motivación Problemas Beneficios de usar un RDBMS Cuándo no usar un RDBMS

Agenda Conceptos Historia Motivación Base de datos DBMS Tipos de DBMSs RDBMSs

Conceptos Base de datos Un conjunto de datos relacionados entre sí y que tienen un significado implícito. Elmasri-Navathe base. ~ de datos. 1. f. Inform. Conjunto de datos organizado de tal modo que permita obtener con rapidez diversos tipos de información. Diccionario de la Real Academia Española Una colección de datos usualmente grande organizada especialmente para una rápida búsqueda y recuperación (como por una computadora) Merriam-Webster

Conceptos Base de datos Guía telefónica Fichas de biblioteca

Conceptos DBMS Siglas de DataBase Management System Software especializado en la gestión de Bases de Datos Diseñado para manejar de forma eficiente grandes volúmenes de datos

Conceptos Tipos de DBMSs Orientado a archivos

Conceptos Tipos de DBMSs Jerárquico

Conceptos Tipos de DBMSs Jerárquico

Conceptos Tipos de DBMSs De Red

Conceptos Tipos de DBMSs Relacional

Conceptos Tipos de DBMSs Relacional (Concepto de transacción y reglas ACID) Transacción: Unidad de trabajo que encapsula varias operaciones sobre una base de datos Atomicity: Una transacción es atómica (todo o nada) Consistency: Toda transacción deja a la base en un estado consistente (constraints) Isolation: Ninguna transacción intefiere con otra... aunque hay niveles aceptables (isolation levels) Durability: Toda transacción exitosa persiste aún ante caídas (no data-loss)

Conceptos Tipos de DBMSs Orientado a objetos

Conceptos Tipos de DBMSs Objeto/Relacional Su existencia se justifica por el éxito de la POO y de los DBMSs relacionales Los OODBMSs y ORDBMSs no tienen demasiado éxito en la industria, es más común el modelo RDBMS + ORM

Conceptos Tipos de DBMSs NoSQL, NoREL, NewSQL, BigData, Sistemas K-V Memcached, MapReduce, BigTable (Google), Cassandra (Facebook), Dynamo (Amazon), MongoDB, NuoDB, VoltDB (Stonebraker)...muchos más: http://nosql-database.org Surgen por la motivación de escalar bien manejando grandes volúmenes (petabytes) de información, utilizando para ello clusters con muchos hosts... pero no son ACID o o o The Google File System MapReduce: Simplified Data Processing on Large Clusters Bigtable: A Distributed Storage System for Structured Data

Conceptos ACID vs BASE La escalabilidad de nuevas tendencias mejora la disponibilidad y la performance, pero no es gratis: podemos a perder la C y la I de ACID? BASE es: Basically Available Soft-State Eventual Consistency Ejemplo: actualizaciones de estado en Facebook

Conceptos Teorema CAP (Consistency - Availability - Partition tolerance)

Teorema CAP en la práctica Conceptos CA (Consistency & Availability, no Partition tolerance) CP (Consistency & Partition tolerance, no Availability) Son el mismo caso, cuando en un sistema CA hay un particionamiento en la red se pierde la A, y un sistema CP sólo pierde la A cuando hay un particionamiento en la red. Es el caso más común, se prioriza la consistencia AP (Availability & Partition tolerance, no Consistency) Se prioriza la disponibilidad, y se tolera la "consistencia eventual": Facebook, Twitter, DNS

Conceptos RDBMSs Siguen vigentes debido a: o Su madurez y su amplia adopción en la industria o Su posibilidad de respetar las reglas ACID (cuando debemos priorizar la consistencia, queremos un sistema ACID y no BASE) o La madurez de las soluciones ORM (y a que los OODBMSs y ORDBMSs no prendieron en la industria) o Su soporte a nuevas necesidades (XML, datos geográficos, alta disponibilidad) Esto podría cambiar en los próximos 25 años: http://cswww.cs.yale.edu/homes/dna/papers/vldb07hstore.pdf

Agenda Conceptos Historia Motivación Breve historia de la disciplina

Historia Teoría, tecnología, lenguaje y disciplina han evolucionado juntas: Teoría: Modelos, reglas, isolation levels Tecnología: Implementaciones reales, mercado, mecanismos de locking Lenguaje: SQL, APIs (ODBC/JDBC/SQLJ/DBI), XQuery Disciplina: MER, normalización, patrones

Historia Edgar Codd (1923-2003) Es el Codd de la forma normal de Boyce- Codd, y del Teorema de Codd ("el poder expresivo del AR es igual al de las consultas seguras del CR") 1970: A Relational Model of Data for Large Shared Data Banks 1979: Extending the Database Relational Model to Capture More Meaning 1985: Las 12 reglas de Codd

Michael Stonebraker (1943) Historia 40 años demostrando cómo implementar DBMSs: Ingres Postgres Illustra Mariposa Aurora C-Store Morpheus H-Store Sci-DB (1973) (1985) (1997, Informix, IBM) / Cohera (2001, Peoplesoft, Oracle) / Streambase (2003) / Vertica (2005) / Goby (2006) / VoltDB (2007) (2008)

Historia Donald Chamberlin (1944) y Raymond Boyce (1947 1974) Lenguaje declarativo basado en álgebra / cálculo relacional 1974: SEQUEL: A Structured English Query Language 80 s: SQL es un estándar de facto 1986: Estándar ANSI 1987: Ratificado por ISO Compliance: ANSI/ISO SQL:92, SQL:1999, SQL:2003, SQL:2006, SQL:2008 Dialectos, extensiones procedurales, XQuery

Historia Peter Chen (?) Inicia el "modelado conceptual" 1976. 2002. The Entity-Relationship Model-- Toward a Unified View of Data Entity-Relationship Modeling-- Historical Events, Future Trends, and Lessons Learned

Agenda Conceptos Historia Motivación Problemas Beneficios de usar un RDBMS Cuándo no usar un RDBMS

Motivación Problemas Imaginemos un SI de un banco que necesita: Restricciones de integridad (movimientos de una cuenta) Consistencia de transacciones (transferencia) Fácil acceso a los datos (reporte de saldos) Seguridad en el acceso a los datos (permisos, auditoría) Alta disponibilidad Recuperabilidad

Beneficios de usar un RDBMS Motivación Tipado de datos, NOT NULL, Primary Keys, Foreign Keys, Checks Soporte de transacciones ACID (commit, rollback), control de concurrencia (mecanismos de locking) Lenguaje SQL, APIS como ODBC y JDBC Mecanismo estándar de autorización Log transaccional: Crash Recovery, Point-In-Time Recovery Soluciones de alta disponibilidad (clusters, hot-standby)

Motivación Cuándo no usar un RDBMS, respuestas clásicas: Inversión en hardware y software - Hay RDBMSs gratuitos con un footprint muy bajo Inversión en capacitación técnica - La alternativa no la necesita? Costo de administración del DBMS - Depende de la complejidad del desarrollo, podría funcionar totalmente desatend Overhead (permisos, control de concurrencia) - En un SI simple y monousuario puede utilizar una planilla

Motivación Cuándo no usar un RDBMS, mejores respuestas: Sistema muy simple, monousuario, no mantiene datos Sistema documental, de expedientes: hay alternativas especializadas Gran volumen de datos (petabytes) y necesidad de performance extrema: hay alternativas especializadas (BigData), pero aún es una opción a evaluar