Diseño Físico. domingo 3 de junio de 2012

Documentos relacionados
Beneficios y Ventajas del Particionado de Datos con SQL Server 2005 Enterprise Edition. Copyright 2008, Solid Quality Mentors. All rights reserved.

Taller 2.2: La calidad de los datos, limpieza y anonimización

Integridad de datos. Integridad de entidad Integridad de dominio Integridad referencial Integridad definida por el usuario

Diseño e Implementación SQL Server

Tablas -SQL Curso Bases de Datos. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS

Bases de Datos Ejercicio Número 2 Bogotá, Diciembre 5 de 2013

DISEÑO FÍSICO. Tema 14. Diseño Físico

Capítulo 1: Modelo conceptual

Administración de Sistemas Gestores de Bases de Datos. Tema 5. Optimización y monitorización. Profesor: Juan Ignacio Contreras 1

Introducción a SQL (DDL)

Inteligencia de Negocios

Gestión de índices. José Manuel Gómez. Departamento de Lenguajes y Sistemas Informáticos

BASES DE DATOS RELACIONALES

3- Uso de índices y relaciones de tablas

Tarea del 12 de enero de Tarea del 19 de enero de Crear su página web. Por ejemplo, en jimdo.com

La eficacia, representación fiel de la realidad, se consigue a través de un buen diseño lógico global de la base de datos

SQL Sintaxis. Ejemplo de Alumno, Curso, Profesor. Esquemas de Alumno, Curso, Profesor. Andrés Moreno S.

Una base de datos tiene un nombre de base de datos, nombre de la tabla, index, columnas y alias en la tabla siguiente le da información

Sistemas de Bases de Datos II ITS / ITSB EMT CETP 2010

SQL Sintaxis. OpenOffice. Ejemplo de Alumno, Curso, Profesor. Ejemplo de Alumno, Curso, Profesor. Andrés Moreno S. Nombre. Apellido. RutAlumno.

Carga y Mantenimiento de DW

2. Creación de tablas, campos, índices, relaciones, restricciones y tipos de datos.

Bases de datos. Modelos de datos. Modelo Relacional. Transformación ERE-Relacional Lenguaje de consulta SQL

UNIDAD III. CICLO DE VIDA DE UNA BASE DE DATOS.

Asignatura: Administración de Bases de Datos

Administración de Bases de Datos

Modelamiento y Gestión de Base de Datos

Asignatura: Administración de Bases de Datos

D. D. L. Sistemas de Bases de Datos II EMT CETP 2016 Leonardo Carámbula

TIPOS DE DATOS POSTGRESQL 8.4.8

SECUENCIA DIDÁCTICA. Módulo IV Competencia de Módulo: atendiendo los requerimientos de la organización. Elementos de competencia:

DIPLOMADO EN MICROSOFT SQL SERVER 2008

Raúl Saráchaga. Explorando los sabores de Azure Data Warehouse

Sistemas de Archivos Implementación. Módulo 11. Departamento de Ciencias e Ingeniería de la Computación Universidad Nacional del Sur.

Tutorial MySql - 1 -

Curso Developing Microsoft SQL Server 2014 Databases (20464)

Objetivos: Descripción del curso. Curso: Dirigido a: INTRODUCCIÓN A SQL - ORACLE UNIVERSIDAD NACIONAL DE INGENIERÍA

TEMA 6: LENGUAJE DE DEFINICIÓN DE DATOS (LDD)

Organización y acceso a los datos (continuación)

INFORMÁTICA MÉDICA. Profesor: MsC. Liz Armenteros Chávez

Grandes volúmenes de datos Particionamiento. bases de datos

TEMA 6: LENGUAJE DE DEFINICIÓN DE DATOS (LDD)

Unidad 5. Lenguaje Estructurado de Consultas SQL

Puesta en marcha de una base de datos

Definición. Tema 1: Introducción

Proyecto 1 BASE DE DATOS SQL Server y MySQL

EL ALMACENAMIENTO DE LA INFORMACIÓN

Modulo I: Introducción Gestores de Bases De Datos

Organización física de las bases de datos T

FUNDAMENTOS DE BASE DE DATOS. Introducción

CI2355 Almacenes de datos y OLAP

BUSQUEDA SECUENCIAL Y DIRECTA, MARCELA MARQUEZ REBECA NAVARRO FONSECA GUADALUPE RUIZ ANGULO JONATHAN ALEXIS TOPETE ESTRUCTURA Y OPERACIONES

Tema 3. Dpto. de Métodos Cuantitativos e Informáticos Facultad de Ciencias de la Empresa. UPCT. Tema 3

SQL. Structured Query Language

Tipos de datos en SQL. SQL. DDL (Data Definition Language) CREATE DOMAIN CREATE TABLE CREATE TABLE. CREATE TABLE con restricciones de atributo

Introducción a SQL 14/11/2012. Introducción a SQL

Bases de datos relacionales y SQL

Guía N 3 Tema: Modelo Relacional

Gestión de la Información Práctica 1

Administración de sistemas gestores de bases de datos

Consideremos el siguiente ejemplo que crea y se inserta en las tablas que definen la identidad basada en la clave principal como un índice agrupado:

Oracle Express y Toad for Oracle

PROGRAMA. Los objetivos de la materia son que el alumno al finalizar el cursado haya aprendido a:

Bases de datos relacionales y SQL

MS_20464 Developing Microsoft SQL Server Databases

GUÍA DE TRABAJO N 5 GRADO 11 Programación y Diseño de Articulación SENA Software Ing. Néstor Raúl Suarez Perpiñan Página 1 de 6

Diseño Físico. Diseño de Bases de Datos Relacionales Curso 2011/2012. Sergio Ilarri

Índice. Diseño Físico. Objetivo del Diseño Físico. Introducción

GUÍA DE TRABAJO N 7 GRADO 11. Ing. Néstor Raúl Suarez Perpiñan Página 1 de 6 GUIA N 7 COMANDOS MYSQL II. CREAR UNA TABLA

José Manuel Gómez. Departamento de Lenguajes y Sistemas Informáticos.

INDICE 1. Introducción: Archivos y Estructuras de Archivos 2. Operaciones Fundamentales para el Procesamiento de Archivos

ÍNDICE INTRODUCCIÓN...17

ÍNDICE. Introducción... Capítulo 1. Características, instalación, inicio y entorno de trabajo... 1

3. Base de datos Relacional: MySQL

Universidad de Ciencias Empresariales y Sociales

LABORATORIO 2. SQL SERVER - BASE DE DATOS SECRETARIA DE GOBIERNO

Configuración de MySQL con NetBeans

Organización de PostgreSQL. Manejo de Usuarios. Herramientas para Desarrollo

MSSQL 2014 Virtualmente todos los tipos de datos

Inteligencia de Negocios

Bodegas de Datos y OLAP. Introducción a la Bodegas de Datos

1 2 3 ( /! 3 ) +, 1& 3 0))) % &! ( ) +,. / & 0)))

Gestión de archivos. Gestión de archivos

Gestión de archivos. Gestión de archivos. Gestión de archivos. Objetivo general

Asegurando la Calidad del Dato en nuestros entornos de BI

Departamento de Lenguajes y Sistemas Informáticos

La madurez analítica y el impacto en las organizaciones

1. OBJETIVO Definir los estándares que permitan la configuración y administración de objetos en la Base de Datos.

SQL - DDL y consultas de actualización. José Muñoz Jimeno Febrero 2015

Sistemas de Información para la Gestión

Modelo Relacional Larry Ellison:

INSTALACIÓN DE SQL SERVER Y CREACIÓN DE BASE DE DATOS

20464 Desarrollo de bases de datos Microsoft SQL Server 2014

FROM tabla1 { INNER LEFT RIGHT } JOIN tabla2 ON tabla1.campo1 = tabla2.campo2: Relaciona los registros de la tabla1 con los de la tabla2 (que también

1. Se usará la Base de Datos llamada. 2. Borrar la tabla CtasBanc anterior y crearla: 5.1 Procedimientos y Funciones Almacenados SQL Server

Gestión de datos y visualización de bases de datos ambientales

Índices Curso de Bases de Datos

Base de Datos TALLER PARA EL CENEVAL. Elaboro Ma Carmen Jiménez

Técnicas Informáticas Diplomatura en Gestión y Administración Pública

Transcripción:

Diseño Físico. 1

Diseño físico. - Disminuir tiempos de respuesta. - Minimizar espacio de almacenamiento. - Evitar Reorganizaciones. - Optimizar el consumo de recursos. - Proporcionar la máxima seguridad. 2

Estrategias. - Inflexibilidad (lógica/física). - Flexibilidad (Administrador). - Hibrido. (incremental) 3

Organización de ficheros - Secuencial. - HASH. (tabla indexada). - ISAM (Patrones de búsqueda). - Arbol B+. 4

Indices. - Indexar clave primaria con un indice único. - Indexar FK. - Indexar atributos consultados frecuentemente. - No indexar tablas pequeñas. - No indexar tablas que se recorrerán secuencialmente. - No indexar atributos de tipo carácter muy largos. 5

Agrupamiento. - Clave de agrupamiento. - Consulta simultánea. - Empeora de forma separada.! 6!

Indexar (B-tree) - Clustered no clustered.(agrupados, no agrupados). - Identity (sql server) (agrupado). - Combinaciones (pk compuesta). - Dimensión degenerada. - Crear 1 columna (echos,fact_key). - Unique (sql server) estructuras mas eficientes. - Mantencion de indeces (degradación). 7

CREATE TABLE dbo.personas( PersonID smallint PRIMARY KEY NONCLUSTERED, Nombre varchar(39), Apellido varchar(40), NumDocumento char(11) UNIQUE CLUSTERED ) 8

create TIPODEINDICE index NOMBREINDICE on TABLA(CAMPO); create unique clustered index I_libros_codigo on libros(codigo); create nonclustered index I_libros_titulo on libros(titulo); create index I_libros_autoreditorial on libros(autor,editorial); 9

Arquitectura 10

Espacio Table 6-1. Disk Space Calculation Required Actual Volume Size (GB) RAID Level No. of Disks Size (GB) Data 1-6 1479 6 RAID 5 6 4 6 399 Log 1-4 200 4 RAID 1 4 2 4 133 TempDB 100 RAID 1+0 4 1 133 Quorum 10 RAID 1 2 1 133 Backup 2200 RAID 5 1 18 2261 File system 600 RAID 5 1 6 665 OLAP 1-4 1600 RAID 5 4 5 4 532 Total 82 8246 11

Calculo estimativo - Ej Tabla de echos columnas: - 8 tipo integer. - 1 tipo decimal. - 10 tipo money. - 3 tipo datetime. - Integers 4 bytes. - decimals 5 bytes. - Money 8 bytes. - Datetime 8 bytes. 8x4 +1x5 + (10+3)x8= 141 bytes + 50% = 212bytes. Promedio de ventas 600.000 diarias. 600.000 x 365 x 2 x 212 bytes = 86 gb. 12

Particionamiento. - Objetos que se pueden particionar: - Tablas, Indices, Vistas indexadas. - Vertical. - Horizontal (ambiente distribuido). - Vistas particionadas. 13

Particionamiento. 14

Particionamiento. 15

Particionado.!"#$" ID c1 c2 c3 c4 1 3 A 2 5 B 3 2 B 4 1 L 5 5 Y 6 5 A 7 2 F Función de particionado 3 5 2 1 5 5 2 Esquema de particionado Filegroup1 Filegroup2 Filegroup1 Filegroup4 Filegroup2 Filegroup2 Filegroup1 16

CREATE PARTITION FUNCTION pfn (int) AS RANGE LEFT FOR VALUES (10, 30, 50) CREATE PARTITION SCHEME p_schema AS PARTITION pfn TO ([FG1], [FG2], [FG3], [FG4]) CREATE TABLE Emplados ( EmpId int, EmpNombre varchar(50) ) on p_schema (EmpID); FG1 FG2 FG3 FG4 10 30 50 17

Calidad de datos DW 18

Introducción - Concepto de calidad de datos. - Problemas y consecuencias. - Causas de la mala calidad. 19

Datos. - Representan objetos del mundo real en un formato que puede ser: - Almacenado, recuperado y elaborado, - Comunicado a través de una red. - Recurso: - Toma de decisiones. - Guía de procesos. - Registro de historia de actividades de la empresa. 20

Datos - Clasificación: - Representación. - Estructurado, semi-estructurado,no-estructurado. - Visión de dato como producto. - Datos brutos, ítems, información. - Complejidad. - Elemental, agregado. 21

Datos Representación Interpretación 22

Debido a que las definiciones son producto de un pensamiento formal y rígido, la calidad no puede ser definida. Robert Pirsig. 23

Calidad - Calidad de información: - Excelencia / Valor. - Adecuación para su su uso. - Alcanzar o exceder expectativas del consumidor. - Calidad de información / Datos es subjetiva. - Depende del contexto, el consumidor, etc. 24

Calidad de datos - Según el consumidor: - Que sean relevantes para su uso. - Que sean correctos y sin inconsistencias. - Que sean lo más actualizados posibles. - Que se accedan adecuadamente. 25

Cod. Titulo Director Año Cant. Remakes Ultimo año de remake 1 Casablanca Weir 1942 3 1940 2 La sociedad de los poetas muertos Curtiz 1989 0 null 3 Supermn Donner 1978 0 2010 4 Indiana Jones null 1980 0 null Error de digitación Nombres Intercambiados Inconsistencia Desactualizado Incompleta Inconsistencia 26

Problemas de calidad. - Datos incorrectos. - Datos Inconsistentes con la realidad. - Datos inconsistentes entre si. - Datos desactualizados. - Información incompleta. - Datos poco confiables debido a su fuente. 27

Consecuencias. - Eficiencia y efectividad en organizaciones y negocios. - EEUU: - Más de 35% de los proyectos de TI fracasan debido a mala calidad de datos. - Servicios de correo: de 100.000 unidades de correspondencia, 7.000 no llego a destino por direcciones incorrectas. - Problemas de calidad de datos le cuestan a los negocios del país, más de 600 billones de dólares por año. 28

Consecuencias - Entregas a clientes en forma tardía o equivocada. - Errores en el cobro a clientes. - Clientes duplicados (varios sistemas, actualizados por distintos procedimientos). - Errores médicos. - Problemas de implementación de nuevos sistemas de información. 29

Causas. - Producción de los datos. - Recolección de datos mediante ingreso humano. - Problemas sistemáticos con la recolección de datos. - Diferentes fuentes con representaciones diferentes del mismo objeto de la realidad. - No mantenimiento al día de los datos. 30

Causas - Almacenamiento: - Formatos diferentes. - Ausencia de formatos definidos. 31

Causas - Utilización: - Capacidad de análisis y procesamiento insuficiente. - Cambios en los requerimientos de calidad. - Problemas de seguridad y acceso. 32

Gestion de la Calidad Medición de calidad Estimación de calidad Monitoreo de calidad Detección de cambios Análisis de causas de mala calidad Corrección de los datos 33 Reestructuración del sistema

Limpieza de datos Análisis estadístico de datos Integración de datos Calidad de datos Data mining DWH Representación del conocimiento