Webir /09/2014
|
|
- Gonzalo Coronel Pereyra
- hace 8 años
- Vistas:
Transcripción
1 Webir /09/2014
2 Temas Recuperación tolerante a errores de ortografía y otras inconsistencias Construcción de índices 2
3 Búsquedas con Comodines mon* - árbol de búsqueda para las palabras del vocabulario *mon - árbol de búsqueda invertido se*mon - mediante ambos árboles 3
4 Búsquedas con Comodines Caso general Indice Permuterm Consulta m*n buscar n$m* Indice k-gram $castle$: $ca, cas, ast, stl, tle, le$ Consulta re*ve buscar $re AND ve$ hello$ ello$h llo$he lo$hel... etr hello metric retrieval... Buscar un conjunto Q tal que W Q Controlar los términos que cumplen las 4 condiciones
5 Construcción de Indices Indexación basado ordenamiento por bloques Indexación de un sólo pasaje en memoria Indexación distribuida Indexación dinámica Seguridad Indexación para recuperación ordenada 5
6 Construcción de Indices Depende del hardware Accesos a memoria son más rápidos que a disco Nomenclatura Mantener en memoria los datos más usados caching Tiempo que lleva mover el cabezal de lectura de disco seek Tiempo de transferencia de disco a memoria por byte cuando el cabezal está en la pos. correcta transfer rate Bloques de memoria contiguos leídos a memoria chunks (8, 16, 32, and 64 kilobytes) Bloques de memoria a donde se transfiere de disco buffer 6
7 Construcción de Indices 0.2 s transferencia de 10 MB contiguos de disco a memoria ( ) = 0.7 s si se almacenan en 100 porciones no contiguas Símbolo Estadística Valor s Promedio de tiempo de seek 5 ms = s b Tiempo transferencia/byte 0.02 μs = s p Tiempo ciclo reloj procesador Tiempo operaciones bajo nivel (compare, swap) 10 9 s μs = 10-8 s Tamaño memoria principal Tamaño del espacio en disco varios GB 1 TB o más 7
8 Construcción de Indices Transferencias de disco a memoria son llevadas a cabo por el bus Procesador libre durante las transferencias Aprovechar Guardar datos comprimidos Transferir y descomprimir 8
9 Construcción de Indices Transferencias de disco a memoria son llevadas a cabo por el bus Procesador libre durante las transferencias Aprovechar Guardar datos comprimidos Transferir y descomprimir 9
10 Construcción de Indices - Proceso Colección de documentos a indexar Separar en palabras (tokenize) Procesamiento lingüístico para normalizar las palabras Ordenar las palabras (pares de términos y docid) en orden alfabético (clave primaria) Unificar ocurrencias repetidas de palabras Ordenar postings por docid (clave secundaria) 10
11 Indexación Basada en Ordenamiento por Bloques (BSBI) Cada término se representa mediante un termid Se pueden asignar los termid a medida que se construye el índice Se pueden asignar mediante un proceso en 2 pasadas en la primera pasada se extraen los términos y se le asigna un termid y en la segunda pasada se construye el índice Ejemplo Reuters-RCV1 1 GB de texto Noticias de un año millones de palabras no normalizadas 4 bytes para cada termid = 0.8 GB Cuando la memoria es insuficiente es necesario usar 11 algoritmos de ordenamiento externos (usan disco)
12 Indexación Basada en Ordenamiento por Bloques (BSBI) 1. Dividir la colección en porciones de igual tamaño (de tal forma que quede holgura en memoria) 2. Generar índice invertido de cada porción 1. Obtener conjunto de pares (termid, docid) 2. Ordenar los pares (termid, docid) 3. Unificar ocurrencias repetidas de los términos 3. Guardar resultados parciales en disco 4. Unificar los resultados parciales (merge) Abrir todos los bloques en simultáneo Tener un pequeño buffer de lectura para cada bloque y uno para la escritura del resultado En cada iteración elegir el menor termid, usar PQ o similar 12
13 Indexación Basada en Ordenamiento por Bloques (BSBI) brutus d1,d3 caesar d1,d2,d4 noble d5 with d1,d2,d3,d5 brutus d6,d7 caesar d8,d9 julius d10 killed d8 brutus d1,d3,d6,d7 caesar d1,d2,d4,d8,d9 julius d10 killed d8 noble d5 with d1,d2,d3,d5 Disco 13
14 Indexación Basada en Ordenamiento por Bloques (BSBI) O(T log T) debido al ordenamiento de los pares (termid, docid) En general dominado por El tiempo para separar s en palabras (tokenize) y el procesamiento lingüístico de cada bloque El tiempo para unificar los resultados parciales 14
15 Indexación Basada en Ordenamiento por Bloques (BSBI) Cómo se pueden asignar los termid a medida que se construye el índice en el BSIB? 15
16 Indexación Basada en Ordenamiento por Bloques (BSBI) Cómo se pueden asignar los termid a medida que se construye el índice en el BSIB? Se necesita estructura auxiliar de memoria Qué pasa si no cabe en memoria? 16
17 Indexación de un Sólo Pasaje en Memoria (SPIMI) En lugar de termid se usan los términos Algoritmo 1. Dividir la colección en porciones de igual tamaño 2. Generar índice invertido de cada porción procesando cada término en orden 1. Si es la primera ocurrencia, agregarlo al diccionario parcial (hash) 2. Agregar docid a la lista de postings del término, si es necesario agrandar el espacio para la lista 3. Guardar resultados parciales ordenados en disco 4. Unificar los resultados parciales (merge) 17
18 Indexación de un Sólo Pasaje en Memoria (SPIMI) Diferencias entre BSBI y SPIMI SPIMI agregar directamente el docid a la lista de postigs del término sin agruparlos todos y luego ordenarlos SPIMI no requiere ordenamiento más rápido No es necesario guardar pares (termid, docid), sólo docid menos memoria SPIMI es O(T) 18
19 Indexación Distribuida Si la colección es muy grande no se puede llevar a cabo la indexación en una sóla computadora Internet Clusters de computadoras Motores de búsquedas en Internet usan algoritmos de indexación distribuida Indices distribuidos, fraccionado por Términos Documentos 19
20 Indexación Distribuida Términos Indices distribuidos, fraccionado por términos Arquitectura distribuida MapReduce Varias computadoras estándar - nodos Un master node que dirige el proceso, asignando y reasignando tareas 20
21 Indexación Distribuida Términos Algoritmo La colección de documentos es fraccionada Las fracciones deben asegurar que el trabajo se pueda hacer de forma eficiente y pareja Se debe llegar a un índice de (termid, docid) La relación entre cada término y su termid también es distribuida Lista de términos más frecuentes y su termid se copian a todos los nodos Los demás términos se usan directamente en lugar de usar termid La tarea inicial (Map) es de parsing, al igual que en BSBI y SPIMI, se genera un diccionario parcial en cada nodo, dividido en segmentos por ejemplo a-f, g-p y q-z Luego (Reduce) se genera una sola lista de postings para cada termid (invert), cada segmento es asignado a un nodo 21
22 Indexación Distribuida Términos Fracciones Parser Master Asigna Asigna Postings a-f g-p q-z Inverter a-f Parser a-f g-p q-z Inverter g-p Parser a-f g-p q-z Inverter q-z 22
23 Webir Ejercicios Cómo contaría la cantidad de veces que cada término aparece en cada uno de los docs de la colección usando MapReduce? Asigna Master Asigna Parser a-f g-p q-z Inverter a-f Parser a-f g-p q-z Inverter g-p Parser a-f g-p q-z Inverter q-z Fracciones de la Colección 23
24 Webir Ejercicios En la etapa de invertir en la indexación distribuida usando MapReduce, se debe distribuir de forma equitativa las fracciones del índice invertido a construir de modo tal que contengan aproximadamente la misma cantidad de postings. Cómo? Asigna Master Asigna Parser a-f g-p q-z Inverter a-f Parser a-f g-p q-z Inverter g-p Parser a-f g-p q-z Inverter q-z Fracciones de la 24
25 Webir Indexación Dinámica Agregar/quitar términos Actualizar listas de postings Reconstruir completamente el índice Pocos/espóradicos cambios Tiempo de recontrucción completa es aceptable para incorporar nuevos documentos al índice 25
26 Webir Indexación Dinámica Indice Auxiliar (IA) Indice auxiliar (IA) de documentos nuevos Incorporación rápida de nuevos documentos En memoria Búsquedas en los dos índices Vector de bits para documentos eliminados Edición de docs = eliminación + reinserción Cuando el IA es muy grande unificar a disco 26
27 Webir Indexación Dinámica Indice Auxiliar (IA) Costo de la unificación Cada lista de postings en un archivo Levantar el archivo y agregar los postings del IA Para evitar múltiples accesos a disco, acumular cambios para actualizar un menor número de veces el índice principal (disco) Un sólo archivo Concatenación de las listas Se recorre cada posting del índice en disco T/n veces, n es el tamaño del IA y T el número total de postings O(T 2 /n) termid docid1 docid2 docid3 termid docid1 docid2 docid3 termid docid1 docid2 docid3... O Se generan varios IA de tamaños 2 0 n, 2 1 n, 2 2 n,, merge logarítmico Se recorre cada posting una vez en los log(t/n) niveles O(T log(t/n)) Consultas más lentas y operaciones/estadísticas más complejas termid docid3 termid docid3... O termid docid1 docid2 termid docid1 docid2 termid docid1 docid termid docid11 docid12 termid docid11 docid12 termid docid1 docid12...
28 Webir Indexación Avanzada Indices posicionales Se aplican los mismos algoritmos con pequeños cambios Recuperación ordenada por algún criterio (Ranking function) Coeficiente No es sólo inserción de docs nuevos al final, es necesario ordenar por el criterio 28
29 Webir Ejercicios Puede la corrección ortográfica ser una fuente de inseguridad? 29
30 Webir Ejercicios Puede la corrección ortográfica ser una fuente de inseguridad? Si se toman en cuenta (términos de) docs a los que el usuario no tiene acceso? 30
31 Webir Seguridad Access Control Lists (ACL) Indice invertido de los docs a los que puede acceder cada usuario Estas listas se cruzan con las listas de resultados Proceso lento para los usuarios con acceso a muchos docs Muchas veces se obtienen los permisos del File System Misuse detection for information retrieval systems, Cathey, Ma, Goharian, Grossman. Proceedings of the twelfth international conference on Information and knowledge management, Using relevance feedback to detect misuse for information retrieval systems, Ma, Goharian. Proceedings of the thirteenth ACM international conference on Information and knowledge management, Query length impact on misuse detection in information retrieval systems, Ma, Goharian. Proceedings of the 2005 ACM symposium on Applied computing,
32 Webir Seguridad Access Control Lists (ACL) Indice invertido de los docs a los que puede acceder cada usuario Estas listas se cruzan con las listas de resultados Proceso lento para los usuarios con acceso a muchos docs Muchas veces se obtienen los permisos del File System Misuse detection for information retrieval systems, Cathey, Ma, Goharian, Grossman. Proceedings of the twelfth international conference on Information and knowledge management, Using relevance feedback to detect misuse for information retrieval systems, Ma, Goharian. Proceedings of the thirteenth ACM international conference on Information and knowledge management, Query length impact on misuse detection in information retrieval systems, Ma, Goharian. Proceedings of the 2005 ACM symposium on Applied computing,
33 Webir Compresión de Indices Menor uso de disco Mejor uso de cache Términos frecuentes Más información en la memoria Descomprimir a medida que sea necesario Menos accesos a disco Compresión del vocabulario Compresión de las listas de postings 33
34 Webir Compresión de Indices Ley de Heap Tamaño del vocabulario (M) en función del tamaño de la colección es lineal en una representación log-log (log( M vs log T) T M = kt b T es el tamaño de la colección (número de tokens) b ~ k 100 Vocabulario sigue creciendo a medida que crece la colección Vocabularios grandes para grandes colecciones 34
35 Webir Compresión de Indices Ley de Zipf Un pequeño número de palabras son utilizadas con mucha frecuencia Un gran número de palabras son poco empleadas cf i = 1/i log cf i = log c - log i cf i es la frecuencia de una palabra en la i-ésima posición ordenadas de mayor a menor frecuencia y a es casi 1 lineal en una representación log-log (log( cf vs log rank) 35
36 Webir Compresión de Indices - Vocabulario El vocabulario es pequeño comparado con las listas de postings Aumentar la velocidad de recuperación Menos accesos a disco Limitaciones de Hardware Celulares, etc. Acelerar el tiempo inicial Diccionario como un solo string Por bloques 36
Índices de RI. UCR ECCI CI-2414 Recuperación de Información Prof. M.Sc. Kryscia Daviana Ramírez Benavides
Índices de RI UCR ECCI CI-2414 Recuperación de Información Prof. M.Sc. Kryscia Daviana Ramírez Benavides Qué es un Índice? Es la segunda etapa para abordar el tema de la RI. Es un archivo que contiene
Más detallesProcesamiento Digital de Imágenes. Compresión de imágenes
FICH, UNL - Departamento de Informática - Ingeniería Informática Procesamiento Digital de Imágenes Guía de Trabajos Prácticos 8 Compresión de imágenes 2010 1. Objetivos Analizar las características y el
Más detallesCapítulo 12: Indexación y asociación
Capítulo 12: Indexación y asociación Conceptos básicos Índices ordenados Archivos de índice de árbol B+ Archivos de índice de árbol B Asociación estática Asociación dinámica Comparación entre indexación
Más detallesBases de Datos Indexación y Hashing 1. Indexación. Jorge Pérez Rojas Universidad de Talca, II Semestre 2006
Bases de Datos Indexación y Hashing 1 Indexación Jorge Pérez Rojas Universidad de Talca, II Semestre 2006 Bases de Datos Indexación y Hashing 2 Acceso a Datos Muchas consultas hacen referencia sólo a una
Más detallesNo se requiere que los discos sean del mismo tamaño ya que el objetivo es solamente adjuntar discos.
RAIDS MODO LINEAL Es un tipo de raid que muestra lógicamente un disco pero se compone de 2 o más discos. Solamente llena el disco 0 y cuando este está lleno sigue con el disco 1 y así sucesivamente. Este
Más detallesAlessandro Chacón 05-38019. Ernesto Level 05-38402. Ricardo Santana 05-38928
Alessandro Chacón 05-38019 Ernesto Level 05-38402 Ricardo Santana 05-38928 CONTENIDO Universo Digital Hadoop HDFS: Hadoop Distributed File System MapReduce UNIVERSO DIGITAL 161 EB 2006 Fuente: International
Más detallesMódulo: Ahorra espacio ÍNDICE 1. QUÉ ES WINRAR? 3
ÍNDICE 3 WINRAR 4 : 6 EN EL FUNCIONAMIENTO DEL WINRAR 14 5. VENTAJAS DEL COMPRESOR WINRAR RESPECTO AL COMPRESOR WINZIP 18 2 1. QUÉ ES WINRAR? WinRAR es una versión del compresor RAR para Windows de 32
Más detallesTema 6. Gestión de la memoria
Tema 6. Índice Introducción Compartición de memoria Memoria virtual Soporte en los procesadores: la MMU en Linux en Windows NT/2000 1 Tema 6. Introducción Necesidad de la gestión de la memoria Requisitos
Más detallesEstructuras de Almacenamiento RAID RAID. Nivel FísicoF. Índice. Requisitos Almacenamiento. Nivel Lógico Modelo Entidad-Relación y Modelo Relacional
Estructuras de Almacenamiento Nivel FísicoF Nivel Lógico Modelo Entidad-Relación y Modelo Relacional El nivel en el que se deben mover los usuario es el nivel lógico El objetivo de un sistema de bases
Más detallesProcesamiento de Texto y Modelo Vectorial
Felipe Bravo Márquez 6 de noviembre de 2013 Motivación Cómo recupera un buscador como Google o Yahoo! documentos relevantes a partir de una consulta enviada? Cómo puede procesar una empresa los reclamos
Más detallesOrganización de Computadoras. Turno Recursantes Clase 8
Organización de Computadoras Turno Recursantes Clase 8 Temas de Clase Subsistema de Memoria Organización de Memoria Principal Notas de clase 8 2 Memoria Velocidad del procesador: se duplica cada 18 meses
Más detalles3. Creación y Transporte de Sitios Web Contenido
3. Creación y Transporte de Sitios Web Contenido 3.1 Entorno de Trabajo 3.2 Creación y selección del modelo de un Nuevo Sitio 3.3 Transporte y Recuperación del Trabajo 3.1 Entorno de Trabajo Se muestra
Más detallesSEGURIDAD Y PROTECCION DE FICHEROS
SEGURIDAD Y PROTECCION DE FICHEROS INTEGRIDAD DEL SISTEMA DE ARCHIVOS ATAQUES AL SISTEMA PRINCIPIOS DE DISEÑO DE SISTEMAS SEGUROS IDENTIFICACIÓN DE USUARIOS MECANISMOS DE PROTECCIÓN Y CONTROL INTEGRIDAD
Más detallesMANUAL COPIAS DE SEGURIDAD
MANUAL COPIAS DE SEGURIDAD Índice de contenido Ventajas del nuevo sistema de copia de seguridad...2 Actualización de la configuración...2 Pantalla de configuración...3 Configuración de las rutas...4 Carpeta
Más detallesComponente del sistema operativo que maneja el acceso a los archivos.
HFS (MAC) Hierachical File System File Manager Componente del sistema operativo que maneja el acceso a los archivos. Finder Parte del sistema operativo que maneja la búsqueda de archivos a ser presentados.
Más detallesDISCOS RAID. Se considera que todos los discos físicos tienen la misma capacidad, y de no ser así, en el que sea mayor se desperdicia la diferencia.
DISCOS RAID Raid: redundant array of independent disks, quiere decir conjunto redundante de discos independientes. Es un sistema de almacenamiento de datos que utiliza varias unidades físicas para guardar
Más detallesARREGLOS DEFINICION GENERAL DE ARREGLO
ARREGLOS DEFINICION GENERAL DE ARREGLO Conjunto de cantidades o valores homogéneos, que por su naturaleza se comportan de idéntica forma y deben de ser tratados en forma similar. Se les debe de dar un
Más detallesFaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS
FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS Introducción Los algoritmos utilizados para el procesamiento de imágenes son de complejidad computacional alta. Por esto
Más detallesSistemas Multimedia Distribuidos. Juan A. Sigüenza Departamento de Ingeniería Informática UAM
Sistemas Multimedia Distribuidos Juan A. Sigüenza Departamento de Ingeniería Informática UAM Componentes de un Sistema Multimedia Distribuido Software de aplicación Almacenamiento de Documentos Almacenamiento
Más detallesUnidad I. 1.1 Sistemas numéricos (Binario, Octal, Decimal, Hexadecimal)
Unidad I Sistemas numéricos 1.1 Sistemas numéricos (Binario, Octal, Decimal, Hexadecimal) Los computadores manipulan y almacenan los datos usando interruptores electrónicos que están ENCENDIDOS o APAGADOS.
Más detalles2 Sea una unidad de disco duro de brazo móvil con las siguientes características:
1 Sea una unidad de disco duro de brazo móvil con las siguientes características: 18 superficies, 20.331 cilindros y 400 sectores por pista. Sectores de 1.024 bytes de información neta. Velocidad de rotación:
Más detallesVersion 3. Capítulo 9. Fundamentos de hardware avanzado para servidores
Capítulo 9 Fundamentos de hardware avanzado para servidores Servidores para redes Un servidor es un computador en una red que es compartido por múltiples usuarios. El término servidor se refiere al hardware
Más detallesAlmacenamiento y Recuperación de la Información
Almacenamiento y Recuperación de la Información Estructuras basicas de archivos Archivos Secuenciales 2do Semestre 2005 Wenceslao Palma M. www.inf.utfsm.cl/~wpalma/ari Una estructura
Más detallesSistemas de Computación I/O. 2º Semestre, 2008 José Miguel Rubio L. jose.rubio.l@ucv.cl http://www.inf.ucv.cl/~jrubio
Sistemas de Computación I/O 2º Semestre, 2008 José Miguel Rubio L. jose.rubio.l@ucv.cl http://www.inf.ucv.cl/~jrubio Funciones: Enviar comandos a los dispositivos Detectar interrupciones. El usuario no
Más detallesCapítulo 4 Gestión de memoria
Sistemas operativos: una visión aplicada Capítulo 4 Gestión de memoria Contenido Objetivos del sistema de gestión de memoria Modelo de memoria de un proceso Esquemas de memoria basados en asignación contigua
Más detallesQUERCUS PRESUPUESTOS MANUAL DEL USO
QUERCUS PRESUPUESTOS MANUAL DEL USO 2 Tabla de Contenido 1 Introducción 1 1.1 General 1 1.1.1 Que es Quercus Presupuestos? 1 1.1.2 Interfaz 1 1.1.3 Árbol de Navegación 2 1.1.4 Estructura de Datos de un
Más detallesTema 4. Subsistema de Memoria
Tema 4. Subsistema de emoria 4.1. ntroducción 4.2. emoria cache. emoria principal 4.4. emoria virtual onceptos generales Organizaciones para mejorar el rendimiento lgunas tecnologías D Fundamentos de omputadores
Más detallesTema 3. Buses. Arquitectura de computadores. Plan 96. Curso 2010-2011. Jerarquía de buses
Tema 3. Buses 1. Introducción Jerarquía de buses Clasificación Fases de una transacción 2. Transferencia de datos 3. Temporización Bus síncrono Bus asíncrono Bus semisíncrono 4. Arbitraje del bus Centralizado
Más detallesAlmacenamiento y estructura de archivos
Bases de Datos Almacenamiento y estructura de archivos Almacenamiento y Estructura de Archivos Introducción a los medios de almacenamiento Discos Magnéticos RAID Almacenamiento Terciario Acceso de almacenamiento
Más detallesArquitectura de sistema de alta disponibilidad
Mysql Introducción MySQL Cluster esta diseñado para tener una arquitectura distribuida de nodos sin punto único de fallo. MySQL Cluster consiste en 3 tipos de nodos: 1. Nodos de almacenamiento, son los
Más detallesTécnicas empleadas. además de los discos las controladoras.
RAID Introducción En los últimos años, la mejora en la tecnología de semiconductores ha significado un gran incremento en la velocidad de los procesadores y las memorias principales que, a su vez, exigen
Más detallesSistemas de archivos distribuidos. Alvaro Ospina Sanjuan alvaro.ospina@correo.upb.edu.co
Sistemas de archivos distribuidos Alvaro Ospina Sanjuan alvaro.ospina@correo.upb.edu.co >Abstracción del sistema operativo para representar y organizar los recursos de almacenamiento >Se debe hacer la
Más detallesSistemas de Archivos Implementación. Módulo 11. Departamento de Informática Facultad de Ingeniería Universidad Nacional de la Patagonia San Juan Bosco
Sistemas de Archivos Implementación Módulo 11 Departamento de Informática Facultad de Ingeniería Universidad Nacional de la Patagonia San Juan Bosco Objetivos Describir los detalles locales de la implementación
Más detallesDOMAIN NAME SYSTEM DNS
DOMAIN NAME SYSTEM DNS Contenido Introducción DNS Definiciones Resolución de Nombres Referencias INTRODUCCIÓN En los 70, ARPANET era una comunidad de unos cientos de máquinas Un solo archivo HOST.TXT contenía
Más detallesTarea 4.2 Memoria Virtual
1 Tarea 4.2 1. Cuál es la diferencia entre paginación simple y paginación en memoria virtual? En memoria virtual no es necesario que todas las páginas estén en marcos de la memoria principal. Las páginas
Más detallesContenido. Sistema de archivos. Operaciones sobre archivos. Métodos de acceso a archivos. Directorio. Sistema de archivos por capas.
Contenido Sistema de archivos Operaciones sobre archivos Métodos de acceso a archivos Directorio Sistema de archivos por capas Espacio libre Sistema de archivos Proporciona el mecanismo para el almacenamiento
Más detallesCAPÍTULO 4. EL EXPLORADOR DE WINDOWS XP
CAPÍTULO 4. EL EXPLORADOR DE WINDOWS XP Características del Explorador de Windows El Explorador de Windows es una de las aplicaciones más importantes con las que cuenta Windows. Es una herramienta indispensable
Más detallesWhitepaper In-File Delta
Octubre-2006 1. Introducción Con la tecnología In-File Delta, ahora es posible hacer una copia de seguridad a diario de ficheros muy grandes. Existen dos modos de operación ( Differencial e Incremental
Más detallesAdministración de la producción. Sesión 10: Gestor de Base de Datos (Access)
Administración de la producción Sesión 10: Gestor de Base de Datos (Access) Contextualización Microsoft Access es un sistema de gestión de bases de datos, creado para uso personal y de pequeñas organizaciones,
Más detallesAmpliación de Estructuras de Datos
Ampliación de Estructuras de Datos Amalia Duch Barcelona, marzo de 2007 Índice 1. Diccionarios implementados con árboles binarios de búsqueda 1 2. TAD Cola de Prioridad 4 3. Heapsort 8 1. Diccionarios
Más detallesFunción de un disco duro 2009
Función de un disco duro Un disco duro es un dispositivo que permite el almacenamiento y recuperación de grandes cantidades de información. Los discos duros forman el principal elemento de la memoria secundaria
Más detallesUnidad de trabajo 2: INFORMÁTICA BÁSICA (primera parte)
Unidad de trabajo 2: INFORMÁTICA BÁSICA (primera parte) Unidad de trabajo 2: INFORMÁTICA BÁSICA... 1 1. Representación interna de datos.... 1 1.2. Sistemas de numeración.... 2 1.3. Aritmética binaria...
Más detallesACTIVIDADES TEMA 1. EL LENGUAJE DE LOS ORDENADORES. 4º E.S.O- SOLUCIONES.
1.- a) Explica qué es un bit de información. Qué es el lenguaje binario? Bit es la abreviatura de Binary digit. (Dígito binario). Un bit es un dígito del lenguaje binario que es el lenguaje universal usado
Más detallesDISCOS RIGIDOS. Forman el principal elemento de la memoria secundaria de un ordenador, llamada así en oposición a la memoria principal o memoria RAM
DISCOS RIGIDOS Es un hardware de almacenamiento permanente su función en la PC consiste en guardar los archivos de instalación del sistema operativo y datos del usuario. Forman el principal elemento de
Más detallesPetabytes de información: Repensando el modelamiento de base de datos. Ernesto Quiñones Azcárate ernestoq@apesol.org Presidencia Apesol 2006 2008
Petabytes de información: Repensando el modelamiento de base de datos Ernesto Quiñones Azcárate ernestoq@apesol.org Presidencia Apesol 2006 2008 Modelos de bases de datos para todos los gustos (según la
Más detallesAnatomia de Google. Una presentación realizada por Jose Dueñas para la asignatura Estructura de Datos II
Anatomia de Google Basado en el artículo The Anatomy Of A Large Scale Search Engine escrito por los creadores de Google, Sergey Brin y Lawrence Page, y presentado en la WWW7 en 1997, Una presentación realizada
Más detalles18 y 19 Sistemas de Archivos Distribuidos y Tarea 05
18 y 19 Sistemas de Archivos Distribuidos y Tarea 05 Prof. Edgardo Adrián Franco Martínez http://computacion.cs.cinvestav.mx/~efranco efranco.docencia@gmail.com Estructuras de datos (Prof. Edgardo A. Franco)
Más detallesUNIDAD 2 Configuración y operación de un sistema de cómputo Representación de datos Conceptos El concepto de bit (abreviatura de binary digit) es fundamental para el almacenamiento de datos Puede representarse
Más detallesMemoria La memoria es la parte del ordenador en la que se guardan o almacenan los programas (las instrucciones y los datos).
Memoria La memoria es la parte del ordenador en la que se guardan o almacenan los programas (las instrucciones y los datos). Memoria Típica. Los datos almacenados en memoria tienen que pasar, en un momento
Más detallesMatemática de redes Representación binaria de datos Bits y bytes
Matemática de redes Representación binaria de datos Los computadores manipulan y almacenan los datos usando interruptores electrónicos que están ENCENDIDOS o APAGADOS. Los computadores sólo pueden entender
Más detallesPROBLEMAS DE FUNDAMENTOS DE TECNOLOGÍA DE COMPUTADORES T5. MEMORIAS
PROBLEMAS DE FUNDAMENTOS DE TECNOLOGÍA DE COMPUTADORES T5. MEMORIAS Tema 5 Memorias Hoja: 2 / 14 Base teórica La memoria es el lugar en el que se almacenan las instrucciones y los datos para que se puedan
Más detallesCapitulo V Administración de memoria
Capitulo V Administración de memoria Introducción. Una de las tareas más importantes y complejas de un sistema operativo es la gestión de memoria. La gestión de memoria implica tratar la memoria principal
Más detallesSistema de Ficheros. Sistemas Operativos - ITIG. Álvaro Polo Valdenebro. Abril 2009. apoloval@gsyc.es. GSyC - 2009 Introducción 1
Sistema de Ficheros Sistemas Operativos - ITIG Álvaro Polo Valdenebro apoloval@gsyc.es Abril 2009 GSyC - 2009 Introducción 1 c 2009 GSyC Algunos derechos reservados. Este trabajo se distribuye bajo la
Más detallesEntendiendo y Optimizando MySQL
Grupo de Usuarios de Linux Universidad Carlos III de Madrid. 10 de Noviembre de 2010 Indice Arquitectura 1 Arquitectura 2 3 4 5 Arquitectura Sistema de Gestión de Bases de Datos. GPL. Escrito en C y C++.
Más detallesRAID. Redundant Array of Independent Disks. Rafael Jurado Moreno (rafa.eqtt@gmail.com) Fuente: Wikipedia
RAID Redundant Array of Independent Disks Rafael Jurado Moreno (rafa.eqtt@gmail.com) Fuente: Wikipedia I.E.S. María Moliner. Segovia 2010 1.Introducción. En informática, el acrónimo RAID (del inglés Redundant
Más detallesTema: Configuración de arreglos redundantes de discos duros (RAID).
1 Tema: Configuración de arreglos redundantes de discos duros (RAID). Objetivo general Configurar arreglos RAID en discos duros para obtener una mayor tolerancia a fallos, rendimiento y capacidad. Objetivos
Más detallesMotores de Búsqueda Web Tarea Tema 2
Motores de Búsqueda Web Tarea Tema 2 71454586A Motores de Búsqueda Web Máster en Lenguajes y Sistemas Informáticos - Tecnologías del Lenguaje en la Web UNED 30/01/2011 Tarea Tema 2 Enunciado del ejercicio
Más detallesEstructura de una BD Oracle. datafiles redo log controlfiles tablespace objetos Estructura lógica. Tablespaces tablespace SYSTEM
Estructura de una BD Oracle. Una BD Oracle tiene una estructura física y una estructura lógica que se mantienen separadamente. La estructura física se corresponde a los ficheros del sistema operativo:
Más detallesEn cualquier caso, tampoco es demasiado importante el significado de la "B", si es que lo tiene, lo interesante realmente es el algoritmo.
Arboles-B Características Los árboles-b son árboles de búsqueda. La "B" probablemente se debe a que el algoritmo fue desarrollado por "Rudolf Bayer" y "Eduard M. McCreight", que trabajan para la empresa
Más detallesFundamentos de Programación. Sabino Miranda-Jiménez
Fundamentos de Programación Sabino Miranda-Jiménez MÓDULO 1. Introducción a la computación Temas: La computación en el profesional de ingeniería Desarrollo computacional en la sociedad Aplicaciones Software
Más detallesTema 1 Introducción. Arquitectura básica y Sistemas Operativos. Fundamentos de Informática
Tema 1 Introducción. Arquitectura básica y Sistemas Operativos Fundamentos de Informática Índice Descripción de un ordenador Concepto básico de Sistema Operativo Codificación de la información 2 1 Descripción
Más detallesNANO GRABADOR OCULTO EXTENDED TS9680
www.tacticalsecurity.net E-mail: info@tacticalsecurity.net NANO GRABADOR OCULTO EXTENDED TS9680 C CONTENIDO Página 1 El dispositivo... 2-3 2 Características técnicas... 4-5-6 3 Trabajando con el dispositivo...
Más detallesUD 1. Representación de la información
UD 1. Representación de la información 1.1 INTRODUCCION... 1 1.2 SISTEMAS DE REPRESENTACIÓN... 2 1.2.1 El Sistema Decimal.... 2 1.2.2 Teorema Fundamental de la Numeración. (TFN)... 2 1.2.3 El Sistema Binario....
Más detalles4. Programación Paralela
4. Programación Paralela La necesidad que surge para resolver problemas que requieren tiempo elevado de cómputo origina lo que hoy se conoce como computación paralela. Mediante el uso concurrente de varios
Más detallesWINDOWS XP. Está situada en la parte inferior, muestra información sobre el trabajo que estamos desarrollando en la ventana
WINDOWS XP Es un sistema Operativo Microsoft Windows XP es un programa que controla la actividad general de la computadora. Así mismo, asegura que todas las partes de la Computadora operen de manera efectiva
Más detallesClase 3. Discos Duros (continuación)
Instituto Tecnológico de Costa Rica Escuela de Ingeniería Electrónica Programa Mantenimiento de PC's Clase 3 Discos Duros (continuación) Introducción Organización de la información La información dentro
Más detallesGLOSARIO. Arquitectura: Funcionamiento, estructura y diseño de una plataforma de desarrollo.
GLOSARIO Actor: Un actor es un usuario del sistema. Esto incluye usuarios humanos y otros sistemas computacionales. Un actor usa un Caso de Uso para ejecutar una porción de trabajo de valor para el negocio.
Más detallesUnidad de disco duro frente a Kingston SSDNow V+ 200 Series 240GB: prueba comparativa...1
Unidad de disco duro frente a Kingston SSDNow V+ 200 Series 240GB: prueba comparativa Índice Unidad de disco duro frente a Kingston SSDNow V+ 200 Series 240GB: prueba comparativa...1 Unidad de disco duro
Más detallesCapítulo 9. Archivos de sintaxis
Capítulo 9 Archivos de sintaxis El SPSS permite generar y editar archivos de texto con sintaxis SPSS, es decir, archivos de texto con instrucciones de programación en un lenguaje propio del SPSS. Esta
Más detallesTEMA II: REPRESENTACIÓN DE LA INFORMACIÓN
TEMA II: REPRESENTACIÓN DE LA INFORMACIÓN 2.1. Introducción. El computador procesa información. Para que un ordenador ejecute unos datos es necesario darle dos tipos de información: las instrucciones que
Más detallesTema 4. Gestión de entrada/salida
Tema 4. Gestión de entrada/salida 1. Principios de la gestión de E/S. 1.Problemática de los dispositivos de E/S. 2.Objetivos generales del software de E/S. 3.Principios hardware de E/S. 1. E/S controlada
Más detallesANEXOS. Algoritmo que genera un valor hash de algún dato, como una clave de. mensaje o de sesión. Con un buen algoritmo de hash, los cambios que se
ANEXOS GLOSARIO A Algoritmo de hash Algoritmo que genera un valor hash de algún dato, como una clave de mensaje o de sesión. Con un buen algoritmo de hash, los cambios que se produzcan en los datos de
Más detallesCÓMO DESCARGAR ARCHIVOS Y PROGRAMAS? EDUCACIÓN SOCIAL - MGP
Objetivos: Conocer qué es una descarga desde Internet. Conocer los diferentes tipos de descargas. Conocer qué ventajas y riesgos tiene. Qué es una descarga? Una descarga consiste en obtener archivos o
Más detallesPRUEBAS DE SOFTWARE TECNICAS DE PRUEBA DE SOFTWARE
PRUEBAS DE SOFTWARE La prueba del software es un elemento crítico para la garantía de la calidad del software. El objetivo de la etapa de pruebas es garantizar la calidad del producto desarrollado. Además,
Más detallesSin embargo, con el tiempo ocurren errores en el disco duro, los datos se desorganizan y las referencias se vuelven obsoletas.
RAZONES PARA DAR MANTENIMIENTO AL PC Las computadoras funcionan muy bien y estän protegidas cuando reciben mantenimiento. Si no se limpian y se organizan con frecuencia, el disco duro se llena de informaciån,
Más detallesAPACHE HADOOP. Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López
APACHE HADOOP Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López Objetivos 1. Qué es Apache Hadoop? 2. Funcionalidad 2.1. Map/Reduce 2.2. HDFS 3. Casos prácticos 4. Hadoop
Más detallesSemana 13: Encriptación. Cifrado simétrico
Semana 13: Encriptación Cifrado simétrico Aprendizajes esperados Contenidos: Características y principios del cifrado simétrico Algoritmos de cifrado simétrico Encriptación Simétrica En la encriptación
Más detallesCOMBINAR CORRESPONDENCIA EN MICROSOFT WORD
COMBINAR CORRESPONDENCIA EN MICROSOFT WORD Combinar documentos consiste en unir dos documentos diferentes sin que se modifiquen los datos que aparecen en ellos. Esta operación es muy útil y muy frecuente
Más detalles9233506 Edición 1 ES. Nokia y Nokia Connecting People son marcas comerciales registradas de Nokia Corporation
9233506 Edición 1 ES Nokia y Nokia Connecting People son marcas comerciales registradas de Nokia Corporation Guía del usuario de Zip Manager Guía del usuario de Zip Manager Vaya a Zip Manager Pro. Nota:
Más detallesHadoop. Cómo vender un cluster Hadoop?
Hadoop Cómo vender un cluster Hadoop? ÍNDICE Problema Big Data Qué es Hadoop? Descripción HDSF Map Reduce Componentes de Hadoop Hardware Software 3 EL PROBLEMA BIG DATA ANTES Los datos los generaban las
Más detallesTEMA 1: SISTEMAS INFORMÁTICOS. Parte 2: representación de la información
TEMA 1: SISTEMAS INFORMÁTICOS Parte 2: representación de la información Qué vamos a ver? Cómo se representa y almacena la información en un ordenador Cómo podemos relacionar la información que entendemos
Más detallesAutor: Microsoft Licencia: Cita Fuente: Ayuda de Windows
Qué es Recuperación? Recuperación del Panel de control proporciona varias opciones que pueden ayudarle a recuperar el equipo de un error grave. Nota Antes de usar Recuperación, puede probar primero uno
Más detallesGENERALIDADES DE BASES DE DATOS
GENERALIDADES DE BASES DE DATOS A fin de evitar que idénticos datos se encuentren repetidos en múltiples archivos, parece necesario que los comunes se almacenen en un archivo único y que este archivo sea
Más detallesFundamento de Informática Teórica(2003) Prof. Dr. Eric Jeltsch F. ORGANIZACION FISICA DE LOS SISTEMAS DE BASE DE DATOS
ORGANIZACION FISICA DE LOS SISTEMAS DE BASE DE DATOS La organización física de una base de datos es un tópico extenso y se aborda en detalle, principalmente en la asignatura Base de Datos, y digo principalmente
Más detallesGuia para examen de Sistemas Operativos Para primer parcial Febrero 2013 Revisión 2 Ing. Julio Cesar Gonzalez Cervantes
Guia para examen de Sistemas Operativos Para primer parcial Febrero 2013 Revisión 2 Ing. Julio Cesar Gonzalez Cervantes Qué es un software comercial? Es el software que las compañías cobran por su producto
Más detallesEstas visiones de la información, denominadas vistas, se pueden identificar de varias formas.
El primer paso en el diseño de una base de datos es la producción del esquema conceptual. Normalmente, se construyen varios esquemas conceptuales, cada uno para representar las distintas visiones que los
Más detallesMODULO DE PRESUPUESTOS EN SISTEMA CONTABILIDAD
MODULO DE PRESUPUESTOS EN SISTEMA CONTABILIDAD MODULO DE PRESUPUESTOS TRANSTECNIA Tenga incorporado en su sistema Contable Transtecnia, una herramienta de gestión que le permite planificar y realizar un
Más detallesUniversidad Nacional de Costa Rica Administración de Bases de Datos
Universidad Nacional de Costa Rica Administración de Bases de Datos Mantenimiento de tablespaces e índices Para más información visite: http://www.slinfo.una.ac.cr Autor: Steven Brenes Chavarria Email:
Más detallesEs un servicio de resolución de nombres que resuelve direcciones legibles (como www.microsoft.com) en direcciones IP (como 192.168.0.1).
DNS (Domain DomainName NameSystem System) Es un servicio de resolución de nombres que resuelve direcciones legibles (como www.microsoft.com) en direcciones IP (como 192.168.0.1). Es una base de datos jerárquica
Más detalles3. Número inicial y número final de mensajes mostrados en la página actual.
Sistema WEBmail El sistema WEBmail permite el acceso rápido y sencillo a su buzón de correo utilizando un navegador de páginas Web. Normalmente es usado como complemento al lector de correo tradicional,
Más detallesCRIPTOGRAFÍA SIMÉTRICA Y ASIMÉTRICA
CRIPTOGRAFÍA SIMÉTRICA Y ASIMÉTRICA Para generar una transmisión segura de datos, debemos contar con un canal que sea seguro, esto es debemos emplear técnicas de forma que los datos que se envían de una
Más detallesCOPIAS DE SEGURIDAD. Ver. 1.0
COPIAS DE SEGURIDAD Ver. 1.0 INDICE 1. COPIAS DE SEGURIDAD...4 2. TIPOS DE COPIAS DE SEGURIDAD...5 2.1. Copia normal o copia total...5 2.2. Copia incremental...5 2.3. Copia diferencial...6 2.4. Recomendación
Más detalles21/02/2012. Agenda. Unidad Central de Procesamiento (CPU)
Agenda 0 Tipos de datos 0 Sistemas numéricos 0 Conversión de bases 0 Números racionales o Decimales 0 Representación en signo-magnitud 0 Representación en complemento Unidad Central de Procesamiento (CPU)
Más detallesADMINISTRACIÓN DE BASES DE DATOS DISTRIBUIDAS
5 ADMINISTRACIÓN DE BASES DE DATOS DISTRIBUIDAS Contenido: 5.1 Conceptos Generales Administración de Bases de Datos Distribuidas 5.1.1 Administración la Estructura de la Base de Datos 5.1.2 Administración
Más detallesMEJORAR EL RENDIMIENTO DEL EXPLORADOR DE INTERNET
MEJORAR EL RENDIMIENTO DEL EXPLORADOR DE INTERNET Internet Explorer almacena en archivos temporales las páginas Web y sus archivos relacionados que carga de Internet, lo que significa que la primera vez
Más detallesHardware y Estructuras de Control. Memoria Virtual. Ejecución de un Programa. Ejecución de un Programa
Memoria Virtual Capítulo 8 Hardware y Estructuras de Control Las referencias de memoria se traducen a direcciones físicas dinámicamente en tiempo de ejecución Un proceso puede ser intercambiado hacia dentro
Más detallesEl grupo de trabajo IEEE 802.15 ha definido tres clases de WPANs que se
2 Disposiciones generales. 2.1 Tipos de WPANs. El grupo de trabajo IEEE 802.15 ha definido tres clases de WPANs que se diferencian por su rango de datos, consumo de energía y calidad de servicio (QoS).
Más detallesAdministración de la memoria
Memoria de impresora de la memoria 1 Esta impresora se suministra con al menos 64 MB de memoria. Para determinar la cantidad de memoria instalada en la impresora, seleccione la opción Imprimir menús del
Más detallesEl soporte del sistema operativo. Hace que un computador sea más fácil de usar. Permite que los recursos del computador se aprovechen mejor.
El soporte del sistema operativo Objetivos y funciones del sistema operativo Comodidad Hace que un computador sea más fácil de usar. Eficiencia Permite que los recursos del computador se aprovechen mejor.
Más detallesHilos, comunicación y competencia entre procesos. Dr. Alonso Ramírez Manzanares 2-Sep-2010
Hilos, comunicación y competencia entre procesos Dr. Alonso Ramírez Manzanares 2-Sep-2010 Implementación de procesos Se mantiene una tabla de procesos con una entrada por cada proceso: Con lo cual tenemos
Más detalles