TÉCNICAS AVANZADAS DE BÚSQUEDA Y RECUPERACIÓN DE INFORMACIÓN

Tamaño: px
Comenzar la demostración a partir de la página:

Download "TÉCNICAS AVANZADAS DE BÚSQUEDA Y RECUPERACIÓN DE INFORMACIÓN"

Transcripción

1 TÉCNICAS AVANZADAS DE BÚSQUEDA Y RECUPERACIÓN DE INFORMACIÓN Ana Rosa Candela Hidalgo Junio 2012 Proceso selectivo de promoción interna para el acceso a escalas del grupo A, subgrupo A1.

2 INTRODUCCIÓN. EL CONTEXTO ACTUAL EN LA RECUPERACIÓN DE INFORMACIÓN Desarrollo de Internet y de las Tecnologías de la Información y las comunicaciones gran impacto en las fuentes de información existentes y en los sistemas de recuperación de información Sociedad de la información gran volumen de información disponible y su crecimiento exponencial INFOXICACIÓN Dispersión de la información en gran variedad de soportes y formatos Nuevas tipologías documentales Aplicaciones de navegabilidad e intercambio de información que potencian la interconexión entre usuarios y la trasferencia de información entre ellos Nuevos cauces de difusión de la información científica y académica (open access, herramientas web 2.0 RSS, blogs, gestores de referencias sociales-) Ana Rosa Candela Hidalgo 2

3 SISTEMAS DE INFORMACIÓN DOCUMENTAL Para que la información documental pueda recuperarse, según las necesidades de los distintos tipos de usuarios, es fundamental su almacenamiento y organización en sistemas cuya estructura se adecue a las características de esta clase específica de información, y cuyo motor de búsqueda posibilite obtener resultados de manera satisfactoria. Los sistemas de información son estructuras organizadas con la finalidad de transformar datos en información e información en datos. Estructuran y organizan los datos de manera sistemática y uniforme, facilitan mecanismos para acceder a ellos y están provistos de un aparato conceptual que permite representar el mundo o el entorno al que hacen referencia. Ana Rosa Candela Hidalgo 3

4 SISTEMAS DE INFORMACIÓN DOCUMENTAL Entidades: objetos materiales o conceptuales del mundo real representados (personas, organizaciones, artículos de revista, noticias de prensa, páginas web ) se corresponden con registros, que es la unidad de información básica de los sistemas de información. Atributos: características de las entidades del mundo real, que las representan y diferencian de otras entidades Cada uno de los valores de un atributo constituye un campo, una zona del registro (título, autor o creador, materia, fecha publicación ) Los SI se desarrollan siguiendo dos modelos: relacional y documental, en función del objetivo del sistema, el tipo de información y de las necesidades de los usuarios del mismo. Ana Rosa Candela Hidalgo 4

5 SISTEMAS DE INFORMACIÓN DOCUMENTAL Un SID es un sistema que acepta como entradas documentos cognitivos y necesidades de información y que produce como salidas personas informadas, a partir de un proceso de descripción y comparación. Descripción: permite identificar las entidades representadas en el sistema y acceder a los documentos a partir de los elementos de la descripción características que lo diferencian de los demás y lo relacionan con el resto Atributos descriptivos (título, autor, fecha) y analíticos, que representan el contenido (palabras clave, descriptores) recuperación de un documento concreto o de un conjunto de documentos Comparación: permite relacionar las necesidades de información de los usuarios con un documento o conjunto de documentos necesitan motores de búsqueda que comparen los términos de la demanda informativa con los de la representación de los documentos, mediante mecanismos de confrontación exacta o parcial. Ana Rosa Candela Hidalgo 5

6 SISTEMAS DE INFORMACIÓN DOCUMENTAL En un SID la información se estructura en una base de datos, que consiste en un conjunto de datos almacenados en soporte informático y organizados de forma que pueden recuperarse de determinadas maneras, de acuerdo con las necesidades expresadas en la estrategia de búsqueda. La recuperación se realiza por sistemas informáticos que manejan y explotan los ficheros de datos y, para que la información sea accesible, es necesario describir y analizar los documentos según sus características específicas. El tercer elemento de un SID es el software de interfaz, que determina y condiciona la comunicación entre el usuario y el sistema Ana Rosa Candela Hidalgo 6

7 SISTEMAS DE INFORMACIÓN DOCUMENTAL La naturaleza de la información y las características y necesidades del colectivo que usará los datos condicionan la organización de los datos que se almacenan y procesan y las formas de recuperación de los mismos. Diccionario de datos: lista de todos los campos de una base de datos con la especificación de un conjunto de parámetros que los caracterizan: etiqueta (título, autor, descriptor), dominio (título, autor o descriptor del documento), tipo (alfanumérico, fecha), indización (sí o no), tratamiento documental (lenguaje libre, lenguaje controlado, no procede)... Índices (ficheros o índices inversos) que permiten la recuperación, integrados por los valores de un campo indizado. Son ficheros en los que cada registro se corresponde con cada uno de los términos indizados, con un campo que recoge información sobre la localización del término, el tipo de campo, el lugar que ocupa dentro de ese campo y un puntero que permite el acceso inmediato al registro la forma en la que se procesa la información de cada campo de la BD en el fichero inverso determina las posibilidades de búsqueda Ana Rosa Candela Hidalgo 7

8 SISTEMAS DE INFORMACIÓN DOCUMENTAL Documentos administrativos: tienen una estructura previsible, formada por un conjunto estable y repetitivo de elementos formales y un contenido predeterminado factura de venta: estructura integrada por fecha, nº de factura, importe, artículo, nº unidades vendidas, nombre del deudor y del emisor, y siempre tratará sobre la deuda contraída por un deudor respecto al emisor de la misma. Documentos cognitivos: poseen características estructurales (extensión, estructura en párrafos o en secciones y subsecciones, subtítulos, títulos paralelos, autores diversos, distintos roles de responsabilidad...) y semánticas poco repetitivas y son de naturaleza imprevisible. No se pueden predecir anticipadamente los temas de los distintos documentos integrados en una unidad de información y la mayor dificultad es la expresión de su contenido. Ana Rosa Candela Hidalgo 8

9 SISTEMAS DE INFORMACIÓN DOCUMENTAL Sistemas de gestión de bases de datos administrativas o relacionales Programas muy adecuados a la gestión de información muy estructurada de tipo numérico o textual (datos propiamente dichos: volumen de ventas, sueldos, existencias de almacén ) Implantados en el ámbito de la empresa para automatizar procesos no están pensadas para ser consultadas por personas (usuarios), sino para ser usadas como parte de procesos informáticos (generar facturación mensual, nóminas.) Utiliza tablas homogéneas para representar entidades. Cada fila es una entidad (cliente) y cada columnas: un atributos (apellido). Una base de datos relacional tendrá diversas tablas (personal, retribuciones según puesto de trabajo ) Se pueden combinar filas y columnas de las distintas bases de datos para generar otra nueva Los documentos que procesan tienen una estructura previsible, formada por un conjunto estable y repetitivo de elementos formales y un contenido predeterminado factura de venta: estructura integrada por fecha, nº de factura, importe, artículo, nº unidades vendidas, nombre del deudor y del emisor, y siempre tratará sobre la deuda contraída por un deudor respecto al emisor de la misma. Ana Rosa Candela Hidalgo 9

10 SISTEMAS DE INFORMACIÓN DOCUMENTAL Sistemas de gestión de bases de datos documentales (textuales): Adecuadas para la gestión de información con gran cantidad de texto discursivo y poco estructurado, típica de los documentos cognitivos (artículos de revistas, informes, patentes, páginas web, noticias de prensa ) documentos de tipo científico, técnico o cultural Presentan: un tipo de registro irrestricto : no hay restricciones previas al tipo de registro a manejar: esquemas abiertos o articulados en campos y tipos de datos, distintos tipos de registros coexistentes, longitud variable de campos, valores repetibles para los campos (documentos con más de un autor o un descriptor), capacidad monobase o multibase indistintamente: abrir y operar una sola o varias BD a la vez índices analíticos (fichero invertido o inverso): los índices analíticos suelen basarse en una estructura denominada fichero invertido o inverso Lenguaje e interfaces de consulta orientados al usuario: exploración (registros o índices), lenguajes de interrogación, estrategias de búsqueda, almacenamiento y reutilización de consultas Definición de vistas (versiones de cada modelo de registro adaptadas a categorías de usuarios: administrador, operadores y usuarios finales) e informes Ana Rosa Candela Hidalgo 10

11 SISTEMAS DE INFORMACIÓN DOCUMENTAL Índice analítico (fichero inverso) El fichero inverso es un índice o conjunto de índices compuestos por todas y cada una de las palabras que aparecen en todos y cada uno de los registros de la base de datos. Algunos SRI pueden crear índices independientes para cada uno de los campos del registro. El índice de una BDD es una representación de los temas presentes en todos los documentos de la BD Su estructura permite: La existencia de valores repetidos (documentos indizados con el mismo descriptor), La realización de búsquedas en documentos de texto completo con gran rapidez La realización de tareas de control terminológico En estos índices, cada término o entrada del índice es único en una BD documental, puede aparecer 100 veces el término Economía, pero sólo existe una entrada en el fichero invertido Relacionar datos de contexto con cada término de entrada: su frecuencia, su posición exacta en cada registro, posibles sinónimos Ana Rosa Candela Hidalgo 11

12 SISTEMAS DE INFORMACIÓN DOCUMENTAL Por tanto, los ficheros invertidos son estructuras que almacenan un conjunto de entradas que ofrecen acceso rápido a los diferentes documentos a los que hacen referencia. Estas entradas suelen coincidir con unidades textuales (palabras, raíces, sintagmas), por lo que se pueden utilizar para almacenar el léxico de una colección. Además de estas entradas, disponemos de un conjunto de referencias a documentos o a representaciones de documentos que nos permiten acceder a ellas de forma rápida COMPOSICIÓN TÍPICA DE UN ÍNDICE INVERTIDO Elemento Término Explicación Todas y cada una de las palabras que forman parte de los registro so de los documentos de la base de datos (y que no constan en el fichero de palabras vacías). Son siempre términos únicos, es decir, hay una sola entrada para cada término aunque aparezca muchas veces en uno o en muchos registros de la base de datos. Frecuencia Localización Número de registros (por tanto, número de documentos) en los que aparece el término. En algunos ficheros invertidos se consigna también el número de veces (frecuencia) con la que aparece en total el término Indicación de los parámetros de localización, imprescindible para la recuperación. La información necesaria consta, al menos, de los siguientes elementos: número de documento número de campo (si es que hay campos) número de palabra. El motivo es que hay que conocer la posición absoluta de la palabra en el documento para poder aplicar correctamente algunos operadores como el de proximidad. Fuente: Abadal, E; Codina, L. Bases de datos documentales: características, funciones y método. Madrid: Síntesis, 2005, p.97 Ana Rosa Candela Hidalgo 12

13 SISTEMAS DE INFORMACIÓN DOCUMENTAL EJEMPLO DE UN ÍNDICE INVERTIDO Término Frecuencia Localización Barcelona 2 (00017, 03, 01) (03401, 01, 04) Madrid 2 (00017, 03, 03) (17200, 02, 01) Zaragoza 3 (00017, 03, 04), (03401, 01, 02) (17001, 04, 01) (03401, 01, 04) ID Campo Título Historia ilustrada de Barcelona 02 Autor U. Eco 03 Fuente Vic. Editorial ZYX, Descriptores Barcelona, Historia Modelo de registro de la base de datos del ejemplo Título Autor Fuente Descriptores (03401, 01, 04) y el resto de conjuntos de datos son vectores porque en cada conjunto la posición de cada elemento es significativa. El 1er elemento siempre es el identificador del registro, el 2º el identificador del campo y el 3º identifica el nº de orden de la palabra en el campo considerado Ana Rosa Candela Hidalgo 13

14 LA RECUPERACIÓN DE LA INFORMACIÓN Es el proceso de determinación y selección de la información más adecuada a las demandas o necesidades de información de los usuarios de un fondo documental, por medio automáticos o semiautomáticos En la RI el objeto de la búsqueda es información de carácter textual, son documentos que contienen información. En ésto radica la dificultad del proceso, pues intervienen las propiedades semánticas de los documentos (el contenido) Las características de la información a tratar está en la base de la diferenciación entre la Recuperación de datos (data retrieval) y Recuperación de la información (information retrieval) 1 Martínez Mendez, F.J. Recuperación de información. Modelos, sistemas y evaluación. Murcia: KIOSKO JMC, 2004, p [Disponible en Ana Rosa Candela Hidalgo 14

15 INTRODUCCIÓN. LA RECUPERACIÓN DE LA INFORMACIÓN Diferencias entre RD y RI (Blair, 1990) Según la forma de responder las preguntas: en RD se emplean preguntas muy formalizadas, cuya respuesta es directamente la información deseada En RI, las preguntas resultan difíciles de trasladar a un lenguaje normalizado y la respuesta es un conjunto de documentos que probablemente pueden contener la información deseada, con un cierto grado de incertidumbre. Según la relación entre el requerimiento del sistema y la satisfacción de usuario: RD es determinista entre pregunta y satisfacción del usuario RI es probabilística, debido al nivel de incertidumbre de la respuesta Según el criterio de éxito de la Búsqueda: En RD, el criterio a emplear es la exactitud de lo encontrado En RI, el grado en el que la respuesta satisface las necesidades de información del usuario, su percepción personal de utilidad. Tramullas destaca en la RI la importancia del factor de predicción por parte del usuario, que debe intuir los términos utilizados para presentar el contenido de los documentos Ana Rosa Candela Hidalgo 15

16 LA RECUPERACIÓN DE LA INFORMACIÓN Salton, 1983, formula la definición de RI más extendida 2 : la recuperación de la información tiene que ver con la representación, almacenamiento, organización y acceso a los items de información. Croft, 1987: es el conjunto de tareas mediante las cuales el usuario localiza y accede a los recursos de información que son pertinentes a la resolución del problema planteado. En estas tareas desempeñan un papel fundamental los lenguajes documentales, las técnicas de resumen, la descripción del objeto documental " En definitiva: la RI no es un hecho aislado vinculado al acceso a la información, sino que constituye un proceso que incluye también la representación, la organización, la búsqueda y la localización de la información. Se inicia, por tanto, con la descripción y el almacenamiento de los documentos. 2 Martínez Mendez, F.J. Recuperación de información. Modelos, sistemas y evaluación. Murcia: KIOSKO JMC, 2004, p. 4. [Disponible en Ana Rosa Candela Hidalgo 16

17 SISTEMAS DE RECUPERACIÓN DE LA INFORMACIÓN (SRI) Los Sistemas de Recuperación de la Información son los programas informáticos que permiten automatizar las distintas tareas que se integran en el proceso de recuperación de la información Por ejemplo, hay que diferenciar las bases de datos (colección organizada de datos e información almacenada) de los programas informáticos que permiten su explotación (sistemas de gestión de bases de datos SGBD) Forman el núcleo de diversas aplicaciones informáticas. Sistemas de gestión de bases de datos documentales Motores de búsqueda en internet Ana Rosa Candela Hidalgo 17

18 SISTEMAS DE RECUPERACIÓN DE LA INFORMACIÓN (SRI) Si la función básica de un SRI es "la recuperación de documentos que contengan información textual cuyo contenido resulte relevante, según el sistema, desde el punto de vista de las necesidades del usuario expresadas a través de los términos de búsqueda (Moya, p. 554), éstos realizan dos operaciones básicas: la representación y búsqueda Representación o indización: del contenido semántico de los documentos y de las necesidades de información del usuario (pregunta) con el uso de palabras o términos del lenguaje natural (términos de indización) las características de un documento se representan como un conjunto de términos de indización Puede ser automática (ordenadores, lenguaje natural ) o manual (intelectual), utilizando lenguajes controlados Búsqueda: proceso por el que el sistema examina las representaciones de los documentos y trata de equipararlas con las de la consulta, para determinar las que mejor satisfacen las necesidades de los usuarios, las más relevantes (las que presentan un mayor grado de semejanza). Ana Rosa Candela Hidalgo 18

19 SISTEMAS DE RECUPERACIÓN DE LA INFORMACIÓN (SRI) Fuente: Vallez, M,, Pedraza-Jiménez, R. El procesamiento del lenguaje natural en la recuperación de información textual y áreas afines. Hipertext.net, nº 5, 2007, p. 4. Tareas de un SRI: 1. Indización de la colección de documentos índice con las descripciones de los documentos 2. Análisis y representación de la consulta del usuario 3. Comparación de las descripciones del documento y la consulta 4. Ordenación de los resultados en función de su relevancia Ana Rosa Candela Hidalgo 19

20 SISTEMAS DE RECUPERACIÓN DE LA INFORMACIÓN (SRI) SALTON, 1983: "cualquier SRI puede ser descrito como un conjunto de items de información (DOCS), un conjunto de peticiones (REQS) y algún mecanismo (SIMILAR) que determine qué ítems satisfacen las necesidades de información expresadas por el usuario en la petición" 3 SIMILAR Esquema simple de un SRI. Fuente: Salton, G. and MC Gill, M.J. Introduction to Modern Information Retrieval. New York: Mc Graw-Hill Computer Series, Martínez Mendez, F.J. Recuperación de información. Modelos, sistemas y evaluación. Murcia: KIOSKO JMC, 2004, p. 5. [Disponible en Ana Rosa Candela Hidalgo 20

21 LOS SISTEMAS DE RECUPERACIÓN DE LA INFORMACIÓN (SRI) SALTON, 1983: en realidad, el esquema es un poco más complejo, puesto que "los documentos suelen convertirse inicialmente a un formato especial, por medio del uso de una clasificación o de un sistema de indización, que denominaremos LANG" SIMILAR LANG ESQUEMA AVANZADO DE UN SRI. Fuente: Salton, G. and MC Gill, M.J. Introduction to Modern Information Retrieval. New York: Mc Graw-Hill Computer Series, proceso establecido entre la entrada REQS y SIMILAR: proceso de formulación de la búsqueda proceso establecido entre SIMILAR y el conjunto de documentos DOCS: proceso de recuperación SIMILAR: proceso de determinación de la similitud existente entre la representación de la pregunta y la representación de los items de información. Ana Rosa Candela Hidalgo 21

22 SISTEMAS DE RECUPERACIÓN DE LA INFORMACIÓN (SRI) Funciones principales en un SRI (Chowdhury, 1999) 1. Identificar las fuentes de información relevantes a las áreas de interés de las solicitudes de los usuarios 2. Analizar los contenidos de los documentos 3. Representar los contenidos de las fuentes analizadas de manera adecuada para compararlas con las preguntas de los usuarios 4. Analizar las preguntas de los usuarios y representarlas de forma adecuada para compararlas con las representaciones de los documentos de la base de datos 5. Realizar la correspondencia entre la representación de la búsqueda y los documentos almacenados en la base de datos 6. Recuperar la información relevante 7. Realizar los ajustes necesarios en el sistema basados en la retroalimentación con los usuarios Ana Rosa Candela Hidalgo 22

23 MODELOS DE SRI El diseño de un RSI se realiza siguiendo un modelo en el que se define: cómo se obtienen las representaciones de los documentos y de la consulta la estrategia para evaluar la relevancia de un documento respecto a una consulta los métodos para establecer la importancia (el orden) de los documentos de salida Ana Rosa Candela Hidalgo 23

24 MODELOS DE SRI Baeza-Yates, en función de la tarea inicial que realiza el usuario en el sistema, clasifica los modelos de SRI en: 1. aquellos en los que se recupera información por medio de una ecuación de búsqueda (retrieval) que se inserta en un formulario destinado a ello Modelos clásicos: booleano, espacio vectorial y probabilístico Modelos estructurados. 2. Aquellos en los que se consultan (browse) los documentos en la búsqueda de referencias, basados en la navegación entre páginas web web Estructura plana: simple lectura de un documento aislado del contexto Estructura guiada: facilita la exploración organizando los documentos en una estructura tipo directorio con una jerarquía de clases y subclases Hipertexto: posibilidad de adquirir información de forma no estrictamente secuencial, sino a través de nodos y enlaces. Ana Rosa Candela Hidalgo 24

25 MODELOS DE SRI Elementos a considerar en un SRI: Necesidades de información: entidad subjetiva, consiste en un estado psicológico. El usuario desea información sobre un tema o materia y no puede precisar con datos aquello que quiere conocer. Documentos cognitivos: obras de creación o de pensamiento (sobre ciencia, tecnología, cultura), es decir, información textual en lenguaje natural RI esencial en un fondo documental de gran volumen Se pasa de la gestión de referencias bibliográficas a la gestión de documentos a texto completo Ana Rosa Candela Hidalgo 25

26 MODELOS DE SRI Elementos a considerar en un SRI: El proceso de representación La representación de un documento puede consistir en una ficha bibliográfica estructurada en una descripción formal (ISBD) y una descripción característica (contenido: descriptores) para el ordenador es un conjunto de palabras o términos de indización (cadenas de caracteres) D i = {t 1, t 2, t 3, t n } t 1, t 2, t 3, t n son palabras simples (turismo) o compuestas (turismo rural) que reflejan el contenido temático del documento D i Documento "Legislación sobre economía y trabajo en España y Europa" D i = {Economía, España, Europa, Legislación, Trabajo} Las necesidades de información (pregunta) también se representan con términos de indización. P j = {t 1, t 2, t 3, t n } Necesidad de información "legislación sobre trabajo y mujeres en Cataluña" P i = {Cataluña, Trabajo, Legislación, Mujeres} Ana Rosa Candela Hidalgo 26

27 MODELOS DE SRI Elementos a considerar en un SRI: El proceso de comparación Un SRI compara de forma automática un conjunto de palabras que representa los documentos con el que representa la necesidad de información Como resultado, se obtiene una ordenación de los documentos partiendo del grado de probabilidad de cada documento para satisfacer las necesidad de información, es decir, de su relevancia, a partir de la estimación del nº de elementos en común. La relevancia tiene grados, no se limita a ser relevante o no ordenación de los resultados recuperados en función de ese valor y no de manera aleatoria u ordenados desde un punto de vista semántico no muy significativo (título o fecha de creación), como sucede en gran parte de las bases de datos documentales Presentación y visualización de la información Pueden presentar uno o varios formatos de presentación (vistas) de los documentos individuales o de los grupos de documentos recuperados (listas de resultados resumidas o detalladas), para adaptarlos a los intereses o las necesidades de los diferentes tipos de usuarios. Ana Rosa Candela Hidalgo 27

28 MODELOS DE SRI MODELO BOOLEANO En un RI booleano, una vez indizados los documentos, y ante la pregunta del usuario, existen dos objetos: la entidad documento y la pregunta, ambos representados por un conjunto de términos de indización La recuperación se basa en obtener aquellos documentos que cumplan la función lógica del Álgebra de Boole, expresada en la consulta del usuario Los términos de la pregunta se pueden relacionar mediante los operadores lógicos AND, OR y NOT. El motor de búsqueda proporciona otros tipos de búsquedas suplementarias: por truncamiento y por proximidad. Opción de restringir la búsqueda a campos concretos o series de datos Ana Rosa Candela Hidalgo 28

29 MODELOS DE SRI MODELO BOOLEANO El resultado de una ecuación de búsqueda booleana es un conjunto que contiene los documentos relevantes (en ocasiones puede ser vacío) El acierto es exacto: sólo hay dos tipos de documentos, los que cumplen las condiciones de la búsqueda y los que no. La estructura de datos empleada tradicionalmente es el fichero inverso. Este fichero genera diversos índices de términos (todos los términos, términos agrupados y/o raíces de los términos) con punteros al fichero de los documentos o fichero directo. El más empleado de forma tradicional en los sistemas de información bibliográfica (BB.DD, portales de revistas-e ) Ana Rosa Candela Hidalgo 29

30 MODELO BOOLEANO - FICHERO INVERSO EJEMPLO DE UN ÍNDICE INVERTIDO Término Frecuencia Localización Barcelona 2 (00017, 03, 01) (03401, 01, 04) Madrid 2 (00017, 03, 03) (17200, 02, 01) Zaragoza 3 (00017, 03, 04), (03401, 01, 02) (17001, 04, 01) (03401, 01, 04) ID Campo Título Historia ilustrada de Barcelona 02 Autor U. Eco 03 Fuente Vic. Editorial ZYX, Descriptores Barcelona, Historia Modelo de registro de la base de datos del ejemplo Título Autor Fuente Descriptores (03401, 01, 04) y el resto de conjuntos de datos son vectores porque en cada conjunto la posición de cada elemento es significativa. El 1er elemento siempre es el identificador del registro, el 2º el identificador del campo y el 3º identifica el nº de orden de la palabra en el campo considerado Ana Rosa Candela Hidalgo 30

31 MODELOS DE SRI MODELO BOOLEANO LIMITACIONES De difícil uso por los usuarios. Se requieren cierto tipo de conocimientos y habilidades. Escaso control sobre el volumen del resultado producido por una petición concreta necesarias reformulaciones de la pregunta para lograr un volumen aceptable de resultados. Todos los registros recuperados son supuestamente de la misma utilidad para el usuario. Se entregan de manera aleatoria. No existen mecanismos que permitan ordenarlos en función de su relevancia. No permite reflejar la importancia relativa de los diferentes componentes de la pregunta todos los términos tienen un peso 1 o 0, dependiendo de si están o no presentes en la pregunta. Ana Rosa Candela Hidalgo 31

32 MODELOS DE SRI MODELO PROBABILISTICO (Sparck-Jones y Robertson) Para cada pregunta existe una respuesta ideal, un conjunto de documentos que contienen exactamente los documentos relevantes y no otros Requiere especificar correctamente las propiedades de estos documentos, pero no sabemos cómo hacerlo. Sólo conocemos la existencia de términos índices cuyo significado puede usarse para caracterizar esas propiedades. Como esos términos son desconocidos al preguntar, hay que llevar a cabo una conjetura inicial, que genera un primer conjunto de documentos. A continuación se interactúa con el usuario para mejorar la calidad. El usuario valora la respuesta y selecciona los documentos relevantes y el sistema emplea esa información para refinar la respuesta Por repetición de este proceso, se espera que la descripción de la respuesta evolucione aproximándose a la ideal, porque cada paso realimenta la información disponible para calcular la relevancia de un documento. Ana Rosa Candela Hidalgo 32

33 MODELOS DE SRI MODELO DE ESPACIO VECTORIAL (Salton) Después del booleano, es el modelo de mayor influencia. A este modelo responden los motores de búsqueda en la web. Los términos de indización son considerados como coordenadas en un espacio informativo multidimensional. Documentos y preguntas son representados como vectores que recogen la frecuencia de aparición de los términos en los documentos (términos significativos y sólo la raíz común). Cada componente del vector representa al término de indización correspondiente. La base de datos se concibe como una matriz de términos y documentos La similaridad entre un documento y una pregunta se calcula mediante la comparación entre sus vectores. La similitud se entiende como afinidad entre el significado del documento y el tema de la pregunta Relevancia Ana Rosa Candela Hidalgo 33

34 MODELOS DE SRI La base de datos se concibe como una matriz de términos y documentos Fuente: Martínez Mendez, F.J. Recuperación de información. Modelos, sistemas y evaluación. Murcia: KIOSKO JMC, 2004, p. 10 [Disponible en si la pregunta fuera cuál es el caudal del río Danubio?, su vector de términos sería Q = (1,1,0,0,0,1,0,0,0). Ana Rosa Candela Hidalgo 34

35 MODELOS DE SRI MODELO DE ESPACIO VECTORIAL (Salton) La indización implica la asignación de designadores de contenido a los documentos (ponderación de términos ), de manera que puedan ser fácilmente diferenciables en el espacio multidimensional. Las frecuencias absolutas de los términos distorsionan los resultados, por eso se tiene en cuenta el peso de los términos en cada documento y en la colección Se mide el valor de discriminación (incentivación de la presencia de aquellos términos que aparecen en menos documentos, frente a los que aparecen en todos o casi todos) frecuencia inversa de documento (idf) El peso de un término en un documento aumenta si es más frecuente en el documento y disminuye si es más frecuente en todos los demás documentos. Se calcula mediante la combinación de la frecuencia de término (tf) y la frecuencia inversa del documento (idf) tf-idf Considera la posibilidad del acierto parcial frente a la simple coincidencia de términos (booleano), más adecuado cuando se trabaja con el significado de los documentos Ana Rosa Candela Hidalgo 35

36 MODELOS DE SRI Fuente: Martínez Mendez, F.J. Recuperación de información. Modelos, sistemas y evaluación. Murcia: KIOSKO JMC, 2004, p. 12 [Disponible en Con estos valores de similitud, se obtiene la siguiente respuesta: {D3,D2, D1, D4} Ana Rosa Candela Hidalgo 36

Recuperación de información Bases de Datos Documentales Licenciatura en Documentación Curso 2011/2012

Recuperación de información Bases de Datos Documentales Licenciatura en Documentación Curso 2011/2012 Bases de Datos Documentales Curso 2011/2012 Miguel Ángel Rodríguez Luaces Laboratorio de Bases de Datos Universidade da Coruña Introducción Hemos dedicado la primera mitad del curso a diseñar e implementar

Más detalles

Análisis y síntesis El proceso documental Lenguajes documentales El proceso de indización El resumen documental

Análisis y síntesis El proceso documental Lenguajes documentales El proceso de indización El resumen documental Análisis y síntesis El proceso documental Lenguajes documentales El proceso de indización El resumen documental El proceso documental El proceso o cadena documental es la razón fundamental de un centro

Más detalles

Sistemas de Recuperación de Información

Sistemas de Recuperación de Información Sistemas de Recuperación de Información Los SRI permiten el almacenamiento óptimo de grandes volúmenes de información y la recuperación eficiente de la información ante las consultas de los usuarios. La

Más detalles

Cuál es la temática sobre la que más se publica en discapacidad?: análisis de los descriptores más utilizados en el SID

Cuál es la temática sobre la que más se publica en discapacidad?: análisis de los descriptores más utilizados en el SID Cuál es la temática sobre la que más se publica en discapacidad?: análisis de los descriptores más utilizados en el SID Informe elaborado por el equipo de trabajo del SID (Servicio de Información sobre

Más detalles

Profesroa: Dra. Ana Mª Muñoz Muñoz 1

Profesroa: Dra. Ana Mª Muñoz Muñoz 1 1 2 3 4 5 6 7 Fundamentos de recuperación de la información Gestión de la Información en Bases de datos Colección de elementos discretos denominados registros cuyo contenido puede ser tan variado como

Más detalles

GENERALIDADES DE BASES DE DATOS

GENERALIDADES DE BASES DE DATOS GENERALIDADES DE BASES DE DATOS A fin de evitar que idénticos datos se encuentren repetidos en múltiples archivos, parece necesario que los comunes se almacenen en un archivo único y que este archivo sea

Más detalles

Aplicación de Técnicas de Recuperación de Información a un Glosario de Términos de Internet Desarrollado Utilizando Tecnología JSP *

Aplicación de Técnicas de Recuperación de Información a un Glosario de Términos de Internet Desarrollado Utilizando Tecnología JSP * Aplicación de Técnicas de Recuperación de Información a un Glosario de Términos de Internet Desarrollado Utilizando Tecnología JSP * Pedro Cuesta Morales 1, Manuel J. Maña López 1, Carlos Cuervo Martínez

Más detalles

Capítulo 1. Introducción

Capítulo 1. Introducción Capítulo 1. Introducción El WWW es la mayor fuente de imágenes que día a día se va incrementando. Según una encuesta realizada por el Centro de Bibliotecas de Cómputo en Línea (OCLC) en Enero de 2005,

Más detalles

POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA

POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA POSIBLE APLICACIÓN DE LA MINERÍA DE TEXTOS A LOS TRABAJOS DE LA COMISIÓN MINISTERIAL DE INFORMÁTICA M.ª del Pilar Cantero Blanco Jefa de Servicio de Sistemas Informáticos. Subdirección General de Planificación

Más detalles

Recuperación Avanzada de la Información

Recuperación Avanzada de la Información Máster en Sistemas Inteligentes Recuperación Avanzada de la Información Máster en Sistemas Inteligentes 1 Carlos G. Figuerola 1 Ángel Zazo Rodríguez 1 1 Departamento de Informática y Automática Grupo de

Más detalles

Tutorial de búsqueda bibliográfica mediante la base de datos Psycinfo Índice

Tutorial de búsqueda bibliográfica mediante la base de datos Psycinfo Índice Tutorial de búsqueda bibliográfica mediante la base de datos Psycinfo Índice 1. Búsqueda bibliográfica en investigación 2. Qué es Psycinfo? 3. Unidades básicas de información 4. Cómo se utiliza Psycinfo?

Más detalles

DESCRIPTORES DE RENDIMIENTO

DESCRIPTORES DE RENDIMIENTO California English Language Development Test DESCRIPTORES DE RENDIMIENTO DE LA PRUEBA Este documento contiene los Descriptores de de la prueba CELDT, que describen lo que los estudiantes, por lo general,

Más detalles

TEMA 4: LOS SISTEMAS DE RECUPERACIÓN DE LA INFORMACIÓN (SRI) DE LAS BASES DE DATOS

TEMA 4: LOS SISTEMAS DE RECUPERACIÓN DE LA INFORMACIÓN (SRI) DE LAS BASES DE DATOS TEMA 4: LOS SISTEMAS DE RECUPERACIÓN DE LA INFORMACIÓN (SRI) DE LAS BASES DE DATOS DOCUMENTALES Y LA CALIDAD DE LOS RESULTADOS OBTENIDOS. COMPETENCIA ESPECÍFICA DE LA ASIGNATURA: CAPACITAR EN LA LOCALIZACIÓN

Más detalles

Cómo hay que iniciar una búsqueda

Cómo hay que iniciar una búsqueda Cómo hay que iniciar una búsqueda Mònica Bonich Albert Cervera Gema Santos PID_00168881 Cómo hay que iniciar una búsqueda Los contenidos de este material se publican bajo una licencia Creative Commons

Más detalles

XerKa, vigilancia a medida y flexible

XerKa, vigilancia a medida y flexible XerKa es una solución software que apoya los procesos de Vigilancia Tecnológica e Inteligencia Competitiva de la empresa. Busca, filtra, analiza y clasifica información procedente de la red Interna e Internet

Más detalles

CUALIFICACIÓN SISTEMAS DE GESTIÓN DE INFORMACIÓN PROFESIONAL. Nivel 3. Versión 5 Situación RD 1201/2007 Actualización

CUALIFICACIÓN SISTEMAS DE GESTIÓN DE INFORMACIÓN PROFESIONAL. Nivel 3. Versión 5 Situación RD 1201/2007 Actualización Página 1 de 16 CUALIFICACIÓN SISTEMAS DE GESTIÓN DE INFORMACIÓN PROFESIONAL Familia Profesional Informática y Comunicaciones Nivel 3 Código IFC304_3 Versión 5 Situación RD 1201/2007 Actualización Competencia

Más detalles

Guía: Proceso de búsqueda y recuperación de información. 2da. Edición. Revisada corregida y ampliada.

Guía: Proceso de búsqueda y recuperación de información. 2da. Edición. Revisada corregida y ampliada. Guía: Proceso de búsqueda y recuperación de información. 2da. Edición. Revisada corregida y ampliada. Está dirigida a profesionales, estudiantes universitarios, científicos El proceso de búsqueda y recuperación

Más detalles

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN)

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) CLASIFICACIÓN NO SUPERVISADA CLUSTERING Y MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) info@clustering.50webs.com Indice INTRODUCCIÓN 3 RESUMEN DEL CONTENIDO 3 APRENDIZAJE

Más detalles

CLASIFICACIÓN E INDIZACIÓN DE DOCUMENTOS

CLASIFICACIÓN E INDIZACIÓN DE DOCUMENTOS CLASIFICACIÓN E INDIZACIÓN DE DOCUMENTOS Para realizar esta tarea se dispone de los siguientes atributos: Aplicación pedagógica CDU Descriptores Se trata de valores controlados y repetibles. Controlados

Más detalles

Modelo de BASE DE DATOS EBSCO

Modelo de BASE DE DATOS EBSCO EL VOCABULARIO CONTROLADO EN LA RECUPERACIÓN DE NFORMACIÓN Modelo de BASE DE DATOS EBSCO Lic. Ana Luisa Pinillo León Servicios Bibliotecarios El vocabulario controlado es la clave fundamental para obtener

Más detalles

CONTENIDOS MÍNIMOS LENGUA CASTELLANA Y LITERATURA

CONTENIDOS MÍNIMOS LENGUA CASTELLANA Y LITERATURA MÍNIMOS DE LENGUA CASTELLANA Y LITERATURA PRIMERO DE ESO Reconocer el orden temporal en que suceden los hechos en una narración. Hacer resúmenes de un texto dado. Respuesta a preguntas sobre un texto que

Más detalles

Oferta tecnológica: Procesamiento del lenguaje natural para la extracción y recuperación de información

Oferta tecnológica: Procesamiento del lenguaje natural para la extracción y recuperación de información Oferta tecnológica: Procesamiento del lenguaje natural para la extracción y recuperación de información Oferta tecnológica: Procesamiento del lenguaje natural para la extracción y recuperación de información

Más detalles

Principales Bases de datos en la Biblioteca Virtual en Salud- España

Principales Bases de datos en la Biblioteca Virtual en Salud- España La Informática de la Salud: Punto de Encuentro de las Disciplinas Sanitarias Principales Bases de datos en la Biblioteca Virtual en Salud- España Cristina Bojo Canales Mª Belén Jaén Casquero Biblioteca

Más detalles

Migración de datos automática a partir de la información de los esquemas conceptuales 1

Migración de datos automática a partir de la información de los esquemas conceptuales 1 Migración de datos automática a partir de la información de los esquemas conceptuales 1 J.Pérez 1, J.A.Carsí 1, I.Ramos 1, V.Anaya 1, J.Silva 1, Departamento de Sistemas Informáticos y Computación Universidad

Más detalles

TECNOLOGÍAS LINGÜÍSTICAS Y ACCESO A LA INFORMACIÓN: LA EXPERIENCIA DE BITEXT EN LA ADMINISTRACIÓN PÚBLICA

TECNOLOGÍAS LINGÜÍSTICAS Y ACCESO A LA INFORMACIÓN: LA EXPERIENCIA DE BITEXT EN LA ADMINISTRACIÓN PÚBLICA TECNOLOGÍAS LINGÜÍSTICAS Y ACCESO A LA INFORMACIÓN: LA EXPERIENCIA DE BITEXT EN LA ADMINISTRACIÓN PÚBLICA Director General Bitext.com Director Técnico Bitext.com Palabras clave Gestión de documentos, gestión

Más detalles

Organización y recuperación de la información

Organización y recuperación de la información Organización y recuperación de la información Documentos de lectura UP01/79009/00625 Esta recopilación de artículos ha sido seleccionada por Cristòfol Rovira Fontanals y Lluís Condina Bonilla. Primera

Más detalles

CUALIFICACIÓN CONFECCIÓN Y PUBLICACIÓN DE PÁGINAS WEB PROFESIONAL. Nivel 2. Versión 5 Situación RD 1201/2007 Actualización

CUALIFICACIÓN CONFECCIÓN Y PUBLICACIÓN DE PÁGINAS WEB PROFESIONAL. Nivel 2. Versión 5 Situación RD 1201/2007 Actualización Página 1 de 18 CUALIFICACIÓN CONFECCIÓN Y PUBLICACIÓN DE PÁGINAS WEB PROFESIONAL Familia Profesional Informática y Comunicaciones Nivel 2 Código IFC297_2 Versión 5 Situación RD 1201/2007 Actualización

Más detalles

Procesamiento de Texto y Modelo Vectorial

Procesamiento de Texto y Modelo Vectorial Felipe Bravo Márquez 6 de noviembre de 2013 Motivación Cómo recupera un buscador como Google o Yahoo! documentos relevantes a partir de una consulta enviada? Cómo puede procesar una empresa los reclamos

Más detalles

Fundamentos de la Búsqueda en la Web Para Periodistas y Comunicadores

Fundamentos de la Búsqueda en la Web Para Periodistas y Comunicadores Fundamentos de la Búsqueda en la Web Para Periodistas y Comunicadores Lluís Codina G r u p o D i gidoc D e p a r tamento d e C o m u nicación U n i ve r s i t at P o m peu F a b r a Contenido de esta presentación

Más detalles

Procesamiento del Lenguaje Natural para recuperación de información

Procesamiento del Lenguaje Natural para recuperación de información 1 de 8 19/03/2007 18:19 free web hosting free hit counter report abuse THE FRUIKIS The brain never dream s Home Procesamiento del Lenguaje Natural para recuperación de información Introducción Procesadores

Más detalles

ORIENTACIONES GENERALES PARA EL DISEÑO Y DESARROLLO DE UN PROYECTO DE INVESTIGACIÓN

ORIENTACIONES GENERALES PARA EL DISEÑO Y DESARROLLO DE UN PROYECTO DE INVESTIGACIÓN ORIENTACIONES GENERALES PARA EL DISEÑO Y DESARROLLO DE UN PROYECTO DE INVESTIGACIÓN Qué es un proyecto de investigación? Un proyecto de investigación consiste en el estudio de un tema en profundidad y

Más detalles

Introducción a la Recuperación de información Information Retrieval

Introducción a la Recuperación de información Information Retrieval Introducción a la Recuperación de información Information Retrieval Raquel Trillo Lado (raqueltl@unizar.es) Sistemas de Información Curso 2012-2013 Guión: Recuperación de Información! Recuperación de información

Más detalles

Es necesario conocer otras dos herramientas de búsqueda en Internet: los «metabuscadores» ó «motores de búsqueda» y los «portales».

Es necesario conocer otras dos herramientas de búsqueda en Internet: los «metabuscadores» ó «motores de búsqueda» y los «portales». Búsqueda de información en la red Una de los usos más extendidos de Internet es la búsqueda de información útil para el/la usuario/a. Sin embargo, su localización no resulta siempre una tarea fácil debido

Más detalles

Introducción a las Fuentes de Información: explotación y manejo

Introducción a las Fuentes de Información: explotación y manejo Introducción a las Fuentes de Información: explotación y manejo Pedro López Clemente ( Salamanca, 3 de septiembre de 2.007 ) Índice Introducción Conceptos básicos Recursos sintácticos El proceso de la

Más detalles

CICLO SUPERIOR DESARROLLO DE APLICACIONES MULTIPLATAFORMA

CICLO SUPERIOR DESARROLLO DE APLICACIONES MULTIPLATAFORMA CICLO SUPERIOR DESARROLLO DE APLICACIONES MULTIPLATAFORMA PROGRAMACIÓN DIDACTICA ANUAL Parte específica del módulo: 0485. Programación Departamento de Familia Profesional de Informática Curso: 2014-15

Más detalles

Recuperación de Información en el Contexto de la Ciencia de la Computación

Recuperación de Información en el Contexto de la Ciencia de la Computación Recuperación de Información en el Contexto de la Ciencia de la Computación Edgar Casasola Murillo Universidad de Costa Rica Escuela de Ciencias de la Computación edgar.casasola@ecci.ucr.ac.cr Temas tratados

Más detalles

14 Guía de Microsoft Word 2010 Guía de contenido digital accesible

14 Guía de Microsoft Word 2010 Guía de contenido digital accesible 14 Guía de Microsoft Word 2010 Guía de contenido digital accesible Mireia Ribera Este documento tiene una licencia Reconocimiento-No Comercial-Compartir- Igual 3.0 de Creative Commons. Se permite la reproducción,

Más detalles

Productos y servicios para la formación de usuarios de bibliotecas universitarias: el uso de bases de datos en entornos Web

Productos y servicios para la formación de usuarios de bibliotecas universitarias: el uso de bases de datos en entornos Web Productos y servicios para la formación de usuarios de bibliotecas universitarias: el uso de bases de datos en entornos Web Natalia Sastre Miralles Biblioteca de la Universidad Politécnica de Valencia

Más detalles

Análisis del Sistema de Información

Análisis del Sistema de Información Análisis del Sistema de Información ÍNDICE DESCRIPCIÓN Y OBJETIVOS... 2 ACTIVIDAD ASI 1: DEFINICIÓN DEL SISTEMA... 6 Tarea ASI 1.1: Determinación del Alcance del Sistema... 6 Tarea ASI 1.2: Identificación

Más detalles

En estos estándares aparece resaltada en letra negrilla y cursiva la habilidad o competencia de Tecnología (TICs) que se requiere en cada nivel.

En estos estándares aparece resaltada en letra negrilla y cursiva la habilidad o competencia de Tecnología (TICs) que se requiere en cada nivel. 1 Recientemente publicamos los Estándares del Currículo para Colegios y Centros de Información de Bibliotecas Escolares desarrollado por la Asociación de Bibliotecólogos de Ontario, Canadá, y ahora presentamos

Más detalles

INSTITUTO DE EDUCACIÓN TÉCNICA PROFESIONAL INTEP T.P. Sistemas e Informática. Asignatura: Internet e Informática. Docente: Ing. Ana Milena Bueno Henao

INSTITUTO DE EDUCACIÓN TÉCNICA PROFESIONAL INTEP T.P. Sistemas e Informática. Asignatura: Internet e Informática. Docente: Ing. Ana Milena Bueno Henao TECNICAS Y HERRAMIENTAS DE BUSQUEDA EN INTERNET En Internet existe una gran cantidad de información que es posible consultar, sin embargo ésta no se encuentra clasificada, ni ordenada, por lo que encontrar

Más detalles

CONSULTA EN BASES DE DATOS

CONSULTA EN BASES DE DATOS CONSULTA EN BASES DE DATOS Tutorial para el Usuario 2 Introducción La Universidad Autónoma de Aguascalientes a través del Departamento de Información Bibliográfica pone a disposición de la comunidad universitaria

Más detalles

Definición del problema de información

Definición del problema de información Definición del problema de información bjetivos Diferenciar entre lenguaje natural y lenguaje documental. Expresar con terminología documental los conceptos que definen un problema o necesidad de información.

Más detalles

Apéndices técnicos. Método de representación: forma en que serán representados internamente los documentos.

Apéndices técnicos. Método de representación: forma en que serán representados internamente los documentos. APÉNDICE A: INDEXACIÓN DE INFORMACIÓN. LUCENE 1. INTRODUCCIÓN: INDEXACIÓN DE INFORMACIÓN El desarrollo y crecimiento masivo de las redes de computadoras y medios de almacenamiento a lo largo de los últimos

Más detalles

Tabla de contenidos. Búsqueda en LILACS, 2. Iniciando la búsqueda, 3-11

Tabla de contenidos. Búsqueda en LILACS, 2. Iniciando la búsqueda, 3-11 Búsqueda en LILACS, 2 Iniciando la búsqueda, 3-11 Tabla de contenidos 1. Formularios, 3-6 1.1. Buscando en el Formulario Libre, 3 1.2. Uso de los Formularios Básico y Avanzado, 4 1.2.1. Uso de los índices,

Más detalles

Práctica1. Introducción a Microsoft Access. Qué es Access?

Práctica1. Introducción a Microsoft Access. Qué es Access? Práctica1. Introducción a Microsoft Access Los sistemas de información empresariales tienen como misión el proporcionar información precisa en el momento adecuado, tanto para la gestión y realización de

Más detalles

LENGUA EXTRANJERA II (INGLÉS)

LENGUA EXTRANJERA II (INGLÉS) LENGUA EXTRANJERA II (INGLÉS) Estructura del examen para los dos próximos cursos académicos, previos a la introducción de la prueba oral. El esquema y los criterios de corrección son los siguientes: (Válida

Más detalles

Tema 3: Bases de datos en Entorno Web

Tema 3: Bases de datos en Entorno Web Tema 3: Bases de datos en Entorno Web 1. Introducción. Un sistema de bases de datos proporciona un control centralizado de los datos. Esto contrasta con la situación que prevalece actualmente, donde a

Más detalles

EVALUACIÓN DE BUSCADORES WEB Y RECUPERACIÓN DE INFORMACIÓN

EVALUACIÓN DE BUSCADORES WEB Y RECUPERACIÓN DE INFORMACIÓN EVALUACIÓN DE BUSCADORES WEB Y RECUPERACIÓN DE INFORMACIÓN EVALUACIÓ DE BUSCADORES WEB Aquí podemos encontrar información referente a la evaluación de buscadores Web. Encontramos información acerca de

Más detalles

BASE DE DATOS UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II. Comenzar presentación

BASE DE DATOS UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II. Comenzar presentación UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II BASE DE DATOS Comenzar presentación Base de datos Una base de datos (BD) o banco de datos es un conjunto

Más detalles

IV. Problemas relativos a la construcción del conocimiento y al cambio cognitivo

IV. Problemas relativos a la construcción del conocimiento y al cambio cognitivo Unidad 4 IV. Problemas relativos a la construcción del conocimiento y al cambio cognitivo 4.1. La problemática del dominio en relación al conocimiento. Dominio general y dominios específicos. Diferenciación

Más detalles

Tipos de datos. A la hora de crear un campo en una tabla, hay que especificar de qué tipo son los datos que se van a almacenar en ese campo.

Tipos de datos. A la hora de crear un campo en una tabla, hay que especificar de qué tipo son los datos que se van a almacenar en ese campo. Manual Basico de manejo de Access (Microsoft). 1. Introducción Qué es una base de datos? Una biblioteca ha de mantener listas de los libros que posee, de los usuarios que tiene, una escuela, de sus alumnos

Más detalles

Tamborenea, Blanca R. Tesauros. 1981/82, no. 2, p. 3-6

Tamborenea, Blanca R. Tesauros. 1981/82, no. 2, p. 3-6 Tamborenea, Blanca R. Tesauros Boletín Bibliotecológico de La Plata 1981/82, no. 2, p. 3-6 Este documento está disponible para su consulta y descarga en Memoria Académica, el repositorio institucional

Más detalles

BASES DE DATOS. 1.1 Funciones de un DBMS

BASES DE DATOS. 1.1 Funciones de un DBMS BASES DE DATOS Un DBMS, son programas denominados Sistemas Gestores de Base de Datos, abreviado SGBD, en inglés Data Base Management System (DBMS) que permiten almacenar y posteriormente acceder a los

Más detalles

APRENDE A BUSCAR Y EVALUAR LA INFORMACIÓN

APRENDE A BUSCAR Y EVALUAR LA INFORMACIÓN APRENDE A BUSCAR Y EVALUAR LA INFORMACIÓN Nos sentimos abrumados con el volumen actual de información, hemos de saber reconocer cuándo se necesita la información y ser capaces de localizarla, evaluarla

Más detalles

Documentación científica

Documentación científica Documentación científica Unidad 4: Tecnologías de la información y la comunicación en la recuperación de la documentación científica Tema 11. Gestión de la información: las bases de datos bibliográficas

Más detalles

BASES DE DATOS BIBLIOGRÁFICAS DEL CSIC

BASES DE DATOS BIBLIOGRÁFICAS DEL CSIC BASES DE DATOS BIBLIOGRÁFICAS DEL CSIC 1. Introducción. Cómo acceder a CSIC. Contenido de las bases EL SERVICIO DE BASES DE DATOS DE LA BIBLIOTECA DE LA UMA El Servicio de Información y Referencia ofrece

Más detalles

El explorador no admite los marcos flotantes o no está configurado actualmente para mostrarlos.

El explorador no admite los marcos flotantes o no está configurado actualmente para mostrarlos. Cómo buscar información en Internet file:///c /Documents and Settings/jerbez/Mis documentos/formación/pialte/internet/index.htm3/12/2006 14:40:12 Introducción INTRODUCCIÓN En Internet podemos encontrar

Más detalles

La importancia del mundo animal en Educación Primaria

La importancia del mundo animal en Educación Primaria La importancia del mundo animal en Educación Primaria Patricia Morales Romero 28841255-z JUSTIFICACIÓN La elección de la unidad didáctica los animales surgió ya que con los niños con los que trabaje estaban

Más detalles

DEPARTAMENTO DE LENGUA CASTELLANA 2014-2015 PREPARACIÓN PARA EL EXAMEN DE RECUPERACIÓN 1º ESO

DEPARTAMENTO DE LENGUA CASTELLANA 2014-2015 PREPARACIÓN PARA EL EXAMEN DE RECUPERACIÓN 1º ESO PREPARACIÓN PARA EL EXAMEN DE RECUPERACIÓN 1º ESO 1. El proceso de la comunicación y sus elementos. 2. Tipología textual: -Según la intención: textos informativos, persuasivos, prescriptivos y literarios.

Más detalles

Catalogación de recursos web: normas internacionales

Catalogación de recursos web: normas internacionales 1 Catalogación de recursos web: normas internacionales La descripción bibliográfica normalizada de los recursos de Internet Tercer Seminario de Centros de Documentación de Espacios Naturales Protegidos,

Más detalles

Cómo documentar la información

Cómo documentar la información Cómo documentar la información Apellidos, nombre Departamento Centro Cabrera Méndez, Margarita (mcabrera@upvnet.upv.es) Departamento de Comunicación Audiovisual, Documentación e Historia del Arte Universidad

Más detalles

Como buscar información en Internet sin naufragar en el intento

Como buscar información en Internet sin naufragar en el intento Como buscar información en Internet sin naufragar en el intento La presencia de Internet en nuestras vidas es innegable. La red nos provee de un gran cúmulo de información que crece minuto a minuto, a

Más detalles

TAREAS DE APOYO AL PROCESO TÉCNICO Y SERVICIO EN SALA. Mª Cruz Hermida

TAREAS DE APOYO AL PROCESO TÉCNICO Y SERVICIO EN SALA. Mª Cruz Hermida TAREAS DE APOYO AL PROCESO TÉCNICO Y SERVICIO EN SALA Mª Cruz Hermida TAREAS DE APOYO AL PROCESO TÉCNICO Y SERVICIO EN SALA Curso para Técnicos Auxiliares de la BUC (Febrero 2006) Prof. Mª Cruz Hermida

Más detalles

María Cecilia Barraza Mora Bibliotecóloga Santiago de Chile, 2005 utemvirtual María Cecilia Barraza Mora Bibliotecóloga Santiago de Chile, 2005 tabla de contenidos Presentación3 1. Definir Perfil de la

Más detalles

Malla curricular por grado

Malla curricular por grado Malla curricular por grado Malla curricular de Comunicación y Lenguaje L1 Español: Primer grado Competencia Indicador de 1. Formula preguntas y respuestas con relación a un hecho real o imaginario según

Más detalles

Tema 6.- Difusión de la información

Tema 6.- Difusión de la información Tema 6.- Difusión de la información 1.- El concepto de difusión documental 2.- Formas de difusión 2.1.- La difusión bajo demanda 2.2.- La difusión documental 2.2.1.- Difusión de documentos primarios 2.2.2.-

Más detalles

Division of Instruction: Albarrán Lax Petkiewicz López Powell Traducción: María De Melo con base en: http://commoncore- espanol.

Division of Instruction: Albarrán Lax Petkiewicz López Powell Traducción: María De Melo con base en: http://commoncore- espanol. Estándares de Lectura Literatura Ideas y detalles clave Composición y estructura Quinto Grado Integración de conocimientos e ideas Nivel de lectura y nivel de complejidad del texto Composición y estructura

Más detalles

BASES DE DATOS. Apuntes de Cátedra

BASES DE DATOS. Apuntes de Cátedra BASES DE DATOS Apuntes de Cátedra Definición de Bases de Datos Base de Datos es un conjunto exhaustivo no redundante de datos estructurados organizados independientemente de su utilización y su implementación

Más detalles

DESARROLLO DE APLICACIONES CON TECNOLOGÍAS WEB PROFESIONAL

DESARROLLO DE APLICACIONES CON TECNOLOGÍAS WEB PROFESIONAL Página 1 de 21 CUALIFICACIÓN DESARROLLO DE APLICACIONES CON TECNOLOGÍAS WEB PROFESIONAL Familia Profesional Informática y Comunicaciones Nivel 3 Código IFC154_3 Versión 5 Situación RD 1087/2005 Actualización

Más detalles

TEMA 3 Representación de la información

TEMA 3 Representación de la información TEMA 3 Representación de la información Álvarez, S., Bravo, S., Departamento de Informática y automática Universidad de Salamanca Introducción Para que el ordenador ejecute programas necesita dos tipos

Más detalles

CAPITULO 1. Introducción a los Conceptos Generales de Bases de Datos Distribuidas

CAPITULO 1. Introducción a los Conceptos Generales de Bases de Datos Distribuidas CAPITULO 1 Introducción a los Conceptos Generales de 1.1 Preliminares Las empresas necesitan almacenar información. La información puede ser de todo tipo. Cada elemento informativo es lo que se conoce

Más detalles

GUÍA PARA LA OBSERVACIÓN TECNOLÓGICA. guía para investigadores CONSEJO SUPERIOR DE INVESTIGACIONES CIENTÍFICAS

GUÍA PARA LA OBSERVACIÓN TECNOLÓGICA. guía para investigadores CONSEJO SUPERIOR DE INVESTIGACIONES CIENTÍFICAS CONSEJO SUPERIOR DE INVESTIGACIONES CIENTÍFICAS GUÍA PARA LA OBSERVACIÓN guía para investigadores Oficina de Transferencia de Tecnología del CSIC en la Comunidad Valenciana Presentación El concepto de

Más detalles

Práctica 1. Desarrollo de bases de datos con Microsoft Access 1.1. Descripción de Microsoft Access 2000

Práctica 1. Desarrollo de bases de datos con Microsoft Access 1.1. Descripción de Microsoft Access 2000 Práctica 1. Desarrollo de bases de datos con Microsoft Access 1.1. Descripción de Microsoft Access 2000 Microsoft Access 2000 para Windows es un SGBDR (Sistema de Gestión de Bases de Datos Relacional)

Más detalles

INFORMACION SOBRE LA PRUEBA VERSANT. 1. Introducción a la prueba Versant Placement Test

INFORMACION SOBRE LA PRUEBA VERSANT. 1. Introducción a la prueba Versant Placement Test INFORMACION SOBRE LA PRUEBA VERSANT. 1. Introducción a la prueba Versant Placement Test El Versant MR English Placement Test, accionado por tecnología Ordinate, consiste de un instrumento de evaluación

Más detalles

CURSO BASES DE DATOS DE PSICOLOGÍA PSYCINFO BIBLIOTECA DE PSICOLOGÍA CURSO 2015-2016

CURSO BASES DE DATOS DE PSICOLOGÍA PSYCINFO BIBLIOTECA DE PSICOLOGÍA CURSO 2015-2016 CURSO BASES DE DATOS DE PSICOLOGÍA PSYCINFO BIBLIOTECA DE PSICOLOGÍA CURSO 2015-2016 1 CÓMO ACCEDER A LA BASE Tiene varias posibilidades para acceder a la base de datos PSYCINFO: 1. Puede acceder desde

Más detalles

8.2. El sistema de indexación automática: el analizador indexador.

8.2. El sistema de indexación automática: el analizador indexador. Motores o robots de búsqueda. Aunque en la actualidad directorios y motores de búsqueda tienden a confluir, existen todavía diferencias significativas entre ellos. La diferencia fundamental es que los

Más detalles

SISTEMA BIBLIOTECARIO UTPL

SISTEMA BIBLIOTECARIO UTPL SISTEMA BIBLIOTECARIO UTPL El Sistema Bibliotecario, por su infraestructura, ubicación y cobertura temática está conformado por: la biblioteca general Benjamín Carrión en la Sede Central, las que existen

Más detalles

Unidad 1. Introducción a los conceptos de Bases de Datos

Unidad 1. Introducción a los conceptos de Bases de Datos Unidad 1 Introducción a los conceptos de Bases de Datos 1.1 Definición de Base de Datos Dato: Conjunto de caracteres con algún significado, pueden ser numéricos, alfabéticos, o alfanuméricos. Información:

Más detalles

3.1. Introducción... 1

3.1. Introducción... 1 ÍNDICE GENERAL Índice general 1. Recuperación de Información basada en contenido 1 1.1. Introducción.......................................... 1 1.2. Pasado, presente y futuro..................................

Más detalles

Índice. Unidad 1. Unidad 4. Unidad 5. Unidad 2. Unidad 3. Unidad 6

Índice. Unidad 1. Unidad 4. Unidad 5. Unidad 2. Unidad 3. Unidad 6 Índice Unidad 1 Capítulo 1- Las oraciones...2 Capítulo 2- Sujetos / sustantivos...7 Capítulo 3- Escritura expresiva...12 Capítulo 4- Predicados / verbos...16 Capítulo 5- Oraciones simples y oraciones compuestas...21

Más detalles

Recuperación de Información en Internet Tema 3: Principios de Recuperación de Información

Recuperación de Información en Internet Tema 3: Principios de Recuperación de Información Recuperación de Información en Internet Tema 3: Principios de Recuperación de Información Mestrado Universitario Língua e usos profesionais Miguel A. Alonso Jesús Vilares Departamento de Computación Facultad

Más detalles

Buscadores en Internet. capítulo 05

Buscadores en Internet. capítulo 05 Buscadores en Internet capítulo 05 Buscadores en Internet buscadores 5.1 Qué son? Los buscadores de Internet o motores de búsqueda son una página web cuyo servidor contiene una base de datos con direcciones

Más detalles

BASES DE DATOS MIS 308

BASES DE DATOS MIS 308 2. MODELOS DE DATOS Introducción 2.1 Entidad relación 2.2 Jerárquico 2.3 De red 2.4 Relacional Introducción Hoy en día las empresas manejan una gran cantidad de datos. Cualquier empresa que se precie debe

Más detalles

Una base de datos es una colección de información ordenada e interrelacionada que es de importancia para una empresa.

Una base de datos es una colección de información ordenada e interrelacionada que es de importancia para una empresa. BASES DE DATOS Una base de datos es una colección de información ordenada e interrelacionada que es de importancia para una empresa. La creación de una base de datos debe ser realizada cuidadosamente procurando

Más detalles

Evolución de la IR Web e Integración de PLN y Web Semántica en los modelos clásicos de IR

Evolución de la IR Web e Integración de PLN y Web Semántica en los modelos clásicos de IR El futuro de los buscadores: Nuevas tendencias en Recuperación de Información Evolución de la IR Web e Integración de PLN y Web Semántica en los modelos clásicos de IR FESABID 2007 José Ramón Pérez Agüera

Más detalles

SISTEMAS DE GESTIÓN DE BASE DE DATOS SGBD / DBMS

SISTEMAS DE GESTIÓN DE BASE DE DATOS SGBD / DBMS Universidad de Carabobo Facultad Experimental de Ciencias y Tecnología Departamento de Computación Unidad Académica Base de Datos SISTEMAS DE GESTIÓN DE BASE DE DATOS SGBD / DBMS Integrantes: Fidel Gil

Más detalles

PROGRAMA FORMATIVO. Office 2007-2 volúmenes

PROGRAMA FORMATIVO. Office 2007-2 volúmenes PROGRAMA FORMATIVO Office 2007-2 volúmenes Código: 3545 Sector: Tecnologías de la Información Modalidad: Distancia Duración: Objetivos: Crear y elaborar documentos, formatos, numeración, viñetas... Crear

Más detalles

PRUEBA DE SUFICIENCIA EN IDIOMAS

PRUEBA DE SUFICIENCIA EN IDIOMAS PRUEBA DE SUFICIENCIA EN IDIOMAS INGLÉS I Prof. Victor A. Nethol Profesor Titular Ordinario Avda. 60 esq. 124 Tel. /Fax (0221) 421-7578 / 482-4855 CARRERA Ingeniería Química DISEÑO CURRICULAR: 1995 ORDENANZA

Más detalles

Informática Documental

Informática Documental Informática Documental Tema 1.- Introducción Informática Documental = Informática + Documentación. Documento: DEF: fuente y soporte de información. TIPOS: o naturaleza: visual, auditivo, audiovisual. o

Más detalles

Índices FULL TEXT (SQL Server 2008) Marta E. Zorrilla Universidad de Cantabria

Índices FULL TEXT (SQL Server 2008) Marta E. Zorrilla Universidad de Cantabria Índices FULL TEXT (SQL Server 2008) Marta E. Zorrilla Universidad de Cantabria 2Marta Zorrilla Qué es la búsqueda full-text? Búsqueda por texto libre (palabras, frases,..) Hasta ahora para buscar palabras

Más detalles

La Biblioteca de Educación Superior: su organización y funcionamiento

La Biblioteca de Educación Superior: su organización y funcionamiento La Biblioteca de Educación Superior: su organización y funcionamiento Este Documento tiene por finalidad orientar la organización, funcionamiento, gestión y promoción de las bibliotecas escolares de los

Más detalles

Unidad didáctica 2: Metodologías de desarrollo de Bases de Datos. Unidad didáctica 1: Fase de análisis de requisitos Modelo E/R

Unidad didáctica 2: Metodologías de desarrollo de Bases de Datos. Unidad didáctica 1: Fase de análisis de requisitos Modelo E/R índice Módulo A Unidad didáctica 1: Introducción a las Bases de Datos Unidad didáctica 2: Metodologías de desarrollo de Bases de Datos 3 19 Módulo B Unidad didáctica 1: Fase de análisis de requisitos Modelo

Más detalles

Cómo preguntarle a Internet? (tutorial)

Cómo preguntarle a Internet? (tutorial) Cómo preguntarle a Internet? (tutorial) Y a hemos aprendido acerca de las mejores herramientas de búsqueda, sobre distintos métodos, diferenciamos la Web Superficial de la Profunda y descubrimos sus características.

Más detalles

Fundamentos del diseño 3ª edición (2002)

Fundamentos del diseño 3ª edición (2002) Unidades temáticas de Ingeniería del Software Fundamentos del diseño 3ª edición (2002) Facultad de Informática necesidad del diseño Las actividades de diseño afectan al éxito de la realización del software

Más detalles

Diseño de Bases de Datos Bases de Datos Documentales Grao en Información e Documentación Curso 2013/2014

Diseño de Bases de Datos Bases de Datos Documentales Grao en Información e Documentación Curso 2013/2014 Bases de Datos Documentales Curso 2013/2014 Miguel Ángel Rodríguez Luaces Laboratorio de Bases de Datos Universidade da Coruña El proceso de diseño El último día... Los problemas de no utilizar un SGBD:

Más detalles

LENGUAJES NATURALES. TEMA. Extracción y Recuperación de Información

LENGUAJES NATURALES. TEMA. Extracción y Recuperación de Información LENGUAJES NATURALES TEMA. Extracción y Recuperación de Información FJRP. LN, 2005 16 de enero de 2006 1. Introducción Objetivos Generales: Recuperación de Información (RI): Determinar cuales son los documentos

Más detalles

Representación y organización de la información por medio de Topic Maps

Representación y organización de la información por medio de Topic Maps Representación y organización de la información por medio de Topic Maps Gustavo Liberatore / Leticia Lizondo gliberat@mdp.edu.ar leticia_lizondo@yahoo.com.ar Depto. Documentación Universidad Nacional de

Más detalles

Introducción... 4 Conceptos básicos... 4 Qué es una base de datos?... 4 Partes de una base de datos... 4. Tablas... 4. Formularios... 5. Informes...

Introducción... 4 Conceptos básicos... 4 Qué es una base de datos?... 4 Partes de una base de datos... 4. Tablas... 4. Formularios... 5. Informes... Contenido Introducción... 4 Conceptos básicos... 4 Qué es una base de datos?... 4 Partes de una base de datos... 4 Tablas... 4 Formularios... 5 Informes... 5 Consultas... 5 Macros... 5 Módulos... 5 Partes

Más detalles

Guía del Catálogo de la Biblioteca

Guía del Catálogo de la Biblioteca Guía del Catálogo de la Biblioteca Desde la página inicial de la UPNA (http://www.unavarra.es/) podemos utilizar una caja de búsqueda para consultar el Catálogo de la Biblioteca. Buscará el término, o

Más detalles