EL VOCABULARIO CONTROLADO EN LA RECUPERACIÓN DE NFORMACIÓN Modelo de BASE DE DATOS EBSCO Lic. Ana Luisa Pinillo León Servicios Bibliotecarios
El vocabulario controlado es la clave fundamental para obtener información de calidad y que responda a las necesidades de los usuarios. Es una herramienta eficaz que brinda un alto nivel de precisión.. Nuestro trabajo pretende describir los tipos de encabezamientos de materia en tres de las diferentes bases de datos del paquete integrado de EBSCO, y las características de los mismos.
EBSCO es un poderoso sistema de referencia en línea, al acceso en los esenciales de Infomed. Ofrece diversas bases de datos con textos completos, índices, y publicaciones periódicas académicas, que cubren las diferentes áreas de las ciencias y las humanidades. Presenta más de 282,000 artículos de revistas, teniendo una relación activa con más de 60,000 editores de todo el mundo.
Objetivo general Usar el vocabulario controlado en la recuperación de información en la base de datos EBSCO.
Un sistema de búsqueda informativa debe contar, dentro de sus requisitos fundamentales, con un conjunto de medios que permitan expresar las características formales y de contenido de forma unívoca. Consejo Nacional de Ciencia y Técnica.
LBI. CARACTERÍSTICAS Poseen un sistema único para expresar los conceptos. Expresan las clases léxico-semánticas de forma explícita. Permiten una codificación para cada concepto. Predominan los sustantivos. No existe la redundancia.
IMPORTANCIA DE LOS LBI Agilizan y facilitan el procesamiento de la información y su recuperación. Expresan el contenido de la demanda informativa. Permiten realizar la búsqueda sucesiva de los documentos en el fondo.
VOCABULARIO CONTROLADO Podemos definir entonces, que el vocabulario controlado es un conjunto limitado de términos que deben utilizarse para representar los temas presentes en recursos de información utilizando un lenguaje de búsqueda informativa determinado. Puede ser alfabético como los listados de encabezamientos por materia y sistemáticos como en el tesauro.
Como ejemplos de vocabulario controlado podemos citar los epigrafiarios, los tesauros, el listado alfabético de palabras claves que representan las diferentes formas de encabezamientos de materias.
Formas de encabezamiento de materia
Epígrafe: Palabra, combinación de palabras o frase de la lengua natural para designar la materia de una fuente de información. El listado alfabético compuesto por palabras del lenguaje natural (epígrafes) recibe el nombre de epigrafiario. Descriptor: Término, palabra, o expresión escogida dentro de un conjunto de términos equivalentes para representar, sin ambigüedad y de manera unívoca, el concepto y el contenido semántico de una fuente de información. El listado de descriptores está representado en el tesauro.
Palabra clave: Conjunto de palabras significativas (que no sean artículos, conjunciones, preposiciones, etc.) extraídas del titulo, del resumen y/o del texto completo. Epigrafiarios: Listado alfabético compuesto por palabras del lenguaje natural (epígrafes) destinado para designar la materia de una fuente de información. Orozco Silva..
La asignación de epígrafe es un tipo específico de sistematización de documentos que se aplica en la práctica bibliotecaria desde hace más de cien años. Consiste en formular brevemente el contenido de los documentos utilizando para ello una o varias palabras tipos llamadas rúbricas de materia, que se distribuyen en orden alfabético.
Metodología para la asignación de epígrafes Aplicación de rúbricas amplias y limitadas. Empleo de sub-rúbricas. Definir el contenido concreto del documento. La inversión de su formulación permite reunir los materiales de temas cercanos.
Ejemplos Temáticas Agua evaporación Agua Purificación Geográficas Ganadería Cuba Ganadería Inglaterra. Cronológicas Bibliografía Historia S. XIX
Tesauro Clasificación terminológica jerarquizada. Listado compuesto por descriptores y no descriptores que obedecen a reglas terminológicas propias relacionadas entre sí por relaciones semánticas, jerárquicas, asociativas, o de equivalencia, con la finalidad de describir el concepto y contenido semántico de una fuente de información. Orozco Silva
Función del tesauro Utiliza el lenguaje de descriptores. Proporciona una visión de un campo dado del conocimiento. Suministra un vocabulario normalizado para un campo dado que asegura un control en los términos empleados como entrada de índices en el Sistema de Almacenamiento y Recuperación de la Información (SARI).
Función del tesauro Asegura que de un grupo de sinónimos, solo uno se usará para indizar el concepto, relaciona términos y posee referencias cruzadas. Ofrece jerarquías clasificadas para que una búsqueda pueda ser ampliada o restringida en forma sistemática.
Los tesauros que se utilizan en nuestro país para las Ciencias Médicas, son el MeSH y el DeCS (traducción del MeSH para los países de América Latina y del Caribe), ambos al acceso en línea. Además, por medio del tesauro DeCS se puede llegar al descriptor en los tres idiomas: portugués, inglés y español.
Listado alfabético de palabras claves Se recupera la información por palabras significativas del lenguaje natural. Es recomendable leer los artículos para lograr exactitud en el tema que se busca y realizar varias estrategias de búsqueda por todos los sinónimos posibles con el fin de recuperar la mayor cantidad de información, ya que no son muy precisos.
Inconvenientes del lenguaje de palabras claves para la búsqueda informativa No hay correspondencia única entre las palabras y su significado. Intervienen factores psicológicos subjetivos. Necesita de un lenguaje artificial con vocabulario controlado para que elimine la sinonimia.
Vocabulario Controlado para comenzar las búsquedas de información en la bases de datos que ofrece el paquete de EBSCO. Seleccionaremos tres ejemplos tipos de las bases de este paquete integrado. utilizando diferentes lenguajes de búsqueda: por epígrafes por descriptores por palabras claves.
Medline Materia Dieta vegetariana Diet, Vegetarian Academic Search Premier Vegetarianism Medic Latina Vegetarianismo, dieta vegetariana, vegetales etc
Conclusiones La búsqueda informativa debe comenzarse por el vocabulario controlado de la base. El usuario escoge el término admitido por el sistema para realizar la búsqueda informativa. Precisión y pertinencia en las respuestas. Rapidez en la localización de la información. Eliminación de ruido.
Conclusiones En la base de datos que indiza por palabras claves es necesario buscar por todos los sinónimos posibles para recuperar. Es el menos preciso.
Conclusiones La búsqueda por descriptores es un sistema que maneja conceptos representados por términos normalizados, permite la universalización de su uso, el intercambio de información con otros sistemas del ámbito nacional e internacional y una indización más específica, por lo que la recuperación será más profunda y exacta.
Bibliografía Consejo Nacional de Ciencia y Técnica Dirección Científico Técnica. Reunión Nacional de Información Científico Técnica. Introducción a un sistema coordinado de lenguajes de búsqueda informativa. 20, 21,22 nov 1975 Kruglikova VP. La asignación de epígrafe. Metodología general. Moscu: Kngr, 1967. p.48-9 López Jiménez C, Prieto Alberto A. La indización coordinada con el Medical Subject Heading. Su estructura y utilización. La Habana: Centro Nacional de Ciencias Medicas, 1987
Orozco Silva E. La inteligencia empresarial: Herramienta para la toma de decisiones a partir de la gestión y el análisis de la información. Ciudad de la Habana: Consultoría BIOMUNDI / IDICT, 200? Sancho Lozano R. Los tesauros de términos científicos y técnicos en general y especialmente los relativos a la química. Rev Esp Doc Cient 1985, 8(1):17-39 Mijailov AI, Chiorni AJ, Giularevskii RS. Fundamentos de la Informática. Moscú. La Habana: Nauta, 1973.
EBSCO[Pagina principal Sitio Web ]. lugar: Editorial, c1999-2009 [actualizado 24 Abr 2014 ;citado 26 Sep. 2010]. [Aprox. 2 pantallas]. Disponible en: MeSH Data Base[Pagina Web Sitio Web] c2000-2008 Medical Subject Heading [actualizado 26 Abr 2009; citado 2 Feb. 2009];citado 2 nov 2009]. [Aprox. 2 pantallas].
Muchas gracias