Motores de Búsqueda en Internet



Documentos relacionados
MOTORES VERSUS DIRECTORIOS: EL DILEMA DE LA BÚSQUEDA

13.3 BUSCAR INFORMACIÓN EN LA RED

Servicio de estadísticas de Alojamiento Fecha de revisión: 19/09/2005

CÓMO CREAR NUESTRO CATÁLOGO

1) Menciona al menos herramientas de búsqueda en internet

5.2.1 La Página Principal

BÚSQUEDA AVANZADA EN INTERNET

Para crear formularios se utiliza la barra de herramientas Formulario, que se activa a través del comando Ver barra de herramientas.

Menús. Gestor de Menús

**NOTA** las partes tachadas todavía no están escritas, se ira actualizando poco a poco el documento

Índice general de materias LECCIÓN 7 74

Cómo Google indexa tu sitio?

Carteleras. Elaborar una agenda de conciertos y actividades musicales

CRECE EN INTERNET. Llegar a buen puerto: buscando información

UN EJEMPLO DE BÚSQUEDA Tutorial sobre el uso de Google.

1. Solicitando una cuenta de correo a nuestro proveedor de Internet. 2. Adquiriendo una cuenta de correo a través de la web (webmail).

CRECE CON INTERNET. Empieza a navegar por la Red

Manual del Profesor Campus Virtual UNIVO

CREAR UN BLOG CON BLOGGER

SEO: Elementos HTML. solo nos hemos de centrarnos en Google. 1 / 19

GENERAR DOCUMENTOS HTML USANDO LENGUAJE PHP. EJERCICIO RESUELTO EJEMPLO SENCILLO. (CU00733B)

BIBLIOTECA CENTRAL. "Prof. Augusto Raúl Cortázar" Guía de Búsquedas. Avanzadas en Internet

Versión 1.0 MANUAL DEL USUARIO

TEMA 4: EMPEZANDO A NAVEGAR ESCUELA UNIVERSITARIA DE INFORMÁTICA. Raúl Martín Martín

e-conocimiento Manual de uso

GUÍA RÁPIDA DE TRABAJOS CON ARCHIVOS.

ANUNCIA TU NEGOCIO EN FACEBOOK.

Un Navegador es un programa que nos conecta a Internet y nos permite organizar nuestro

BUSCAR Y RECOPILAR INFORMACIÓN EN INTERNET. APLICACIÓN PRÁCTICA.

Manual de ayuda para la utilización del Correo Interno en el Campus Virtual

Estimado usuario. Tabla de Contenidos

Plataforma Helvia. Manual de Administración. Bitácora. Versión

Mapas colaborativos en línea

Navegando por Internet

Gestión Documental con Microsoft Office SharePoint Server 2007 (MOSS) Ignacio López - Ingeniero en Informática Software Architect en Alhambra-Eidos

Manual de usuario Sitio

Los servicios más comunes son como por ejemplo; el correo electrónico, la conexión remota, la transferencia de ficheros, noticias, etc.

Es necesario conocer otras dos herramientas de búsqueda en Internet: los «metabuscadores» ó «motores de búsqueda» y los «portales».

MANUAL DE USUARIO DEL SISTEMA PARA EL REDACTOR

5. CONOCIENDO EL GESTOR DE

CAPÍTULO I: UNA PRESENTACIÓN EN POCOS MINUTOS

AYUNTAMIENTO DE SAN MARTÍN DEL REY AURELIO

LA WEB 2.0 (III): RSS Y GOOGLE READER

El proceso de edición digital en Artelope y CTCE

GOOGLE NOTICIAS Y ALERTAS

Se puede acceder a dicho módulo a través de la siguiente dirección URL:

PASOS PARA CREAR UNA PÁGINA WEB

Guía Notas Parciales. Intermedio (Nueva Versión)

Región de Murcia Consejería de Educación, Ciencia e Investigación. Manual Usuario FCT

EXTRACTO Descripción del uso y manejo de SIRAIS 1.2

Instructivo Asesoría Básica Comunidad Virtual SharePoint 2010

Manual de adminitración web

FeriaOnline.com C/Llamaquique Nº 4 Tfno: Oviedo mail: info@feriaonline.com Url:

Apunte. Estrategias de Búsqueda de Recursos en Internet 3

Google Calendar. Google Calendar

Manual de Usuario. Youtube

Manual de ayuda para crear y gestionar Tareas, como actividad evaluable

La Empresa al Día. Manual de Usuario

Solución al Reto Hacking v2.0 de Informática 64

Tutorial de PowerPoint

PRODUCCIÓN DIGITAL I. 13 de Junio de Wenceslao Zavala

Squipy v Introducción

Teclado sobre una PDA para Personas con Parálisis Cerebral

GUÍA PARA EL ALUMNADO DE LOS CURSOS DE FP A TRAVÉS DE INTERNET.

Plataforma e-ducativa Aragonesa. Manual de Administración. Bitácora

Plantilla de texto plano

Guía basada en conceptos de usabilidad web

Un kilobyte (KB) son 1024 bytes, un Megabyte (MB) son 1024 KB, un Gigabyte son 1024 Mb

Reseñas. Ángeles Maldonado y Elena Fernández, Cindoc. El profesional de la información, vol. 9, nº 3, marzo de 2000

Los motores de búsqueda.

reemplaza menú archivo y esta situado en la esquina superior izquierda de estos programas de

CÓMO CREAR UNA PÁGINA WEB v.1

NOTIFICACIÓN DE MOVIMIENTOS DE ESTUPEFACIENTES POR PARTE DE LOS LABORATORIOS FARMACÉUTICOS Y ALMACENES MAYORISTAS DE DISTRIBUCIÓN

MANUAL DE AYUDA HERRAMIENTA DE APROVISIONAMIENTO

Cómo posicionar su sitio web a través de buscadores de Internet

MANUAL DE USO Octubre CLIENTE: Liber Ediciones AUTOR: 2.0 DISEÑO _

Manual del estudiante

Base de datos en la Enseñanza. Open Office

Fuentes de información y plataformas de almacenamiento de información P08/93150/01582

FLICKR Flickr y sus Herramientas

LABORATORIO Nº 2 GUÍA PARA REALIZAR FORMULAS EN EXCEL

Ingreso al Sistema Administrador


Guía básica de Google AdWords

Sitemap de texto plano (sin formato)

Programa Presupuestos de Sevillana de Informática.

Una de estas herramientas son los buscadores, es decir, portales (o páginas Web) que realizan búsquedas en todo

USO DE LA TECNOLOGIA COMO RECURSO PARA LA ENSEÑANZA. Sistema de búsqueda en Internet. Mtro. Julio Márquez Rodríguez

C. E. I. P. LAS VIÑAS. Bollullos del Cdo. (Huelva) Centro TIC/DIG. Buscar en Internet

INSTRUCTIVO PLATAFORMA ITM VIRTUAL itmvirtual.itm.edu.co

YOUTUBE Y SUS HERRAMIENTAS DE EDICIÓN. ANOTACIONES Y MATERIAL INTERACTIVO EN YOUTUBE MÓDULO II. [Autores ]

RESOLUCIÓN DE ERRORES EN MOODLE CAMPUS VIRTUAL-BIRTUALA UPV-EHU

Módulo mod_banners para insertar y visualizar anuncios o publicidad (banners) en Joomla. Contador. (CU00446A)

Posicionamiento WEB POSICIONAMIENTO WEB GARANTIZADO

INDEX GUÍA INSTRUCTIVA PARA PASOS INICIALES DEL SITE BUILDER

SEGUIMIENTO EDUCATIVO. Comunicaciones

La ventana de Microsoft Excel

PREPARANDO EL ENTORNO DE DESARROLLO PARA PROGRAMAR EN PHP. DESCARGAR E INSTALAR NOTEPAD++ (CU00808B)

SELECCIÓN DE PALABRAS CLAVE PARA POSICIONAMIENTO EN BUSCADORES

Jornadas de INCLUSION DIGITAL. a través de las TIC ORGANIZAN: CAPACITA: CLAEH

Transcripción:

Resumen Motores de Búsqueda en Internet Prof. Gustavo Javier Astudillo Universidad Nacional de Luján Departamento de Ciencias Básicas Teleinformática y Redes astudill@infovia.com.ar En el presente trabajo monográfico se desarrolla el tema "motores de búsqueda en Internet", y se incluye la arquitectura de un motor tradicional y su modo de operación. Además, se analizan cinco de los buscadores más tradicionales (Yahoo!, Altavista, WebCraeler, Lycos, Ozú) describiendo sus características generales, modo de operación, capacidad para expresar condiciones de búsqueda, formatos de salida, opciones anexas y capacidad de personalización. Finalmente, se profundiza el concepto "metabuscadores" en un intento por dar un cierre al tema, con una explicación acabada de aquellos buscadores que buscan en los buscadores. Introducción Cuántas veces por día escuchamos la palabra Internet, diez, cien, más... pero, qué es Internet, desde la teoría, una colección de redes de comunicación interconectadas por puentes o dispositivos en encadenamiento; pero en la práctica, en la vida diaria la vemos como un conjunto de servicios, donde se nos ofrece conocer personas, comunicarnos a través de un correo gratuito, catear, y, por supuesto, buscar información. Desde sus inicios, de manera creciente hasta hoy, se agregan más y más servidores que contienen más y más información sobre los temas cuya variedad llega a asombrar. Esto hace que cada vez se eleve la complejidad de encontrar algo en la red, y obligó a que en su momento surgieran dentro del ámbito las páginas de Internet, o word wide web, un servicio que permitiera realizar búsquedas "a través de la red" para hallar el servidor que alojara la información que andábamos buscando. Los buscadores, así bautizadas las páginas que brindan servicio de búsqueda en Internet, se volvieron tan populares que se propagaron ejemplares de éstas páginas por doquier, y esto hizo que se que para ganar la atención se los usuarios se idearan mecanismos de búsqueda dentro de la maraña de ficheros en que se estaba convirtiendo Internet. Cuántas veces a escuchado la frase: "buscalo en Internet", pero cuánta gente haciendo caso de este consejo a fracasado con todo éxito (parafraseando a los Les Luthiers) en la búsqueda de información. Para que esto no ocurra es bueno saber qué son los buscadores, cómo funcionan, cómo y de dónde obtienen la información que nos brindan, éstas son algunas de las preguntas que instaremos responder en el presente documento. Desarrollo Como ya hemos mencionado al servicio que nos permite buscar información en Internet se lo denomina Buscadores, y sólo como para una primera aproximación, no son más que páginas web (en lenguaje HTML) que nos proporcionan un formulario el que volcar al alguna palabra clave, con la cual intentará obtener coincidencias en una base de datos, y un botón que nos permite darle la orden de buscar. file:///c /WINDOWS/Escritorio/tt/Monografia de buscadores.htm (1 of 10) [15/11/2001 5:05:21 PM]

Dentro de la palabra "Buscadores", en realidad, se engloban dos términos diferentes, dos maneras distintas de presentar y acceder a la información. Estos son, a saber, motores de búsqueda, e índices o directorios. Los primeros, trabajan con páginas web, son bases de datos sobre páginas web. Son programas que realizan búsquedas dentro de una base de datos de documentos HTML. Los índices o directorios, trabajan básicamente con sitios web, son una recopilación manual de documentos, que pueden mantenerse como directorios o bien ser introducidos también en una base de datos para permitir que se realicen búsquedasiii. La diferencia entre los índices y los motores de búsqueda esta dada esencialmente porque los primeros nos brindan un formulario donde incluir la dirección de la página y así estamos actualizando, manualmente, la base de datos del buscador. En cambio, los motores de búsqueda utilizan robots para actualizar y ampliar la base de datos. Como se puede deducir de los dos párrafos anteriores, los "Buscadores" son más que simples páginas que nos brindan un servicio. El término hace referencia a dos tipos de buscadores, aquí nos ocuparemos de los motores de búsqueda. Estos reciben la consulta del usuario, que consiste en una o varias palabras (keyworks), realiza la búsqueda en la base de datos, y extrae una lista ordenada de URL y una porción de texto, que cumplen entera o parcialmente con la consulta realizada. El orden depende de una puntuación que asocia el programa a cada documento cuando realiza la búsqueda, esto varía en cada caso, normalmente se suelen tener cuanto antes aparecen las palabras, cuanto más juntas se encuentran entre sí, etc. Los motores de búsqueda actualizan su base de datos con la utilización de programas denominados robots también conocidos como Spiders (arañas), Web crawlers, Web Wanderers (deambuladores Web) o Warms (gusanos). Los robots tienen la función de peticionar a diferentes servidos páginas de donde extraen la información para actualizar la base de datos que, luego, el motor consultará para responder a las peticiones de los usuarios del mismo. Demos, entonces, una definición más formal de robot: Un robot, es un programa que de manera automática atraviesa la estructura de documentos Web extrayendo un documento y a partir de éste extrayendo recursivamente todos los documentos que está referenciados por enlaces. Los documentos son introducidos en una base de datos e indexados para su posterior localización por un mecanismo de búsquedaiii. De acuerdo a lo dicho de los robots se podría llegar a pensar que funcionan como una especie de "virus" que, sin ninguna impunidad, acceden a los servidores extraen información de ellos y la llevan a otro servido para dejarla a nuestra disposición. Esto no es tan así, si bien realizan peticiones a servidores para posteriormente revisar su contenidos, a los robots, no les es posible acceder a cualquier servidor, o cualquier página dentro de un servidos, se pueden establecer restricciones acerca de a qué páginas (o servidores) estos bots pueden tener acceso, así, como también, facilitarles el trabajo indicando que páginas, dentro del servidor, se pretende que sean incluidas en la base de datos del motor de búsqueda!l que el robot "esponde. Esta tarea se puede realizar desde el mismo servidor o puede ser manejado desde un páginas HTML cualquiera. Pero, cual es en realidad el mecanismo de funcionamiento de un Robots Web, en primera instancia se le pasa un dirección URL donde comenzar a buscar, el robots consulta (si existe) el archivo robots.txt que le indica a que páginas y directorios (dentro del servidor) puede tener acceso, de no existir este archivos o si el robots no esta programado para reconocerlo, hace una petición de la página al servidor (como lo haría cualquier browser) y analiza unas etiquetas especiales, denominadas meta tags, que se pueden incluir en el encabezado de cualquier página web, en la que se le indica si puede incluir una referencia a esa página en la base de datos, y además, si puede tener acceso a las páginas que se encuentran referenciadas (enlaces de hipertexto) dentro de ella; las cuales serán solicitadas por el robots recomenzando el proceso que describimos hasta aquí. file:///c /WINDOWS/Escritorio/tt/Monografia de buscadores.htm (2 of 10) [15/11/2001 5:05:21 PM]

Coma ya hemos mencionado más arriba los robots se valen de un archivo llamado robots.txt para saber a qué páginas o directorios pueden (o no) acceder dentro de un servidor. Este archivo debe estar en el directorio raíz del servidor web, es decir, en el directorio donde se encuentra la página principal, para que el robots lo encuentre. Este archivo está compuesto por una serie de registros, que pueden estar, o no, vacios; y separados por líneas en blanco. Cada registro debe tener el siguiente formato: <directiva> : <valor> # <comentario> El nombre de la directiva puede ir en mayúsculas o minúsculas y los espacio en blanco son opcionales. Las directivas son: user-agent (agente de usuario) : define, para el registro en el que se encuentre, el nombre del robot para el que se establecen las normas de acceso. Se pueden definir varios agentes en el mismo registro si las normas son las mismas para todos. Podemos utilizar el valor "*", con el cual se pueden definir reglas de acceso para todos aquellos robots que no han sido incluidos en otros registros. Disallow (no permitir) : define la URL que no debe ser inspeccionada por el robot o robots indicados en user-agent. La URL puede ser parcial o completa. Algunos ejemplos del contenido de archivos robots.txt: Ningún robots puede inspeccionar nuestro sitio: user-agent: * # todos los robots disallow: / # directorio raíz Impedimos el acceso al robot robot_solop a un directorio personal: user-agent: robot_solop # todos los robots disallow: /doc/personal # directorio con documentos personales Otra opción para controlar el indexado (almacenamiento de la URL de la página en la base de datos) de nuestra página y el acceso a enlaces que contienen nuestras páginas son las meta tags. La ventaja de utilizar estas etiquetas META es que no todos los servidores tienen incluido el archivo robots.txt. En particular en los servidores que nos ofrecen un host para nuestra página no cuentan con este archivo, con lo que si no fuera por esta etiqueta no podríamos utilizar la exclusión de robots para nuestra página y los enlaces que esta contiene. Las meta tags se incluyen dentro del encabezado de una página web ( <head>...</head> ) y su es el siguiente: <META NAME="robots" CONTENT="all index follow none noindex noflollow"> all (todo): permitimos al robot tanto indexar como explorar la página. index (indexar): permitimos al robot indexar nuestra página. follow (siguiente): permite al robot recorrer la página en busca enlaces. none (nada): significa que el robot debe ignorar esta página. noindex (no indexar): no permitimos al robot indexar nuestra página, pero lo habilitamos para que recorra la página en busca de enlaces. nofollow (no seguir): no permitimos explorar nuestra página, pero si que se file:///c /WINDOWS/Escritorio/tt/Monografia de buscadores.htm (3 of 10) [15/11/2001 5:05:21 PM]

indexada. Algunos ejemplos: <META NAME="robots" CONTENT="all"> <META NAME="robots" CONTENT="index,follow"> <META NAME="robots" CONTENT="follow,noindex"> <META NAME="robots" CONTENT="index,noflollow"> <META NAME="robots" CONTENT="none"> <META NAME="robots" CONTENT="noindex,noflollow"> La etiqueta META NAME="robots" la podemos combinar con otra meta tags, META NAME="description", en la que podemos incluir un resumen del texto que deseamos que aparezca en el buscador con el modificador CONTENT="<descripción>". Analizando algunos buscadores Yahoo! (Argentina) Características generales Es un motor de búsqueda de cobertura internacional, con un índice temático. Modo de operación El motor Yahoo! cuenta con un formulario censillo para usuarios poco experimentados, donde solo se debe incluir la palabra(s) clave y hacer clic sobre el botón "Buscar". Posee, también, un formularios de búsqueda avanzada que se opera de manera similar a al anterior; se introduce la palabra clave, se puede optar entre cinco métodos de búsqueda y dos categoría en donde buscar. Un vez seleccionadas las opciones basta hacer un clic en el botón de "Buscar". La ayuda, tanto para el formulario sencillo, como para el avanzado, es de acceso muy sensillo de lenguaje coloquial de fácil lectura para el público en general. Capacidad de expresar condiciones de búsqueda Se pueden expresar condiciones de búsqueda utilizando los operadores booleanos OR, AND y NOT. Además, se pueden utilizar comillas ("") para realizar búsquedas textuales, y los símbolos "+" y "-" para incluir (+) o excluir (-) palabras en la búsqueda. Las expresiones no soportan paréntesis, ni permite hacer control de vocabulario (sinonimias y polisemias). Formato de salida Ordena los resultados comenzando por los más relevantes. Esto es, el número de palabras clave que se hayan encontrado (más palabras clave, más relevante es el resultado); las correspondencias exactas con las palabras (que tienen mayor relevancia que las correspondencias aproximadas); y en qué lugar del documento se encontraron las palabras buscadas (se le asigna mayor relevancia a una correspondencia en el título del sitio web que a las que ocurren en los comentarios o en la URL). Opciones anexas De cada sitio se visualiza el título con el enlace, una pequeña descripción. file:///c /WINDOWS/Escritorio/tt/Monografia de buscadores.htm (4 of 10) [15/11/2001 5:05:21 PM]

Yahoo!, cuenta con servicio de noticias, messenger y correo gratuito. Además, de novedades y ofertas, acceso ajuegos, ofertas de viajes y la posibilidad de acceder a una versión de Yahoo! en diferentes idiomas. Capacidad de personalización Cuenta con un enlace que permite configurar el sitio a la medida del usuario. Altavista (España) Características generales Es un motor de búsqueda de cobertura internacional. Modo de operación Altavista cuenta con una página principal que permite a los más novatos escribir palabra (s) clave, seleccionar el idioma, y con dos opciones de búsqueda una internacional y otra sólo para España, luego, un clic en el botón de "Buscar" se dispara la petición de búsqueda. Cuenta, además, con un formulario de búsqueda avanzada, al cual se accede con un clic en un enlace en forma de pestaña. Este formulario el espacio para incluir la consulta es más amplio que en el anterior y el usuario puede elegir el orden de salida. Además, se pueden limitar los resultados por fecha, elegir el idioma, limitar la búsqueda a una URL específica y establecer cuántos resultados se desean obtener por página. La ayuda está disponible a través de una "guía rápida de inicio" de fácil acceso, y sencilla lectura, con varios ejemplos de búsquedas para orientar al más novato. Capacidad de expresar condiciones de búsqueda Puede expresar condiciones búsqueda por campos (dominios, servidores, URL's, links, imágenes, título e idioma), utilizar operadores booleanos (AND, OR, NOT), de proximidad y paréntesis, localizar términos compuestos y truncar. Cuenta, además, con la función de "afinar" la búsqueda, esto es, volver a buscar sobre las páginas encontradas con claves más precisas. Formato de salida Los criterios para la ordenación están dados por si las palabras o frases demandadas se encuentran en las primeras líneas de una página; la frecuencia de ocurrencia; sí las palabras o frases se una consulta múltiple se encuentran cerca una de otra en el documento. De cada página se visualiza: el título con el enlace, la URL y las primeras palabras en el caso de que no contenga etiqueta META de descripción, sí es así aparece el contenido de la misma. Además, aparece el tamaño de la página (bits), el idioma y la fecha de la última modificación. Si fuera pertinente, aparece un enlace que permite obtener una traducción. Opciones anexas Brinda varios servicios todos relacionados con la búsqueda de información. Se destaca la posibilidad de acceder a un traductor. file:///c /WINDOWS/Escritorio/tt/Monografia de buscadores.htm (5 of 10) [15/11/2001 5:05:21 PM]

Capacidad de personalización Cuenta con un enlace que permite configurar el sitio a la medida del usuario. WebCrawler Características generales Es un motor de búsqueda de cobertura internacional. Cuenta con un índice temático. Modo de operación Cuenta solo con un formulario sencillo de búsqueda en el que se le permite al usuario introducir la(s) palabra(s) clave, seleccionar entre buscar web's, imágenes, noticias o todo; luego con hacer clic sobre el botón "search" se dispara el proceso de búsqueda. Posee una ayuda (en inglés) de no tan fácil acceso ya que se encuentra al final de la página. Esta es denominadas como "general searchs tips" y es de fácil acceso u cuenta con ejemplos sencillos que ilustran cada formato de búsqueda. Capacidad de expresar condiciones de búsqueda Se pueden expresar condiciones de búsqueda con los operadores lógicos AND, OR, y NOT, y combinarlos utilizando paréntesis. Además, pueden utilizarse comillas ("") para búsquedas textuales. También, permite utilizar los símbolos más (+) y menos (-) para designar si una palabra debe estar o no en los resultas de la búsqueda. Formato de salida Se ordenan los resultados según su grado de relevancia estimado a partir del número de palabras solicitadas encontradas en el documento. Cuenta con tres formatos de presentación : uno solo los títulos (Titles Only) de las páginas, otro, solo las URL (URL) de las páginas y, el tercero (Full Description), muestra el título, con la URL, las primeras palabras a modo de descripción y el grado de relevancia. Opciones anexas Contiene enlaces a juegos on-line, una galería de fotos, y un ranking de las "top free download sites". Además, cuenta con enlaces a otros sitios y la opción de agregar a favoritos y un enlace a las políticas de seguridad del sitio. Capacidad de personalización Pueden elegirse sólo entre tres formatos de salida. Lycos (en español) Características generales Es un motor de búsqueda de cobertura internacional. Cuenta con un índice temático. Modo de operación file:///c /WINDOWS/Escritorio/tt/Monografia de buscadores.htm (6 of 10) [15/11/2001 5:05:21 PM]

Posee un formulario con un cuadro de texto en el que nos permite ingresar la(s) palabra(s) clave. Podemos elegir entre buscar en toda la web o en un país determinado, para luego hacer un clic sobre el botón " Ve Por El!" para disparar la búsqueda en la base de datos del motor Lycos. Nos permite seleccionar entre varios sitio en donde se encuentra Lycos, en "Las Américas", "Europa" o "Asia". En la página inicial de Lycos no se ofrece ayuda para saber cómo utilizar el buscador. Capacidad de expresar condiciones de búsqueda Puede utilizar los operadores booleanos AND, OR y NOT, operadores de proximidad y paréntesis. Sin embargo, no se admite el truncado. Cuenta con la posibilidad de restringir la búsqueda a una lista de países, o a través, de el agregado de nuevas keyworks. Permite realizar la misma búsqueda realizada en Lycos utilizando el robot HotBot. Formato de salida Muestra los resultados en tres formatos distintos, muestra primero, un listado de veinte categorías en donde seguir la búsqueda, a continuación aparecen los sitios sugeridos y, por último un listado de veinte páginas web, que cuenta con un título que hace las veces de enlace a la página, un texto donde resaltan en negrita las coincidencias y la URL de la página entre corchetes. Opciones anexas Cuenta con una variedad muy amplia de opciones anexas. Comunidad: E-mail, Chat, Foros, Messenger y Páginas Personales. Canales: Cocina, Viajes Finanzas, Finanzas, Personales, Vida Profesional, Universidad, Créditos, Juegos, Familia Valores, Propiedades, MP3. WiredNews, Tutoriales, Web, Tiempo, Entretenimiento Downloads, Informática, Palm, Sexología y Aventura. Servicios: Mapas, Postales, Móvil, Lycos 50, E-ventos, Especiales, Software, y Empleos. Ofrece viajes y se puede acceder a páginas donde hacer preguntas sobre salud, así como revisar las cotizaciones de la bolsa y cotizar, y leer las noticias. Permite agregar una página a la base de datos del buscador, como agregar el buscador a favoritos en forma automática y publicar anuncios. Capacidad de personalización Cuenta con un enlace que permite configurar el sitio a la medida del usuario. Ozú Características generales Es un motor de búsqueda de cobertura internacional. Cuenta con un índice file:///c /WINDOWS/Escritorio/tt/Monografia de buscadores.htm (7 of 10) [15/11/2001 5:05:21 PM]

temático de acceso a través de un enlace. Funciona con Google. Modo de operación Cuenta con un formulario tradicional, y común a todos los buscadores, en el que se consignan la(s) palabra(s) clave, permite seleccionar si la búsqueda de ser realizada en Internet, en España o se buscan noticias, para luego tener que hacer un clic sobre el botón de "Buscar". Posee, también un formulario de búsqueda avanzada que le permite ajustar el número de resultados que verá en cada página. Sus opciones son 10, 20, 30, 50 ó 100 y el valor predeterminado es 10. Cuenta con una página de ayuda de fácil acceso y con una concisa explicación del funcionamiento de la opción de búsqueda, que incluye desde las preguntas más frecuentes, explicaciones que cómo funcionan los operadores y hasta una imagen ilustrativa de cómo se muestran los resultados explicada sección por sección. Capacidad de expresar condiciones de búsqueda Permite utilizar los operadores lógicos AND y OR. Permite la utilización de búsquedas textuales (entre comillas) y permite incluir el símbolo más (+) para agregar lo que denomina "palabras vacías", que no son más que símbolos o palabras demasiado comunes, que serén ignoradas por el motor a menos que se indique su inclusión con éste símbolo. También, permite excluir palabras utilizando el símbolo menos (-). No soporta que se trunquen palabras, ni la utilización de comodines. Formato de salida La primera línea del resultado es el título de la página Web encontrada, que actúa a la vez como enlace a la página encontrada. El texto bajo el título es un resumen de la página de resultados devuelta. Cuando OZÚ encuentra múltiples resultados del mismo sitio Web, el resultado más pertinente se indica primero en la lista y las demás páginas pertinentes de ese mismo sitio aparecen con sangría. A continuación se indica la dirección URL de resultado Después de la dirección URL aparece un vínculo en caché. El contenido en caché es el contenido que OZÚ usó para juzgar si esta página es una buena coincidencia para su consulta. El siguiente número de la línea es el tamaño de la parte del texto de la página Web. Opciones anexas Cuenta con numerosas opciones, entre las cuales podemos mencionar páginas de chat y videochat, postales, viajes y humor, junto con servicio de correo gratuito. Además, cuenta con servicios de Alojamientos Rurales, Anuncios, Callejero y Mapas, Categorías, Foros, Horóscopo, Software GRATIS! y Wap. Así como file:///c /WINDOWS/Escritorio/tt/Monografia de buscadores.htm (8 of 10) [15/11/2001 5:05:21 PM]

una gran variedad de CANALES. Junto con algunas ofertas y sorteos. Capacidad de personalización No cuenta con la posibilidad de personalización, salvo por la elección de la cantidad de resultados que deseamos que muestre. Los Metabuscadores La red (Internet) cuenta con más de un millón de páginas y un buscador puede localizar sólo una pequeña parte de ellas, en la maraña de sitios que existen hoy dispersos por todo el mundo, y que para complicar aun más el panorama crecen en número a una velocidad casi incontrolable. Este fue, y es, un contexto propicio para el desarrollo de los metabuscadores o meta buscadores, que aparecen en un intento por dar una solución al "corto" alcance de los buscadores tradicionales. Como su nombre los sugiere, los metabuscadores son más que "simples" sistemas de búsqueda, son sitios web que permiten realizar búsquedas sobre otros buscadores. Los metabuscadores no poseen, en general, base de datos propias, sino, que utilizan las base de datos los distintos motores en los que realizan la búsqueda para devolver el resultados de la consulta realizada por el usuario. Un metabuscador es un sistema automático de recuperación que utiliza para sus consultas bases de datos de distintos buscadores. No debemos confundir una guía de búsqueda con un metabuscador, las primeras son páginas que cuentan con un trabajo previo de recopilación de buscadores y nos permite acceder a ellos para realizar un búsqueda. Un metabuscador permite disparar búsquedas (desde su propio formulario) en simultaneo a varios buscadores, lo que redunda en una mayor variedad de los resultados. Los resultados obtenidos de diferentes sitios son filtrados por el metabuscador para evitar las redundancias. La búsqueda mediante estas potentes herramientas se puede realizar en forma simultanea o configurable, lo cual, en principio definiría dos clasificaciones para los metabuscadores. Si permiten realizar consultas en simultaneo a diferentes páginas se trata de un SUSI (Simultaneous Unified Search Interface) y, si en el diseño de la búsqueda se puede elegir sobre qué motor se desea realizar la búsqueda estamos hablando de un CUSI (Configurable Unified Search Interface). En la bibliografía no se ponen muy de acuerdo sobre si los CUSI son metabuscadores o no lo son, así algunos manifiestan que no serían metabuscadores:...existen también páginas que despliegan varias opciones de búsqueda. A diferencia de los metabuscadores, deben ser interrogados en forma individual. Estas páginas son llamadas Configurable Unified Search Interfaces o CUSIs... Y por otro lado,...estos recursos (los metabuscadores) son clasificados como CUSI (Configurable Unified Search Index) o SUSI (Simultaneous Unified Search Index). Invitamos a lector a analizar este documentos y hacerse de su propia opinión. Algunas desventajas de los metabuscadores SUSI: Un solo usuario toma la atención de varios servicios, que de por si ya están bastante recargados. Se sobrecarga el tráfico en la red. file:///c /WINDOWS/Escritorio/tt/Monografia de buscadores.htm (9 of 10) [15/11/2001 5:05:21 PM]

Como manejan el servicio de búsqueda, también manejan cómo se muestran los resultados frente al formato con que trabaja cada buscador que consulta. Se debe tener cuidado con el uso de operadores ya que no todos los buscadores tienen la misma capacidad a la hora de expresar condiciones de búsqueda (sintaxis). A continuación se presenta un ranking de herramientas de búsqueda obtenido del sitio serch IQ : Top Ranked Tool Metasearch Vivisimo Ixquick Queryserver vivisimo.com www.ixquick.com www.queryserver.com IQ:140 IQ:140 IQ:140 Engines Google HotBot www.google.com www.hotbot.com IQ:130 IQ:120 Intuitive Ask Jeeves www.aj.com IQ:120 Directories Open Directory Yahoo www.dmoz.org www.yahoo.com IQ:120 IQ:120 Free Features Excite www.exite.com IQ:100 Bibliografía William Stallings, Comunicaciones y Redes de Computadoras, Prentice Hall, 2000 Ferran Martí, estudio/cómo crear tu página web: Paso a Paso - Sexto paso: Buscadores: Motores, WebAprendiz.com, 2000/01, enlace... Miguel Sánchez-Cuenca, Búsquedas en Internet, diciembre 96, enlace... Antonio Vicent Ciscar, Buscar en Internet, enlace... Red Académica Uruguaya, Guía para la localización de recursos en Internet, metabuscadores, enlace... Twin Cities Free-Net, Twin Cities Free-Net: Search by Multiple Indexes by Keyword, enlace... Martijn Koster, Why Simultaneous Search Engines are not so great, enlace... Gabriela Diaz, METABUSCADORES, enlace... file:///c /WINDOWS/Escritorio/tt/Monografia de buscadores.htm (10 of 10) [15/11/2001 5:05:21 PM]