Aspectos prácticos de Internet Tema 6 Web y buscadores Introducción Conceptos Básicos HTML HTTP URL DNS Servidores web Caches y proxies Web 2.0 Buscadores
Introducción Nació en 1990- Tim Berners-Lee Documentos escritos en HTML: Hipertext Markup Language Hiperenlaces permiten ir de un documento a otro Hiperespacio independiente de la ubicación física Gran enciclopedia de ámbito mundial en constante desarrollo y cambio 2
Conceptos Básicos Herramientas de Navegación o Navegadores o Browsers Interpretan y muestran en pantalla los documentos de la Web Documentos con texto, formato y elementos multimedia (imágenes, audio, vídeo...) Visualización independiente del sistema Pueden lanzar la ejecución de otras aplicaciones Pueden manejar otros servicios, además de http (ftp, https, telnet, etc.) Mozilla Firefox, Google Chrome, Internet Explorer, Safari, Lynx, etc 3
Conceptos Básicos Hipertexto e Hipermedia Hipertexto = Texto + enlaces Formato de los documentos Web Los documentos enlazados pueden estar en cualquier sitio Hipermedia: Imágenes, gráficos, sonidos, animación, video 4
Conceptos Básicos HTML Lenguaje de marcación de hipertexto Estándar en continuo desarrollo. HTML 5.0 Continuamente se le van añadiendo nuevas posibilidades (marcos, gif animados, css, canvas, etc) Enlaces También denominados links o hiperenlaces Constan de dos partes: - Referencia (URL) - Ancla (Anchor) 5
Conceptos Básicos URL: Uniform Resource Locator (Localizador uniforme de recursos) http://www.uji.es/ca/serveis/si/bin/manuals/pdf/per10.pdf Tres partes: - Siglas de protocolo: http, https, ftp, telnet, gopher, file, news,mailto, etc - Nombre de dominio: www.uji.es, webmail.uji.es - Ruta en el servidor: Organizado en carpetas o directorios (/) EJ: /personal/nombre/imagen/galeria.htm Algunas URL s utilizan la tilde ~ http://nuvol.uji.es/~huerta/j11.htm 6
Conceptos Básicos HTTP Hipertext Transport Protocol o Protocolo de transporte de Hipertexto Sistemas de Nombres de Dominio (DNS) http://173.194.34.242/ Clientes y servidores Arquitectura cliente-servidor Software cliente: Navegadores http://www.google.com/ Software servidor: Apache, Tomcat, IIS 7
Conceptos Básicos Servidores Web Ordenador que está esperando peticiones de clientes Muestra la página requerida o un error: 403 Forbiden, 404 Not Found, etc. Apache, IIS, Tomcat, etc. Bases de datos: MySQL, PostgreSQL Tecnologías web: PHP, ASP VB, ASP.NET, etc 8
Conceptos Básicos Cache Copia local de la páginas que se han visitado En memoria o en disco duro Parámetros configurables Con páginas dinámicas cache obsoleta - Recargar o actualizar - Vaciar la cache Los elementos que llevan mas tiempo si utilizarse se eliminan de la cache Niveles de cache Cache engine 9
Conceptos Básicos Proxys Optimizan el tráfico de Internet de un conjunto de máquinas Combinado con el uso de cache Aumenta la seguridad y el control de conexiones Su configuración puede ser manual o automática: http://www.uji.es/proxy.pac Programas específicos proxy: Wingate 10
Web 2.0 Una nueva forma de utilizar la web de manera interactiva y colaborativa Centrada en el usuario que consume información pero también la produce: Prosumer Servicios 2.0: Blogs, Wikis, redes sociales, entornos para compartir (fotos, videos, etc), mash-ups, e-learning, RSS, etc Web 3.0 o semántica: centrada en las máquinas 11
Buscadores Dada la cantidad de información existente son fundamentales en Internet Han ido evolucionando : motores de búsqueda Uno de los primeros fue Donde de la UJI http://donde.uji.es Actualmente destaca Google, le sigue Bing Otros que en pasado eran más importantes: Altavista http://www.altavista.com Yahoo http://www.yahoo.es Otros que vienen (baidu.com 9ª web más visitada) 12
Google Buscador de información en (casi) todo Internet Casi cierta información no se puede buscar Datos protegidos por contraseña Intranets inaccesibles Google para buscar en la Intranet Google para buscar en un PC (Google Desktop) Spinoff dos estudiantes de Stanford 1998 El nombre viene de googol = 10^100 13
Google Ejecuta web crawlers que recopilan información de web: Páginas, documentos, imágenes, otros ficheros Los datos se indexan y se almacenan en grandes servidores Redundancia: varias copias de cada elemento Cada elemento es clasificado según: Número de páginas que apuntan al elemento Numero de búsquedas que lo encuentran La búsqueda se realiza en paralelo en varios servidores Los almacenes de datos son los más grandes del mundo 14
Google Permite búsquedas de muy diversos tipos: En la web De imágenes Dentro de los grupos de Google De noticias de periódicos digitales De vídeos De documentos académicos Dentro de un directorio temático De mapas De blogs De libros De código fuente De patentes (solo USA) 15
Google Herramientas dentro del propio buscador: Calculadora: aritmética y conversiones de distancias, tiempos.. Conversión de moneda: valor actualizado de las divisa Traducción de páginas web y de textos Vínculos en caché: permite ver páginas no disponibles Páginas similares: sobre el mismo tema Quién tiene vínculos que apuntan a su sitio? Búsquedas dentro de un dominio Voy a tener suerte: lleva directamente a un resultado Etc, etc 16
Búsqueda avanzada Google 17
Otras directivas + para incluir palabras obligatoriamente: star wars episode +v ~ para incluir también sinónimos: ~comida * comodín para incluir cualquier secuencia de caracteres: anima* X..Y para buscar en el rango numérico desde X hasta Y site para restringir la búsqueda a un sitio web: site:uji.es filetype para restringir la búsqueda a un tipo de archivos: filetype:pdf weather para buscar sobre meteorología: weather:castellon map para buscar mapas: map:castellon cache para acceder a la copia de Google: cache:www.uji.es Otras: allinanchor:, allintext:, allintitle:, allinurl:, cache:, define:, id:, inanchor:, info:, intext:, intitle:, inurl:, link:, phonebook:, related: 18