En este capitulo se hace una descripción de todos los componentes que. Internet y los medios que se utilizan para realizar su conexión.

Tamaño: px
Comenzar la demostración a partir de la página:

Download "En este capitulo se hace una descripción de todos los componentes que. Internet y los medios que se utilizan para realizar su conexión."

Transcripción

1 2. Marco Teórico En este capitulo se hace una descripción de todos los componentes que conforma la estructura del Internet y del Sitio Web Internet A continuación se hará una explicación de los componentes que conforman el Internet y los medios que se utilizan para realizar su conexión Concepto Internet es el sistema de comunicación para conectarse tanto con grandes bancos de información, como con todos los usuarios de este medio en el mundo. Permite que usted pueda consultar millones de páginas, libros, revistas, periódicos al día, artículos especializados, cartas de conocidos y desconocidos, estadísticas, mapas, carteleras de espectáculos, obras de arte, directorios, itinerario de aviones, trenes, autobuses, barcos y mucho más. Internet es la red digital que comunica a millones de usuarios, empresas, industrias, instituciones educativas y gubernamentales en todo el mundo 16

2 mediante tecnología de cómputo, la cual está rompiendo las fronteras de tiempo y distancia. Internet ha revolucionado la comunicaciones, ha modificado la forma de hacer negocios y de trabajar en todo el mundo. Usted pude reservar habitaciones en un hotel, comprar los boletos para viajar, para asistir a algún concierto o museo y hasta seleccionar el menú para cenar, o comprar el artículo que desee desde el lugar donde se conecta a Internet; normalmente en unas horas podrá recibir respuesta a cualquier pregunta que haga y se comunicará con quien lo desee. Las funciones de la Internet se basan en un pequeño grupo de servicios de información que permiten conectarse a una máquina remota, intercambiar archivos o enviar y recibir correspondencia electrónica. Estos servicios están disponibles en las máquinas conectadas a la Internet y se basan el conjunto de protocolos estándares Internet Telnet Telnet es el protocolo o servicio que permite iniciar sesiones de trabajo en máquinas remotas conectadas a la Internet. El telnet permite el teletrabajo ya que ofrece a través de un terminal lejano al puesto de trabajo acceder a toda la 17

3 información, recursos informáticos y aplicaciones de la máquina situada en el centro de trabajo. El telnet permite también acceder a bancos de datos emulando un terminal que estuviera directamente enlazado al ordenador central. El telnet es también el servicio mas utilizado para ofrecer acceso a bancos de datos aunque empieza a ser sustituido por los servicios mas avanzados gopher y WWW Correo Electrónico El correo electrónico permite el intercambio rápido de mensajes entre personas o grupos de personas del sistema de comunicación. Los sistemas de correo electrónico abren nuevas posibilidades inimaginables con los sistemas anteriores, entre ellos las listas de correo que permiten el intercambio de correspondencia entre un grupo cerrado de personas propiciando el debate ágil sobre los temas de interés del grupo. Por ejemplo, en una empresa, una persona envía una propuesta a diferentes miembros de la compañía, y estos a su vez, lo revisan y envían los comentarios entre si. 18

4 Servicio de noticias Los servicios de noticias (Netnews o Usenet News) también conocidos como tablones de anuncios o foros de debate son sistemas de distribución de mensajes de uno a muchos. Un mensaje dirigido al grupo de noticias se distribuye entre todos los usuarios subscritos al grupo, y sirve de mecanismo para la discusión de todo tipo de temas desde los temas más técnicos y especializados hasta temas de actualidad general. Un tema especifico, como lenguaje de programación en JAVA, es un ejemplo de servicio de noticias en un Sitio para programadores, y el tema lo dirige únicamente a los programadores de ese lenguaje, en donde ellos podrán postular comentarios, preguntas y respuesta El GOPHER. Distribución electrónica de documentos El GOPHER de Internet o simplemente GOPHER es un servicio de distribución de documentos e información que permite a los usuarios explorar, buscar y recuperar información residente en bancos de datos de forma fácil a la vez que potente. El acceso a la información es configurable por el usuario a través de 19

5 índice o estructuras de menú siendo posible el acceso directo a la información de consulta frecuente. Cuando el usuario explora a través del GOPHER, la información aparece como una serie de menús anidados donde cada elemento de menú es una frase explicativa del contenido de la información. El otro método de acceso a través de índice permite introducir consultas por palabra clave. En GOPHER el acceso es transparente al tipo de información: texto, imágenes, ficheros y sonido. GOPHER se encarga de gestionar la recuperación y visualización de la información en sus distintas formas. Puede combinar información de distintos servidores de datos de forma transparente al usuario. Esto lo hace particularmente indicado para aplicaciones de ventanilla única o múltiples servidores de información interelacionados El WWW (World Wide Web). El WWW es un sistema de información multimedia, permite la creación de documentos hipertexto, o libros electrónicos con aplicaciones a revistas informativas, documentos de referencia y consulta, formación o soporte técnico. El WWW permite acceder remotamente a documentos electrónicos organizados en forma de hipertexto que incorporan imágenes y sonido. 20

6 Los documentos hipertexto reflejan la forma de trabajar con documentos. Se busca en el índice, se encuentran los elementos que interesan, y se van a las páginas donde se desarrollan; si no es lo deseado, se vuelve al índice y se repite el proceso. Un documento hipertexto incluye enlaces a otros documentos donde se desarrollan con mas detalle, conceptos, ideas, noticias que se apuntan en el documento. La información documental se codifica utilizando el estándar de marca de documentos SGML. Los documentos producidos por procesadores de texto como Microsoft Word o WordPerfect se traducen automáticamente a HTML (Hyper-Text Markup Languaje). EL WWW permite desarrollar aplicaciones interactivas con soporte de entrada de datos en formularios. Esto permite desarrollar aplicaciones interactivas sobre MOSAIC. El MOSAIC desarrollado por el NCSA de la Universidad de Illinois es el cliente más popular del servicio WWW. En el MOSAIC una palabra, una frase, e incluso una imagen pueden formar parte de un enlace hipertexto. De esta forma es posible organizar esquemas de acceso a la información basados en iconos. El MOSAIC permite integrar sistemas anteriores de distribución de 21

7 documentos basados en el intercambio de ficheros o GOPHER. es una herramienta universal de acceso a Internet TCP/IP (Transmission Control Protocol/Internet Protocol). TCP/IP son las siglas de Protocolo de Control de Transmisión/Protocolo de Internet, el lenguaje que rige todas las comunicaciones entre todos los ordenadores en Internet. También puede ser usado para las comunicaciones de protocolos en las redes privadas (ya sea en una intranet o una extranet). TCP/IP es un conjunto de instrucciones que dictan cómo se han de enviar paquetes de información por distintas redes. También tiene una función de verificación de errores para asegurarse que los paquetes llegan a su destino final en el orden apropiado. IP, Protocolo de Internet, es la especificación que determina hacia dónde son encaminados los paquetes, en función de su dirección de destino. TCP, o Protocolo de Control de Transmisión, se asegura que los paquetes lleguen correctamente a su destino. Si TCP determina que un paquete no ha sido recibido, intentará volver a enviarlo hasta que sea recibido correctamente. Existe un nivel superior de protocolo que usa el TCP/IP para accesar al Internet; los cuales incluye el protocolo de transferencia de hypertexto del 22

8 WWW (HTTP), protocolo de transferencia de archivo (FTP), Telnet (el cual permite realizar accesos remotos) y el protocolo de transferencia de correo simple (SMTP). Estos y otros protocolos por lo general están agrupados con el TCP/IP en forma de paquetes. En el casos de las computadoras personales, estás usualmente se conectan por medio del protocolo de Internet de Linea Serial (SLIP) o el protocolo de punto a punto (PPP). Estos protocolos encierran los paquetes IP con el propósito de enviarlos a través de una conexión de pulsos telefónicos por medio de un modem HTTP (Hipertext Transfer Protocol). Http son las siglas de Protocolo de Transferencia de Hypertexto, el método utilizado para transferir ficheros hipertexto por Internet. En el World Wide Web, las páginas escritas en HTML utilizan el hipertexto para enlazar con otros documentos. Al pulsar en un hipertexto, se salta a otra página web, fichero de sonido, o imagen. La transferencia hipertexto es simplemente la transeferencia de ficheros hipertexto de un ordenador a otro. El protocolo de transferencia hipertexto es el conjunto de reglas utilizadas por los ordenadores para transferir ficheros hipertexto, páginas web, por Internet. 23

9 Requisitos para conectarse a Internet El requerimiento esencial para realizar una conexión a Internet, es el poseer el cableado, equipo y servicio. El Cableado es el medio de comunicaciones mediante los cuales los datos son transmitidos entre los dispositivos de emisión y recepción en una red. El cableado puede constar de líneas telefónicas, líneas RIDS (Red Integrada de Servicios Digitales) y líneas arrendadas. Una línea telefónica permite una conexión a Internet por medio de un módem. Cada vez que un usuario desea conectarse a la red, marca el número telefónico que le proporcionó el proveedor de servicio. Durante una conexión a Internet, cada minuto se factura a la línea como si fuera una llamada telefónica ordinaria. También se puede tener una línea telefónica dedicada, lo cual implica agregar otra línea de teléfono, que se utilizará solo para acceso a Internet. Una línea RIDS, es el siguiente nivel después de una línea telefónica estándar. En esencia, duplica la velocidad de transferencia de datos y ofrece una conexión más confiable, de modo que es menos probable que la llamada se interrumpa a la mitad de una transmisión. Una línea telefónica regular necesita un módem a fin de traducir los datos digitales (ceros y unos) de la computadora en analógicos, es decir sonidos, que viajan por las líneas telefónicas como 24

10 (chirridos, bips y tonos). En los conmutadores telefónicos centrales, esos sonidos deben convertirse de nuevo a datos digitales para una transmisión a larga distancia. Una conexión RIDS puede tomar los datos digitales directamente de la computadora y transmitirlos como señales digitales a conmutadores telefónicos en todo el mundo. Así se evita el intercambio de digital a analógico, y por lo tanto menos probable que los datos de cómputo se corrompan o pierdan. Una línea arrendada, es un tipo de línea que se clasifica según la velocidad, y comienza a un nivel más o menos similar al de una línea RIDS. Las líneas más rápidas son de fibra óptica, y son directamente muy veloces. Este tipo de conexión es básicamente para negocios que requieren una conexión de 24 horas a Internet, con alta velocidad y máxima confiabilidad en la transferencia de datos. El equipo esta compuesto por computadoras, terminales de entrada y salida y procesadores de telecomunicaciones como los módems. Las computadoras sirven para procesar la información y además actúan como terminales de entrada y salida que envían y reciben datos. En la práctica, los usuarios se pueden conectar incluso a los modelos más antiguos de computadoras a la red. Por desgracia, por lo general las máquinas más antiguas son anteriores a la capacidad de imágenes, gráficas y sonidos y por 25

11 tanto, a menos que este equipo pueda mejorarse; sin embargo, por lo general es mejor el equipo más rápido y poderoso, para un mejor procesamiento de la información. Los módem (significa modulador-desmodulador) son dispositivos que traducen los datos digitales (de la computadora) en señales analógicas (sonidos), de modo que puedan utilizar las líneas telefónicas normales. Existen dos tipos de módem: interno y externo. El Interno son pequeñas piezas rectangulares de metal, incluidas con los chips de la computadora y ensambladas en el interior de ésta. El Externo por lo general están conectados a la computadora por medio de una conexión y un cable. Los módems externos pueden moverse con facilidad de una computadora a otra y por lo general son de un diseño muy sólido. Muchos incorporan luces indicadoras para mostrar el estado de los mensajes que se reciben y envían. El Adaptador de terminal RIDS proporciona un enlace entre la computadora y una línea RIDS. Es diferente a un módem en el sentido de que acepta datos digitales, que se reciben y envían sin la necesidad de traducirlos en señales analógicas para la línea telefónica. El Servicio se refiere a los proveedores los cuales ofrecen el servicio de conexiones a Internet. Debido a que los sistemas telefónicos nacionales no 26

12 estaban diseñados para proporcionar conexiones directas entre las computadoras personales y los sistemas principales de Internet, son necesarios los proveedores de servicio, que actúan como puente. Utilizan computadoras diseñadas de manera específica, que aceptan datos de las líneas telefónicas, desde las computadoras más potentes, en las casas y oficinas, y los dirigen a los cables de larga distancia, más rápidos. Los Proveedores de Servicio cobran una tarifa, tanto por proporcionar un punto de acceso a la red, como muchos otros servicios especiales, como investigación de negocios, puntos principales de periódicos y revistas e información del mercado financiero. Algunos servicios, como el correo electrónico, son normales entre todos los servidores Sitio Web A continuación se describe los elementos que conforman la estructura y el funcionamiento de un Sitio Web Concepto Un Sitio Web esta relacionado con una colección de archivos Web que incluye un archivo inicial llamado pagina principal o home page. Para accesar al sitio de una compañía o individuo, estos dan su dirección de su "home page". Desde el 27

13 home page, se puede accesar a las demás páginas en el sitio. Por Ejemplo, el sitio Web de la Universidad es la dirección de su página principal una vez se accesa a este sitio, el home page de la Universidad direciona a las demás paginas dentro del web. Un Sitio Web se puede entender como un libro, conformado por varias paginas; es decir, que un sitio web es una recopilación de archivos Webs (paginas de Internet o paginas web) y también de otros Sitios Webs (subsitios) Página Principal o Home Page Para el usuario del Web, la "home page" es la primera página que se despliega después de ejecutar una búsqueda a través del Browser (Buscador), como lo son Netscape Navigator o Microsoft Internet Explorer. Para el desarrollador del sitio Web, un "home page" es la dirección que compone un sitio Web la cual es la dirección de la página principal (home page). Por dicha razón, la página inicial es la que se despliega cuando un usuario selecciona un sitio o destino en el WWW. 28

14 Página Web Una página web es una unidad de información, frecuentemente llamada un documento, que esta disponible en el World Wide Web. Las páginas web son creadas usando HTML, con lo que se define el contenido de una página web, que puede ser imágenes, texto, enlaces de hipertexto, videos y archivos de audio, los archivos en HTML son archivos de texto que han sido salvados con la extensión "html". Las páginas web son enviadas y recibidas usando HTTP, un método basado en la filosofía cliente/servidor, usado para transferir archivos de hipertexto a través de la Internet. El programa visualizador (browser) permite al usuario pedir páginas web de un servidor HTTP y ver la página web pedida en la pantalla de su computador Características de la Página Web Normalmente las páginas están integradas por varias sub-páginas que están relacionadas por vínculos que con un clic del ratón lo llevan a esa sección. Sin embargo, no es absolutamente necesario tener sub-páginas y de hecho su 29

15 página podría ser una sola y muy larga, pero fácilmente manejable con la ayuda de anclas y vínculos que llevan a los visitantes rápida y fácilmente de un lado a otro y de arriba a abajo. El motivo de tener varias sub-páginas es organizativo y en aquellos casos que se tiene mucha información. Las páginas están escritas en un lenguaje llamado HTML y con ayuda de programación y otros lenguajes como Java o CGI (Common Gateway Interface); puede tener desde simplemente textos, dibujos, fotografías y hasta archivos de sonido y video. Para formas interactivas y atributos especiales como contador de hits, reloj, motor de busqueda y otros, es indispensable que tenga un dominio propio (virtual o server específico), con lo que su dirección será: nombre>.com, así como también cuando el tráfico que va a tener su Sitio va a ser alto. Formas interactivas son cuestionarios que llena el visitante cuando está en su página, para registrarse, hacer comentarios o hasta para hacer pedidos que usted recibe en su para atenderlos. 30

16 HTML (Hiper Text Markup Languaje) El HTML es el lenguaje informático utilizado para crear documentos hipertexto. El HTML utiliza una lista finita de rótulos, o tags, que describe la estructura general de varios tipos de documentos enlazados entre sí en el World Wide Web Servidor Web Un servidor Web es una computadora que puede almacenar archivos de uno o más sitios. Un sitio Web enorme puede estar distribuido en varios servidores en diferentes lugares geográficos. Un servidor Web además es un programa que utiliza el modelo cliente/servidor y el HTTP para proporcionar los archivos que conforman las páginas Web a los usuarios del Web. Cada computadora en el Internet que contiene un sitio Web debe de tener un programa de servidor Web (o de los archivos del sitio deben de ser enviados a computadoras que posean programas de servidor Web). Los servidores mas populares son Apache, un servidor de Web para ambos sistemas operativos de 32 bits Windows y UNIX; Windows NT server; y Fast Track and Enterprise servers de Netscape. Otros servidores incluyen al servidor 31

17 Web de Novell para los usuarios del sistema operativo NetWare; los distintos servidores Linux; y los servidores Lotus Domino de IBM. Los servidores de Web comúnmente vienen como parte de grandes paquetes de programas relacionados al Internet y Intranet para el servicio de correo electrónico, permisos de bajar (download) archivos FTP, y construcción y publicación de páginas Web Cliente/Servidor Cliente/Servidor describe la relación entre dos programas en donde uno, el cliente, realiza solicitudes al otro, el servidor, el cual responde la petición. Aunque la idea de cliente/servidor puede realizarse en una sola computadora, es más conveniente que se aplique en un entorno de red. Dentro del entorno de red, el modelo cliente/servidor provee una forma conveniente de interconectar programas que están distribuidos eficientemente a través de diferentes localidades. Las aplicaciones generalmente adoptan el modelo cliente/servidor, al igual que el TCP/IP. En dicho modelo, un servidor, comúnmente llamado un deamon, es activado y aguarda las solicitudes del cliente. Típicamente, varios programas 32

18 clientes comparten los servicios con un programa servidor. Ambos cliente y servidor, son parte de un programa mayor o de una aplicación. En relación con el Internet, los Web browsers son programas clientes que reciben peticiones (el envío de paginas o archivos Web) del servidor Web ( el cual técnicamente es llamado HTTP o servidor HTTP) en otra computadora. Similarmente, el TCP/IP permite realizar peticiones de archivos a servidores FTP en otras computadoras en el Internet Contenido Dinámico Los archivos HTML son documentos estáticos los cuales únicamente le muestran al usuario información. Por el contrario, el HTML Dinámico se orienta a la modificación del contenido y el ajuste de los estilos en línea (on the fly). Dentro del contenido dinámico existe comunicación entre el usuario y el servidor y de servidor a usuario. En esta estructura, el usuario tiene la opción de ver cual es la información que desea consultar, mediante opciones que le indica el servidor. Cuando el usuario le manda los datos necesarios al servidor, este los procesa y le manda la información que desea ver el usuario. La arquitectura del contenido dinámico esta basada en el esquema de cliente/servidor. El cliente esta compuesto por un lenguaje scripting (Javascript, 33

19 VBScript, Activex, Applets, etc.). Dentro del esquema del contenido del Servidor, son cuatro etapas que existen en el ciclo de vida. 1)Petición del Cliente. 2)Procesa la Petición. 3)Envía los Resultados. 4)Cierra la Conexión. Cuando el servidor recibe la petición por parte del cliente, los datos pasan por tres etapas dentro del servidor. Primero son recibidos por el protocolo del servidor (por lo general es el TCP/IP), luego los datos son enviados al software de servidor (éste se refiere a los puertos HTTP, FTP o RealPlayer) y por ultimo los datos llegan a la información. Una vez procesados y obtenido la información necesaria, los resultados regresan por el mismo trayecto de donde vino, es decir información - software de servidor - protocolo, para llegar donde el cliente. Cliente Protocolo (TCP/IP) Software de Servidor (HTTP - FTP) Información Diagrama del Contenido Dinámico Dentro del proceso de los datos en la etapa de información, los datos son 34

20 enviados por el HTTP a la Aplicación Web. La aplicación extrae la información del Recurso (éste puede ser la Base de datos) mediante las variables post y get. Post envía datos al servidor y get pide los datos. HTTP Aplicación Recursos Diagrama de la etapa de información Servlet Aplicación sin interfaz gráfica que se ejecuta en un servidor de Internet, procesando información HTML previamente recogida por un navegador. Estos programas, usualmente son utilizados para el acceso de base de datos; por lo que residen en el servidor. 35

21 Aplicación Web Una aplicación web es una colección de servlets, páginas JSP, clases Java, archivos de descripción de la aplicación, documentos estáticos: HTML, XHTML, imágenes, etc. y otros recursos que pueden ser empaquetados y ejecutados en distintos servidores de diferentes proveedores. Es decir, una aplicación web se podría definir como la capa web de cualquier aplicación. Una de las características principales de una aplicación web es su relación con el ServletContext, el cual es la interfaz que define el conjunto de métodos que utiliza un servlet para comunicarse con el contenedor del servlet. Esta relación está controlada por el contenedor de servlets, que asocia un único ServletContext para cada aplicación, garantizando que las aplicaciones no van a colisionar a la hora de almacenar objetos en el ServletContext. El contenedor que alberga una aplicación web no es más que la estructura de directorios en donde están colocados todos los archivos necesarios para la ejecución de la aplicación web. 36

22 JDBC (Java Database Connectivity) La Conectividad de Bases de Datos Java (Java Database Connectivity, JDBC) es una especificación de la interfaz de aplicación de programa (application program interface, API) para conectar los programas escritos en Java a los datos en bases de datos populares. La interfaz de aplicación de programa nos permite codificar órdenes de solicitud de acceso en lenguaje estructurado de solicitud (structured query language, SQL) que luego pasan al programa que administra la base de datos. Devuelve los resultados a través de una interfaz similar. La JDBC es muy similar a la Conectividad Abierta de Base de Datos (Open Database Connectivity, ODBC) de Microsoft y, con un pequeño programa "puente" podemos usar la interfaz JDBC para acceder a bases de datos a través de la interfaz ODBC de Microsoft. Por ejemplo, podemos escribir un programa diseñado para acceder a muchos productos populares de base de datos en una variedad de plataformas de sistema operativo. Cuando se accede a una base de datos en un PC que corre bajo Windows 95 de Microsoft y, por ejemplo, una base de datos de Microsoft Access, nuestro programa con órdenes JDBC será capaz de acceder a la base de datos de Access de Microsoft. La JDBC tiene actualmente dos niveles de interfaz. Además de la interfaz 37

23 principal hay también una API de un "administrador" JDBC que a su vez se comunica con los "controladores" de producto de las bases de datos individuales, si es necesario, el puente JDBC-ODBC bridge y a un controlador de red JDBC cuando el programa Java está corriendo en un entorno de red (es decir, accediendo a una base de datos remota). Cuando accede a una base de datos remota, la JDBC aprovecha el esquema de dirección de archivos de Internet y un nombre de archivo que tiene en mucho la apariencia de una dirección de página web (o URL). Por ejemplo, una orden SQL en Java puede identificar a la base de datos como: jdbc:odbc:// JDBC especifica un conjunto de clases de programación orientada a objetos para que el programador lo use en la construcción de solicitudes SQL. Un conjunto adicional de clases describe el controlador API de JDBC. Soporta los tipos de datos más comunes de SQL, mapeados en forma de tipos de datos Java. La API permite el soporte específico de implementación para las solicitudes transaccionales y la capacidad de "comprometerse" o volver al principio de una transacción. 38

24 JSP (Java Server Page) (Página de Servidor Java) Se refiere a un tipo especial de páginas HTML, en las cuales se insertan pequeños programas que corren sobre Internet (comunmente denominados scripts), se procesan en línea para finalmente desplegar un resultado final al usuario en forma de HTML. Por lo general dichos programas hacen consultas a bases de datos y dependiendo del resultado que se despliegue será la información que se muestre a cada usuario de manera individual. Los archivos de este tipo llevan la extensión ".jsp". La forma en que compila la información una aplicación JSP se ilustra en la siguiente figura. Cuando un usuario carga por primera vez la página, todos los archivos que componen la aplicación son trasladados juntos, sin datos dinámicos, a un archivo de fuente Java (extensión.java ). Luego, el archivo.java es compilado a un archivo.class ; este proceso es conocido como el tiempo de traducción. Cuando el usuario realiza una petición a la aplicación JSP, uno o más de los componentes de la aplicación (un bean o un servlet) manipulan el dato enviado o extraído por el usuario, desde un almacenamiento de datos y lo regresan a un archivo.java donde es recompilado a un archivo.class. El archivo.class, retorna el dato al cliente (Web browser) por medio del método service. Cuando el usuario hace una nueva petición, los 39

25 componentes manipulan el dato y lo vuelven a enviar a un archivo.java, el cual es recompilado nuevamente a un archivo.class. Esta etapa es conocida como el tiempo de solicitud. Archivo JSP Archivo JSP Gráficos Archivo.java Componente Web Browser Vía HTTP u otro Protocolo Archivo.class Almacenamiento de Datos Cliente Servidor Almacenamiento de Datos Figura ilustrativa de la compilación de la información en una aplicación JSP 40