Tema: XML el nuevo lenguaje universal. Autor: Marlene Melián Montalvo Institución: CITMATEL. Este trabajo consiste en una introducción al lenguaje XML. En el mismo se da a conocer su surgimiento, definiciones de XML y XHTML, objetivos, funciones y ventajas con relación al HTML 1. El SGML y el HTML. 2. - Qué es el XML y el XHTML? 3. - Por qué de la creación de XML? - Objetivos a cumplir, aspiraciones 4. - Ventajas del XML con relación al HTML 5. Conclusiones XML. El nuevo lenguaje universal 1. El SGML y el HTML. En los años 60, IBM intentó resolver sus problemas asociados al tratamiento de documentos en diferentes plataformas a través del GML ( Lenguaje de Etiquetado Generalizado). El principal problema consistía en que cada aplicación utilizaba sus propias marcas para describir los diferentes elementos. Las marcas o etiquetas son códigos que indican a un programa cómo debe tratar su contenido y así, si se desea que un texto aparezca con un formato determinado, dicho texto debe ir delimitado por la correspondiente marca que indique como debe ser mostrado en pantalla o impreso. Y lo mismo ocurre con todas las demás características de cualquier texto. Ejemplos pueden tenerlos en mente los usuarios de WordPerfect. Conociendo este sistema ( GML) y conociendo a la perfección el sistema de marcas de cada aplicación seria posible pasar información de un sistema a otro sin necesidad de perder el formato indicado. La forma que IBM creó para solventar esto se basaba en tratar las marcas como texto accesible desde cualquier sistema, texto plano, código ASCII. Y la norma se denominó GML ( General Modeling Lenguage ) Más tarde GML pasó a manos de ISO y se convirtió en SGML ( ISO 8879), Standart Generalized Markup Lenguage. Esta norma es la que se aplica desde entonces a todos los lenguajes de marcas, cuyos ejemplos más conocidos son el HTML y el RTF. Los lenguajes de marcas no son equivalentes a los lenguajes de programación aunque se definan igualmente como lenguajes. Son sistemas complejos de descripción de información, normalmente
documentos, que si se ajustan a SGML, se pueden controlar desde cualquier editor ASCII. Las marcas más utilizadas suelen describirse por textos descriptivos encerrados entre signos de menor (<) y mayor (>), siendo lo más usual que exista una marca de principio y otra de final. El HTML es una aplicación SGML ( Lenguaje de Etiquetado Generalizado Estándar) conforme al estándar internacional ISO 8879, y está ampliamente considerado como el lenguaje de publicación estándar de la World Wide Web. En sus casi 10 años de creación y desarrollo se ha confirmado como un estándar aceptado y aprobado por la inmensa mayoría de los desarrolladores de documentos en el Internet. El HTML, tal y como fue concebido, era un lenguaje para el intercambio de documentos científicos y técnicos adaptado para su uso por no especialistas en tratamiento de documentos. HTML resolvió el problema de la complejidad de SGML sirviéndose de un reducido conjunto de etiquetas estructurales apropiadas para la realización de documentos relativamente simples. Además de simplificar la estructura de los documentos, HTML soportaba el hipertexto. Las posibilidades de utilizar multimedia fueron añadidas con posterioridad. Con el paso del tiempo se ha podido ver, que a pesar de los parches como scripts que se le han ido poniendo al HTML y su interrelación con algunos lenguajes de programación, este, que hoy en día es el lenguaje estándar de Internet, se ha quedado por debajo, frente a las nuevas necesidades de la gran red de redes y es donde aparece la palabra interactividad. Dada la creciente variedad de programas y plataformas, está claro que la idoneidad del HTML clásico para ser usado en dichas plataformas es más que limitado. El código HTML permite insertar menús, tablas, imágenes en los documentos, pero no permite al usuario que maneje esos datos como mejor le convenga con la poderosa ayuda del ordenador. Esa es la principal novedad que XML aporta. Con HTML se pueden hacer accesos a información comparativa en diferentes empresas, pero nada más. Con XML el usuario podrá ordenar los datos o actualizarlos en tiempo real ( Tener en cuenta los apuntes de XLL) 2. - Qué es el XML y el XHTML? XML ( extensible Markup Lenguage fue creado al amparo del Word Wide Web Consortium (W3C) organismo que vela por el desarrollo de WWW partiendo de las amplias especificaciones de SGML. Su desarrollo se comenzó en 1996 y la primera versión salió a la luz el 10 de febrero de 1998. La primera definición que apareció fue: Sistema para definir, validar y compartir formatos de documentos en la web. Gran cantidad de personas ha oído hablar últimamente del XML y muchas personas plantean que es como una especie de HTML pero más avanzado. Pero todo el mundo lo que debería preguntarse es qué es exactamente XML y qué aplicaciones tiene actualmente? De estas dos cuestiones el mayor error es considerar a XML un HTML extendido. XML no es más que un conjunto de reglas para definir etiquetas semánticas que nos organizan un documento en diferentes partes. XML es un metalenguaje que define la sintaxis utilizada para definir otros lenguajes de etiquetas estructurados. El XML no es, lo que nos sugiere su nombre, un lenguaje de marcado. XML es un meta-lenguaje que nos permite definir lenguajes de marcado adecuados a usos determinados.
Este lenguaje es abierto, derivado del SGML, optimizado para su uso en la Web, y que va a permitirnos describir el sentido o la semántica de los datos. El XML a diferencia del HTML, separa el contenido de la presentación. XML es un Meta-Lenguaje, que permite la definición de lenguajes concretos de representación de documentos. Una forma de entender rápidamente la estructura de un documento XML, es viendo un pequeño ejemplo: <? xml version= 1.0 encoding= UTF-7 > <! DOCTYPE MENSAJE SYSTEM mensaje.dtd > <mensaje> <remitente> <nombre>marlene Melián </nombre> <email>mmm@citmatel.inf.cu</email> </remitente> <destinatario> <nombre>visionglobal </nombre> <email> VisionGlobal@citmatel.inf.cu</email> </destinatario> <asunto> Trabajo del evento </asunto> <texto> <parrafo> A continuación les adjunto el trabajo a presentar en el evento </parrafo> </texto> </mensaje> Aunque no es obligatorio, los documentos XML pueden empezar con unas líneas que describen la versión de XML, el tipo de documento, y otras cosas. La primera, o declaración XML, define la declaración de XML usada. Hasta ahora sólo hay una, la 1.0. Además en la declaración XML especificamos la codificación del documento. En general, y para uso con lenguajes europeos (incluyendo el juego de caracteres especiales del castellano, usamos UTF-7 o ISO-8859-1.) La segunda, o declaración de tipo de documento, define qué tipo de documento estamos creando para ser procesado correctamente. Es decir, definimos que Declaración de Tipo de Documento (DTD) valida y define los datos que contiene nuestro documento XML. En ella se define el tipo de documento, y dónde encontrar la información sobre su Definición de Tipo de Documento, mediante un identificador público (PUBLIC) que hace referencia a dicha DTD, o mediante un Identificador Universal de Recursos (URI) precedido por la palabra SYSTEM Los fundamentos del XML son muy sencillos y en principio, las únicas herramientas que nos harán falta son:. Un editor para poder escribir los documentos XML, por ejemplo el notepad en Windows y el xemacs en Linux.. Un procesador o parser XML, por ejemplo podemos usar los procesadores que incorporan el Internet Explorer 5.X o el Netscape 6.X En teoría HTML es un subconjunto de XML especializado en presentación de documentos para la Web, mientras que XML es un subconjunto de SMGL especializado en la gestión de información para la Web. En la práctica XML contiene a HTML aunque no en su totalidad. La definición de HTML
contenida totalmente dentro de XML y por lo tanto que cumple al pie de la letra las especificaciones del SGML es el XHTML Qué es el XHTML? - El XHTML son las siglas de EXtensible HyperText Markup Lenguaje - El XHTML está preparado para reemplazar al HTML. - El XTML es además idéntico al HTML 4.01 - El XHTML es el HTML definido como una aplicación del XML. 3. - Por qué de la creación de XML? (Objetivos a cumplir, aspiraciones) Objetivos - Debe ser directamente utilizable en Internet - XML debe soportar una amplia variedad de aplicaciones. - Debe ser fácil la escritura de programas que procesen documentos XML - El diseño de XML debe ser formal y conciso. - Los documentos XML deben ser fácilmente creables. Principales características son ventajas sobre el HTML también - Es una arquitectura abierta y extensible. No se necesita versiones para que pueda funcionar en futuros navegadores. Los identificadores pueden crearse de manera simple y ser adaptados en el acto en internet/intranet por medio de un validador de documentos ( parser) - Mayor consistencia, homogeneidad y amplitud de los identificadores descriptivos del documento con XML ( los RDF, Resource Description Framework), en comparación a los atributos de la etiqueta <META> del HTML. - Integración de los datos de las fuentes más dispares. Se podrá hacer el intercambio de documentos entre las aplicaciones tanto en el propio PC como en una red local. - Datos compuestos de múltiples aplicaciones. La extensibilidad y flexibilidad de este lenguaje nos permitirá agrupar una variedad amplia de aplicaciones, desde páginas web hasta bases de datos. - Los motores de búsqueda devolverán respuestas más adecuadas y precisas, ya que la codificación del contenido web en XML consigue que la estructura de la información resulte más accesible. - Se permitirá un comportamiento más estable y actualizable de las aplicaciones web, incluyendo enlaces bidireccionables y almacenados de forma externa ( El famoso epígrafe 404 file not found desaparecerá). - El concepto de hipertexto se desarrollará ampliamente ( permitirá denominación independiente de la ubicación de enlaces bidireccionales, enlaces que pueden especificarse y gestionarse desde fuera del documento, hiperenlaces múltiples, enlaces agrupados, atributos para los enlaces, etc.. Creados a través del Lenguaje de enlaces extensible (XLL) Por qué utilizar XML?
- Es un estándar internacionalmente reconocido. - No pertenece a ninguna compañía, y su utilización es libre. - Permitirá la utilización efectiva de Internet en diferentes alfabetos, por personas con minusvalías físicas, y en diferentes hardware ( teléfonos celulares, PDAs, terminales Braille, etc) 4. - Ventajas del XML con relación al HTML Problemas que presenta el HTML - Define más la presentación que el contenido. - No es fácilmente procesable por máquinas. - Problemas de internacionalización. - Su interpretación es ambigua según el software utilizado. - Su estructura es monolítica - Enlaces simples - Sólo tiene un uso: páginas web. Ventajas de XML - Fácilmente procesable tanto por humanos como por software. - Separa radicalmente la información o el contenido de su presentación o formato. - Diseñado para ser utilizado en cualquier lenguaje o alfabeto. - Su análisis sintáctico es fácil debido a las estrictas reglas que rigen la composición de un documento. - Estructura Jerárquica - El No. De marcas es ilimitado - Poderosos enlaces (XLL) Desventajas del XML Es posible que con el tiempo las mayores ventajas del XML se vuelvan sus desventajas. La posibilidad de construir sistemas acordes a nuestras necesidades para el intercambio de datos podría llevarnos a la prolíferación de versiones incompatibles y si esto llegase a suceder, entonces la solución que plantea el XML ante la búsqueda de intercambio universal de información, lo llevaría a su opuesto; en vez de unificar todo un lenguaje, nos encontraríamos con lenguajes muy específicos y cada vez más alejados de la universalidad. Conclusiones Debido a que es un lenguaje incompatible aún con algunos browsers, el XML solo es un tema de debate entre los desarrolladores que poco a poco han comenzado a interesarse en el mismo. Queda aún un largo camino por recorrer; pero en lo que se refiere al intercambio de información entre aplicaciones, el XML llegó para quedarse.