LA INFORMACIÓN EN MEDIOS ELECTRÓNICOS PARA LA DIAN 10 Capítulo 2 CONCEPTOS BÁSICOS DE ARCHIVOS XML Y ESQUEMAS DE VALIDACIÓN XSD. HISTORIA DEL XML: El XML proviene de un lenguaje que inventó IBM por los años 70. El lenguaje de IBM se llama GML (General Markup Langauge) y surgió la necesidad que tenían en la empresa de almacenar grandes cantidades de información de temas diversos. Imaginar por un momento la cantidad de documentación que generaría IBM sobre todas las áreas en las que se trabajaba e investigaba, y la cantidad de información generada hasta hoy. Así, necesitaban una manera de guardar la información y los expertos de IBM se inventaron GML, un lenguaje con el que podían clasificarlo todo y escribir cualquier documento para que se pueda luego procesar adecuadamente. El lenguaje gusto a la gente de la norma internacional ISO, una entidad que se encarga de normalizar cuantas cosas existan para los procesos del mundo actual, de modo que por el año 1986 trabajaron para normalizar el lenguaje, creando el SGML, que no era otra cosa que el GML pero estándar (Estándar inglés). SGML es un lenguaje muy trabajado, capaz de adaptarse a un gran abanico de problemas y a partir de él se han creado los siguientes para almacenar información. Por el año 1989, para el ámbito de la red Internet, un usuario que había conocido el lenguaje de etiquetas (Markup) y los hiperenlaces creó un nuevo lenguaje llamado HTML, que fue utilizado para un nuevo servicio de Internet, la Web. Este lenguaje fue adoptado rápidamente por la comunidad y varias organizaciones comerciales crearon sus propios visores de HTML y compitieron entre ellos para tener y crear el visor mas avanzado, creando etiquetas propias. Desde 1996 hasta hoy una entidad llamada W3C ha tratado de poner orden e el HTML y establecer sus reglas y etiquetas para que sea un estándar. Sin embargo HTML creció de una forma descontrolada y no cumplió con las expectativas que generaban todos los problemas que planteaba la sociedad global de Internet. El mismo W3C en el año 1998 empezó y continuó en el desarrollo de XML (Extended Markup Language) Lenguaje de Marcado Extendido o Extensible. En este lenguaje se ha pensado mucho más y muchas personas con grandes conocimientos en la materia han estado trabajando en su consolidación y pretenden solucionar las carencias del HTML en lo que se respecta al tratamiento de la información.
LA INFORMACIÓN EN MEDIOS ELECTRÓNICOS PARA LA DIAN 11 ARCHIVOS PLANOS XML: Un archivo XML es un conjunto de registros magnéticos en un estándar específico. Se basan en documentos de texto plano en los que se utilizan etiquetas para delimitar los elementos de un documento. XML define estas etiquetas en función del tipo de datos que está describiendo y no de la apariencia final que tendrán en pantalla o en la copia impresa, además de permitir definir nuevas etiquetas o ampliarlas.. Estos archivos al estar en este estándar permiten fácil intercambio entre los sistemas informáticos. Las especificaciones concretas de XML que deben utilizar los formatos es la especificación XML 1.0 Tercera edición y se puede encontrar en la dirección http://www.w3.org/tr/rec-xml.. Los caracteres especiales que pueden contener los archivos XML, solo serán caracteres que formen parte del conjunto de caracteres ISO-8859-1, los caracteres que por alguna razón no formen parte de este conjunto no deben ser incluidos en los archivos. ESQUEMA DE VALIDACIÓN XSD: Un esquema XSD es la descripción de la estructura de la información contenida en un archivo XML y de sus reglas, por ejemplo la longitud del campo, tipo, obligatoriedad. Los esquemas XSD son necesarios para que los sistemas que transmiten o reciben archivos XML por Internet puedan validar la conformación de dichos archivos. Se debe identificar que un esquema corresponde a una determinada versión y tipo de archivo XML, en el nombre del archivo, y el encabezado o cabecera que contienen la versión y el tipo de archivo, adicionalmente la solicitud de presentación de información por envío de archivos también la incluye. El esquema por su parte incorpora un elemento de documentación que indica el formato que describe. XML es una tecnología en realidad sencilla que tiene a su alrededor otras tecnologías que la complementan y la hacen mucho más grande y con unas posibilidades mayores para el manejo de información. XML con todas sus tecnologías relacionadas, representa una manera distinta de hacer las cosas, más avanzada, cuya principal novedad consiste en permitir compartir los datos con los que se trabaja a todos los niveles, por todas las aplicaciones y soportes.
LA INFORMACIÓN EN MEDIOS ELECTRÓNICOS PARA LA DIAN 12 El XML juega un papel importante en este mundo actual, que tiende a la globalización y la compatibilidad entre los sistemas, ya que es la tecnología que permitirá compartir información de una manera segura, fiable, fácil. Además, XML permite al programador y los soportes dedicar sus esfuerzos a las tareas importantes cuando trabaja los datos, ya que algunas tareas tediosas como la validación de éstos o el recorrido de las estructuras corre a cargo del lenguaje y está especificado por el estándar (Para la información exógena que se debe suministrar a la U.A.E. D.I.A.N. se está utilizando desde el año gravable 2005, el esquema XSD propuesta como especificación técnica, para cada uno de los formatos reglamentados, cuyas estructuras técnicas estarán programadas en el software denominado Prevalidador DIAN Tributario que se puede bajar de la página Web de la Entidad a través del enlace de Otros servicios y que la garantiza al obligado a informar que cumplirá con las especificaciones técnicas reglamentadas para cada período informado. XML es interesante en el mundo de Internet y el e-bussiness, ya que existen muchos sistemas distintos que tienen que comunicarse entre si, interesa por igual a todas las ramas de la informática y tratamiento de datos, ya que permite avances importantes a la hora de trabajar con ellos. COMPONENTES DE UN DOCUMENTO XML: 1.- COMENTARIOS: Los comentarios en los documentos XML empiezan por <? y acaban con -- >. Pueden colocarse en cualquier parte del documento, pueden contener cualquier cadena de texto. 2.- SECCIONES CData: Le indican al documento que ignore todos los caracteres de marcas que se encuentren en el interior de esta sección. 3.- ELEMENTOS: El elemento es donde se describen los datos (Elementos, atributos, tipos). Son las etiquetas más frecuentes utilizadas dentro de un documento XML como parte del texto. Están delimitadas por los símbolos < y >, sintaxis conocida, puesto que era la utilizada en HTML. Si el contenido de la etiqueta es vacío, entonces se delimitan por los símbolos < y />. Importante en XML los atributos siempre deben ir encerrados entre comillas dobles.
LA INFORMACIÓN EN MEDIOS ELECTRÓNICOS PARA LA DIAN 13 Las declaraciones de tipo de elemento son aquellas que establecen qué elementos pueden formar parte del documento y cuales pueden formar parte de su interior (Los elementos se anidan unos dentro de otros). 4.- ATRIBUTOS: Los atributos son los que usan dentro de las etiquetas para describir los campos. El atributo se considera como la propiedad de un elemento. ELEMENTOS DE TIPO COMPLEJO: Son documentos XML que contienen atributos y elementos adicionales. DOCUMENTOS XML BIEN FORMADOS: Cuando todos los elementos del XML cumplen con las especificaciones técnicas respecto a reglas sintácticas. DOCUMENTOS XML VALIDOS: Además, de estar bien formado, debe seguir una estructura y una semántica determinada. OBJETIVOS Y USOS DEL XML: El XML se creó para cumplir varios objetivos: - Que fuera idéntico a la hora se servir, recibir y procesar la información. - Que fuera formal y conciso desde el punto de vista de los datos y la manera de guardarlos. - Que fuera extensible, para que lo puedan utilizar todos los campos del conocimiento. - Que fuese fácil de leer y editar. - Que fuese fácil de implantar, programar y aplicar a los distintos sistemas. El XML se puede usar para infinidad de trabajos y aporta muchas ventajas en amplios escenarios. Algunas ventajas del XML en campos prácticos. - COMUNICACIÓN DE DATOS. Si la información se transfiere en XML, cualquier aplicación podría escribir un documento de texto plano con los datos que estaba manejando en formato XML y otra aplicación recibir esta información y trabajar con ella. - MIGRACIÓN DE DATOS. Si tenemos que mover los datos de una base de datos a otra sería muy sencillo si los trabajasen en formato XML.
LA INFORMACIÓN EN MEDIOS ELECTRÓNICOS PARA LA DIAN 14 - APLICACIONES WEB. Hasta ahora cada navegador interpreta la información a su manera y los programadores del web tienen que hacer unas cosas u otras en función del navegador del usuario. Con XML se tiene una sola aplicación que maneja los datos y para cada navegador o soporte podemos tener una hoja de estilo o similar para aplicarle el estilo adecuado.