De HTML a XML: Prolongando el lenguaje de marcas.

, , Comments Off on De HTML a XML: Prolongando el lenguaje de marcas.

Una gran mayoría de la gente que trabaja en la industria de la informática sabe lo que es el HTML (Hypertext arkup Language). Existe desde hace mucho tiempo y ha sido usado extensamente en diseño de páginas web, tanto que, aunque es raro ver páginas web escritas únicamente en HTML, es considerado el conocimiento básico en todo el proceso de creación de páginas web.

XML (Extensible Markup Language), por otro lado, es mucho más reciente y es una tecnología mucho menos conocida, comparada con HTML. XML fue creado en 1996 por un grupo de 11 personas, como una adaptación de SGML (Standard Generalized Markup Language) para su uso en Word Wide Web. XML es un lenguaje de marcas mucho más estructurado y estricto comparado con HTML que permite a los usuarios crear su propias definiciones y código modularizado. Fue hecho para crear especificaciones estándares para la creación de lenguajes de marcas personalizados, los cuales se conocen ahora como dialectos XML. Puede no ser algo obvio al instante, pero los lenguajes de marcas personalizados, como HTML, RSS y Atom fueron todos creados a partir de XML, como un método para aumentar la usabilidad de Internet.

Una vez que XML fue adaptado de SGML, contiene un montón de códigos y técnicas que eran originalmente de SGML, como su rigurosidad y la así llamada “buena construcción”. Características que se extienden incluso hasta los descendientes de XML. Determinadas reglas deben ser siempre consideradas en la creación de un código basado en XML. Existe incluso una declaración bien formulada con cada documento, para estipular qué tipo de documento es y en qué reglas se debe basar el procesamiento. Esto es muy diferente comparado con el código informal que se usa en HTML.

Al procesar una página HTML, deberías tener algún tipo de resultado sin importar cual sea la entrada. El procesador HTML trata de darle sentido a lo que había en el documento y crea la salida que él cree que mejor representa la información de entrada. Esto no es correcto para XML. XML emplea un mecanismo de gestión de error que es considerado “draconiano”. Donde sea que el procesador XML encuentre algo que no puede comprender, simplemente crea un informe de error y termina el procesamiento del archivo. Eso te deja con un recuadro de error y ningún resultado, totalmente diferente que con HTML.

Poniéndolo en perspectiva, HTML es un lenguaje de marcas usado para rápida y fácilmente visualizar alguna forma de salida. No tiene en cuenta la exactitud de la entrada y simplemente intenta crear una salida basada en el archivo de entrada. Por otro lado, XML es un lenguaje de marcas muy estricto, que normalmente no se usa para crear contenido. Se usa, principalmente, como una herramienta para crear otros lenguajes de marcas que creen el contenido necesario.

Pomagajte nam izboljšati. Ocenite ta članek: