6. Procesamiento de HTML
Para continuar la discusión con el ejemplo del documento HTML, consideremos la tarea de extraer el código postal de la dirección. Aquí presentamos un (intencionadamente frágil) algoritmo para encontrar la marca HTML para el código postal: Si se encuentra un párrafo con dos etiquetas <br>, el código postal es la segunda palabra después de la primera coma en la segunda etiqueta de ruptura. Aunque este algoritmo funciona con el ejemplo, existen en el mundo una gran cantidad de direcciones perfectamente válidas para las cuales no puede funcionar. Incluso si se pudiera escribir un algoritmo que encontrase el código postal para cualquier dirección escrita en HTML, existe un gran número de párrafos con dos etiquetas de ruptura cuyo contenido no es una dirección postal. La escritura de un algoritmo que busque en cualquier párrafo HTML y encuentre cualquier código postal que contenga sería extremadamente difícil, sino imposible.
Echemos un vistazo ahora a un documento XML de ejemplo. Con XML, se puede asignar algún significado a las etiquetas en el documento. Más importante aún, también resulta fácil para una maquina el procesar la información. Se puede extraer el código postal de un documento simplemente localizando el contenido rodeado por las etiquetas <codigo-postal> y </codigo-postal>, técnicamente conocido como el elemento <codigo-postal>.
<direccion> <nombre> <titulo>Mrs.</titulo> <nombre> Mary </nombre>
<apellidos>McGoon </apellidos> </nombre> <calle> 1401 Main Street </calle>
<ciudad>Anytown</ciudad> <estado>NC</estado>
<codigo-postal> 34829 </codigo-postal> </direccion>
Autor y licencia de 'Introducción a XML - Procesamiento de HTML'
Mononeurona Extraído de: http://www.mononeurona.org/index.php?idp=316
Esta obra está bajo una licencia de Creative Commons.
|
|
Este trabajo está licenciado bajo la Creative Commons License. 1999-2005 © :: MonoNeurona.org :: |
|
|
|
Este contenido ha sido recopilado por el equipo de Wikilearning. Todo el contenido recopilado se ha obtenido respetando y comunicando en nuestro site la licencia de cada fuente.
|
|
Wikilearning tiene permiso expreso por escrito de los autores para publicar los contenidos que ha extraído de otras webs, incluyendo su uso comercial.
|
|
Wikis relacionados con 'Introducción a XML - Procesamiento de HTML'
XML es un metalenguaje, es decir, un lenguaje hecho para poder construir otros lenguajes con...
Más »
Bienvenidos al manual de HTML de Indaya. A
través de todos estos capítulos vamos a...
Más »
Este es un curso tremendamente completo, guiado y con ejemplos y prácticas pensadas para convertirlo...
Más »
XML es una tecnologia emergente para hacer explicita la estructura de los documentos por sobre...
Más »
Para realizar tu pagina Web necesitas en principio un editor de textos para escribir los...
Más »
¿Estás seguro de que deseas eliminar este capítulo?