1 - Para empezar

Monografía creado por Chato. Extraido de: http://www.tejedoresdelweb.com/307/article-1057.html
04 de Enero de 2007

Necesitamos algo de terminología mínima antes de entrar en aguas más profundas. Para ello, hagamos algunas observaciones sobre la materialidad (impresión) de este artículo. Usted puede distinguir varias partes, un título, un subtítulo, el texto del artículo, que a la vez son varios párrafos, y una firma. A un nivel más amplio, esta publicación está compuesta de un conjunto de artículos, separados por líneas, titulares, imágenes o simplemente, distancia física en la página; y a nadie le cuesta mucho trabajo reconocer cuando termina un artículo y empieza el siguiente, al márgen de la cuestión temática, porque están separados por ciertas convenciones de forma.

El hecho de que usted pueda distinguir fácilmente estas componentes de un documento, que llamaremos estructura del texto, proviene de convenciones tipográficas y de diagramación, a saber, que lo normal es tener el título destacado con un color, un tamaño o una tipografía distinta, separado del texto. Así mismo, es común que la firma tenga algún atributo distinto (por ejemplo, estar en cursiva) y se encuentre al final del documento. A todos estos elementos los llamaremos el formato del texto.

La primera observación es entonces, que el formato permite a los lectores reconocer la estructura del texto.

A pesar de que una misma estructura puede dar origen a varios formatos distintos (basta mirar las portadas de los periódicos o revistas para darse cuenta de que existe una miríada de maneras distintas de representar una estructura básica consistente en un titular y varias noticias con sus correspondientes resumenes), el problema de recuperar la estructura a partir del formato y poder contestar preguntas como "¿Hay algun artículo escrito por Perico Palotes?", "¿Cómo le fue al Chino Ríos?" es trivial para cualquier persona.

Sin embargo estas preguntas exceden las capacidades de los sistemas automatizados de recuperación de la información actuales. Todos los que han navegado por Internet y han ocupado un sistema de búsqueda se han dado cuenta de que los resultados de las búsquedas son en varias ocasiones irrelevantes respecto a la pregunta planteada.

Los sistemas de búsqueda obtienen respuestas irrelevantes en gran parte porque no son capaces de reconocer la estructura del documento a partir de distintos formatos.

Sé el primero en opinar


Monografías relacionados con 'XML, estructura vs. Presentación'

XML es una tecnologia emergente para hacer explicita la estructura de los documentos por sobre... Más »

Autor y licencia de 'XML, estructura vs. Presentación'


Monografía de Chato. Extraido de: http://www.tejedoresdelweb.com/307/article-1057.html CopyLeft
Este contenido ha sido recopilado por el equipo de Wikilearning. Todo el contenido recopilado se ha obtenido respetando y comunicando en nuestro site la licencia de cada fuente.
Wikilearning tiene permiso expreso por escrito de los autores para publicar los contenidos que ha extraído de otras webs, incluyendo su uso comercial.