El uso de los buscadores en Internet - Buscadores en Internet. Conceptos, clasificación y caracterís
3 - Buscadores en Internet. Conceptos, clasificación y caracterís
[editar]
Artículo creado por Lic. Ania Torres Pombert. Extraido de: http://www.bvs.sld.cu/revistas/aci/vol11_3_03/aci04303.htm
05 de Enero de 2006
< anterior
| 1
2
3 4
5
6
7
| siguiente >
Muchos son los nombres que han recibido los buscadores de acuerdo con su estructura y funcionamiento. Algunos autores los clasifican en índices, robots y metabuscadores,2 otros los agrupan en directorios y buscadores,3 o bien en índices y motores de búsqueda.4,5 Todos estos términos tienen su equivalente en inglés, sin embargo, en esta lengua además de "index", "meta- search engine" "directory" y "search engine", para los 2 últimos aparecen en la literatura sinónimos como "crawler o spider" y "human-powered" respectivamente. Veamos a continuación algunas definiciones.
En el artículo "Buscadores: Los puntos de partida en la red"2 se plantea que se dividen básicamente en índices, robots y metabuscadores. Aquí se consideran los índices como los pioneros en Internet, ellos funcionan mediante la incorporación constante de nuevas páginas a su base de datos, generalmente disponen de un evaluador que minimiza el número de páginas que ingresan al sistema y asegura su calidad; los robots (llamados por la gran mayoría motores de búsqueda) disponen de programas "arañas" que recorren la red e incluyen de forma automática "todo cuanto encuentran", esto genera grandes dificultades para los navegantes al momento de seleccionar los recursos, sobre todo en el caso de búsquedas con un alto recobrado; por último, los metabuscadores se limitan a redirigir la pregunta que reciben a varios buscadores a la vez, y según el estado de opinión prevaleciente, suele ser difícil pero recomendable el trabajo con ellos, cuando no se encuentra información en los índices y motores.
Efectivamente, de acuerdo con las diferentes formas de funcionamiento, es acertado establecer estas 3 categorías para clasificar los buscadores, pero cabría preguntar qué significa "todo lo que encuentran" los robots, o será que realmente no hay límites en lo que ellos recogen en la red.
En otra clasificación, se dividen en directorios y buscadores. Se dice que los directorios son catálogos de direcciones que tienen relativamente pocos sitios (cientos o miles), pero ellos se seleccionan y verifican; esto supone cierta calidad, incluso, algunos directorios que contienen una evaluación del sitio que indica cuán bueno es, otros presentan un breve resumen, escrito por un reseñador o evaluador, que explica el contenido (la mayoría sólo tienen una descripción que proporciona el propio autor del sitio); por otra parte, se definen los buscadores como enormes índices que comúnmente registran millones de páginas y donde las búsquedas producen miles de sitios como respuesta.3
En estas clasificaciones, si bien es cierto que la definición de los directorios es muy amplia y clara, el concepto de buscador se queda sin explicar ¿cómo funciona esta herramienta?, además ¿por qué llamarle buscador?, ¿acaso no son buscadores también los directorios?; por otra parte, estos llamados "buscadores" no deben considerárseles índices precisamente, porque ellos no muestran listas de términos o categorías a los navegantes, el índice no es más que una parte interna donde se almacena una copia de cada una de las páginas identificadas.
Otras 2 clasificaciones, tal vez menos comunes, son buscadores de categorías y buscadores de contenido (o de palabras por contexto), al primero se le llama también índices, que está claro que se refieren a los directorios y aunque no se describen conceptos los ejemplos hablan por sí solos: por categorías, Yahoo y por contexto, Altavista.6
Es oportuno señalar que aun cuando los motores de búsqueda no se estructuran por categorías temáticas como los directorios, existen también motores especializados en áreas geográficas y temáticas, por tipos de recursos, entre otros.
Sullivan,7 un importante autor vinculado al tema de los motores de búsqueda, editor de la revista Search Engine Watch, plantea que el término "motor de búsqueda" se emplea indistintamente para los motores basados en los programas "crawler" o "spider", y para los directorios accionados por humanos, pero enfatiza en las diferencias entre ambos justamente porque los primeros trabajan automáticamente y los segundos dependen del factor humano.
Un aspecto importante, tratado por este autor, son las partes de los motores de búsqueda: el primer elemento es el "spider" o "crawler", encargado de visitar las páginas web, leerlas y analizar sus enlaces a otras páginas, esta operación se repite cada cierto tiempo en busca de cambios. El segundo elemento es el índice, también llamado catálogo donde se almacena una copia de cada página web que se encuentra, cada vez que cambia la página se actualiza con la nueva información, claramente transcurre un tiempo desde que se encuentra la página hasta que se indiza y no es hasta entonces que está disponible en el motor de búsqueda. El tercer elemento es el software, programa que se encarga de examinar los millones de páginas web contenidas en el índice, busca aquellas que contengan las palabras iguales a las solicitadas en la búsqueda, para luego ordenarlas según su relevancia. Para muchos navegantes es una interrogante saber si realmente el orden de los registros es aleatorio o responde a un determinado método de ordenamiento, más adelante se ofrecerán algunas consideraciones al respecto.7
Como puede apreciarse, en cada una de las definiciones, la función de cada una de estas herramientas es la misma: "buscar en la red", todos entonces se sitúan en una gran categoría general: buscadores. Son páginas web que analizan la red con el objetivo de que los navegantes encuentren los sitios donde se encuentra la información que ellos necesitan, ponen a su disposición "alternativas" para moldear las búsquedas con ayuda de sus propios lenguajes de interrogación, la diferencia está en el funcionamiento de cada uno; según esto, se dividen en 3 subcategorías, que en la opinión de la autora la manera más acertada de agruparlos es en:
Si se analizan detenidamente los conceptos referentes a las 2 primeras categorías es fácil encontrar ventajas y desventajas en cada una, por ejemplo, los directorios son excelentes para buscar por temas o categorías y los resultados se ordenan por dichas categorías, pero ellos no catalogan tantas direcciones como un motor de búsqueda; por su parte, los motores de búsqueda son muy útiles para buscar datos específicos y permiten encontrar "casi todo", pero esto, a su vez, produce como resultado demasiados sitios de todo tipo y calidad (miles) en una respuesta típica.
Pero hablar en la actualidad de buscadores, obliga necesariamente a hablar de los metabuscadores, innumerables trabajos, en la literatura especializada, abordan el tema, debaten sobre aspectos como funcionamiento, ventajas, desventajas y eficiencia, entre otros. A pesar de los beneficios indiscutibles de los motores de búsqueda y de los directorios temáticos, su crecimiento condujo a la creación de estas nuevas herramientas.1,8-12
Según Tyner,11 se conoce como metabuscadores, a aquellos que permiten interrogar varias bases de datos simultáneamente desde una única interfaz; aunque ellos no ofrecen el mismo nivel de control sobre la lógica y la interfaz de búsqueda que los motores y directorios, la mayoría son bastante rápidos. Apunta, además que la tendencia es mejorar sus capacidades con la incorporación de opciones de búsqueda al uso de los operadores convencionales, entre ellas, se destaca la posibilidad de poder escoger los motores de búsqueda donde debe buscarse, la búsqueda por campos (título, URL, etc.), entre otras.
Otras cualidades se agregan a la definición anterior, se plantea que al no tener sus propias bases de datos, a diferencia de los motores de búsqueda y los directorios temáticos, los metabuscadores no almacenan páginas web, no agregan direcciones, ni clasifican y reseñan sitios web, sino que envían una solicitud de búsqueda a varios buscadores a la vez.8
Stanley,1 considera que los metabuscadores constituyen el próximo eslabón dentro de la cadena alimenticia de la información en los motores de búsqueda convencionales, se consideran son superiores. Muy claramente expone aquellos elementos que considera sus ventajas esenciales:
Una importante reflexión de la autora apunta al siguiente hecho: que los metabuscadores no dispongan de sus propias bases de datos sino que interroguen las de otros buscadores, significan una importante reducción en los costos por concepto de hardware para los productores. Ciertamente podría considerarse esta, una causa para el auge de los metabuscadores y su aceptación entre los navegantes.
No es menos cierto que los elementos descritos por Stanley1 sobre los metabuscadores, constituyen ventajas para el proceso de búsqueda; sin embargo, otros autores, que enfatizan en los problemas que puede causar su uso, llaman la atención de los navegantes para que los tengan siempre muy en cuenta, reconocen, por tanto, que son una herramienta muy útil.
Liu8 expone algunos elementos que son válidos anotar, sobre todo porque otros autores, que han escrito sobre el tema de los metabuscadores, no los tratan. Él plantea que es totalmente imposible que estas herramientas puedan unificar todas las ventajas de cada uno de los motores y que, por consiguiente, las búsquedas booleanas pueden generar resultados diferentes en diversos buscadores, las búsquedas por frases puede que no se ejecuten en alguno de ellos, y otros elementos como el uso de limitadores pueden sacrificarse. Apunta que los metabuscadores no devuelven, desde cada buscador, todas las páginas que se corresponden con la solicitud sino que toman un rango entre 10 y 100 registros de cada uno, por lo que efectivamente permiten redireccionar la búsqueda, como apunta Stanley,1 una vez que se escoja el motor, que más resultados relevantes arrojó, para continuar la búsqueda.
Algunos autores aseguran que la mayoría de los grandes buscadores utilizan lenguajes similares para interrogar sus bases de datos. Por esto, los resultados de la búsqueda en los metabuscadores pueden verse favorecidos si se conocen, en alguna medida, los lenguajes utilizados por los buscadores que estos procesan. Afortunadamente algunos metabuscadores ofrecen al navegante la opción de escoger dentro de un grupo determinado de buscadores disponibles, cuáles incluir en su metabúsqueda. Si se escogen aquellos conocidos por su confiabilidad, potencia y rapidez, los resultados de la búsqueda serán mejores.1
Cierto es, que cada categoría difiere de la otra sustancialmente por el funcionamiento y por las herramientas para la búsqueda en la red, pero incluso dentro de una misma categoría se diferencian unos de otros. Son eBlast y Yahoo directorios temáticos, pero no son iguales, son Altavista y Northern Light motores de búsqueda, pero son diferentes, de igual forma son Metacrawler y Savvy Search metabuscadores, y difieren uno del otro.
El uso de estos 3 mecanismos no presenta grandes diferencias a primera vista, por lo que es posible que los navegantes no distingan en cuál de ellos realizan habitualmente sus búsquedas, todos muestran un recuadro para introducir las palabras claves que se desean encontrar, solo que varía la forma en que se debe plantear la cuestión, porque, en algunos casos, puede complicarse con elaboradas reglas lógicas. Esta tabla resume brevemente la naturaleza de cada categoría de buscador.
Tabla. Caracterización de las diversas categorías de buscadores
|| Directorios temáticos || Motores de búsqueda || Metabuscadores ||
|| Bases de datos más pequeñas, menos actualizadas, y más elaboradas gracias a la presencia del factor humano. || Bases de datos más amplias y actualizadas. || No tiene bases de datos propias, sino que buscan automáticamente en las de otros buscadores. ||
|| Colocan la información por temas y categorías, una vez recopilada, de forma manual en sus índices. ||
Colocan la información, que sean capaces de recoger en la red, en sus índices sin ordenarlas por temas, de manera automática y periódica. || No almacenan información porque no dependen de bases de datos propias. ||
|| No realizan las búsquedas en Internet "en vivo", almacenan los datos de los sitios y ofrecen enlace a éstos. || No realizan las búsquedas en Internet "en vivo", sino en las copias de las páginas que almacenan en sus índices. ||
Envían su búsqueda a varios motores, sus resultados dependen de que estos estén disponibles en el momento de la búsqueda, o se descarguen en el período de tiempo permisible. ||
|| Son fáciles de usar, permiten, en primer lugar, ubicar la búsqueda en un tema determinado. || Son más difíciles, se requiere explotar al máximo las opciones de búsqueda porque contienen más información. || Son difíciles de usar para búsquedas muy precisas, porque tienen menos control de la búsqueda al interrogar varias bases de datos con interfaces diferentes. ||
|| Son convenientes para buscar información general, institucional porque devuelve resultados a las páginas principales. || Se utilizan para buscar información más escasa, especializada, actualizada o incluida en páginas personales. || Se recomienda para temas "oscuros", difíciles de encontrar. ||
|| || Ejemplos || ||
|| LookSmart (http://www.looksmart.com)Open Directory (http://dmoz.org)Yahoo (http://www.yahoo.com) || Altavista (http://www.altavista.com)Google (http://www.google.com)HotBot (http://hotbot.lycos.com) || Metacrwler (http://metacrawler.com)NetLocator (http://nln.com)StartingPoint (http://www.sptp.com) ||
Mucho se ha debatido sobre la necesidad de conocer las herramientas con que se busca en la red, precisamente por la gran variedad que existe, donde unos suelen ser más eficientes que otros. Un aspecto importante a considerar para seleccionar los buscadores es la evaluación de sus bases de datos. Como se ha explicado anteriormente, los resultados de las búsquedas, obtenidos de cada buscador no son más que la "salida en pantalla" de la información de sus bases de datos, después que esta se localiza, procesa, evalúa y ordena. Por supuesto, no es comparable la evaluación de una base de datos en CD con otra en Internet, esta última es mucho más difícil.
Notess13 expone, de manera muy sencilla, sus puntos de vista al respecto, plantea que el mayor problema para evaluar una base de datos en Internet es que sus registros nunca son estáticos, porque existen muchas páginas "efímeras" que se indizan en el tiempo en que se crea o actualiza la base de datos y poco tiempo después se mueven, cambian o rediseñan completamente; sin embargo, aun cuando el contenido de los registros es variable, plantea el autor, que las bases de datos en Internet pueden evaluarse en cuanto a alcance, estructura y actualidad. Se explica en este artículo, que para determinar el alcance de la base de datos se debe consultar la ayuda o las FAQs, se sugiere también, que el examen de la estructura es efectivo, por ejemplo, si el único acceso a los registros individuales es por una búsqueda de palabras claves, cabría entonces, pensar que es una base de datos que se genera automáticamente, mientras que, si tiene una estructura jerárquica de materias, debe construirse selectivamente. Ciertamente, estos son aspectos importantes, pero no se pueden obviar otros más elementales, sobre todo, para los buscadores de tipo directorio, como el título de la página, que se supone sea claro y refleje, con exactitud, el contenido del sitio y la consulta del "about" que ofrece información general.
Wighton14 concede también, una especial importancia a la consulta de las FAQs de los buscadores, antes de formular una búsqueda, enfatiza, que esto permite saber cómo se puede buscar y hasta dónde se puede llegar y, a partir de aquí, elegir o desechar el buscador.
Notess,13 explica que la estructura de los registros de la base de datos, que se muestra en los resultados, puede parecer un elemento difícil de evaluar, sobre todo, porque a diferencia de otras, en las bases de datos en Internet, los campos no aparecen explícitamente, sin embargo, generalmente son fáciles de identificar, incluso existen buscadores como Google que explican detalladamente en su ayuda, a qué se refiere cada dato expuesto en los resultados de la búsqueda, la mayoría de los buscadores entregan sus resultados con los siguientes campos: título, descripción del contenido, categoría de materia y URL.
Realmente el navegante nunca podrá ver la estructura de la base de datos, por esto resulta un poco difícil saber cómo se maneja una búsqueda, una vez formulada la pregunta a la base de datos, pero conocer a qué se refiere cada elemento mostrado en los resultados puede ser un factor determinante a la hora de decidir cuáles son los registros más relevantes.
Otro aspecto enunciado por este autor para evaluar las bases de datos, es su modo de actualización, es difícil encontrar un motor que actualice constantemente cada uno de los sitios; para los grandes motores, porque tendrían una gran demanda en cuanto al ancho de banda y para los directorios, aunque más pequeños en volumen de información, porque exigiría una sobrexplotación del recurso humano. Plantea este autor, que es muy difícil determinar la frecuencia de actualización de una base de datos, pero el análisis de algunos de los resultados devueltos puede ser una vía para esto. Por ejemplo, en un intento de acceso a los enlaces que luego no se pueden alcanzar, o que te ofrecen un mensaje de que la página se ha movido a otra dirección sería conveniente fijarse en la fecha de la página si es posible, esto proporciona una medida del tiempo que lleva sin actualizarse; la última fecha de actualización de los sitios que forman parte de los resultados de la búsqueda muchas veces son de un año, 2 o más, ello indica que el creador del sitio cambió de empleo o sencillamente perdió el interés, un motor de búsqueda que se respete no debe incluir este tipo de sitios en sus índices.13
Existen varios trabajos donde se exponen diversos análisis y comparaciones entre buscadores, estos pueden ayudar a una mejor comprensión de su funcionamiento.6,11,12,15-22
Internet es una gran biblioteca, solo que a diferencia de la biblioteca tradicional no tiene libros y revistas impresas, materiales audiovisuales o diapositivas sino que sus documentos son sitios web sin control bibliográfico, no disponen de un equivalente al ISBN, que identifica los libros, tampoco existen sistemas análogos para su catalogación y clasificación, como los establecidos por la Biblioteca del Congreso, mucho menos, existe un catálogo central que registre todas sus páginas y, ni siquiera lo más elemental, muchos de los documentos que se encuentran en Internet carecen de autor y fecha de publicación.11
Evidentemente, como Internet es un medio libre para publicar, no existen normas estándares para hacerlo ni para indizar la información que fluye por ella. Las bases de datos de los buscadores no reconocen e indizan los mismos campos, y su funcionamiento para recuperar la información es diferente. De todo lo anterior, se infiere que para que los buscadores se conviertan en una herramienta eficaz es necesario que se conozcan muy bien.
Como se ha explicado anteriormente, la tendencia inevitable es la especialización de las herramientas de búsqueda en el web. Esto ha provocado la aparición de una gran variedad de buscadores, que generalmente resultan difíciles de evaluar por el navegante; por otra parte, en muchos casos han devenido, incluso en portales, añaden entonces a su oferta, un conjunto más o menos homogéneo de servicios, como noticias, bolsas de vivienda, chats o correo electrónico. Son gratuitos y se financian mediante la publicidad, debido a esto, el acceso a sus páginas principales es, a veces, la primera causa para que el navegante se sienta perdido entre tantos efectos especiales, comerciales y propagandas.
Muchos son los expertos que han sugerido los aspectos que deben considerar los navegantes para buscar en el web. En algunos casos, se apunta a que el navegante solo debe preocuparse por buscar la caja de diálogo, que permite introducir las palabras claves por las que pretende realizar la búsqueda, el cual tiene al lado un botón o un gráfico con las palabras "buscar", "search", "go", "go to get it", donde el navegante mediante un click inicia el proceso de búsqueda, es recomendable buscar, cerca de esta caja de diálogo, opciones para seleccionar el número de registros a mostrar por página, los dominios donde buscar, los tipos de recursos o el tipo de lógica a emplear.6
Gresham23 opina que encontrar resultados relevantes en Internet es una mezcla de experiencia, técnicas, aptitudes, inventiva y buena suerte, todas combinadas con la habilidad de proceder en una dirección clara y metódica, en otras palabras, es simplemente "navegar con un propósito", apunta además que depende más de la estrategia de búsqueda que de la propia herramienta a utilizar. Sugiere la siguiente secuencia lógica de pasos:
Flanagan,5 de manera más breve, apunta que para buscar en Internet existen 2 pasos claves a dar, en primer lugar, se ha de comprender correctamente qué se va a buscar, esto implica definir conceptos, determinar sinónimos, palabras relacionadas y, en segundo lugar, cómo usar las herramientas de búsqueda disponibles.
Tyner11 señala también, aspectos que considera importantes, y al igual que Flanagan,5 se refiere a formular la búsqueda y su alcance, mediante la identificación de los conceptos que abordan la cuestión, las palabras claves, sus sinónimos y variaciones, así como la preparación de la estrategia de búsqueda, sin embargo, en esta reflexión no se considera la herramienta que se utilizará, sin la cual no queda bien expresada la estrategia (aunque más adelante hace alusión a ello), ni se trata la evaluación de los resultados.
Realmente, el primer cuestionamiento del navegante debe ser siempre, ¿qué quiero buscar?, ¿cómo?, y ¿dónde puedo encontrarlo?. Los planteamientos anteriores, sobre todo de Gresham,23 constituyen una guía muy acertada de los pasos a seguir.
Una vez elaborada esta guía, deben considerarse otros elementos para lograr mejores resultados, estos aspectos sugeridos por varios autores,3,6,11,13,15,24 se consideran aplicables a la mayoría de los buscadores:
En el artículo "Buscadores: Los puntos de partida en la red"2 se plantea que se dividen básicamente en índices, robots y metabuscadores. Aquí se consideran los índices como los pioneros en Internet, ellos funcionan mediante la incorporación constante de nuevas páginas a su base de datos, generalmente disponen de un evaluador que minimiza el número de páginas que ingresan al sistema y asegura su calidad; los robots (llamados por la gran mayoría motores de búsqueda) disponen de programas "arañas" que recorren la red e incluyen de forma automática "todo cuanto encuentran", esto genera grandes dificultades para los navegantes al momento de seleccionar los recursos, sobre todo en el caso de búsquedas con un alto recobrado; por último, los metabuscadores se limitan a redirigir la pregunta que reciben a varios buscadores a la vez, y según el estado de opinión prevaleciente, suele ser difícil pero recomendable el trabajo con ellos, cuando no se encuentra información en los índices y motores.
Efectivamente, de acuerdo con las diferentes formas de funcionamiento, es acertado establecer estas 3 categorías para clasificar los buscadores, pero cabría preguntar qué significa "todo lo que encuentran" los robots, o será que realmente no hay límites en lo que ellos recogen en la red.
En otra clasificación, se dividen en directorios y buscadores. Se dice que los directorios son catálogos de direcciones que tienen relativamente pocos sitios (cientos o miles), pero ellos se seleccionan y verifican; esto supone cierta calidad, incluso, algunos directorios que contienen una evaluación del sitio que indica cuán bueno es, otros presentan un breve resumen, escrito por un reseñador o evaluador, que explica el contenido (la mayoría sólo tienen una descripción que proporciona el propio autor del sitio); por otra parte, se definen los buscadores como enormes índices que comúnmente registran millones de páginas y donde las búsquedas producen miles de sitios como respuesta.3
En estas clasificaciones, si bien es cierto que la definición de los directorios es muy amplia y clara, el concepto de buscador se queda sin explicar ¿cómo funciona esta herramienta?, además ¿por qué llamarle buscador?, ¿acaso no son buscadores también los directorios?; por otra parte, estos llamados "buscadores" no deben considerárseles índices precisamente, porque ellos no muestran listas de términos o categorías a los navegantes, el índice no es más que una parte interna donde se almacena una copia de cada una de las páginas identificadas.
Otras 2 clasificaciones, tal vez menos comunes, son buscadores de categorías y buscadores de contenido (o de palabras por contexto), al primero se le llama también índices, que está claro que se refieren a los directorios y aunque no se describen conceptos los ejemplos hablan por sí solos: por categorías, Yahoo y por contexto, Altavista.6
Es oportuno señalar que aun cuando los motores de búsqueda no se estructuran por categorías temáticas como los directorios, existen también motores especializados en áreas geográficas y temáticas, por tipos de recursos, entre otros.
Sullivan,7 un importante autor vinculado al tema de los motores de búsqueda, editor de la revista Search Engine Watch, plantea que el término "motor de búsqueda" se emplea indistintamente para los motores basados en los programas "crawler" o "spider", y para los directorios accionados por humanos, pero enfatiza en las diferencias entre ambos justamente porque los primeros trabajan automáticamente y los segundos dependen del factor humano.
Un aspecto importante, tratado por este autor, son las partes de los motores de búsqueda: el primer elemento es el "spider" o "crawler", encargado de visitar las páginas web, leerlas y analizar sus enlaces a otras páginas, esta operación se repite cada cierto tiempo en busca de cambios. El segundo elemento es el índice, también llamado catálogo donde se almacena una copia de cada página web que se encuentra, cada vez que cambia la página se actualiza con la nueva información, claramente transcurre un tiempo desde que se encuentra la página hasta que se indiza y no es hasta entonces que está disponible en el motor de búsqueda. El tercer elemento es el software, programa que se encarga de examinar los millones de páginas web contenidas en el índice, busca aquellas que contengan las palabras iguales a las solicitadas en la búsqueda, para luego ordenarlas según su relevancia. Para muchos navegantes es una interrogante saber si realmente el orden de los registros es aleatorio o responde a un determinado método de ordenamiento, más adelante se ofrecerán algunas consideraciones al respecto.7
Como puede apreciarse, en cada una de las definiciones, la función de cada una de estas herramientas es la misma: "buscar en la red", todos entonces se sitúan en una gran categoría general: buscadores. Son páginas web que analizan la red con el objetivo de que los navegantes encuentren los sitios donde se encuentra la información que ellos necesitan, ponen a su disposición "alternativas" para moldear las búsquedas con ayuda de sus propios lenguajes de interrogación, la diferencia está en el funcionamiento de cada uno; según esto, se dividen en 3 subcategorías, que en la opinión de la autora la manera más acertada de agruparlos es en:
- Directorios (se refiere a los llamados índices o buscadores de categorías).
- Motores de búsqueda (que algunos le llaman buscadores, robots, arañas o buscadores de contenido).
- Metabuscadores (que se abordarán más adelante).
Si se analizan detenidamente los conceptos referentes a las 2 primeras categorías es fácil encontrar ventajas y desventajas en cada una, por ejemplo, los directorios son excelentes para buscar por temas o categorías y los resultados se ordenan por dichas categorías, pero ellos no catalogan tantas direcciones como un motor de búsqueda; por su parte, los motores de búsqueda son muy útiles para buscar datos específicos y permiten encontrar "casi todo", pero esto, a su vez, produce como resultado demasiados sitios de todo tipo y calidad (miles) en una respuesta típica.
Pero hablar en la actualidad de buscadores, obliga necesariamente a hablar de los metabuscadores, innumerables trabajos, en la literatura especializada, abordan el tema, debaten sobre aspectos como funcionamiento, ventajas, desventajas y eficiencia, entre otros. A pesar de los beneficios indiscutibles de los motores de búsqueda y de los directorios temáticos, su crecimiento condujo a la creación de estas nuevas herramientas.1,8-12
Según Tyner,11 se conoce como metabuscadores, a aquellos que permiten interrogar varias bases de datos simultáneamente desde una única interfaz; aunque ellos no ofrecen el mismo nivel de control sobre la lógica y la interfaz de búsqueda que los motores y directorios, la mayoría son bastante rápidos. Apunta, además que la tendencia es mejorar sus capacidades con la incorporación de opciones de búsqueda al uso de los operadores convencionales, entre ellas, se destaca la posibilidad de poder escoger los motores de búsqueda donde debe buscarse, la búsqueda por campos (título, URL, etc.), entre otras.
Otras cualidades se agregan a la definición anterior, se plantea que al no tener sus propias bases de datos, a diferencia de los motores de búsqueda y los directorios temáticos, los metabuscadores no almacenan páginas web, no agregan direcciones, ni clasifican y reseñan sitios web, sino que envían una solicitud de búsqueda a varios buscadores a la vez.8
Stanley,1 considera que los metabuscadores constituyen el próximo eslabón dentro de la cadena alimenticia de la información en los motores de búsqueda convencionales, se consideran son superiores. Muy claramente expone aquellos elementos que considera sus ventajas esenciales:
- Se accede a una sola página web para formular la búsqueda.
- Se necesita sólo conocer la interfaz de una página para la búsqueda.
- Se formula sólo una vez la estrategia de búsqueda.
- Los resultados permiten redireccionar la búsqueda a otros buscadores.
- Se obtienen los resultados integrados, a partir de varios buscadores.
Una importante reflexión de la autora apunta al siguiente hecho: que los metabuscadores no dispongan de sus propias bases de datos sino que interroguen las de otros buscadores, significan una importante reducción en los costos por concepto de hardware para los productores. Ciertamente podría considerarse esta, una causa para el auge de los metabuscadores y su aceptación entre los navegantes.
No es menos cierto que los elementos descritos por Stanley1 sobre los metabuscadores, constituyen ventajas para el proceso de búsqueda; sin embargo, otros autores, que enfatizan en los problemas que puede causar su uso, llaman la atención de los navegantes para que los tengan siempre muy en cuenta, reconocen, por tanto, que son una herramienta muy útil.
Liu8 expone algunos elementos que son válidos anotar, sobre todo porque otros autores, que han escrito sobre el tema de los metabuscadores, no los tratan. Él plantea que es totalmente imposible que estas herramientas puedan unificar todas las ventajas de cada uno de los motores y que, por consiguiente, las búsquedas booleanas pueden generar resultados diferentes en diversos buscadores, las búsquedas por frases puede que no se ejecuten en alguno de ellos, y otros elementos como el uso de limitadores pueden sacrificarse. Apunta que los metabuscadores no devuelven, desde cada buscador, todas las páginas que se corresponden con la solicitud sino que toman un rango entre 10 y 100 registros de cada uno, por lo que efectivamente permiten redireccionar la búsqueda, como apunta Stanley,1 una vez que se escoja el motor, que más resultados relevantes arrojó, para continuar la búsqueda.
Algunos autores aseguran que la mayoría de los grandes buscadores utilizan lenguajes similares para interrogar sus bases de datos. Por esto, los resultados de la búsqueda en los metabuscadores pueden verse favorecidos si se conocen, en alguna medida, los lenguajes utilizados por los buscadores que estos procesan. Afortunadamente algunos metabuscadores ofrecen al navegante la opción de escoger dentro de un grupo determinado de buscadores disponibles, cuáles incluir en su metabúsqueda. Si se escogen aquellos conocidos por su confiabilidad, potencia y rapidez, los resultados de la búsqueda serán mejores.1
Cierto es, que cada categoría difiere de la otra sustancialmente por el funcionamiento y por las herramientas para la búsqueda en la red, pero incluso dentro de una misma categoría se diferencian unos de otros. Son eBlast y Yahoo directorios temáticos, pero no son iguales, son Altavista y Northern Light motores de búsqueda, pero son diferentes, de igual forma son Metacrawler y Savvy Search metabuscadores, y difieren uno del otro.
El uso de estos 3 mecanismos no presenta grandes diferencias a primera vista, por lo que es posible que los navegantes no distingan en cuál de ellos realizan habitualmente sus búsquedas, todos muestran un recuadro para introducir las palabras claves que se desean encontrar, solo que varía la forma en que se debe plantear la cuestión, porque, en algunos casos, puede complicarse con elaboradas reglas lógicas. Esta tabla resume brevemente la naturaleza de cada categoría de buscador.
Tabla. Caracterización de las diversas categorías de buscadores
|| Directorios temáticos || Motores de búsqueda || Metabuscadores ||
|| Bases de datos más pequeñas, menos actualizadas, y más elaboradas gracias a la presencia del factor humano. || Bases de datos más amplias y actualizadas. || No tiene bases de datos propias, sino que buscan automáticamente en las de otros buscadores. ||
|| Colocan la información por temas y categorías, una vez recopilada, de forma manual en sus índices. ||
Colocan la información, que sean capaces de recoger en la red, en sus índices sin ordenarlas por temas, de manera automática y periódica. || No almacenan información porque no dependen de bases de datos propias. ||
|| No realizan las búsquedas en Internet "en vivo", almacenan los datos de los sitios y ofrecen enlace a éstos. || No realizan las búsquedas en Internet "en vivo", sino en las copias de las páginas que almacenan en sus índices. ||
Envían su búsqueda a varios motores, sus resultados dependen de que estos estén disponibles en el momento de la búsqueda, o se descarguen en el período de tiempo permisible. ||
|| Son fáciles de usar, permiten, en primer lugar, ubicar la búsqueda en un tema determinado. || Son más difíciles, se requiere explotar al máximo las opciones de búsqueda porque contienen más información. || Son difíciles de usar para búsquedas muy precisas, porque tienen menos control de la búsqueda al interrogar varias bases de datos con interfaces diferentes. ||
|| Son convenientes para buscar información general, institucional porque devuelve resultados a las páginas principales. || Se utilizan para buscar información más escasa, especializada, actualizada o incluida en páginas personales. || Se recomienda para temas "oscuros", difíciles de encontrar. ||
|| || Ejemplos || ||
|| LookSmart (http://www.looksmart.com)Open Directory (http://dmoz.org)Yahoo (http://www.yahoo.com) || Altavista (http://www.altavista.com)Google (http://www.google.com)HotBot (http://hotbot.lycos.com) || Metacrwler (http://metacrawler.com)NetLocator (http://nln.com)StartingPoint (http://www.sptp.com) ||
Mucho se ha debatido sobre la necesidad de conocer las herramientas con que se busca en la red, precisamente por la gran variedad que existe, donde unos suelen ser más eficientes que otros. Un aspecto importante a considerar para seleccionar los buscadores es la evaluación de sus bases de datos. Como se ha explicado anteriormente, los resultados de las búsquedas, obtenidos de cada buscador no son más que la "salida en pantalla" de la información de sus bases de datos, después que esta se localiza, procesa, evalúa y ordena. Por supuesto, no es comparable la evaluación de una base de datos en CD con otra en Internet, esta última es mucho más difícil.
Notess13 expone, de manera muy sencilla, sus puntos de vista al respecto, plantea que el mayor problema para evaluar una base de datos en Internet es que sus registros nunca son estáticos, porque existen muchas páginas "efímeras" que se indizan en el tiempo en que se crea o actualiza la base de datos y poco tiempo después se mueven, cambian o rediseñan completamente; sin embargo, aun cuando el contenido de los registros es variable, plantea el autor, que las bases de datos en Internet pueden evaluarse en cuanto a alcance, estructura y actualidad. Se explica en este artículo, que para determinar el alcance de la base de datos se debe consultar la ayuda o las FAQs, se sugiere también, que el examen de la estructura es efectivo, por ejemplo, si el único acceso a los registros individuales es por una búsqueda de palabras claves, cabría entonces, pensar que es una base de datos que se genera automáticamente, mientras que, si tiene una estructura jerárquica de materias, debe construirse selectivamente. Ciertamente, estos son aspectos importantes, pero no se pueden obviar otros más elementales, sobre todo, para los buscadores de tipo directorio, como el título de la página, que se supone sea claro y refleje, con exactitud, el contenido del sitio y la consulta del "about" que ofrece información general.
Wighton14 concede también, una especial importancia a la consulta de las FAQs de los buscadores, antes de formular una búsqueda, enfatiza, que esto permite saber cómo se puede buscar y hasta dónde se puede llegar y, a partir de aquí, elegir o desechar el buscador.
Notess,13 explica que la estructura de los registros de la base de datos, que se muestra en los resultados, puede parecer un elemento difícil de evaluar, sobre todo, porque a diferencia de otras, en las bases de datos en Internet, los campos no aparecen explícitamente, sin embargo, generalmente son fáciles de identificar, incluso existen buscadores como Google que explican detalladamente en su ayuda, a qué se refiere cada dato expuesto en los resultados de la búsqueda, la mayoría de los buscadores entregan sus resultados con los siguientes campos: título, descripción del contenido, categoría de materia y URL.
Realmente el navegante nunca podrá ver la estructura de la base de datos, por esto resulta un poco difícil saber cómo se maneja una búsqueda, una vez formulada la pregunta a la base de datos, pero conocer a qué se refiere cada elemento mostrado en los resultados puede ser un factor determinante a la hora de decidir cuáles son los registros más relevantes.
Otro aspecto enunciado por este autor para evaluar las bases de datos, es su modo de actualización, es difícil encontrar un motor que actualice constantemente cada uno de los sitios; para los grandes motores, porque tendrían una gran demanda en cuanto al ancho de banda y para los directorios, aunque más pequeños en volumen de información, porque exigiría una sobrexplotación del recurso humano. Plantea este autor, que es muy difícil determinar la frecuencia de actualización de una base de datos, pero el análisis de algunos de los resultados devueltos puede ser una vía para esto. Por ejemplo, en un intento de acceso a los enlaces que luego no se pueden alcanzar, o que te ofrecen un mensaje de que la página se ha movido a otra dirección sería conveniente fijarse en la fecha de la página si es posible, esto proporciona una medida del tiempo que lleva sin actualizarse; la última fecha de actualización de los sitios que forman parte de los resultados de la búsqueda muchas veces son de un año, 2 o más, ello indica que el creador del sitio cambió de empleo o sencillamente perdió el interés, un motor de búsqueda que se respete no debe incluir este tipo de sitios en sus índices.13
Existen varios trabajos donde se exponen diversos análisis y comparaciones entre buscadores, estos pueden ayudar a una mejor comprensión de su funcionamiento.6,11,12,15-22
Internet es una gran biblioteca, solo que a diferencia de la biblioteca tradicional no tiene libros y revistas impresas, materiales audiovisuales o diapositivas sino que sus documentos son sitios web sin control bibliográfico, no disponen de un equivalente al ISBN, que identifica los libros, tampoco existen sistemas análogos para su catalogación y clasificación, como los establecidos por la Biblioteca del Congreso, mucho menos, existe un catálogo central que registre todas sus páginas y, ni siquiera lo más elemental, muchos de los documentos que se encuentran en Internet carecen de autor y fecha de publicación.11
Evidentemente, como Internet es un medio libre para publicar, no existen normas estándares para hacerlo ni para indizar la información que fluye por ella. Las bases de datos de los buscadores no reconocen e indizan los mismos campos, y su funcionamiento para recuperar la información es diferente. De todo lo anterior, se infiere que para que los buscadores se conviertan en una herramienta eficaz es necesario que se conozcan muy bien.
Como se ha explicado anteriormente, la tendencia inevitable es la especialización de las herramientas de búsqueda en el web. Esto ha provocado la aparición de una gran variedad de buscadores, que generalmente resultan difíciles de evaluar por el navegante; por otra parte, en muchos casos han devenido, incluso en portales, añaden entonces a su oferta, un conjunto más o menos homogéneo de servicios, como noticias, bolsas de vivienda, chats o correo electrónico. Son gratuitos y se financian mediante la publicidad, debido a esto, el acceso a sus páginas principales es, a veces, la primera causa para que el navegante se sienta perdido entre tantos efectos especiales, comerciales y propagandas.
Muchos son los expertos que han sugerido los aspectos que deben considerar los navegantes para buscar en el web. En algunos casos, se apunta a que el navegante solo debe preocuparse por buscar la caja de diálogo, que permite introducir las palabras claves por las que pretende realizar la búsqueda, el cual tiene al lado un botón o un gráfico con las palabras "buscar", "search", "go", "go to get it", donde el navegante mediante un click inicia el proceso de búsqueda, es recomendable buscar, cerca de esta caja de diálogo, opciones para seleccionar el número de registros a mostrar por página, los dominios donde buscar, los tipos de recursos o el tipo de lógica a emplear.6
Gresham23 opina que encontrar resultados relevantes en Internet es una mezcla de experiencia, técnicas, aptitudes, inventiva y buena suerte, todas combinadas con la habilidad de proceder en una dirección clara y metódica, en otras palabras, es simplemente "navegar con un propósito", apunta además que depende más de la estrategia de búsqueda que de la propia herramienta a utilizar. Sugiere la siguiente secuencia lógica de pasos:
- Determinar el tipo de información que se necesita (artículos científicos, estadísticas, documentos gubernamentales) y luego determinar qué tipo de organizaciones pueden ofrecer estos documentos.
- Crear una lista de todas las palabras claves posibles y de sus sinónimos.
- Determinar qué tipo de herramienta utilizar en la búsqueda (directorio, motor general o especializado, metabuscador) en dependencia de lo que se busca.
- Construir la estrategia de búsqueda y conducirla (en dependencia del buscador, se definirán las combinaciones de búsquedas, se debe ser lo más preciso posible y explotar las opciones disponibles).
- Evaluar los resultados de la búsqueda (si los primeros 15 registros no se consideran relevantes debe considerarse replantear la estrategia varias veces o cambiar de buscador, si el resultado persiste, si los resultados son relevantes debe valorarse la actualidad de los registros y si el sitio proviene de una fuente confiable).
Flanagan,5 de manera más breve, apunta que para buscar en Internet existen 2 pasos claves a dar, en primer lugar, se ha de comprender correctamente qué se va a buscar, esto implica definir conceptos, determinar sinónimos, palabras relacionadas y, en segundo lugar, cómo usar las herramientas de búsqueda disponibles.
Tyner11 señala también, aspectos que considera importantes, y al igual que Flanagan,5 se refiere a formular la búsqueda y su alcance, mediante la identificación de los conceptos que abordan la cuestión, las palabras claves, sus sinónimos y variaciones, así como la preparación de la estrategia de búsqueda, sin embargo, en esta reflexión no se considera la herramienta que se utilizará, sin la cual no queda bien expresada la estrategia (aunque más adelante hace alusión a ello), ni se trata la evaluación de los resultados.
Realmente, el primer cuestionamiento del navegante debe ser siempre, ¿qué quiero buscar?, ¿cómo?, y ¿dónde puedo encontrarlo?. Los planteamientos anteriores, sobre todo de Gresham,23 constituyen una guía muy acertada de los pasos a seguir.
Una vez elaborada esta guía, deben considerarse otros elementos para lograr mejores resultados, estos aspectos sugeridos por varios autores,3,6,11,13,15,24 se consideran aplicables a la mayoría de los buscadores:
- Escribir en minúsculas y sin acentos.
- No usar una sola palabra en su búsqueda porque se obtendrán demasiados resultados.
- Emplear varias palabras claves que definan o determinen específicamente lo que se busca.
- Encerrar "entre comillas" las palabras que se desean encontrar juntas (frases).
- Usar los operadores más comunes (and, or, not).
- Buscar en las horas de menos tráfico, en consideración a que la mayoría de los motores están ubicados en los Estados Unidos.
- Consultar siempre la información disponible de cada buscador para conocer qué opciones puede utilizar para interrogar sus bases de datos.
< anterior
| 1
2
3 4
5
6
7
| siguiente >
Artículos relacionados con 'El uso de los buscadores en Internet'
Un sitio web no se llena mágicamente de visitantes, lo mismo que no se vende...
Más »
La Web Semántica es la forma en que las páginas Web podrán ser leídas e...
Más »
Un sitio web no se llena mágicamente de visitantes, lo mismo que no se vende...
Más »
Los desarrolladores web o webmasters saben muy bien lo que son. Son parte del código...
Más »
Una persona rusa puede copiar un libro de Gabriel García Márquez traducido al chino, publicarlo...
Más »
Autor y licencia de 'El uso de los buscadores en Internet'
Artículo de Lic. Ania Torres Pombert. Extraido de: http://www.bvs.sld.cu/revistas/aci/vol11_3_03/aci04303.htm
Todo el contenido de la revista, excepto donde se especifique algo diferente, se encuentra bajo los términos de la Licencia Creative Commons
Este contenido ha sido recopilado por el equipo de Wikilearning. Todo el contenido recopilado se ha obtenido respetando y comunicando en nuestro site la licencia de cada fuente.
Wikilearning tiene permiso expreso por escrito de los autores para publicar los contenidos que ha extraído de otras webs, incluyendo su uso comercial.
