MOTORES DE BÚSQUEDA

 

Luciano Rubio Irubio


Todo el saber de la Web


El fin de esta serie de artículos es dar a conocer a los lectores de PC ACTUAL las mejores herramientas de búsqueda de contenido en Internet. Y si en las dos anteriores entregas hemos recopilado y contado las características de los motores de búsqueda en castellano disponibles en la Red, en esta última parte vamos a repasar las herramientas para localizar información en cualquier lengua y, principalmente, en inglés.
Nos guste o no, e independientemente del número de hablantes de cada lengua, el idioma nativo de Internet es el inglés, por varios motivos. El primero de ellos es que el origen de la Red está en Estados Unidos (lo que implica que durante los primeros años de Internet, los usuarios de este país eran mayoría); el segundo es que la lengua de Shakespeare es, en teoría, el lenguaje de uso universal, el que se debe dominar si queremos que nos entiendan fuera de nuestras fronteras. Y, como colofón, hay que destacar que tanto económicamente como a nivel de universidades, la influencia de los países con lengua inglesa es muy fuerte.
Afortunadamente para los hispanohablantes, la cantidad de contenido en castellano es cada día mayor; pero aún así, sigue siendo poco frente al que hay en inglés. Por lo tanto, si queremos algo de información un poco especial tendremos que «pasar por el aro». Por ello, sin más dilación, comenzamos a pasar revista a los motores de búsqueda en inglés.
Yahoo!, el pionero
Este fue el primer índice que apareció en Internet, con el objetivo claro de poner un poco de orden dentro del caos en que empezaba a convertirse la Red y, en concreto, la Web. Yahoo! es el índice más completo a nivel mundial, totalmente profesional y con especialistas que analizan minuciosamente aspectos tales como la ordenación y definición de las categorías. Este nivel de profesionalización llegó a su cumbre cuando la empresa salió a cotizar en bolsa (a principios de este año), financiándose mediante publicidad en sus páginas y venta de productos propios, tales como camisetas, gorras y ropa interior.
Con un total de 14 grandes categorías, contiene multitud de subcategorías que cercan el «saber» de la Red en parcelas muy específicas. Para completar el servicio, dispone de una utilidad de búsqueda sobre su base de datos, cuyas opciones son el lugar de búsqueda (Yahoo!, Usenet o direcciones de e-mail), el tiempo que lleva en la base de datos (por defecto, desde los principios de este servicio), la conjunción lógica que une los términos del query (que puede ser AND o OR), si debe buscar cadenas enteras o subcadenas y el número de resultados por página.
Otra de las características de que dispone es Yahoo! Remote, una ventana del navegador de reducidas dimensiones que contiene tan sólo los campos del formulario electrónico necesarios para realizar una búsqueda, más unos interesantes enlaces relacionados con las noticias del día. Los resultados de las búsquedas que realicemos desde esta ventana se visualizarán en el navegador desde donde se invocó a esta utilidad.
Para dar de alta una URL el proceso más sencillo es desplazarse por el índice hasta la categoría donde queramos incluirla y pulsar el gráfico señalado como «Add URL». Una vez rellenado el cuestionario, un robot verificará la existencia del web y en el plazo aproximado de una semana lo dará de alta. A este respecto debemos señalar que este supuesto robot inteligente falla a veces y, aunque la URL exista y esté en funcionamiento, se niega a dar de alta el sitio debido a la falta de respuesta del web. Por último, señalar que dispone de opciones para crear páginas con enlaces elegidos al azar. Su dirección es http://www.yahoo.com.
Lycos, todo un clásico
Otro de los buscadores más conocidos es Lycos, que nació a rebufo de Yahoo! y que ha superado a éste en muchos aspectos. Con un diseño claro y atractivo, Lycos se ha convertido en algo más que un lugar donde buscar información. La base del contenido es un índice (donde las altas las han de realizar los usuarios) cuestionable, con opciones y caminos hacia la información que le diferencian del resto de índices. Nos estamos refiriendo a sus 10 categorías especiales, desde donde se accede a Top News (las últimas noticias generales), guía de las ciudades más importantes de los EEUU (con mapas), búsqueda de información por empresas, acceso directo a compañías, acceso a las categorías del índice, Top 5% sites donde se muestra una lista de los sitios más solicitados (ordenados en las mismas categorías que en el índice), búsqueda de direcciones de e-mail, mapas de carreteras, búsqueda de gráficos y sonidos, y una revisión de los puntos más interesantes de la semana.
El motor de búsqueda permite optimizar ésta mediante el uso de los operadores lógicos AND y OR, más una extraña característica de encontrar un número fijo de palabras. También podemos especificar nivel de exactitud, el número de resultados por página y la cantidad de información que nos debe facilitar por cada coincidencia. Para añadir una nueva URL, deberemos hacer uso del enlace correspondiente que aparece al final de la página; aunque al igual que ocurría con Yahoo!, la URL debe estar en funcionamiento ya que antes de aceptar los datos hace la correspondiente comprobación. Como servicios añadidos encontramos el club Lycos, cuya principal ventaja son los descuentos de software adquirido por Internet a los que podremos acceder. Su dirección es: http://www.lycos.com.
Altavista, de origen profesional
La mayoría de las herramientas de búsqueda que hay en la Web fueron creadas por usuarios, generalmente universitarios o estudiantes, que han venido a más y han acabado en empresas con excelentes resultados financieros. Más tarde, los propios proveedores de Internet y de servicios sobre y para la Red se lanzaron a esta aventura.
La finalidad era darse a conocer y aprovechar la oportunidad de ingresos por publicidad que brinda este medio a las páginas más visitadas. Las casas comerciales con presencia activa en la Web, utilizan por norma herramientas de búsqueda en su propio árbol, dejando a otros la vorágine de informaciones del resto de Internet. Pero, como toda norma, tiene su excepción: Digital.
Altavista es una herramienta de búsqueda cuya base de datos se alimenta de los dos métodos que hemos visto en el resto de buscadores comentados. Por un lado rastrea la Web, añade sus direcciones y las asocia a las palabras clave que aparecen en la cabecera; por otro lado, da de alta la dirección para que el robot actúe sobre ella.
Por defecto, las opciones de búsqueda son el servicio de la red donde se ha de mirar (Web o Usenet) y la forma de dar los resultados. Si accedemos a las opciones de búsqueda avanzada, podemos optar por usar los operadores lógicos AND, NOR, OR y NEAR, indicar qué documentos se han de listar primero e indicar que las páginas devueltas estén dentro de un periodo de tiempo determinado. Además de los típicos FAQ, dispone de páginas de feedback (donde hacer comentarios, preguntas y sugerencias), generadores de enlaces aleatorios y cuestiones legales acerca del uso de logotipos y servicios. Su dirección es: http://www.altavista.com.
Excite, algo más que un buscador
Excite pertenece a la familia de los índices, pero en él podemos encontrar, además de la base de datos interrogable, acciones propias de un robot. La forma de actuar de esta herramienta es similar a la de Altavista, donde el usuario indica la raíz del árbol de ficheros HTML y la máquina se encarga de añadir las páginas con las claves correspondientes. Por parte del índice, dispone de 20 categorías con las suficientes subcategorías como para acotar bastante las áreas de contenido.
Una cuestión curiosa y que ayuda mucho a la navegación por el índice es que en la franja izquierda de la pantalla se va desglosando el árbol, de tal forma que para cambiar de subcategoría no hay que ir a las páginas visitadas anteriormente. Según sus creadores, su base de datos es del orden del 50% superior al del resto de buscadores, y además dispone de servicios extras tales como mapas, localizador de poblaciones a nivel mundial (vía City.Net, servicio paralelo de búsqueda con la misma tecnología de Excite), localización de personas, páginas amarillas, sección de noticias y acceso a otras páginas de interés más o menos informático. Desde la página principal podemos elegir dónde se tiene que realizar el query (en la web o en las news) y podemos utilizar los operadores lógicos AND, OR y NOT combinados con paréntesis. Como dato, hemos observado que es posible utilizar el símbolo «+» en lugar de la conjunción copulativa y el «-» por la negación.
Haciendo gala de la interactividad de Internet, Excite ofrece al usuario la posibilidad de crear su propia página de Excite, con las referencias a las noticias y páginas de interés, que se irán renovando según vayan apareciendo novedades en las categorías elegidas. Para los residentes en Estados Unidos se añade incluso la posibilidad de agregar a esta página la programación de las cadenas de televisión. En definitiva, se trata de una herramienta de búsqueda muy atractiva con numerosos servicios adicionales, que en nuestra opinión no debe faltar en el bookmark o en los lugares favoritos. Su dirección es http://www.excite.com.
Infoseek, la búsqueda alternativa
Contrariamente a lo que ocurre por regla general en las herramientas de búsqueda, en Infoseek se anima al usuario a buscar más por frases completas que por términos. Como prueba buscamos «Dónde está PC ACTUAL» y en respuesta obtuvimos todos los enlaces donde aparecían alguna de las palabras ordenadas por mayor número de coincidencias. La base de datos se alimenta de las direcciones que van dando de alta los usuarios vía e-mail, quienes tan sólo deben indicar el comienzo del árbol. El resto de los datos se obtienen de los tags «META» que introducimos en la cabecera, tal y como se indica en la correspondiente página.
Las opciones de búsqueda avanzada son las más completas y potentes que hemos visto hasta ahora, aunque tenemos que señalar que hay que leerse detenidamente la ayuda para poder hacer un uso adecuado a nuestras necesidades. También podemos preguntarle por cuestiones más específicas como imágenes, sitios, enlaces, URLs y títulos.
Además de las funciones propias como motor de búsqueda e índice, Infoseek mantiene páginas de noticias, que se parecen más a un periódico electrónico con todas sus secciones: un calendario de los sucesos más importantes de la Red, una base de datos interrogable de compañías norteamericanas (en la que suministrando el nombre devuelve los enlaces a las páginas de la base de datos que contienen el nombre que hemos tecleado, o bien la dirección y teléfono de ésta y sus sucursales) y una utilidad de mapas a la que suministrándole el nombre de la calle y el estado, nos devuelve un mapa de la zona (lástima que sólo se circunscriba al territorio USA). Incluso tiene un horóscopo.
Por último, señalar que si accedemos a una de las versiones locales, mientras que mantengamos la misma dirección IP (si no tenemos una conexión permanente a Internet, esta característica se mantendrá durante toda la sesión actual), cada vez que accedamos a su página principal nos derivará a la versión en el idioma elegido. Su dirección es http://guide.infoseek.com.
Magellan, un amplio índice
Basado en la tecnología de búsqueda de Excite, Magellan es un índice con 26 grandes categorías de las que se desprenden numerosas subcategorías. Para interrogar la base de datos disponemos de la típica caja de texto donde teclear las claves, junto con un grupo de gráficos para iniciar el query y fijar las opciones.
Pulsando en el último gráfico, seleccionamos la conjunción lógica que interpondrá el buscador entre las palabras que tecleemos (OR o AND), la parte de la base de datos donde debe buscar, la calidad de la búsqueda y si los cambios que realicemos aquí tienen que ser válidos sólo en la próxima operación o en toda la sesión.
Las opciones de búsqueda permiten realizar ésta en toda su extensión, sólo los sitios revisados por los autores y/o aquellos que tengan la green light, que son aquellos sites revisados que no contienen información para adultos. Además de la lógica comentada, podemos utilizar el símbolo «+» delante de un término para forzar que aparezca en todos los resultados, y el «-» a modo de NOT.
Como servicios adicionales presenta tres tipos de búsquedas extras especializadas en la localización de personas y una guía del rock, que no es otra cosa que un buscador centrado en la música de este tipo. Además, dispone de una opción denominada Search Voyeur, que nos muestra 20 comienzos de búsqueda aleatorios realizados en los últimos minutos. Con esta opción hay que tener un poco de cuidado si lo manejan menores, puesto que, como ejemplo, cuando accedimos a él para probarlo aparecieron varias referencias a búsquedas con contenido para adultos. Las altas se realizan indicando el comienzo del árbol de la Web, y es un robot quien lo explora y añade los enlaces y referencias. Su dirección es http://www.mckinley.com.
Open Text, un buscador interactivo
A pesar de que el nombre de esta herramienta de búsqueda tenga una referencia a texto, el aspecto gráfico está excelentemente cuidado. Las búsquedas se pueden realizar desde pagina principal bien por palabras clave o por frases completas. Si pulsamos el enlace etiquetado como Power Search accederemos a una página donde podremos elegir las conjunciones lógicas de los términos que indiquemos y el lugar de la página donde debe aparecer dicha palabra.
Además de poder buscar direcciones de correo electrónico y dentro de los grupos de news, tenemos acceso a un área de noticias actualizadas contra la que podemos dirigir querys. Como servicios extras dispone de un área de descubrimientos con enlaces a los mejores sitios de la Red que figuren en la base de datos, lugares de humor y de dibujos animados, artículos publicados en Internet e información acerca de los creadores de esta herramienta de búsqueda.
En la parte de interactividad, dispone de enlaces para dar de alta nuevos recursos (esta opción no estaba disponible mientras realizamos nuestras pruebas), enviar al webmaster un mensaje y ajustar las preferencias de la sesión a nivel de la cantidad de gráficos que se han de representar y el uso o no de frames. Por último, señalar que dispone de ayudas tanto para usar esta herramienta como para optimizar las búsquedas. Su dirección es http://index.opentext.net.
WebCrawler, la falta de opciones
Bajo el lema «busca antes de navegar», en WebCrawler encontramos un índice con pocos añadidos más. La base de datos se nutre de las altas que van dando los usuarios; y como en otros casos, tan sólo hay que indicar la dirección de partida y un robot se encargará del resto, ya que las actualizaciones se realizan diariamente. Las únicas opciones de búsqueda que tenemos son dónde se deben buscar las claves (en el título o en el sumario) y el número de referencias por página (10, 25 ó 100). Dado que no admite operadores lógicos, los resultados que obtenemos si introducimos más de una clave son desmesurados, casi inmanejables.
Como servicios extras tenemos el navegador (que nos muestra lo mejor, lo nuevo y lo más interesante de otras categorías), el especial (acceso a enlaces aleatorios, qué tags hay que introducir en nuestra página web para realizar búsquedas con esta herramienta, etc.), añadir URLs, una ayuda (propia para esta herramienta) y trucos para optimizar búsquedas.
Camaradería mejor que competencia cruel
Nos ha sorprendido mucho que, a pesar de la «profesionalización» de Internet en el sentido de convertirse en un medio totalmente comercial con grandes movimientos de dinero, siga existiendo el espíritu de los primeros tiempos: lo importante es prestar ayuda a los usuarios y para ello, en vez de pelear duramente por los potenciales consumidores de su publicidad y no darles pistas acerca de la competencia, señalan claramente que si no has encontrado lo que buscabas en su herramienta, busques en las otras. En algunos casos, esta derivación se hace simplemente mediante links a otras herramientas de búsqueda y en otros se realiza directamente la búsqueda, pasando a obtener resultados inmediatos.
Yahooligans!
Existe una versión de Yahoo!, desarrollada por la misma empresa, dedicada a dar servicio a los más pequeños de la casa. Además de sacar de su base de datos todos aquellos contenidos no aptos para ellos (pornografía, violencia...), dispone de categorías especiales orientadas a estas edades, tales como programas de los cursos escolares, preguntas y respuestas a los ejercicios más comunes, enlaces a páginas con contenido educativo de cualquier área del saber humano (adaptado para que lo puedan entender), etc. Y todo ello con la misma tecnología y la misma seriedad que su hermano mayor Yahoo! Su dirección es http://www.yahooligans.com.
Otra forma de financiarse
Hemos visto una clara tendencia de los propietarios intelectuales de los motores de búsqueda que hay en Internet a incluir publicidad en sus páginas, con el objetivo de rentabilizar tanto los costosos accesos a Internet como las máquinas dedicadas y el personal cualificado. Sin embargo, por debajo de esta «superficialidad» hay otro mercado del que también sacan provecho: las tecnologías de búsqueda.
Todos los programas que físicamente realizan el query a velocidades aceptables (hay que tener en cuenta la magnitud de las bases de datos) con metodologías de localización propias y la generación de páginas web dinámicas no son nada triviales y encierran miles de horas de trabajo, además de la experiencia acumulada durante años-Internet (que corresponden a varios años naturales). Los compradores de estas tecnologías son las grandes empresas que tienen presencia directa en Internet y desean dotar a sus páginas de capacidad para autobúsqueda de términos, y los administradores de Intranets cuyo contenido de información en formato HTML empieza a ser demasiado grande.
Tecnología al servicio de otros idiomas
La gran mayoría de las herramientas de búsqueda en inglés están adaptando sus buscadores a otros idiomas. Lycos, Altavista, Infoseek, etc, quieren ampliar sus dominios a todos los usuarios sin que el idioma sea un problema. Los internautas hispanos estamos de enhorabuena dado que la gran cantidad de hispanohablantes hace que el castellano sea uno de los primeros idiomas a los que se traducen. De los buscadores que hemos analizado, se encuentran en otros idiomas (además del inglés):
Yahoo!: Francés, alemán y japonés. Existen además versiones locales de Canada y Gran Bretaña.
Lycos: Alemán y sueco.
Altavista: Danés, holandés, estonio, finlandés, francés, alemán,islandés, lituano, noruego, polaco, ruso y sueco. Además existen versiones locales para Austria, Belgica, Alemania, Estonia, Finlandia, Francia, Alemania, Islandia, Luxemburgo, Lituania, Noruega, Polonia, Rusia, Suecia, Suiza, Holanda y Gran Bretaña.
Infoseek: Alemán, español, francés yjJaponés.
Open Text: Japonés, español y portugués (bajo la misma página).
Luciano Rubio lrubio bpe.es