MOTORES DE BÚSQUEDA
Luciano
Rubio Irubio
Todo el saber de la Web
El fin de esta serie de artículos es dar a conocer a los lectores de
PC ACTUAL las mejores herramientas de búsqueda de contenido en Internet. Y si
en las dos anteriores entregas hemos recopilado y contado las características
de los motores de búsqueda en castellano disponibles en la Red, en esta última
parte vamos a repasar las herramientas para localizar información en cualquier
lengua y, principalmente, en inglés.
Nos guste o no, e independientemente del número de hablantes de cada lengua, el
idioma nativo de Internet es el inglés, por varios motivos. El primero de ellos
es que el origen de la Red está en Estados Unidos (lo que implica que durante
los primeros años de Internet, los usuarios de este país eran mayoría); el
segundo es que la lengua de Shakespeare es, en teoría, el lenguaje de uso
universal, el que se debe dominar si queremos que nos entiendan fuera de
nuestras fronteras. Y, como colofón, hay que destacar que tanto económicamente
como a nivel de universidades, la influencia de los países con lengua inglesa
es muy fuerte.
Afortunadamente para los hispanohablantes, la cantidad de contenido en
castellano es cada día mayor; pero aún así, sigue siendo poco frente al que hay
en inglés. Por lo tanto, si queremos algo de información un poco especial
tendremos que «pasar por el aro». Por ello, sin más dilación, comenzamos a
pasar revista a los motores de búsqueda en inglés.
Yahoo!, el pionero
Este fue el primer índice que apareció en Internet, con el objetivo claro de
poner un poco de orden dentro del caos en que empezaba a convertirse la Red y,
en concreto, la Web. Yahoo! es el índice más completo a nivel mundial,
totalmente profesional y con especialistas que analizan minuciosamente aspectos
tales como la ordenación y definición de las categorías. Este nivel de
profesionalización llegó a su cumbre cuando la empresa salió a cotizar en bolsa
(a principios de este año), financiándose mediante publicidad en sus páginas y
venta de productos propios, tales como camisetas, gorras y ropa interior.
Con un total de 14 grandes categorías, contiene multitud de subcategorías que
cercan el «saber» de la Red en parcelas muy específicas. Para completar el
servicio, dispone de una utilidad de búsqueda sobre su base de datos, cuyas
opciones son el lugar de búsqueda (Yahoo!, Usenet o direcciones de e-mail), el
tiempo que lleva en la base de datos (por defecto, desde los principios de este
servicio), la conjunción lógica que une los términos del query (que puede ser
AND o OR), si debe buscar cadenas enteras o subcadenas y el número de
resultados por página.
Otra de las características de que dispone es Yahoo! Remote, una ventana del
navegador de reducidas dimensiones que contiene tan sólo los campos del
formulario electrónico necesarios para realizar una búsqueda, más unos
interesantes enlaces relacionados con las noticias del día. Los resultados de
las búsquedas que realicemos desde esta ventana se visualizarán en el navegador
desde donde se invocó a esta utilidad.
Para dar de alta una URL el proceso más sencillo es desplazarse por el índice
hasta la categoría donde queramos incluirla y pulsar el gráfico señalado como
«Add URL». Una vez rellenado el cuestionario, un robot verificará la existencia
del web y en el plazo aproximado de una semana lo dará de alta. A este respecto
debemos señalar que este supuesto robot inteligente falla a veces y, aunque la
URL exista y esté en funcionamiento, se niega a dar de alta el sitio debido a
la falta de respuesta del web. Por último, señalar que dispone de opciones para
crear páginas con enlaces elegidos al azar. Su dirección es
http://www.yahoo.com.
Lycos, todo un clásico
Otro de los buscadores más conocidos es Lycos, que nació a rebufo de Yahoo! y
que ha superado a éste en muchos aspectos. Con un diseño claro y atractivo,
Lycos se ha convertido en algo más que un lugar donde buscar información. La
base del contenido es un índice (donde las altas las han de realizar los
usuarios) cuestionable, con opciones y caminos hacia la información que le
diferencian del resto de índices. Nos estamos refiriendo a sus 10 categorías
especiales, desde donde se accede a Top News (las últimas noticias generales),
guía de las ciudades más importantes de los EEUU (con mapas), búsqueda de
información por empresas, acceso directo a compañías, acceso a las categorías
del índice, Top 5% sites donde se muestra una lista de los sitios más
solicitados (ordenados en las mismas categorías que en el índice), búsqueda de
direcciones de e-mail, mapas de carreteras, búsqueda de gráficos y sonidos, y
una revisión de los puntos más interesantes de la semana.
El motor de búsqueda permite optimizar ésta mediante el uso de los operadores
lógicos AND y OR, más una extraña característica de encontrar un número fijo de
palabras. También podemos especificar nivel de exactitud, el número de
resultados por página y la cantidad de información que nos debe facilitar por
cada coincidencia. Para añadir una nueva URL, deberemos hacer uso del enlace correspondiente
que aparece al final de la página; aunque al igual que ocurría con Yahoo!, la
URL debe estar en funcionamiento ya que antes de aceptar los datos hace la
correspondiente comprobación. Como servicios añadidos encontramos el club
Lycos, cuya principal ventaja son los descuentos de software adquirido por
Internet a los que podremos acceder. Su dirección es: http://www.lycos.com.
Altavista, de origen profesional
La mayoría de las herramientas de búsqueda que hay en la Web fueron creadas por
usuarios, generalmente universitarios o estudiantes, que han venido a más y han
acabado en empresas con excelentes resultados financieros. Más tarde, los
propios proveedores de Internet y de servicios sobre y para la Red se lanzaron
a esta aventura.
La finalidad era darse a conocer y aprovechar la oportunidad de ingresos por
publicidad que brinda este medio a las páginas más visitadas. Las casas
comerciales con presencia activa en la Web, utilizan por norma herramientas de
búsqueda en su propio árbol, dejando a otros la vorágine de informaciones del
resto de Internet. Pero, como toda norma, tiene su excepción: Digital.
Altavista es una herramienta de búsqueda cuya base de datos se alimenta de los
dos métodos que hemos visto en el resto de buscadores comentados. Por un lado
rastrea la Web, añade sus direcciones y las asocia a las palabras clave que
aparecen en la cabecera; por otro lado, da de alta la dirección para que el
robot actúe sobre ella.
Por defecto, las opciones de búsqueda son el servicio de la red donde se ha de
mirar (Web o Usenet) y la forma de dar los resultados. Si accedemos a las
opciones de búsqueda avanzada, podemos optar por usar los operadores lógicos
AND, NOR, OR y NEAR, indicar qué documentos se han de listar primero e indicar
que las páginas devueltas estén dentro de un periodo de tiempo determinado.
Además de los típicos FAQ, dispone de páginas de feedback (donde hacer
comentarios, preguntas y sugerencias), generadores de enlaces aleatorios y
cuestiones legales acerca del uso de logotipos y servicios. Su dirección es:
http://www.altavista.com.
Excite, algo más que un buscador
Excite pertenece a la familia de los índices, pero en él podemos encontrar,
además de la base de datos interrogable, acciones propias de un robot. La forma
de actuar de esta herramienta es similar a la de Altavista, donde el usuario
indica la raíz del árbol de ficheros HTML y la máquina se encarga de añadir las
páginas con las claves correspondientes. Por parte del índice, dispone de 20
categorías con las suficientes subcategorías como para acotar bastante las
áreas de contenido.
Una cuestión curiosa y que ayuda mucho a la navegación por el índice es que en
la franja izquierda de la pantalla se va desglosando el árbol, de tal forma que
para cambiar de subcategoría no hay que ir a las páginas visitadas
anteriormente. Según sus creadores, su base de datos es del orden del 50%
superior al del resto de buscadores, y además dispone de servicios extras tales
como mapas, localizador de poblaciones a nivel mundial (vía City.Net, servicio
paralelo de búsqueda con la misma tecnología de Excite), localización de
personas, páginas amarillas, sección de noticias y acceso a otras páginas de
interés más o menos informático. Desde la página principal podemos elegir dónde
se tiene que realizar el query (en la web o en las news) y podemos utilizar los
operadores lógicos AND, OR y NOT combinados con paréntesis. Como dato, hemos
observado que es posible utilizar el símbolo «+» en lugar de la conjunción
copulativa y el «-» por la negación.
Haciendo gala de la interactividad de Internet, Excite ofrece al usuario la
posibilidad de crear su propia página de Excite, con las referencias a las
noticias y páginas de interés, que se irán renovando según vayan apareciendo
novedades en las categorías elegidas. Para los residentes en Estados Unidos se
añade incluso la posibilidad de agregar a esta página la programación de las
cadenas de televisión. En definitiva, se trata de una herramienta de búsqueda
muy atractiva con numerosos servicios adicionales, que en nuestra opinión no
debe faltar en el bookmark o en los lugares favoritos. Su dirección es
http://www.excite.com.
Infoseek, la búsqueda alternativa
Contrariamente a lo que ocurre por regla general en las herramientas de
búsqueda, en Infoseek se anima al usuario a buscar más por frases completas que
por términos. Como prueba buscamos «Dónde está PC ACTUAL» y en respuesta
obtuvimos todos los enlaces donde aparecían alguna de las palabras ordenadas
por mayor número de coincidencias. La base de datos se alimenta de las
direcciones que van dando de alta los usuarios vía e-mail, quienes tan sólo
deben indicar el comienzo del árbol. El resto de los datos se obtienen de los
tags «META» que introducimos en la cabecera, tal y como se indica en la
correspondiente página.
Las opciones de búsqueda avanzada son las más completas y potentes que hemos
visto hasta ahora, aunque tenemos que señalar que hay que leerse detenidamente
la ayuda para poder hacer un uso adecuado a nuestras necesidades. También
podemos preguntarle por cuestiones más específicas como imágenes, sitios,
enlaces, URLs y títulos.
Además de las funciones propias como motor de búsqueda e índice, Infoseek
mantiene páginas de noticias, que se parecen más a un periódico electrónico con
todas sus secciones: un calendario de los sucesos más importantes de la Red,
una base de datos interrogable de compañías norteamericanas (en la que
suministrando el nombre devuelve los enlaces a las páginas de la base de datos
que contienen el nombre que hemos tecleado, o bien la dirección y teléfono de
ésta y sus sucursales) y una utilidad de mapas a la que suministrándole el
nombre de la calle y el estado, nos devuelve un mapa de la zona (lástima que
sólo se circunscriba al territorio USA). Incluso tiene un horóscopo.
Por último, señalar que si accedemos a una de las versiones locales, mientras
que mantengamos la misma dirección IP (si no tenemos una conexión permanente a
Internet, esta característica se mantendrá durante toda la sesión actual), cada
vez que accedamos a su página principal nos derivará a la versión en el idioma
elegido. Su dirección es http://guide.infoseek.com.
Magellan, un amplio índice
Basado en la tecnología de búsqueda de Excite, Magellan es un índice con 26
grandes categorías de las que se desprenden numerosas subcategorías. Para
interrogar la base de datos disponemos de la típica caja de texto donde teclear
las claves, junto con un grupo de gráficos para iniciar el query y fijar las
opciones.
Pulsando en el último gráfico, seleccionamos la conjunción lógica que interpondrá
el buscador entre las palabras que tecleemos (OR o AND), la parte de la base de
datos donde debe buscar, la calidad de la búsqueda y si los cambios que
realicemos aquí tienen que ser válidos sólo en la próxima operación o en toda
la sesión.
Las opciones de búsqueda permiten realizar ésta en toda su extensión, sólo los
sitios revisados por los autores y/o aquellos que tengan la green light, que
son aquellos sites revisados que no contienen información para adultos. Además
de la lógica comentada, podemos utilizar el símbolo «+» delante de un término
para forzar que aparezca en todos los resultados, y el «-» a modo de NOT.
Como servicios adicionales presenta tres tipos de búsquedas extras
especializadas en la localización de personas y una guía del rock, que no es
otra cosa que un buscador centrado en la música de este tipo. Además, dispone
de una opción denominada Search Voyeur, que nos muestra 20 comienzos de
búsqueda aleatorios realizados en los últimos minutos. Con esta opción hay que
tener un poco de cuidado si lo manejan menores, puesto que, como ejemplo,
cuando accedimos a él para probarlo aparecieron varias referencias a búsquedas
con contenido para adultos. Las altas se realizan indicando el comienzo del
árbol de la Web, y es un robot quien lo explora y añade los enlaces y
referencias. Su dirección es http://www.mckinley.com.
Open Text, un buscador interactivo
A pesar de que el nombre de esta herramienta de búsqueda tenga una referencia a
texto, el aspecto gráfico está excelentemente cuidado. Las búsquedas se pueden
realizar desde pagina principal bien por palabras clave o por frases completas.
Si pulsamos el enlace etiquetado como Power Search accederemos a una página
donde podremos elegir las conjunciones lógicas de los términos que indiquemos y
el lugar de la página donde debe aparecer dicha palabra.
Además de poder buscar direcciones de correo electrónico y dentro de los grupos
de news, tenemos acceso a un área de noticias actualizadas contra la que
podemos dirigir querys. Como servicios extras dispone de un área de
descubrimientos con enlaces a los mejores sitios de la Red que figuren en la
base de datos, lugares de humor y de dibujos animados, artículos publicados en
Internet e información acerca de los creadores de esta herramienta de búsqueda.
En la parte de interactividad, dispone de enlaces para dar de alta nuevos
recursos (esta opción no estaba disponible mientras realizamos nuestras
pruebas), enviar al webmaster un mensaje y ajustar las preferencias de la
sesión a nivel de la cantidad de gráficos que se han de representar y el uso o
no de frames. Por último, señalar que dispone de ayudas tanto para usar esta
herramienta como para optimizar las búsquedas. Su dirección es
http://index.opentext.net.
WebCrawler, la falta de opciones
Bajo el lema «busca antes de navegar», en WebCrawler encontramos un índice con
pocos añadidos más. La base de datos se nutre de las altas que van dando los
usuarios; y como en otros casos, tan sólo hay que indicar la dirección de
partida y un robot se encargará del resto, ya que las actualizaciones se
realizan diariamente. Las únicas opciones de búsqueda que tenemos son dónde se
deben buscar las claves (en el título o en el sumario) y el número de
referencias por página (10, 25 ó 100). Dado que no admite operadores lógicos,
los resultados que obtenemos si introducimos más de una clave son desmesurados,
casi inmanejables.
Como servicios extras tenemos el navegador (que nos muestra lo mejor, lo nuevo
y lo más interesante de otras categorías), el especial (acceso a enlaces
aleatorios, qué tags hay que introducir en nuestra página web para realizar
búsquedas con esta herramienta, etc.), añadir URLs, una ayuda (propia para esta
herramienta) y trucos para optimizar búsquedas.
Camaradería mejor que competencia cruel
Nos ha sorprendido mucho que, a pesar de la «profesionalización» de Internet en
el sentido de convertirse en un medio totalmente comercial con grandes
movimientos de dinero, siga existiendo el espíritu de los primeros tiempos: lo
importante es prestar ayuda a los usuarios y para ello, en vez de pelear
duramente por los potenciales consumidores de su publicidad y no darles pistas
acerca de la competencia, señalan claramente que si no has encontrado lo que
buscabas en su herramienta, busques en las otras. En algunos casos, esta
derivación se hace simplemente mediante links a otras herramientas de búsqueda
y en otros se realiza directamente la búsqueda, pasando a obtener resultados
inmediatos.
Yahooligans!
Existe una versión de Yahoo!, desarrollada por la misma empresa, dedicada a dar
servicio a los más pequeños de la casa. Además de sacar de su base de datos
todos aquellos contenidos no aptos para ellos (pornografía, violencia...),
dispone de categorías especiales orientadas a estas edades, tales como
programas de los cursos escolares, preguntas y respuestas a los ejercicios más
comunes, enlaces a páginas con contenido educativo de cualquier área del saber
humano (adaptado para que lo puedan entender), etc. Y todo ello con la misma
tecnología y la misma seriedad que su hermano mayor Yahoo! Su dirección es
http://www.yahooligans.com.
Otra forma de financiarse
Hemos visto una clara tendencia de los propietarios intelectuales de los
motores de búsqueda que hay en Internet a incluir publicidad en sus páginas,
con el objetivo de rentabilizar tanto los costosos accesos a Internet como las
máquinas dedicadas y el personal cualificado. Sin embargo, por debajo de esta
«superficialidad» hay otro mercado del que también sacan provecho: las
tecnologías de búsqueda.
Todos los programas que físicamente realizan el query a velocidades aceptables
(hay que tener en cuenta la magnitud de las bases de datos) con metodologías de
localización propias y la generación de páginas web dinámicas no son nada
triviales y encierran miles de horas de trabajo, además de la experiencia
acumulada durante años-Internet (que corresponden a varios años naturales). Los
compradores de estas tecnologías son las grandes empresas que tienen presencia
directa en Internet y desean dotar a sus páginas de capacidad para autobúsqueda
de términos, y los administradores de Intranets cuyo contenido de información
en formato HTML empieza a ser demasiado grande.
Tecnología al servicio de otros idiomas
La gran mayoría de las herramientas de búsqueda en inglés están adaptando sus
buscadores a otros idiomas. Lycos, Altavista, Infoseek, etc, quieren ampliar
sus dominios a todos los usuarios sin que el idioma sea un problema. Los
internautas hispanos estamos de enhorabuena dado que la gran cantidad de
hispanohablantes hace que el castellano sea uno de los primeros idiomas a los
que se traducen. De los buscadores que hemos analizado, se encuentran en otros
idiomas (además del inglés):
Yahoo!: Francés, alemán y japonés. Existen además versiones locales de Canada y
Gran Bretaña.
Lycos: Alemán y sueco.
Altavista: Danés, holandés, estonio, finlandés, francés, alemán,islandés,
lituano, noruego, polaco, ruso y sueco. Además existen versiones locales para
Austria, Belgica, Alemania, Estonia, Finlandia, Francia, Alemania, Islandia,
Luxemburgo, Lituania, Noruega, Polonia, Rusia, Suecia, Suiza, Holanda y Gran
Bretaña.
Infoseek: Alemán, español, francés yjJaponés.
Open Text: Japonés, español y portugués (bajo la misma página).
Luciano Rubio lrubio bpe.es