La próxima página web

Se había acostumbrado a leer el periódico a través de Internet. Pensaba que la paciencia era una virtud que compartía con el resto de lectores. Hasta que un buen día, mientras usaba el ordenador de un amigo, comprendió que unos pocos segundos eran suficientes para descargar cualquier página. Sorprendido, se fijó que el módem de su anfitrión funcionaba a 33 Kbps, y el suyo a 56 Kbps. ¿Dónde estaba el truco? La voz de su camarada llegó desde la cocina: “¿Te fijaste que bien funciona el nuevo servidor proxy de mi proveedor? Ahora no podría Navegar sin su ayuda”. Tenía toda la razón: nadie debería navegar sin un proxy. Le descubrimos el porqué

Han abierto una nueva tienda en el barrio que ha tenido un gran éxito desde su inauguración. Se llama ‘El Próximo’ y en su propaganda asegura que tiene todos los productos informáticos del mercado. Si un cliente solicita un artículo que no se encuentra en el catálogo de existencias, un mensajero viaja hasta el almacén del fabricante para conseguir la mercancía deseada. El tiempo que necesita la tienda en gestionar el pedido nunca será superior al que emplearía el cliente si se desplazara él mismo hasta la sede del mayorista o a cualquier otra tienda. Además, sus precios son los mejores del mercado, con diferencia. Y siempre tiene a disposición del público los ordenadores más novedosos y los programas más solicitados. Con estas condiciones de venta se entiende que todos los vecinos del entorno acudan a ‘El Próximo’ para adquirir cualquier tipo de material informático.
El caso anterior muestra las tres características que definen a los servidores proxy: están cerca de nosotros, poseen la información que necesitamos o la buscan por nosotros y, por último, son baratos en términos de ancho de banda, ya que entregan sus datos a toda velocidad. Estas ideas son tan buenas que los navegadores las utilizan en casi todas las ocasiones. Su navegador emplea un mecanismo que sigue al pie de la letra muchas de las habilidades principales de un servidor proxy. Cuando usted viaja por la Red, página tras página, tiene la posibilidad de retroceder en el camino andado y observar de nuevo las URL ya visitadas. El contenido de esas páginas está almacenado en su disco duro y permite cargarlas de forma casi instantánea. Durante la instalación de un navegador, el mismo proceso que crea directorios y copia ficheros, reserva una parte del disco duro para guardar las últimas páginas visitadas. A ese puñado de Mbytes donde se almacena la información más reciente cargada desde Internet se conoce como la caché del navegador y cumple a la perfección las tres características antes señaladas: no hay nada más cerca de usted, con respecto a la Red, que su propio ordenador; le ofrece la información que buscaba, es decir, las páginas anteriores; y el ancho de banda es enorme, ya que es igual a la velocidad de transferencia de su dis- co duro. El rendimiento de su navegador puede aumentar de forma considerable si utiliza un gestor de caché mejorado. Visite la página (web-caching.com/personal-caches.html) que contiene buenas referencias para mejorar el uso de la caché de su navegador.

Más barato y más seguro
La figura 1 nos muestra el funcionamiento de un servidor proxy. Los ordenadores representados en el gráfico pertenecen a la misma oficina. Están conectados entre ellos a través de una red de área local. Esta pequeña red les permite compartir la impresora que se observa en el gráfico y la única salida a Internet que tienen contratada. Para este ejemplo sólo nos fijaremos en las conexiones de tipo Web. El ordenador que tiene módem y, por tanto, conexión directa a Internet es el servidor proxy. El resto de máquinas de la oficina navega a través del proxy, como indican las flechas del dibujo. Los navegadores solicitan todas las páginas al servidor proxy y este se encarga de buscarlas en la Red. Para los servidores Web de Internet la única máquina que existe en la oficina de nuestro ejemplo es el servidor proxy. Algo parecido ocurre con los mayoristas de informática a donde acuden los mensajeros de ‘El Próximo’. Los mayoristas no conocen a los clientes ya que todas las compras las realizan los empleados de la tienda. El único cliente de ese barrio, desde su punto de vista, es ‘El Próximo’. Ya se encargará él de repartir a cada comprador el producto que ha solicitado. De igual forma, el servidor proxy hace de intermediario entre los ordenadores de la oficina y los servidores Web de Internet. Una de las ventajas que ofrece el acceso a través de un proxy a la Red es el ahorro en la factura del teléfono y en la del proveedor de servicios, ya que todos los puestos de trabajo navegan a través de la misma línea y con la misma cuenta. La seguridad también mejora notablemente: ningún ordenador de la oficina es visible desde la Red, excepto el propio servidor. Además, el proxy puede incluir filtros y programas que controlen la integridad de la información recibida, facilitando la instalación de un cortafuegos (firewall) en ese mismo servidor Web.
Quizá esté pensando que la economía y la seguridad son dos buenos argumentos para defender el uso de un servidor proxy, pero la velocidad de la conexión no mejora con el esquema de la figura 1. Más bien empeora, puesto que la misma línea es compartida por varias personas. El ancho de banda se divide entre el número de usuarios que de forma simultánea estén solicitando páginas al servidor. Existen dos buenas soluciones que se complementan. La primera es la necesidad de adecuar el ancho de banda y el número de usuarios. Una oficina con veinte ordenadores necesita algo más que un proxy con un módem a 56 Kbps. Una línea digital o RDSI parece una elección muy razonable. La segunda solución consiste en mantener una copia en el servidor de las páginas web más visitadas. En la figura 1 se aprecia que el proxy tiene conectado un disco externo. Lo utiliza como almacén de las páginas web que han sido visitadas por los empleados de la oficina. Cuando un usuario solicita una URL determinada, el proxy busca esa página en su disco y si la encuentra se la envía al cliente inmediatamente. De otra forma, el proxy se conecta con el servidor Web que indica la URL, entrega la página recibida al cliente y guarda una copia en su disco. A los servidores proxy que, además de gestionar las peticiones de información de los clientes, almacenan las páginas ya visitadas para ofrecérselas a los próximos clientes, se les conoce como servidores proxy con caché o Servidores Caché (SC).

Bueno en todas las ocasiones
No necesita tener una oficina con una red de PC para beneficiarse del uso de un servidor proxy. Tampoco tiene que instalar uno en su casa o junto a su portátil. Hay alguien que debe ofrecerle el servicio de proxy por defecto. Si está pensando en su proveedor de servicios de Internet (PSI) ha acertado. La figura 2 nos ayudará a entender dónde se sitúan los servidores proxy y qué beneficios aportan. El SC de un proveedor funciona como el de la oficina del ejemplo anterior, pero con una diferencia: los usuarios no están obligados a utilizarlo. Los empleados de la oficina no tienen elección; si quieren navegar por la Red deben hacerlo a través del proxy. Los clientes de un PSI con un SC son libres de utilizarlo o no. Pero si el proxy funciona bien no hay razón alguna para no beneficiarse de él. La práctica demuestra que el índice de aciertos de un SC ronda el 35% (ver el cuadro ‘Cuantificar los beneficios’). Es decir, una de cada tres páginas que solicitan los clientes son servidas por el proxy sin necesidad de conectarse a Internet. Como se puede observar en la figura 2, el SC de un proveedor se encuentra al mismo nivel que el servidor de correo o el de noticias. En el gráfico aparece con el nombre de ‘Proxy clásico’. Los usuarios que tienen configurado su navegador para utilizar el proxy de caché solicitan todas las páginas web al servidor y reciben la información de éste. La página sale directamente del disco del servidor —una de cada tres veces, más o menos— o el proxy tiene que ‘bajarla’ de Internet. El resultado es evidente: aumenta la velocidad de la conexión. Y no sólo cuando la información ya es-taba en el SC. También cuando no existe copia de esa página en el disco y el servidor ha tenido que buscarla en In-ternet. Imagine una autopista saturada a la que eliminamos uno de cada tres cohes. El SC elimina una de cada tres peticiones a Internet. Si todos los clientes de un PSI utilizan los servidores proxy, el tráfico con la Red será mucho más fluido. Pero la esperanza de que todos los clientes configuren su navegador para utilizar los servicios de un proxy de caché no es realista. Por fortuna, la nueva generación de servidores proxy obligan a todos los usuarios a beneficiarse de sus grandes virtudes. Para distinguirlos de los servidores proxy clásicos se utiliza un adjetivo muy apropiado: transparentes.

El amigo invisible
Los servidores proxy transparentes funcionan de la misma forma que los servidores clásicos, pero los usuarios no tienen que modificar la configuración de su navegador para recibir la información de la Red a través de ellos. Ni siquiera necesitan saber que existen. Hay varios métodos para conseguir que las peticiones de los navegadores se dirijan al proxy transparente en lugar de salir hacia Internet. La figura 2 muestra una de las formas más utilizadas para conseguir este objetivo. Para conectarse a Internet, los PSI contratan una o más líneas a los operadores de telecomunicaciones que trabajan en nuestro país. La conexión a cada una de estas líneas se realiza a través de un encaminador (router). Todo el tráfico ha- cia Internet pasa por este elemento, como se ve en la figura 2. El proxy transparente está conectado directamente al encaminador y espera las peticiones de páginas web de los clientes. El router filtra todo el tráfico de los usuarios y envía al proxy las solicitudes de tipo http. Si la información solicitada se encuentra en la caché del SC, el usuario recibirá la página del servidor proxy. De otra forma, el encaminador conectará con la dirección que indique la URL solicitada. Cuando reciba la página del servidor situado en Internet, el router mandará el contenido tanto al cliente que la ha pedido como al servidor proxy transparente, que guardará una copia para próximas ocasiones. El encaminador también se ocupa de vigilar la buena salud del proxy. Cuando detecta que el servidor ha dejado de funcionar, por fallos físicos o problemas en la aplicación, envía todas las peticiones a Internet y no vuelve a consultar al SC hasta que recupere su estado normal. La empresa Cisco ofrece encaminadores que a través del protocolo WCCP (www.cisco.com/univercd/cc/td/doc/product/iaabu/webcache/ce17/ver17/wc17plan.htm),
aplican todas estas características para poner en marcha cachés transparentes. Varios fabricantes de proxy de caché, como puede ser Inktomi (locutus.inktomi.com/products/traffic/product.html) han incorporado el protocolo WCCP a sus programas.
Ha aparecido una interesante alternativa, el protocolo WPAD (www.news.com/News/Item/0,4,30032,00.html?owv), que se integra con los navegadores y permite descubrir los servidores caché más cercanos y hacer uso de ellos sin intervención del cliente. Este protocolo ha sido presentado por Inktomi, Micrsoft, Sun y RealNetworks para ser aceptado como un estándar por la IETF (www.ietf.org). Cuando el cliente conecte a través de un nodo local a Internet, su navegador preguntará por los servidores caché del nodo, tanto los de páginas web como los de audio, vídeo, etc. Así los usuarios se beneficiarán automáticamente de los servidores proxy instalados en el nodo local.

El cine del barrio
Hemos visto que un proxy ofrece grandes ventajas a un PSI o a un negocio con conexión a Internet. Pero las empresas que obtienen mayor provecho de los servidores caché son las compañías de telecomunicaciones. El siguiente ejemplo servirá para aclarar esa afirmación: imagine que para ver cualquier película de Hollywood hubiera que viajar hasta los Ángeles. Cada estreno obligaría a cientos de miles de personas a desplazarse hasta USA para disfrutar del nuevo largometraje. La solución a esta locura ya la conoce usted. Las productoras distribuyen copias por los salas de todas las ciudades del mundo. Las películas más interesantes se proyectan en el cine de su barrio. Las grandes operadoras están llevando esta misma idea a sus redes de datos. ¿Porqué obligar a los internautas a conectar con un servidor Web del otro lado del océano, a través de costosas líneas internacionales, cuando puedo ofrecerle la misma información en el nodo local de su ciudad? Situar un proxy transparente en cada uno de los nodos de acceso supone un ahorro en ancho de banda y un aumento considerable de la calidad del servicio. También los proveedores de Internet salen ganando al contratar el acceso de sus clientes a través de una red con servidores proxy en sus nodos. En el artículo ‘Buscando una conexión de calidad’ (iWorld, junio de 1999) se explica cómo la red IP que utiliza un PSI condiciona por completo la calidad de sus servicios. Una red (¿Infovía Plus?) que instale servidores caché en sus nodos evitará que un buen porcentaje del tráfico llegue a los proveedores y a Internet. Al final, todos los clientes, tanto internautas como PSI, notarán la diferencia. ¿Cuál será el primer operador de telecomunicaciones que anuncie sus nuevos servidores caché? Al tiempo.


Cuantificar los beneficios
------------------------------------
La distancia entre los cálculos teóricos y los resultados reales distingue a las buenas ideas de las simples falacias técnicas. De nada sirve escribir sobre las grandes ventajas de utilizar un servidor proxy si, al llevarlo a la práctica, no encontramos beneficios significativos. Hay que dejar muy claro que los servidores cachés no son la panacea a los problemas de velocidad en la Red, pero sí una ayuda inestimable para mejorar el rendimiento de la conexión de los internautas. Jacobo Van Leeuwen ha administrado el servidor proxy de uno de los mayores PSI de nuestro país. Los datos que nos ha facilitado sobre el rendimiento del proxy caché que gestionaba son muy instructivos. Las siguientes estadísticas reflejan el enorme provecho que un SC proporciona a un conjunto elevado de clientes.

Número total de peticiones: 704217
Número de peticiones que estaban en caché: 250596 (35%)
Tiempo medio en responder una petición que estaba en caché: 0.9 seg.
Tiempo medio en responder una petición que NO estaba en caché: 5.8 seg.

Estos datos corresponden al uso del servidor en un solo día. De las más de setecientas mil peticiones recibidas, un 35% fueron servidas directamente desde la caché del servidor y necesitaron menos de un segundo en enviarse al cliente. Si la página solicitada no se encontraba en el disco del proxy, el tiempo de respuesta fue de 5.8 segundos. La diferencia entre utilizar o no los servicios de caché del proveedor es muy notable. Por ejemplo, el tiempo que necesitaría un cliente para recibir tres páginas a través del servidor caché sería, de media, el siguiente:

2 páginas de Internet + 1 página de la caché = 2*5.8 seg. + 1*0.9 seg. = 12.5 seg.
Si no utiliza el servidor proxy:
3 páginas de Internet = 3*5.8 seg. = 17.4 seg.

Los servidores caché no parecen una buena idea; son una buena idea. Las redes IP de ámbito nacional (Infovía Plus, InterPista y Retenet) tienen planes inmediatos para desplegar proxy transparentes en todos sus nodos. De otra forma no podrán soportar la demanda de ancho de banda que requieren los miles de nuevos clientes gratuitos: www.alehop.com. www.teleline.es/oferta/general ¿Conexión a Internet gratis? Sí, claro, con la ayuda de una buena estructura de servidores proxy.


Jaime Fernández Gómez (tnt@idg.es) es colaborador de iWorld

 Jaime Fernández. [01/09/1999 ]