La próxima
página web
Se había acostumbrado a leer el periódico a través de Internet. Pensaba que la
paciencia era una virtud que compartía con el resto de lectores. Hasta que un
buen día, mientras usaba el ordenador de un amigo, comprendió que unos pocos
segundos eran suficientes para descargar cualquier página. Sorprendido, se fijó
que el módem de su anfitrión funcionaba a 33 Kbps, y el suyo a 56 Kbps. ¿Dónde
estaba el truco? La voz de su camarada llegó desde la cocina: “¿Te fijaste que
bien funciona el nuevo servidor proxy de mi proveedor? Ahora no podría Navegar
sin su ayuda”. Tenía toda la razón: nadie debería navegar sin un proxy. Le
descubrimos el porqué
Han abierto una nueva tienda en el barrio que ha tenido un gran éxito desde su
inauguración. Se llama ‘El Próximo’ y en su propaganda asegura que tiene todos
los productos informáticos del mercado. Si un cliente solicita un artículo que
no se encuentra en el catálogo de existencias, un mensajero viaja hasta el
almacén del fabricante para conseguir la mercancía deseada. El tiempo que
necesita la tienda en gestionar el pedido nunca será superior al que emplearía
el cliente si se desplazara él mismo hasta la sede del mayorista o a cualquier
otra tienda. Además, sus precios son los mejores del mercado, con diferencia. Y
siempre tiene a disposición del público los ordenadores más novedosos y los
programas más solicitados. Con estas condiciones de venta se entiende que todos
los vecinos del entorno acudan a ‘El Próximo’ para adquirir cualquier tipo de
material informático.
El caso anterior muestra las tres características que definen a los servidores
proxy: están cerca de nosotros, poseen la información que necesitamos o la
buscan por nosotros y, por último, son baratos en términos de ancho de banda,
ya que entregan sus datos a toda velocidad. Estas ideas son tan buenas que los
navegadores las utilizan en casi todas las ocasiones. Su navegador emplea un
mecanismo que sigue al pie de la letra muchas de las habilidades principales de
un servidor proxy. Cuando usted viaja por la Red, página tras página, tiene la
posibilidad de retroceder en el camino andado y observar de nuevo las URL ya
visitadas. El contenido de esas páginas está almacenado en su disco duro y
permite cargarlas de forma casi instantánea. Durante la instalación de un
navegador, el mismo proceso que crea directorios y copia ficheros, reserva una
parte del disco duro para guardar las últimas páginas visitadas. A ese puñado
de Mbytes donde se almacena la información más reciente cargada desde Internet
se conoce como la caché del navegador y cumple a la perfección las tres
características antes señaladas: no hay nada más cerca de usted, con respecto a
la Red, que su propio ordenador; le ofrece la información que buscaba, es
decir, las páginas anteriores; y el ancho de banda es enorme, ya que es igual a
la velocidad de transferencia de su dis- co duro. El rendimiento de su
navegador puede aumentar de forma considerable si utiliza un gestor de caché
mejorado. Visite la página (web-caching.com/personal-caches.html) que contiene
buenas referencias para mejorar el uso de la caché de su navegador.
Más barato y más seguro
La figura 1 nos muestra el funcionamiento de un servidor proxy. Los ordenadores
representados en el gráfico pertenecen a la misma oficina. Están conectados
entre ellos a través de una red de área local. Esta pequeña red les permite
compartir la impresora que se observa en el gráfico y la única salida a
Internet que tienen contratada. Para este ejemplo sólo nos fijaremos en las
conexiones de tipo Web. El ordenador que tiene módem y, por tanto, conexión
directa a Internet es el servidor proxy. El resto de máquinas de la oficina
navega a través del proxy, como indican las flechas del dibujo. Los navegadores
solicitan todas las páginas al servidor proxy y este se encarga de buscarlas en
la Red. Para los servidores Web de Internet la única máquina que existe en la
oficina de nuestro ejemplo es el servidor proxy. Algo parecido ocurre con los
mayoristas de informática a donde acuden los mensajeros de ‘El Próximo’. Los
mayoristas no conocen a los clientes ya que todas las compras las realizan los
empleados de la tienda. El único cliente de ese barrio, desde su punto de
vista, es ‘El Próximo’. Ya se encargará él de repartir a cada comprador el
producto que ha solicitado. De igual forma, el servidor proxy hace de
intermediario entre los ordenadores de la oficina y los servidores Web de
Internet. Una de las ventajas que ofrece el acceso a través de un proxy a la
Red es el ahorro en la factura del teléfono y en la del proveedor de servicios,
ya que todos los puestos de trabajo navegan a través de la misma línea y con la
misma cuenta. La seguridad también mejora notablemente: ningún ordenador de la
oficina es visible desde la Red, excepto el propio servidor. Además, el proxy
puede incluir filtros y programas que controlen la integridad de la información
recibida, facilitando la instalación de un cortafuegos (firewall) en ese mismo
servidor Web.
Quizá esté pensando que la economía y la seguridad son dos buenos argumentos
para defender el uso de un servidor proxy, pero la velocidad de la conexión no
mejora con el esquema de la figura 1. Más bien empeora, puesto que la misma
línea es compartida por varias personas. El ancho de banda se divide entre el
número de usuarios que de forma simultánea estén solicitando páginas al
servidor. Existen dos buenas soluciones que se complementan. La primera es la
necesidad de adecuar el ancho de banda y el número de usuarios. Una oficina con
veinte ordenadores necesita algo más que un proxy con un módem a 56 Kbps. Una
línea digital o RDSI parece una elección muy razonable. La segunda solución
consiste en mantener una copia en el servidor de las páginas web más visitadas.
En la figura 1 se aprecia que el proxy tiene conectado un disco externo. Lo
utiliza como almacén de las páginas web que han sido visitadas por los
empleados de la oficina. Cuando un usuario solicita una URL determinada, el
proxy busca esa página en su disco y si la encuentra se la envía al cliente
inmediatamente. De otra forma, el proxy se conecta con el servidor Web que
indica la URL, entrega la página recibida al cliente y guarda una copia en su
disco. A los servidores proxy que, además de gestionar las peticiones de
información de los clientes, almacenan las páginas ya visitadas para
ofrecérselas a los próximos clientes, se les conoce como servidores proxy con
caché o Servidores Caché (SC).
Bueno en todas las ocasiones
No necesita tener una oficina con una red de PC para beneficiarse del uso de un
servidor proxy. Tampoco tiene que instalar uno en su casa o junto a su
portátil. Hay alguien que debe ofrecerle el servicio de proxy por defecto. Si
está pensando en su proveedor de servicios de Internet (PSI) ha acertado. La
figura 2 nos ayudará a entender dónde se sitúan los servidores proxy y qué
beneficios aportan. El SC de un proveedor funciona como el de la oficina del
ejemplo anterior, pero con una diferencia: los usuarios no están obligados a
utilizarlo. Los empleados de la oficina no tienen elección; si quieren navegar
por la Red deben hacerlo a través del proxy. Los clientes de un PSI con un SC
son libres de utilizarlo o no. Pero si el proxy funciona bien no hay razón
alguna para no beneficiarse de él. La práctica demuestra que el índice de
aciertos de un SC ronda el 35% (ver el cuadro ‘Cuantificar los beneficios’). Es
decir, una de cada tres páginas que solicitan los clientes son servidas por el
proxy sin necesidad de conectarse a Internet. Como se puede observar en la
figura 2, el SC de un proveedor se encuentra al mismo nivel que el servidor de
correo o el de noticias. En el gráfico aparece con el nombre de ‘Proxy
clásico’. Los usuarios que tienen configurado su navegador para utilizar el
proxy de caché solicitan todas las páginas web al servidor y reciben la
información de éste. La página sale directamente del disco del servidor —una de
cada tres veces, más o menos— o el proxy tiene que ‘bajarla’ de Internet. El
resultado es evidente: aumenta la velocidad de la conexión. Y no sólo cuando la
información ya es-taba en el SC. También cuando no existe copia de esa página
en el disco y el servidor ha tenido que buscarla en In-ternet. Imagine una
autopista saturada a la que eliminamos uno de cada tres cohes. El SC elimina
una de cada tres peticiones a Internet. Si todos los clientes de un PSI
utilizan los servidores proxy, el tráfico con la Red será mucho más fluido.
Pero la esperanza de que todos los clientes configuren su navegador para
utilizar los servicios de un proxy de caché no es realista. Por fortuna, la
nueva generación de servidores proxy obligan a todos los usuarios a
beneficiarse de sus grandes virtudes. Para distinguirlos de los servidores
proxy clásicos se utiliza un adjetivo muy apropiado: transparentes.
El amigo invisible
Los servidores proxy transparentes funcionan de la misma forma que los
servidores clásicos, pero los usuarios no tienen que modificar la configuración
de su navegador para recibir la información de la Red a través de ellos. Ni
siquiera necesitan saber que existen. Hay varios métodos para conseguir que las
peticiones de los navegadores se dirijan al proxy transparente en lugar de
salir hacia Internet. La figura 2 muestra una de las formas más utilizadas para
conseguir este objetivo. Para conectarse a Internet, los PSI contratan una o
más líneas a los operadores de telecomunicaciones que trabajan en nuestro país.
La conexión a cada una de estas líneas se realiza a través de un encaminador
(router). Todo el tráfico ha- cia Internet pasa por este elemento, como se ve
en la figura 2. El proxy transparente está conectado directamente al
encaminador y espera las peticiones de páginas web de los clientes. El router
filtra todo el tráfico de los usuarios y envía al proxy las solicitudes de tipo
http. Si la información solicitada se encuentra en la caché del SC, el usuario
recibirá la página del servidor proxy. De otra forma, el encaminador conectará
con la dirección que indique la URL solicitada. Cuando reciba la página del
servidor situado en Internet, el router mandará el contenido tanto al cliente
que la ha pedido como al servidor proxy transparente, que guardará una copia
para próximas ocasiones. El encaminador también se ocupa de vigilar la buena
salud del proxy. Cuando detecta que el servidor ha dejado de funcionar, por
fallos físicos o problemas en la aplicación, envía todas las peticiones a
Internet y no vuelve a consultar al SC hasta que recupere su estado normal. La
empresa Cisco ofrece encaminadores que a través del protocolo WCCP
(www.cisco.com/univercd/cc/td/doc/product/iaabu/webcache/ce17/ver17/wc17plan.htm),
aplican todas estas características para poner en marcha cachés transparentes.
Varios fabricantes de proxy de caché, como puede ser Inktomi
(locutus.inktomi.com/products/traffic/product.html) han incorporado el
protocolo WCCP a sus programas.
Ha aparecido una interesante alternativa, el protocolo WPAD
(www.news.com/News/Item/0,4,30032,00.html?owv), que se integra con los
navegadores y permite descubrir los servidores caché más cercanos y hacer uso
de ellos sin intervención del cliente. Este protocolo ha sido presentado por
Inktomi, Micrsoft, Sun y RealNetworks para ser aceptado como un estándar por la
IETF (www.ietf.org). Cuando el cliente conecte a través de un nodo local a
Internet, su navegador preguntará por los servidores caché del nodo, tanto los
de páginas web como los de audio, vídeo, etc. Así los usuarios se beneficiarán
automáticamente de los servidores proxy instalados en el nodo local.
El cine del barrio
Hemos visto que un proxy ofrece grandes ventajas a un PSI o a un negocio con
conexión a Internet. Pero las empresas que obtienen mayor provecho de los
servidores caché son las compañías de telecomunicaciones. El siguiente ejemplo
servirá para aclarar esa afirmación: imagine que para ver cualquier película de
Hollywood hubiera que viajar hasta los Ángeles. Cada estreno obligaría a
cientos de miles de personas a desplazarse hasta USA para disfrutar del nuevo
largometraje. La solución a esta locura ya la conoce usted. Las productoras
distribuyen copias por los salas de todas las ciudades del mundo. Las películas
más interesantes se proyectan en el cine de su barrio. Las grandes operadoras
están llevando esta misma idea a sus redes de datos. ¿Porqué obligar a los
internautas a conectar con un servidor Web del otro lado del océano, a través
de costosas líneas internacionales, cuando puedo ofrecerle la misma información
en el nodo local de su ciudad? Situar un proxy transparente en cada uno de los
nodos de acceso supone un ahorro en ancho de banda y un aumento considerable de
la calidad del servicio. También los proveedores de Internet salen ganando al
contratar el acceso de sus clientes a través de una red con servidores proxy en
sus nodos. En el artículo ‘Buscando una conexión de calidad’ (iWorld, junio de
1999) se explica cómo la red IP que utiliza un PSI condiciona por completo la
calidad de sus servicios. Una red (¿Infovía Plus?) que instale servidores caché
en sus nodos evitará que un buen porcentaje del tráfico llegue a los
proveedores y a Internet. Al final, todos los clientes, tanto internautas como
PSI, notarán la diferencia. ¿Cuál será el primer operador de telecomunicaciones
que anuncie sus nuevos servidores caché? Al tiempo.
Cuantificar los beneficios
------------------------------------
La distancia entre los cálculos teóricos y los resultados reales distingue a
las buenas ideas de las simples falacias técnicas. De nada sirve escribir sobre
las grandes ventajas de utilizar un servidor proxy si, al llevarlo a la
práctica, no encontramos beneficios significativos. Hay que dejar muy claro que
los servidores cachés no son la panacea a los problemas de velocidad en la Red,
pero sí una ayuda inestimable para mejorar el rendimiento de la conexión de los
internautas. Jacobo Van Leeuwen ha administrado el servidor proxy de uno de los
mayores PSI de nuestro país. Los datos que nos ha facilitado sobre el
rendimiento del proxy caché que gestionaba son muy instructivos. Las siguientes
estadísticas reflejan el enorme provecho que un SC proporciona a un conjunto
elevado de clientes.
Número total de peticiones: 704217
Número de peticiones que estaban en caché: 250596 (35%)
Tiempo medio en responder una petición que estaba en caché: 0.9 seg.
Tiempo medio en responder una petición que NO estaba en caché: 5.8 seg.
Estos datos corresponden al uso del servidor en un solo día. De las más de
setecientas mil peticiones recibidas, un 35% fueron servidas directamente desde
la caché del servidor y necesitaron menos de un segundo en enviarse al cliente.
Si la página solicitada no se encontraba en el disco del proxy, el tiempo de
respuesta fue de 5.8 segundos. La diferencia entre utilizar o no los servicios
de caché del proveedor es muy notable. Por ejemplo, el tiempo que necesitaría
un cliente para recibir tres páginas a través del servidor caché sería, de
media, el siguiente:
2 páginas de Internet + 1 página de la caché = 2*5.8 seg. + 1*0.9 seg. = 12.5
seg.
Si no utiliza el servidor proxy:
3 páginas de Internet = 3*5.8 seg. = 17.4 seg.
Los servidores caché no parecen una buena idea; son una buena idea. Las redes
IP de ámbito nacional (Infovía Plus, InterPista y Retenet) tienen planes
inmediatos para desplegar proxy transparentes en todos sus nodos. De otra forma
no podrán soportar la demanda de ancho de banda que requieren los miles de
nuevos clientes gratuitos: www.alehop.com.
www.teleline.es/oferta/general
¿Conexión a Internet gratis? Sí, claro, con la ayuda de una buena estructura de
servidores proxy.
Jaime Fernández Gómez (tnt@idg.es) es
colaborador de iWorld
Jaime
Fernández. [01/09/1999 ]