Estadísticas Una aguja en un pajar

Normalmente, la gente usa la Internet para tratar de encontrar alguien que comparta sus aficiones. La buena noticia es que hay más de 100 millones de páginas Web. Es muy probable que haya alguna página que hable de esas aficiones. La mala noticia es que hay más de 100 millones de páginas Web. Lo más posible es que haya muchas páginas, y que, además, hay que encontrar lo que a uno le interesa entre ellas. 

Esta sobre abundancia de páginas hace que los sitios Web que ofrecen buscadores sean los más utilizados. La mayoría de las veces, para encontrar algo en la Internet, se usa algún buscador tal como Altavista.magallanes.net, o elbuscador.telepolis.com, o por mencionar alguno de los menos conocidos, lycos, olvidándose de recursos mucho más directos y útiles, como los grupos de usenet, o las listas de FAQ (Frequently Asked Questions, preguntas frecuentemente preguntadas). La mayoría de las veces, lo más fácil es encontrar un grupo de usenet que trate del tema, y buscar su FAQ, que están todas en varios sitios repartidos por toda la Internet, como por ejemplo rtfm.mit.edu. De aquí se deduce que es bastante absurdo crear páginas con listas interminables de vínculos que traten de un tema determinado, salvo que esos punteros estén comentados, ordenados de alguna forma peculiar o valorados en general. Esas listas, entre otras cosas, hacen que cuando uno busca algo en los buscadores, la mayoría de las páginas que recupera son páginas de punteros a otras páginas. Además, la estadísticas de mi servidor indican que el 42\% de las personas que llegan a las páginas del mismo lo hacen a través de un buscador. 

Aunque hay que distinguir entre los buscadores y los catálogos, el más famoso de los cuales es Yahoo. Los gestores de estos sitios tratan de categorizar toda la sabiduría del mundo, un esfuerzo borgiano por su origen y no cabe duda que titánico. En estos catálogos, la información está categorizada, y algunas veces comentada, pero el problema es que estos catálogos no están completos, y la mayoría de las veces no están actualizados. Dado que muchas páginas Web son bastante efímeras, no es raro tratar de probar secuencialmente un listado de direcciones de una categoría de Yahoo y encontrar que la mitad no funcionen. Al menos, los buscadores actualizan los contenidos cada cierto tiempo, y la mayoría de las veces las páginas que devuelven existen. Los catálogos se han hecho también tremendamente populares, habiendo muchos en castellano, como Olé, Ozú, y Sol. Otra diferencia entre catálogos y buscadores es que el autor de una página tiene que darla de alta en un catálogo, mientras que para que la encuentren los buscadores basta que haya un puntero a ella desde otra página de la cual los buscadores tienen ya conocimiento. 

Y ya que la Internet es el compendio de toda la sabiduría del ser humano, oráculo al que recurrimos para encontrar lo que nos aflige, ¿qué es lo que se suele buscar? Como ya se ha comentado en otra ocasión, todo lo que se hace en la Internet, y por supuesto lo que se hace en los buscadores, queda registrado; aunque las estadísticas generalmente son secretas, algunas veces se filtra las palabras que se han introducido en ciertos buscadores, como Yahoo!. En un documento hallado en el sitio Search Engine Watch (algo así como "los vigilantes de los motores de búsqueda"), uno no se sorprende al comprobar que la primera palabra es sex, con más de un millón y medio de búsquedas mensuales; entre las primeras también está porn, porno, weather (tiempo) y netscape software (¿tan difícil es teclear directamente netscape?). 6 de las 10 primeras son sexuales, y si seguimos con las 200 siguientes, veremos una gama completa de perversiones, tendencias y prácticas sexuales. E incluso, allá por el puesto 163, yahoo, con unas cuarenta mil búsquedas. Resulta complicado pensar quién va a meterse en Yahoo! para buscar Yahoo, pero aún más difícil imaginar qué es lo que va a hacer cuando lo encuentre. Y esto, ojo, 1000 veces al día, o unas 40 a la hora, una cada minuto y medio. Nuestro país, Spain, junto con otros, anda allá por el puesto 179. También aparecen destacadas marijuana y grupos como Marylin Manson o U2. En resumen, que, como en la vida misma, la gente pide sexo, drogas y rock and roll (cielos, ya he mencionado tres o cuatro veces la palabra. ¿Acabará todo el mundo en esta página? Más sobre esto más adelante...) 

Un poquito más cerca, en la facilidad de búsqueda que tiene el sitio Web del Refranero Castellano, de Víctor Rivas, las diez palabras más buscadas, a las cuales se puede acceder desde el mismo sitio, son abogado, amor, sexo, adulterio, mujer, tetas, cojones, puta, polla, amistad y lindezas por el estilo. Bueno, aquí hay que reconocer que el refranero castellano abunda en palabras de esa laya. 

Nada que extrañar aquí, por otro lado. La gran explosión en el ámbito mundial del video surgió cuando comenzaron a comercializarse videos porno, y el Canal Plus, codificado, registra sus mayores niveles de audiencia cuando emite las películas porno. Además, cuando a uno le regalaban un diccionario de chico, ¿Que es lo que buscaba primero? 

Cabría preguntarse, estos millones de personas y otras muchas que usan buscadores para encontrar lo que desean y anhelan en la Internet, ¿realmente lo encuentran?. Aquí tengo que echar mano de estadísticas propias, del servidor kal-el, y comparar las palabras que la gente introduce en los buscadores, que quedan registradas, y las páginas de mi servidor en las que acaban. Por ejemplo, si algún sadomasoquista sajón de pro trata de buscar mordazas (GAGS), acabará en la página de un software de dominio público alojado allí. Si trata de buscar desnudos, acabará en otra de las páginas de Atalaya, la de Desnudos en el ciberespacio, y si trata de buscar pareja, encontrará un cuento sobre el tema, Naranja Completa. Aunque no quiero generalizar, muy probablemente más la mitad de las personas que se introducen en mis páginas a través de un buscador, lo hacen por equivocación, mal que me pese (y que tomen nota los que venden publicidad en Internet). 

Estos errores en la búsqueda, o el que uno no encuentre lo que quiere buscar, se deben fundamentalmente a dos razones. La primera es que la información que está almacenada en Internet, y en la que se puede buscar, es fundamentalmente de tipo textual, no contextual, con lo cual, en la ausencia de contexto, el buscador se limita a presentar páginas que incluyan la combinación de letras, que no la palabra, que se ha introducido. Por supuesto, usar términos de búsqueda más complejos hace que se estreche la búsqueda, y muy probablemente que uno se acerque a lo que quiere buscar; algunos buscadores, como Altavista, permiten, con un interfaz amigable, afinar la búsqueda. La segunda razón es que las páginas carecen también de cualquier tipo de información geográfica. Salvo que se diga explícitamente, ninguna página incluye la situación geográfica en la que se encuentra. Esto hace que si uno busca "cines", por ejemplo, le aparezcan los cines de Pernambuco, pero quizás no los de Granada. Y lo mismo sucede con el idioma. ¿A quién no le ha aparecido en un buscador una página en japonés? 

En todo caso, y pese a ser la aguja en el pajar, muchos autores de páginas desean que sus páginas sean encontradas, y, si es posible que aparezcan más alto que las demás en los buscadores. Para conseguir esto hay bastantes trucos sucios, que no voy a revelar en un foro tan público, pero que se pueden hallar con sólo investigar cómo funcionan los buscadores, pero, además, hay formas limpias y éticas de conseguirlo. La más simple es tener en cuenta la naturaleza del lenguaje HTML como un lenguaje de descripción estructural, y no como un lenguaje de procesador de textos. Si uno quiere que encuentren su página por una palabra clave de esa página, lo lógico es incluirla en campos como <title> o <h1>, o incluso enfatizarla usando algún <em>, que, recordemos, no significa cursiva, sino poner énfasis en esa palabra. Además, es conveniente añadir tags <meta> dentro de la página que la describan brevemente y que incluyan sus palabras clave, tales como: 

<meta name=keywords value="buscadores Internet, catálogos Internet"> 

<meta name=content value="¿Qué se busca en la Internet?¿Cómo se busca?¿Se encuentra lo que se busca?¿Cómo hacer para que a uno lo encuentren?"> 

Estos tags no sólo ayudan a los buscadores, sino que ese texto aparecerá, además, en las dos líneas con las cuales cada buscador describe las páginas. 

Y por último, un consejo. Aunque haya muchos buscadores y el día tenga muchas horas, todo el mundo, y cuando se habla de todo el mundo en Internet quiere decir todo el mundo, se pone a buscar a las dos de la tarde de los días de diario. Lo mejor es tratar de evitar estas horas. Portales y porteras