Sumarios


Epígrafes
:              
Tamaño

Relaciones

Conclusiones

Bibliografía



Notas al pie
Gráficos

|| Quiénes Somos || Staff || Anteriones ||1ª Época ||Colaboraciones || Suscripción||Titulares || Octubre-Diciembre 2005 || Nº 65 Segunda Época
     

Métrica de la blogosfera.
Algunas medidas y relaciones en la blogosfera hispana
Juan Julián Merelo y Fernando Tricas
Manda este articulo a un AmigoImprime esta paginaDescarga esta pagina


El crecimiento de la blogosfera hispana ha sido espectacular: se ha multiplicado por veinte, en paralelo con la blogosfera global


















La blogosfera hispana funciona como una red típica: es un “mundo pequeño”, y también libre de escala


















Una ardilla hipertextual que partiera de TrafalgarSur podría llegar a Alt1040, en ciudad de México, sin tocar suelo
















El estudio cuantitativo del tamaño y de las relaciones propias de la blogosfera hispana nos ayuda a comprender mejor el fenómeno blog en el ámbito de las lenguas hispanas, hasta ahora no muy bien representado en los estudios internacionales, centrados habitualmente en  la blogosfera angloparlante. Una de las principales conclusiones es que su tamaño (medido en número de bitácoras) ha crecido de forma exponencial.

English Abstract

A los efectos del estudio cuyos resultados presentamos, se puede considerar la blogosfera como el conjunto de los blogs o bitácoras ( 1) que, en su lado humano, está representada por la comunidad formada por sus autores, que, individual o colectivamente, comparten información y opiniones en sus sitios. Evidentemente, si miramos al fenómeno blog en su generalidad, la blogosfera tiene otros componentes humanos: los que comentan y los lectores habituales y/o casuales, por ejemplo. Sin embargo, aunque estos últimos influyen en la dinámica de la misma, es mucho más interesante mirar sólo a las bitácoras en sí y los enlaces que se producen entre ellas, porque, primero, es una información medible e inequívoca (la dirección de un sitio o página web es única) y, segundo, plasma una relación que se podría expresar como conoce-a. El tratar la blogosfera como el conjunto de todos los lectores y escritores de blogs, aunque se ha abordado en otros trabajos (Ferreras, 2005) requiere quizás de un enfoque diferente, no reticular, que queda fuera de los límites de este trabajo.

Precisamente, lo que intentaremos hacer es acercarnos a la blogosfera hispana desde la teoría de redes sociales complejas, practicando una estimación de su tamaño y de su configuración global. Una de estas características globales interesantes es el hecho de que se trate de un mundo pequeño o no (Watts, Strogatz, 1999), es decir, que la distancia media entre dos puntos cualesquiera de la blogosfera sea pequeña, y que el aumento de esta distancia, al añadir nuevos nodos, sea lento ( 2). El hecho de que una red sea un “mundo-pañuelo” (traducción más exacta del término inglés small-world, mundo pequeño) implica una transferencia de información rápida entre los diferentes nodos, lo que a su vez comporta también cambios de estado rápidos.

Por otra parte, una característica interesante en bastantes redes de origen social o biológico es que sean “libres de escala” ( 3) (Albert, Barabási, 2002); es decir, que no haya ningún número de enlaces preferido o común. En las redes libres de escala, el número de enlaces se organiza según una ley de potencias: hay muchos nodos con pocos enlaces, pero existe la posibilidad de que haya algunos nodos con un número de enlaces uno o varios órdenes de magnitud mayor que la mayoría de los demás. A esto alude el fenómeno de las “colas largas” o long-tail: en algunos casos, el volumen total de enlaces de los nodos con menos enlaces puede ser superior que el de los sitios con muchos.

Volvamos entonces a la red social de la que se ocupa este artículo: la blogosfera hispana. Las primeras medidas sobre su crecimiento muestran que el aumento de tamaño en los últimos meses ha tenido un ritmo similar al de la blogosfera global (Sifry, 2005): se ha multiplicado por veinte desde los primeros estudios que se hicieron hace unos dos años (Tricas, Ruiz, Merelo, 2003; Merelo, Tricas, Ruiz, 2003), aunque, en realidad, la mejor estimación que se puede hacer sobre el tamaño total es una suposición informada. Es muy posible, sin embargo, que el número de bitácoras desconocidas haya crecido de la misma forma que el de las conocidas.

El tamaño alcanzado complica que se puedan hacer cálculos sobre el grafo de hiperenlaces de la blogosfera; por eso, en este trabajo pretendemos buscar estrategias alternativas para medir el mismo tipo de estructuras en una selección de las bitácoras más representativas, para saber si somos capaces de establecer alguna clase de relación entre estos resultados y aquéllos.

Para empezar, hay que establecer algún criterio acerca de qué se considera “representativo” dentro de la blogosfera hispana. Sobre esta muestra representativa, se establecerá el grafo de conexiones de la misma y se hará una serie de medidas que nos permitirán identificar subestructuras y calcular cuáles son las bitácoras más notables por su influencia o su posición dentro de la red. Dentro de la blogosfera hispana, y dado que la localización geográfica es, en la mayoría de los casos, difícil de determinar, optamos en su día por incluir a todas aquellas que estén escritas en alguno de los idiomas oficiales de España, lo que incluye también a muchas bitácoras localizadas en países latinoamericanos (con la excepción de Brasil, cuando somos capaces de establecerlo claramente).

Nuestra experiencia en el estudio de la blogosfera viene dada por el desarrollo de herramientas alrededor de los weblogs. En particular, el blogómetro ( 4), que recorre diariamente la blogosfera extrayendo los enlaces nuevos que aparecen en las bitácoras y almacenándolos en una base de datos. También se ha hecho una serie de estudios, más exhaustivos, sobre Blogalia ( 5) (Merelo, Prieto, Tricas, 2004), una comunidad de la cual se tienen datos desde su creación, y que presenta una dinámica que es representativa de la que sigue el resto de la blogosfera.

Tamaño

Llevamos recopilando información desde finales del año 2002, cuando, por la poca representación de la blogosfera hispana en los servicios de publicación y directorios más populares ( 6), y por la imposibilidad de separar “nuestra” blogosfera del resto, decidimos crear nuestra propia herramienta, para tratar de obtener datos fiables y, de paso, ayudar a los integrantes de la propia blogosfera a tener acceso a dicho tipo de servicios, con datos más próximos. La idea era  publicar un ranking diario de los sitios mas enlazados desde las bitácoras de nuestra lista.

Nuestra herramienta se desarrolla de manera abierta y el programa que se ocupa de la recogida de datos, así como la lista de bitácoras, están disponibles en SourceForge ( 7). Aunque contamos con la colaboración habitual de algunos de los proveedores más importantes (Blogia, Acelblog, Ya.com) para actualizar nuestros datos, otros no proporcionan información acerca de bitácoras alojadas por idioma, por situación geográfica o ninguna en absoluto. También algunos propietarios de bitácoras interesados en el proyecto nos facilitan los datos de sus propios sitios.

En el momento de escribir estas líneas, contamos con 102.498 bitácoras en nuestro listado, que se distribuyen por alojamientos según se recoge en la tabla 1 ( 1) (sólo aparecen alojamientos con más de 1.000 bitácoras):

En esta lista están mal representados (a la baja) los MSN Spaces (dominio msn.com) de Microsoft (por su reciente aparición) y las bitácoras albergadas en Blogger (dominio blogspot.com), por la dificultad que entraña encontrar nuevas bitácoras publicadas en este sitio, que es el más popular y uno de los más longevos.

El crecimiento de la blogosfera sigue una tendencia claramente exponencial, duplicándose cada 5-6 meses, como puede apreciarse en la figura 1 ( 2).

Relaciones

Una de las primeras preguntas que se puede plantear es si este crecimiento sigue las reglas del “enlazado preferencial” (Albert, Barabási, 2002), es decir, si las bitácoras existentes enlazan, con preferencia, a aquellas que ya tienen enlaces; o dicho de otra forma, la probabilidad que tiene un nodo de recibir un nuevo enlace crece con el número de enlaces existentes. Esta dinámica daría lugar a una red que sigue una ley de potencias (Shirky, 2003; Kottke, 2003) en una serie de parámetros; por ejemplo, en un gráfico que represente el número de enlaces vs. orden. Y efectivamente, así sucede, como se muestra en la figura 2 ( 3). Este gráfico ha sido obtenido a partir de la lista de los sitios más enlazados, confeccionada a partir de los datos del blogómetro y aumentada con los sitios más visitados entre los usuarios de la blogosfera hispana del sistema de estadísticas Nedstat ( 8); de allí se ha extraído una lista de aproximadamente 500 sitios, y se ha buscado en Technorati el número de enlaces entrantes ( 9).

La ley de potencias ajustada a las 100 primeras bitácoras es f(x)=1192.61x-0.475358, donde x es la posición que ocupa la bitácora, puestas por orden decreciente de número de enlaces entrantes. Esta ley de potencias es interesante: como el exponente es menor que uno, daría lugar a la clásica “cola larga” (Shirky, 2003), es decir, la suma de los enlaces de los sitios menos enlazados sería mayor que la de los enlaces a los sitios más enlazados; la multitud de sitios pequeños de la blogosfera superaría en importancia a los sitios grandes. En todo caso, debido al sesgo en el muestreo (sólo se han tomado 500 bitácoras), el ajuste más adecuado en este caso sería una ley de potencias con corte exponencial (10); aun así, se puede deducir que el hecho de que una bitácora sea más enlazada que otra no induce un sesgo demasiado fuerte en la creación de nuevos enlaces, y que, fuera de las bitácoras más enlazadas, el número de enlaces (que discutiblemente podríamos asociar a popularidad) disminuye rápidamente.

La segunda característica macroscópica que se puede estudiar es el hecho de que se trate de una red small-world (pequeño mundo) o no. Para ello se han tomado, usando también el API de Technorati, todos los enlaces entrantes a las bitácoras seleccionadas. A partir de ahí, se han dejado sólo los enlaces entre ese grupo. De los 42.700 enlaces iniciales, el conjunto final contiene sólo alrededor de 3.600, es decir, que este grupo “elitista” inicial no es endogámico en el sentido de que el número de enlaces procedentes de fuera es mayor que el de los enlaces del propio grupo (que representan menos de un 10 por ciento del total). Esto ha supuesto una segunda selección: algunos de los nodos del grupo inicial no tienen ningún enlace dentro de él. El nuevo grupo sólo tiene 431 componentes; de esos, 428 están conectados entre sí, formando otros tres un pequeño grupo aparte. Curiosamente, en un estudio hecho a principios de 2004  (Merelo, 2004), había dos grandes islas bien definidas que, grosso modo, correspondían a las bitácoras españolas y las iberoamericanas.

El hecho de que se trate de una red “mundo pequeño” no está sólo relacionado con el diámetro de la red, que es 3,402, sino con el coeficiente de clustering. El coeficiente de clustering mide la transitividad de las relaciones, es decir, para cada 3 nodos, en qué proporción sucede que cuando A está relacionado con B, B está también relacionado con C. En este caso, es 0,236, mucho mayor que el correspondiente a una red aleatoria Erdös-Renyi (11)  con el mismo número de nodos y grado de conexión medio, que sería 0,034. La blogosfera hispana es, por lo tanto, un pañuelo – al menos a este nivel – con la apariencia que se muestra en la figura 3 ( 4).

Este gráfico tiene el aspecto general de los grafos que siguen una ley de potencias: un núcleo de sitios bastante interconectados, con una serie de “tentáculos” que se relacionan con esta zona central y que, a su vez, forman pequeños grupos con vínculos fuertes entre sí. En todo caso, es curioso observar que hay, si no transferencia ideológica, sí conocimiento y enlace mutuo entre todas las bitácoras que forman esta representación de la blogosfera. Esto  parece establecer una diferencia con la blogosfera global donde las bitácoras posicionadas ideológicamente aparecen casi aisladas, desde el punto de vista de los hiperenlaces (Adamic, Glance 2005).

Conclusiones

En este artículo hemos presentado algunos datos cuantitativos sobre la blogosfera hispana; se ha puesto de manifiesto su crecimiento en los últimos dos años, y las cualidades de la red que forman las bitácoras: es un mundo pequeño que sigue una ley de potencias; además, su cohesión, es decir, la conexión entre sus diferentes grupos ha aumentado desde los últimos estudios realizados a principios del año pasado.

De la misma forma, el dinamismo de la blogosfera se ha puesto de manifiesto por el pequeño exponente de la ley de potencias ajustada, y su grado de apertura por el hecho de que incluso bitácoras muy diferentes ideológicamente o temáticamente están conectadas directamente, o por una media de aproximadamente tres grados de separación.

En resumen, consideramos útil mantener un observatorio de la blogosfera hispana, para comprobar el efecto que tienen fenómenos tales como la introducción de millones de bitácoras, como lo sucedido recientemente con MSN Spaces, eventos como el 11M y su efecto en la creación de nuevas agrupaciones en la estructura reticular de la blogosfera. Asimismo, resultaría interesante correlacionar todos estos fenómenos con la creación de opinión pública y la propagación de memes en la blogosfera.

Bibliografía

ADAMIC, L. GLANCE, N.: «The Political Blogosphere and the 2004 U.S. Election: Divided They Blog” , 2nd Annual Workshop on the Weblogging Ecosystem: Aggregation, Analysis and Dynamics, WWW2005, Japan, http://www.hpl.hp.com/research/idl/papers/politicalblogs/

ALBERT, R., BARABASI, A.L.: «Statistical Mechanics of Complex Networks»,
Reviews of Modern Physics, núm. 47, 2002, http://arxiv.org/abs/cond-mat/0106096

FERRERAS, 2005:  «II Encuesta: los weblogs más leídos», publicado en  http://tintachina.com/archivo/ii_encuesta_los_weblogs_mas_leidos.php (último acceso 1 de agosto de 2005).

FUMERO, A.: «El abecé del universo blog», TELOS, 65, octubre-diciembre, 2005.

KOTTKE, J.: Screw the Power law, Embrace the Power Law, http://www.kottke.org/03/02/screw-power-law

MERELO, J. J., TRICAS, F., RUIZ, V.: «Do we live in a Small World? Measuring the Spanish-speaking blogosphere», Proceedings of BlogTalk, An European Conference on Weblogs, Viena, Austria, May 23-24, 2003, http://geneura.ugr.es/~jmerelo/habilitacion2005/papers/65.pdf

MERELO, J. J.: Mapas de la blogosfera, http://atalaya.blogalia.com/historias/15216

MERELO, J. J., TRICAS, F., RUIZ, V., ORIHUELA, J. L.: «Revisiting the Spanish blogosphere», Blog Talks 2.0, Viena, Austria, 2004, http://webdiis.unizar.es/~ftricas/Articulos/Revisiting%20the%20Spanish%20blogosphere.pdf

MERELO, J. J.; PRIETO, B.; TRICAS, F.: Blogosphere community formation, structure and visualization. Actas Blogtalk 2.0, Viena, Austria, Julio 2004. Notas en directo de la charla en http://joi.ito.com/joiwiki/BlogTalkNotesPanel3. Disponible también en http://webdiis.unizar.es/~ftricas/Articulos/Blogosphere%20community%20formation.pdf

SHIRKY, C.: Power Laws, Weblogs, and Inequality, http://www.shirky.com/writings/powerlaw_weblog.html. First published February 8, 2003 on the “Networks, Economics, and Culture” mailing list. Accedido por última vez el 2 de agosto de 2005.

SIFRY, D.: State of The Blogosphere, March 2005, Part 1: Growth of Blogs, http://www.sifry.com/alerts/archives/000298.html

WATTS, D. J.; STROGATZ, D. J.: Collective Dynamics of ´Small-World´ Networks, Nature, 393:440-442 (1998).





Volver a índice
        Manda este articulo a un AmigoImprime esta paginaDescarga esta pagina