La falta de consistencia entre indizaciones es un problema bien conocido en el campo de la Documentación. Es decir, diferentes indizadores profesionales aplicarán diferentes descriptores a un mismo recurso. De hecho, éste es uno de los grandes problemas de la indización humana.
Igualmente, en el área de la HCI, Furnas et al. (1987) demuestran que, como no podía ser de otra forma, los usuarios muestran una gran variabilidad en los términos que utilizan para referirse a un mismo objeto.
En sistemas de indización social (tagging) ocurre lo mismo. Ya que los usuarios describen los recursos en lenguaje completamente libre y con propósitos muy diferentes, la probabilidad de que dos usuarios utilicen un mismo tag para un mismo recurso es muy baja.
Pero, ¿cómo afecta que tengamos un sistema en el que muchos usuarios taggean un mismo recurso? (estamos hablando de broad folksonomies, o folksonomías "realmente folk").
En este sentido, Golder y Huberman (2006) descubren un patrón de uso realmente interesante, aunque los propios autores no lleguen a relacionarlo directamente con el problema de la inconsistencia entre indizadores ni con el problema del vocabulario descrito en (Furnas et al.; 1987).
Según su observación, después de que unos 100 usuarios describan un mismo recurso, la proporción de cada tag respecto al total de tags diferentes asignados tiende a estabilizarse.
Es decir, a partir de 100 indizaciones, se obtiene una consistencia relativa: Podemos decir que el tag X describe al recurso Y en un grado Z estable.
Esto es una gran ventaja de la indización social frente a la indización individual (aunque sea realizada por profesionales). Sin embargo, también implica un problema: únicamente aquellos recursos con muchos taggeadores poseerán una descripción consistente y precisa, lo que en estos sistemas dejará fuera a una larga cola de recursos descritos por pocos usuarios.
Scott Golder and Bernardo A. Huberman. (2006). "Usage Patterns of Collaborative Tagging Systems" Journal of Information Science, 32(2). 198-208.
Furnas et al. (1987). The Vocabulary Problem in Human-System Communication. Communications of the ACM, November 1987, 30(11).
Post relacionados: Exhaustividad y Precisión en SRIs basados en tagging