La falta de consistencia entre indizaciones es un problema bien conocido en el campo de la Documentación. Es decir, diferentes indizadores profesionales aplicarán diferentes descriptores a un mismo recurso. De hecho, éste es uno de los grandes problemas de la indización humana.
Igualmente, en el área de la HCI, Furnas et al. (1987) demuestran que, como no podía ser de otra forma, los usuarios muestran una gran variabilidad en los términos que utilizan para referirse a un mismo objeto.
En sistemas de indización social (tagging) ocurre lo mismo. Ya que los usuarios describen los recursos en lenguaje completamente libre y con propósitos muy diferentes, la probabilidad de que dos usuarios utilicen un mismo tag para un mismo recurso es muy baja.
Pero, ¿cómo afecta que tengamos un sistema en el que muchos usuarios taggean un mismo recurso? (estamos hablando de broad folksonomies, o folksonomías "realmente folk").
En este sentido, Golder y Huberman (2006) descubren un patrón de uso realmente interesante, aunque los propios autores no lleguen a relacionarlo directamente con el problema de la inconsistencia entre indizadores ni con el problema del vocabulario descrito en (Furnas et al.; 1987).
Según su observación, después de que unos 100 usuarios describan un mismo recurso, la proporción de cada tag respecto al total de tags diferentes asignados tiende a estabilizarse.
Es decir, a partir de 100 indizaciones, se obtiene una consistencia relativa: Podemos decir que el tag X describe al recurso Y en un grado Z estable.
Esto es una gran ventaja de la indización social frente a la indización individual (aunque sea realizada por profesionales). Sin embargo, también implica un problema: únicamente aquellos recursos con muchos taggeadores poseerán una descripción consistente y precisa, lo que en estos sistemas dejará fuera a una larga cola de recursos descritos por pocos usuarios.
Scott Golder and Bernardo A. Huberman. (2006). "Usage Patterns of Collaborative Tagging Systems" Journal of Information Science, 32(2). 198-208.
Furnas et al. (1987). The Vocabulary Problem in Human-System Communication. Communications of the ACM, November 1987, 30(11).
Post relacionados: Exhaustividad y Precisión en SRIs basados en tagging
Y yo hablaría incluso de la auto - incosistencia en el etiquetado, no se si se debe a cumplir con el dicho de "en casa del herrero cuchillo de palo", pero en más de 10 y 100 ocasiones, cuando quiero recuperar recursos que he etiquetado previamente en mi delicious, me pongo a buscarlos por etiquetas que no les he asignado, y puede que entonces volvamos a lo que hemos estado hablando, ¿influyen las emociones, el estado de animo en la manera en que etiquetamos?
Enviado por Catuxa. Julio 8, 2006 02:38 PM
Hola Catu,
Bueno, esa es otra incógnita: cómo de bueno/eficiente/útil es nuestro propio etiquetado para nosotros mismos.
En los comentarios del post anterior me apresuré a afirmar que quién mejor que nosotros para saber con qué tags hemos etiquetado el recurso que intentamos recuperar. Pero esto no tiene por qué ser así. Incluso pasado cierto tiempo es posible que nos sea más fácil recuperar recursos a través de tags asignados por otros, que mediante nuestros propios tags.
Enviado por yusef. Julio 8, 2006 03:38 PM
Hola Yusef. buen post bien interesante!!. Mira que nosotros tambien hemos intentado hacer nuestras bases de conocimiento social y bueno a falta de tiempo para postear considero que un recurso o fuente bien indexado o tiquetado documenta ó solventa muchas limitaciones para accceder a los recursos y facilita las cosas a la audicencia ..
Pero claro de entrada hay muchas inconsistencias -lo que vos expones-.. Fijate lo que hemos hecho al respecto.
http://del.icio.us/infoesfera y su presentación en el blog
http://www.infoesfera.com/2006/04/16/enlaces-2006-04-16/
Claro!! evidenciaras que falta bastante pero intentamos mejorar si el tiempo nos los permite!! Uff..
Enviado por Jhon. Julio 10, 2006 04:40 AM
Gracias Jhon, me alegra que haya a quien le interesen este tipo de posts.
Un ejemplo de tagging profesional podría ser el que vosotros realizáis: más exhaustivo que la media.
Aunque la inconsistencia también se produce entre indizadores profesionales, una buena incógnita a resolver sería cuántos taggeadores profesionales serían necesarios para llegar a la descripción estable.
Es decir, si asumimos que como norma general, hacen falta aprox. 100 taggeadores para que un recurso obtenga una descripción estable y consistente, ¿cuántos taggeadores profesionales serían necesarios? Seguramente menos.
Enviado por yusef. Julio 11, 2006 12:30 AM
Y si el etiquetado es mixto? Y si el sistema tiene recursos etiquetados profesionalmente a los que luego los usuarios añadiran la capa de tagging personal/social?
No tengo datos, pero presumo que el tagging profesional, siendo inconsistente, lo es menos que el personal/social, verdad?
En mi proyecto actual le estamos dando muchas vueltas a eso. Cómo reducir la inconsistencia en un pre-taggeado inhouse para no depender del taggeado de los usuarios a la hora de ofrecer eficacia.
Aún así, todavía tenemos dudas :-)
Para cuándo un workshop sobre tagging?
Catuxa, Yusef, JSerrano y demás documentalosos de fuera de Madrid, os vendríais a Madrid para algo así?
Enviado por Javier Cañada. Julio 15, 2006 08:16 PM
Hola Javier,
El tagging o indización profesional siempre será más consistente que el tagging de los usuarios, ¿pero será más consistente que el tagging agregado? Es decir, un sólo usuario taggeará pobremente, pero el resultado agregado de 100 usuarios taggeando un mismo recurso probablemente resulte más exhaustivo que el tagging de un único profesional.
El tagging o indización profesional tiene otro gran inconveniente,y es su coste y por tanto su inviabilidad para colecciones grandes y en constante crecimiento de objetos/documentos/recursos/etc.
Mi opinión al respecto es que el tagging social es una buena solución, pero únicamente para colecciones grandes y de naturaleza dinámica. Además, cuanto menos social es el tagging, menos útil es. Así pues las broad folksonomies (todos-taggean-todo) son más útiles que las narrow folksonomies (que en realidad no son folksonomías). Después también está el problema de la motivación del usuario para taggear, que ya escuché que se planteaba en los podcasts de la descon0.
Mezclar el tagging social y distribuido con el profesional y centralizado, podría ser una buena opción. Pero en mi opnión depende de la naturaleza de los objetos. Si los objetos son puramente textuales y no demasiado breves, la indización automática sería mejor opción. Si sólo son fichas técnicas de productos, el tagging social ofrecería mucho valor añadido.
Respecto a lo del workshop, me parece una gran idea! yo me apunto!
Enviado por yusef. Julio 15, 2006 10:57 PM
Me apunto tambien, pero pasado el verano carusorososososo que nos está tocando vivir.
Enviado por Catuxa. Julio 16, 2006 03:15 PM