El 85,7% de los tags no tienen capacidad representativa alguna. Es decir, nunca han sido asignados por más de un usuario para describir un mismo documento.
Aclaración:
Esta cifra se vería lógicamente disminuida si se aplicaran técnicas de desambiguación (detección de sinónimos, stemming...).
Está calculada sobre datos de del.icio.us, es decir, dónde el tagging se realiza de forma completamente libre.
Post relacionado: Consistencia inter-tagging.
Yusef, una preguntina... ¿por representatividad a q t refieres? ¿el tag respecto al contenido del objeto q describe?
Enviado por vane. Marzo 8, 2007 11:13 PM
Sí, principalmente a la capacidad del tag para describir el objeto, desde el punto de vista de la significación colectiva (que tenga sentido descriptivo no solo para quien lo asigna, sino también para el resto).
Y siempre partiendo del hecho de que hablamos de dominios semánticos limitados.
Enviado por yusef. Marzo 9, 2007 12:04 AM
Perdòname Yusef, pero DESAMBIGUACIÒN, es una palabra monstruosa... tiene que haber una mejor, o dos... ;-)
Enviado por Andrea. Marzo 9, 2007 05:23 PM
jaja, estoy seguro Andrea, pero en ese momento no se me ocurría ninguna. Estoy completamente abierto a sugerencias.
Enviado por yusef. Marzo 9, 2007 05:27 PM
pero que "tenga sentido descriptivo no sólo para quien lo asigna, sino también para el resto"... con esto se supone q evalúas la descriptividad...sólo por el numero de ocurrencias, no?
quizás sea problema de que no llego a entender bien el término. ¿Con representatividad te refieres a "representatividad probada"? quiero decir, no significa que los no probados por numero de ocurrencias sean "no representativos" no? Un tag con una ocurrencia podría ser representativa perfectamente, verdad?
y ademas, supongo que estos datos están muy alejados de lo q deberían ser, no? teniendo en cuenta q al ser un campo semántico muy limitado (esencialmente es utilizado por frikis) cualquier objeto que se salga de la temática principal será una desviación. Eso sin contar que es un sistema multi-idioma y lo que ya comentas de la "desambiguación" (entre comillas :P) con lo que la representatividad deberia subir porcentualmente bastante. Muchos de esos tags "no representativos" serían en realidad representativos no demostrables
Como lo ves? ¿Tu si hicieras una apuesta, cuál crees que sería el porcentaje real de representatividad para un mismo idioma?
Por que si no lo entiendo por este lado, no le veo utilidad a esta medición
Siento el rollo :D
saludines
Enviado por vane. Marzo 9, 2007 07:03 PM
Hola vane,
Cuando hablo de capacidad representativa me refiero a la capacidad descriptiva de los tags desde una perspectiva colectiva.
Este 85% de tags no sólo tienen una frecuencia de uso muy baja sino que, además, nunca han sido asignados por más de un usuario a un mismo recurso.
¿Cuál es la utilidad de esta medición? Muy sencilla. Nos indica qué porcentaje de tags potencialmente no tendrán sentido para la inmensa mayoría de los usuarios del sistema.
Por supuesto muchos de esos tags los entenderemos, porque no serán más que "errores" tipográficos (websitee) o formas alternativas de escribir lo mismo (web/site, unsitioweb, sede:web, ...).
Pero muchos también serán tags ego-orientados, que no tienen sentido más que para quien los asigna, y para los que no hay desambiguación posible.
Tampoco debemos olvidar en el 15% restante, también habrá muchos tags vacíos de significado por otras razones (ejemplo: toread), aunque sean usados por más de un usuario para describir un mismo recurso.
Mi "opinión" sobre el tema es que existirá un porcentaje muy alto de tags sin capacidad representativa alguna, o al menos muy baja. Pero esto no es nada nuevo que no se haya estudiado ya.
Enviado por yusef. Marzo 10, 2007 07:29 PM
muy interesante
Enviado por lopez. Marzo 13, 2007 09:55 PM