No nos sorprendería que el infierno fuera una biblioteca

sigue la ofensiva

Para Rajoy una manifestación por la paz es una "manifestación paleta". Yo sólo agradezco no tener en el gobierno a un presidente paleto que ubicara nuestra bandera en el lado derecho de esta representación.

Si su problema es que no entiende el concepto de proporcionalidad (quizá le resulta matemáticamente demasiado complejo), le aconsejaría esta otra visualización.

Por Yusef  Julio 24, 2006, Comentarios (11) , (#)
Jerarquiología

En el principio de Peter (una crítica de las estructuras demasiado jerárquicas):

todo empleado tiende a ascender hasta su nivel de incompetencia

lo que más me gusta es el es el comienzo:

En una jerarquía (y supuesta la existencia de un suficiente número de grados) todo empleado asciende a, y permanece en, su nivel de incompetencia

traído a lo nuestro:

En un directorio (y supuesta la existencia de un suficiente número de niveles de navegación) toda categoría asciende a, y permanece en, su nivel de incompetencia

Según Peters, la eficacia de una jerarquía es inversamente proporcional a su coeficiente de madurez (CM), aplicándolo a lo nuestro debe de ser algo así:

CM = número de categorías absolutamente inutiles e innecesarias x 100 dividido por el número total de categorías

... otra parida posteada.

Por barbol  Julio 21, 2006, Comentarios (5) , (#)
Cómo mejorar los Tag-Clouds

He colgado en mi web personal la versión borrador del artículo que Víctor y yo presentaremos en el InSciT 2006:

Improving Tag-Clouds as Visual Information Retrieval Interfaces

PD: Se piden disculpas si el inglés utilizado resultara un tanto macarrónico.

Por Yusef  Julio 21, 2006, Comentarios (7) , (#)
Interfaz: MDS + Ojo de Pez

He colgado en mi web personal una versión borrador del artículo que junto a Víctor he publicado en el último número de El Profesional de la Información:

Interfaz visual para recuperación de información basada en análisis de metadatos, escalamiento multidimensional y efecto ojo de pez (PDF).

Por Yusef  Julio 19, 2006, Comentarios (11) , (#)
1er Congreso Internacional de Investigación en Ciencia de la Información

En el marco de la celebración de sus 50 años la Escuela Interamericana de Bibliotecología, organiza y convoca el primer evento académico dedicado a la investigación en bibliotecología y documentación, al rededor de los ejes: Gestión del Conocimiento y Biblioteca Pública.

La presentación, la programación, las inscripciones y las condiciones para la presentación de ponencias que se reciben hasta el 30 de agosto, en su sitio web.

Por Andrea  Julio 17, 2006, Comentarios (0) , (#)
toread
Por Yusef  Julio 16, 2006, Comentarios (3) , (#)
Usabilidad, Estética, Accesibilidad, Utilidad...

Como anunciaba el servicio de alerta para profesionales de la documentación, han salido publicados los últimos números de BiD: Textos universitaris de biblioteconomia i documentació y de la Revista Española de Documentación Científica.

En esta última publico un artículo sobre usabilidad y otros factores de diseño web relacionados. Para quien no pueda acceder a la revista, y esté interesado en el artículo, he colgado una versión borrador en mi web personal: Factores del Diseño Web Orientado a la Satisfacción y No-Frustración de Uso.

Por Yusef  Julio 15, 2006, Comentarios (2) , (#)
typertext

typertext es un blog que acaba de nacer, autodefinido como "apuntes sobre la letra, el espacio, la interacción". Su autor es Henry Naranjo Pérez, diseñador y docente universitario.

Por Yusef  Julio 11, 2006, Comentarios (0) , (#)
Libros para Web

Libros-web es un blog creado por Rafael López Callejón, en el que se publican reseñas y comentarios sobre libros de usabilidad, diseño y AI.

Por Yusef  Julio 11, 2006, Comentarios (0) , (#)
Consistencia inter-tagging

La falta de consistencia entre indizaciones es un problema bien conocido en el campo de la Documentación. Es decir, diferentes indizadores profesionales aplicarán diferentes descriptores a un mismo recurso. De hecho, éste es uno de los grandes problemas de la indización humana.

Igualmente, en el área de la HCI, Furnas et al. (1987) demuestran que, como no podía ser de otra forma, los usuarios muestran una gran variabilidad en los términos que utilizan para referirse a un mismo objeto.

En sistemas de indización social (tagging) ocurre lo mismo. Ya que los usuarios describen los recursos en lenguaje completamente libre y con propósitos muy diferentes, la probabilidad de que dos usuarios utilicen un mismo tag para un mismo recurso es muy baja.

Pero, ¿cómo afecta que tengamos un sistema en el que muchos usuarios taggean un mismo recurso? (estamos hablando de broad folksonomies, o folksonomías "realmente folk").

En este sentido, Golder y Huberman (2006) descubren un patrón de uso realmente interesante, aunque los propios autores no lleguen a relacionarlo directamente con el problema de la inconsistencia entre indizadores ni con el problema del vocabulario descrito en (Furnas et al.; 1987).

Según su observación, después de que unos 100 usuarios describan un mismo recurso, la proporción de cada tag respecto al total de tags diferentes asignados tiende a estabilizarse.

Es decir, a partir de 100 indizaciones, se obtiene una consistencia relativa: Podemos decir que el tag X describe al recurso Y en un grado Z estable.

Esto es una gran ventaja de la indización social frente a la indización individual (aunque sea realizada por profesionales). Sin embargo, también implica un problema: únicamente aquellos recursos con muchos taggeadores poseerán una descripción consistente y precisa, lo que en estos sistemas dejará fuera a una larga cola de recursos descritos por pocos usuarios.

Scott Golder and Bernardo A. Huberman. (2006). "Usage Patterns of Collaborative Tagging Systems" Journal of Information Science, 32(2). 198-208.

Furnas et al. (1987). The Vocabulary Problem in Human-System Communication. Communications of the ACM, November 1987, 30(11).

Post relacionados: Exhaustividad y Precisión en SRIs basados en tagging

Por Yusef  Julio 07, 2006, Comentarios (7) , (#)
Exhaustividad y Precisión en SRIs basados en tagging

(O mi modesta post-aportación asíncrona a la desconferencia)

Tras leer el estupendo post-resumen de la desponencia de ana (y los comentarios de las deakilleras), he decidido realizar una aportación perpendicular (o quizá tangencial) al tema que expone, motivado a partir de la frase:

yo ... alegué, que estábamos sacrificando exhaustividad y precisión en la recuperación de información desde la primera letra de t-a-g.

Efectivamente, como sistema basado en el lenguaje natural, la exhaustividad y precisión en la RI se ven fuertemente afectadas.

Como sabemos, además, la exhaustividad y la precisión se afectan entre sí: a mayor exhaustividad menor precisión, y viceversa. La primera cuestión es: ¿cuál se ve más afectada de las dos en los sistemas basados en tagging?

La precisión. Esto se debe a qué ambos parámetros están condicionados por la especificidad de los tags, y la exhaustividad del tagging. Todos los datos parecen indicar que los tags son más generales que específicos, y el tagging un proceso poco exhaustivo. O en otras palabras, si los tags son el eslabón perdido entre las categorías y las palabras clave, se acercan un poquito más a sus primas las cateogrías que a sus primos los keywords.

Otro problema es la ambigüedad en los tags, que afecta tanto a la precisión (polisemia) como a la exhaustividad (sinonimia). El problema de la ambiguedad es inherente al lenguaje natural, pero en el tagging además se encuentra acentuado. La razón la resumen muy bien Guy and Tonkin (2006) con la siguiente frase:

Possibly the real problem with folksonomies is not their chaotic tags but that they are trying to serve two masters at once; the personal collection, and the collective collection. Is it possible to have the best of both worlds?

Es decir, muchos tags sólo tienen sentido para su autor.

Si bien el problema de la falta de especificidad de los tags es difícilmente solucionable (bueno, siempre se puede increpar al usuario con mensajes-popup del tipo "Sé más específico al taggear ¡alma de cántaro!"), el problema de la ambigüedad puede ser más "fácil" de solucionar.

Y aquí es cuando recomiendo el que para mi es uno de los mejores papers escritos sobre el tema, el trabajo de Wu, Zhang and Yu (2006): Exploring Social Annotations for the Semantic Web.

Aunque el título despista (realmente el tema de la web semántica sólo lo utilizan para contextualizar la investigación), y reconozco que puede ser pesadito de leer, me parece una de las aportaciones más serias al tema. Como resumen: los autores, inspirados en el modelo de indización de semántica latente y el modelo probabilístico de recuperación de información, ofrecen una buena solución para el problema de la sinonimia, polisemia y ausencia de significación de algunos tags. La semántica se puede inferir a partir de la propia folksonomía, o al menos en parte. O como decía Mika: Las ontologías somos nosotros.

Por Yusef  Julio 06, 2006, Comentarios (20) , (#)
Liquid browsing

A través de Jorge Serrano descubro Liquid browsing (2004), un modelo de interfaz para la recuperación y manipulación de grandes cantidades de información en pantallas de dispositivos móviles.

Aunque el modelo es menos espectacular que el de BumpTop 3D Desktop (y sin actitud 2.0), parece una solución atractiva.

El efecto de distorsión visual que emplea es similar al que nosotros hemos usado para la exploración de palabras clave visualmente distribuidas, en un artículo publicado en el último número de el profesional de la información.

Yusef Hassan–Montero y Víctor Herrero–Solana
Interfaz visual para recuperación de información basada en análisis de metadatos, escalamiento multidimensional y efecto ojo de pez.
Julio-agosto 2006, vol. 15, núm. 4.

Por Yusef  Julio 06, 2006, Comentarios (0) , (#)
mnemomap

mnemomap es un buscador por tags que permite redefinir las búsquedas proporcionando visualmente sinónimos, traducciones y tags relacionados.

Visualmente me parece una propuesta interesante (por su sencillez), aunque mejorable (¿para qué expandir el nodo de sinónimos, por ejemplo, cuando el sistema no es capaz de ofrecer ninguno?).

Además está el problema de que los sistemas basados en tagging no son demasiado adecuados para soportar la recuperación de información por querying, debido a la naturaleza más genérica que específica de los tags.

[vía information aesthetics]

Por Yusef  Julio 04, 2006, Comentarios (0) , (#)
Mapa interactivo de la blogosfera

En el blog DataMining presentan un mapa interactivo de la blogosfera, donde además de mostrar las relaciones entre blogs se puede acceder a los blogs representados.

Por Yusef  Julio 02, 2006, Comentarios (2) , (#)
Bitácora bajo licencia de Creative Commons.