24 mai 2007

Comment bien utiliser les "tags"

Les "tags", cette possibilité pour les utilisateurs d'ajouter des mots-clés aux ressources trouvées dans les bases de données qu'ils consultent, font peur aux concepteurs de ces mêmes bases de données.
Surtout si ces derniers sont des professionnels de l'information, qui utilisent un vocabulaire cadré, structuré, limité : Rameau, le MeSH, etc.
Comment permettre aux internautes d'ajouter des mots-clés sans tomber dans la dérive d'un vocabulaire complètement anarchique, avec les variantes singulier-pluriel, les fautes de frappe, etc.

Je vois deux possibilités qui me paraissent largement suffire l'une comme l'autre :
  1. En utilisant la méthode de Delicious de suggestion de mots-clés. Quand on rentre un nouveau favori sur Delicious, il va chercher tous les utilisateurs ayant déjà rentré la même URL, et propose les tags utilisés. Parmi ces tags, il distingue ceux que l'internaute a déjà utilisé pour ses propres favoris déjà créés.
    Cela me paraît très incitatif.
  2. La seconde a été adoptée récemment sur Allociné : pour un film donné, on indique les tags déjà rentrés par les autres internautes, et le nombre de fois où ce tag a été utilisé pour ce film. L'internaute peut bien être rapide de ses dix doigts (ou de ses deux index), il a toujours plus vite fait de recliquer sur un mot déjà rentré que de le retaper avec des variantes ou des fautes (pour l'exemple ci-dessous, "18e siecle" existe, et il faut être obstiné pour vouloir ajouter "XVIIIe siècle)

J'ai lu naguère quelque part que les utilisateurs de FlickR se rendaient rapidement compte des tags les plus utilisés par les autres internautes, et se mettaient à les employer eux-mêmes. On favorise de cette manière la cohérence de la base, sans donner à l'internaute l'impression de le corseter. Et celui-ci enrichit ainsi l'indexation à peu de frais.

Je suis résolument pour la possible intervention des utilisateurs dans une base de données, institutionnelle. Une fois ce principe posé, il suffit de voir comment résoudre les craintes des gestionnaires de la base.

Libellés :

3 Commentaires:

Anonymous Damien a dit...

je pense que nous pourrions arriver dans nos catalogues à une double indexation (professionnelle et usuelle) ; après tout qu'est-ce que Rameau, sinon le fruit d'un taguage sans cesse réfléchi et corrigé par la communauté des bibliothécaires ? Pédagogiquement, la double indexation serait une bonne chose ; elle sensibliserait les usagers aux problèmes relatifs à l'indexation, comme l'usage du singulier ou du pluriel (par ex. différence entre le concept "femme" et le concept "femmes"). La double-indexation existe déjà de manière marginale pour les thèses. Cherchant un jour des documents sur le syndrome de Stockholm, j'ai trouvé une thèse dont la notice portait outre le mot clé Rameau 606 $aVictimes$xpsychologie, un mot-clé libre en 610 $asyndrome de stockholm ; grâce à ce mot-clé, j'ai trouvé plus facilement le document que je cherchais. Je n'ai pas été jusqu'au bout de la démarche et j'ai négligé d'envoyer au groupe Rameau une proposition de notice d'autorité (c'est pas bien !)
Rameau aura toujours (et c'est normal) un temps de retard sur les demandes des usagers. Je suis donc partisan de la double indexation dans nos catalogues (avec affichage des tags les plus utilisés comme dans Del.icio.us), comme je suis partisan du "double encyclopédisme" (universalis + wikipedia)

15:39  
Blogger Lully a dit...

Je suis d'accord sur l'idée de la double indexation, bien évidemment : l'indexation contrôlée reste pertinente, ne serait-ce que pour avoir la possibilité, à partir d'une notice, de relancer la requête dans la base de manière pertinente sur le même sujet. A condition que l'indexation soit homogène.
Si je prends une base de monnaies, il faut que le même type soit toujours décrit de la même manière : le type de Chartres ne doit pas être décrit tantôt comme "bléso-chartrain", tantôt comme chinonais, etc. Mais d'un autre côté j'apprécierai de pouvoir le ré-indexer moi-même comme reliquaire -- avec à l'affichage, pour l'utilisateur, une distinction claire de ce qui est indexation professionnelle et ce qui est indexation libre.
Mais la double indexation n'est pas là pour résoudre seulement une question de retard. Si on prend les dépôts d'articles dans HAL, par exemple, il est clair que les chercheurs (base où ils déposent eux-mêmes, donc indexent eux-mêmes) n'ont pas la même démarche :
Face à une ressource, le bibliothécaire l'indexe pour la ranger dans une catégorie.
Le chercheur l'indexe pour la décrire au plus précis, avec des termes rarement connus du bibliothécaire.
Pour exprimer cela en termes "logiques", le bibliothécaire indexe un livre pour le ranger dans un "répertoire" (comme on range un fichier dans un dossier sur son ordinateur), alors que le chercheur cherche davantage une classification "à facettes".
Dans FlickR, par exemple, on retrouve les deux : les sets (ou ranger des ensembles de photos) et les tags.

18:16  
Blogger Lully a dit...

Correction postérieure : dans Allociné, le nombre indiqué à côté du tag indique le nombre total de films décrit avec ledit tag, et non le nombre de fois où il a été utilisé par les internautes pour décrire ce film précisément.

14:26  

Enregistrer un commentaire

Liens vers ce billet:

Créer un lien

<< Accueil

Mentions légales

MonnaieCe n'est pas un blog de collectionneur.
Je suis historien, un peu informaticien (j'adore les métadonnées !). D'où ce que vous pouvez lire ici.
Comme vous pouvez le constater, même si je le laisse en ligne, il n'est plus alimenté depuis longtemps.

Recherche sur le web numismate

Recherche dans les livres de numismatique de Google Book Search[...]

 

 

Généré par Blogger

Site Meter