Vous connaissez sans doute Yahoo Answers ?
Si non, imaginez un forum gigantesque où les gens viennent poser leurs questions et d'autres personnes leur répondent. Au croisement d'un forum et de Wikipedia, Yahoo Answers est une sorte de Quid interactif et collaboratif.
Aujourd'hui, cet outil est un succès phénoménal. Il y a plus de 90 millions d'utilisateurs dans le monde entier et chaque jour, plus de 100 000 questions sont posées sur ce site. Bien sûr, Yahoo veut améliorer cet outil pour qu'il attire encore plus de monde, devenant une sorte de base de données on-line de la connaissance humaine. Contrairement à Wikipédia, qui recueille des données de niveau encyclopédique, Yahoo Answers se veut à la portée de tout le monde, aussi bien au niveau des questions que des réponses. Ainsi, on peut très bien trouver des questions comme "Est-ce que 2 Ghz est une fréquence suffisante pour le portable de mon fils ?" ou "Quel est votre parfum de crême glacée préféré ?". Comme vous pouvez vous-même le constater, le champ et le type des questions reste assez vaste: on y trouve très bien des débats d'idées, de goûts ou alors des questions demandant des réponses précises (ex: "Quel est le secret de la vie, de l'Univers et de tout le reste ?" Réponse: "42" !).

Bref, l'idée est d'améliorer ce service, typiquement, pour attirer encore plus de monde. La piste principale pour l'amélioration est simple: faire en sorte que chaque question posée ait sa réponse. Pour ce faire, encore plus simple, il suffit de mettre en relation celui qui pose la question à la personne qui a la réponse ! (génial, isn't it ?). Facile à faire dans son entourage proche, cela devient plus problématique quand on doit traiter 90 millions d'entités virtuelles. En effet, difficile de savoir qui possède la connaissance nécessaire (nous l'appellerons l'expert).

Une première solution repose sur la taxonomie: en effet, lorsqu'un utilisateur pose une question, il la pose dans une catégorie (ex: une question sur Umberto Eco ira dans "Art > Livres & Auteurs"). Imaginons que moi, l'expert, me ballade sur Yahoo Answers; il est de fait évident que je vais me diriger d'abord vers mes domaines de prédilection, les domaines dans lesquels j'ai une certaine expertise, à savoir par exemple "Informatique > Sécurité", "Histoire > Seconde Guerre Mondiale" ou "Gastronomie > Cuisine du Sud-Pakistan". Il suffit donc d'afficher les questions sans réponses relatives à ses catégories sur la page d'acceuil de ces catégories pour attirer des personnes possédant à priori un certain niveau d'expertise.
Mais cette méthode possède ses limites:

  • Le principe même d'une taxonomie impose des limites inhérentes à un système de partitions.
    ex: si je veux poser une question sur Le Nom de la rose, comment me décider entre littérature et philosophie, sachant que le bonne solution se trouve entre les deux (intersection en mathématiques)
  • L'utilisateur peut par inadvertance ou méconnaissance poser sa question dans la mauvaise catégorie.
    ex: si je ne sais rien des matrices, comment puis-je savoir que je dois poser la question dans "Mathématiques > Algèbre" ?
  • Le système ne permet pas de séparer le bon grain de l'ivraie, c'est à dire que les questions ardues seront mêlées aux questions basiques

Donc il faut trouver un tout nouveau système pour mettre en lien l'utilisateur et "l'expert", un système entièrement automatique, car, comme on l'a constaté, l'utilisateur est faillible. En fait, la problèmatique peut quasiment se ramener au fait de trouver automatiquement les experts, ce qui peut-être aussi décomposé en deux problèmes différents:

  • Trouver en quoi une personne est experte: reconnaissance automatique de contenu
  • Trouver son niveau d'expertise dans ce domaine: nul, néophyte, moyen, avancé, expert.

Le prochain article sera à priori sur la reconnaissance de contenu, je vous laisse cogiter en attendant: comment peut-on extraire des informations sur les centre d'intérêts des utilisateurs SANS utiliser la taxonomie ?
Bon courage !!! N'hésitez pas à partager vos idées, on ne sait jamais, grâce à vous, je vais peut-être faire une percée dans le domaine… :p