Message
par Fifokaswiti » mer. nov. 03, 2010 4:53 pm
Oui, tout ce qui est extraction et valorisation de métadonnées et plus généralement d'entités nommées (thèmes, lieux, personnes, etc.) A priori, quelqu'un qui a lu (et aimé) un bouquin parlant de Vernon Sullivan sera intéressé par un autre bouquin parlant du même.
Mais c'est une approche différente de ce qui se fait. Aujourd'hui, les systèmes de recommandation fonctionnent de manière tout à fait « bête » : ils ne savent pas ce que contient le bouquin, mais ils peuvent prédire avec un fort degré de justesse qu'un individu donné va l'apprécier, étant donné son historique d'achat et ceux d'autres clients, en fonctionnant par comparaison (statistiquement, si un historique contient les livres A et B, ils ont beaucoup de chances de contenir C.) Là, il est question de rajouter dans le système des informations sur la nature des livres (genre, sous-genre, thème, concepts invoqués…) et de s'en servir pour étendre les résultats à des objets peu vendus mais qui peuvent être intéressants.
En soi, ce n'est pas impossible, ni très compliqué. Des outils de traitement automatique du langage avec extraction d'entités nommées existent depuis des années. La gestion et la valorisation de métadonnées sont des domaines très bien connus, surtout dans l'informatique décisionnelle (ce dont il s'agit, là, d'une certaine façon) ou dans des domaines connexes (gestion documentaire, etc.)
Mais le jeu en vaut-il la chandelle ? Pour avoir mis en place des systèmes de ce type, les résultats sont souvent très bruités, et peu maîtrisables (donc généralement, insuffisants pour faire des propositions valables). On risque, voire il est quasiment sûr, que pour une boîte comme Amazon, proposer des textes d'auteurs inconnus plutôt que des best- ou medium-sellers est une stratégie contre-productive (car pour le pékin lambda, un auteur inconnu est un risque[1]). Amazon n'a pas vocation − pédagogique − à faire découvrir de nouveaux auteurs, mais uniquement à vendre un maximum de livres.
Du coup j'imagine des sites de promotion de jeunes auteurs, spécifiquement labellisés « découvreur de jeunes talents », tout ça… mais imaginer la stratégie ou le modèle économique qui fera vivre tout ce monde, je ne sais pas. Il y a sans doute des choses à gratter de ce côté-là, on peut valoriser socialement le fait de lire des « petits auteurs indépendants[2] » comme on le fait pour la musique, tout ça.
[1] d'autant plus qu'il est impossible de déterminer automatiquement la « qualité » d'un texte, surtout qu'il s'agit là d'une notion subjective. Le jour où un système automatique pourra digérer un roman et en conclure que j'ai de bonnes chances de le trouver à mon goût, j'offre le champagne à son inventeur (qui n'en aura rien à faire, de base, car il sera déjà riche.)
[2] expression qui prête à rire aujourd'hui…