Algorithme et classement Wikio : le point de vue de Jean Véronis [Interview]

Jean Véronis, créateur de l'algorithme du classement Wikio

Jean Véronis, créateur de l'algorithme du classement Wikio

Cela faisait longtemps que je ne vous avais pas parlé de Wikio, n’est-ce pas ?

Comme vous le savez, la date de publication du classement de mars approche à grands pas. D’ailleurs c’est demain !

J’ai essayé, comme le mois dernier, de tweet-liver les tops blogs en exclusivité.

Mais j’avais aussi envie de proposer quelque chose de plus consistant à mettre sous la dent des aficionados du kikalaplugrosse…

Ayant à l’idée de vous proposer un de ces jours un vrai billet de vulgarisation sur la manière dont est calculé le classement, j’ai établi un premier contact avec Jean Véronis.

Professeur de linguistique et d’informatique, directeur d’une équipe de recherche, impliqué dans diverses éditions, conseiller scientifique pour France Télécom… il est le créateur de l’algorithme qui permet à Wikio de calculer la “force du réseau social*” des blogs et d’établir cette échelle de valeur parfois contestée dans la blogosphère.

Ce qui m’a frappé en parcourant Technologies du langage, son blog, c’est la capacité qu’a cet homme-là à s’interroger sur son travail, sa volonté d’en expliquer les ressorts, et son écoute vis-à-vis des critiques que l’on peut lui remonter.

J’ai donc sollicité une première interview par mail, afin de demander à Jean Véronis de réagir aux principales remarques et interrogations autour du fameux classement…

Bonjour Jean Véronis. Wikio est loin d’être votre employeur à temps plein : à quel titre intervenez-vous chez eux ?

Je suis consultant. Mais le projet étant réellement fascinant par sa complexité technologique, j’y consacre une partie non négligeable de mon temps !

Quel est le but de l’algorithme qui produit le classement Wikio ?

Il existe des centaines de milliers de blogs dans chaque langue. Rien que pour le français, la base Wikio en comprend plus de 300 000. Que mettre en avant ?

Il ne s’agit pas que de la publication du classement chaque mois. Il fait évidemment pas mal de bruit sur la blogosphère car tout ce qui touche les egos est explosif, sans compter, bien entendu, les intérêts financiers qui peuvent entrer en jeu : bien des blogueurs tirent (ou essaient de tirer) un revenu de leur activité, et leur position au classement peut être favorable ou préjudiciable…

A titre personnel, le classement m’intéresse peu ; je n’aime ni les médailles ni les podiums (mais je n’ai rien non plus contre les gens qui en sont friands !). J’y vois surtout un outil de découverte. A chaque nouvelle sortie d’un classement je découvre des blogs qui m’étaient jusqu’ici inconnus et qui sont souvent de vraies petites perles.

Ce que les blogueurs ont du mal à comprendre, je crois, c’est qu’au-delà du jeu du “kikalaplugrosse” (puisque c’est le gentil surnom qui est donné au classement), il s’agit de mettre en place petit à petit un système analogue à celui du Page Rank pour Google, qui permette l’affichage sur les sites Wikio des billets les plus pertinents.

La pertinence, tout comme chez Google, est une notion bien subjective, bien entendu, mais nous serons probablement tous d’accord qu’on ne peut tout afficher chaque jour dans n’importe quel ordre, et que –probablement– un billet de Maître Eolas sur le procès Villepin devrait être mis plus en avant qu’un billet d’un blog inconnu qui se résume à un copié-collé d’un article de presse…

Comment faire ? Le problème est le même que pour Google. Google utilise aussi les liens comme base de son algorithme: en gros, plus une page reçoit de liens, plus elle remonte dans les pages de résultats. Le but de l’algorithme Wikio (outre le buzz mensuel) est identique.

Il vous arrive de le faire évoluer : cela arrive-t-il souvent et pourquoi ?

Non, depuis la mise en place en septembre 2008, il n’y a eu qu’une adaptation mineure (pour éviter les effets de “clique”, c’est-à-dire des gens qui se lient systématiquement les uns les autres). Mais le classement évoluera certainement de façon profonde dans les mois qui viennent, notamment pour prendre en compte la pénurie de plus en plus importante de backlinks.

Parmi les pistes, il y a la prise en compte de Twitter (et donc de backtweets) et des votes (qui n’interviennent pas à l’heure actuelle dans le classement). C’est relativement difficile, susceptible de spam et de biais, donc il faudra un peu de temps pour faire les choses proprement.

Vous l’annonciez sur votre blog : “ne vous attendez pas à un chamboulement complet du jour au lendemain“. Pour l’instant, on ne peut pas dire qu’il y ait eu de gros bouleversements dans le classement. Il va falloir attendre combien de temps pour que cela produise des effets ?

Très honnêtement, je l’ignore. Tout cela est expérimental, ce n’est pas une science exacte. Ce mois-ci en effet, il n’y a pas eu de changement dans le sommet du classement, mais il y a eu plus de changements dans les positions intermédiaires. Peut-être que les “cliques” du top sont trop énormes pour être impactées. Nous verrons bien. S’il faut trouver un autre système, j’ai quelques cartes en réserve ;-)

Depuis quelques temps, les blogueurs se plaignent de recevoir moins de backlinks. Vous confirmez ?

Oui, absolument. C’est particulièrement sensible dans le domaine de la high-tech, qui décline fortement dans le classement –dans les autres domaines, les backlinks ont toujours été assez rares. Il y a sans doute plusieurs raisons à cela.

La première est l’explosion de Twitter: pour signaler un article intéressant, on twitte, on ne backlinke plus. C’est tellement plus facile: un clic et c’est fait, alors que pour créer un hyperlien dans un blog, quelle galère. Non seulement il faut copier-coller l’url de façon plutôt malcommode, mais en plus il faut déjà avoir écrit soi-même un billet !

L’autre raison est plus insidieuse. Les blogueurs –en particulier ceux qui monétisent leur blog– se plaignent de plus en plus de la reprise de leurs écrits (et de leurs images) par des “usines à contenu”, donc le seul but est de monter dans Google à leur place. Ils ont donc de plus en plus tendance à ne publier que des flux tronqués, et donc (généralement) sans liens…

Pouvez-vous clarifier de quelle manière vous intervenez parfois sur les liens indexés : à quelles occasions ceci est-il nécessaire et à quoi touchez-vous ?

 

Il n’y a aucune intervention manuelle sur l’ordre du classement. En d’autres termes, pas de “triturages”, d’arrrangements pour faire plaisir aux copains ou pour des raisons marketing.

Mais il y a bien sûr intervention des documentalistes et des développeurs pour corriger les bugs, tuer le spam, les agrégateurs et autres bestioles indésirables !

Que répondez-vous aux gens qui soupçonnent Wikio de trafiquer les résultats en faisant des interventions manuelles ?

Il faut bien voir que le Web 2.0 n’est pas un long fleuve tranquille. Il y a toutes sortes de pièges, techniques et humains, et il est donc tout à fait normal de faire des ajustements techniques en permanence. C’est très différent d’une manipulation de résultats.

Après, il est impossible de convaincre ceux qui sont partis dans la théorie du complot. Ils croiront toujours que l’Homme n’a jamais mis le pied sur la Lune.

La publication du classement de février a été éprouvante pour Gaël, n°1 des blogs divers : il y avait à sa place un blog qui n’avait rien à y faire… Comment expliquez-vous ce bug (“gros gros bug” selon Dadavidov, “manipulation” selon Mtislav) ?

Je n’ai aucun moyen de dire si le blog incriminé a fait une manip intentionnelle ou pas, mais il est certain qu’il y avait une faille dans le système de détection des backlinks de Wikio, puisqu’il suffisait de truffer son flux avec des urls d’autres sites pour récupérer leurs backlinks. C’est un cas de figure un peu tordu : quel est l’intérêt d’un blogueur à faire ça ? Son flux devient illisible, puisqu’il renvoie chez les autres. Mais bon, c’est arrivé. Les ingénieurs de Wikio sont en train de colmater la brèche.

En conclusion, que pensez-vous des émotions qui s’expriment autour de ce classement ?

En tant qu’entomologiste du Web ça m’intéresse toujours beaucoup de voir comment s’agite la fourmilière quand on a tapé dedans, exprès ou non ! Mais je suis quand même épaté de l’importance qu’accordent certains au classement. Une place de plus ou de moins ce n’est pas la fin du monde, non ?

Quant au bug, c’est vrai, il est regrettable, mais même les plus grands (Google et Microsoft par exemple) ont des soucis de temps à autre, alors pour une petite équipe de la taille de celle de Wikio, je crois que c’est bien pardonnable.

Car il bien comprendre que le Web 2.0 est une jungle technique (et humaine !), avec une multitude de difficultés, de formats disparates et mal définis (ou mal utilisés), de truands, de filous, de farceurs, de bricoleurs, de sous-doués techniques — mais aussi, heureusement, une majorité de gens honnêtes, passionnés, intéressants à rencontrer. Comme dans la vraie vie, quoi !

Eh bien merci et à très bientôt, pour un prochain billet qui essaiera d’expliquer les mécanismes du classement en termes simples.

*Je crois que ce que mesure l’algo au bout du compte
c’est la force du réseau social de chaque blogueur.

Ce n’est évidemment ni l’audience
(nul ne sait comment la mesurer),
ni sans doute « l’influence»
(qui est une notion bien subjective)…

Jean Véronis

> Edit : Ce billet a reçu quelques corrections de français grâce à la relecture de Des Fraises Et…, que je n’ai pensé à solliciter qu’après publication.

> Voir aussi :

Qu’est-ce que Wikio ? Le B.A.-Ba
Comment est annoncé le classement Wikio ? [interview]
Les exclus top blogs Wikio du mois de Mars

Toute ma série Le Wikio pour les nuls

24 réponses à Algorithme et classement Wikio : le point de vue de Jean Véronis [Interview]

  1. “truffer son flux avec des urls d’autres sites pour récupérer leurs backlinks.” En dehors de l’allitération, je trouve le jargon assez moche et opaque (pléonasme).

    Mais j’ai tout lu et plutôt deux fois qu’une, pas tout compris, mais ça flatte un peu l’hémisphère gauche de mon cerveau d’occasion.

    Bises.

  2. See Mee dit :

    @Des fraises et… : Nous tenterons de rendre tout cela plus clair à l’occasion de prochains billets…

  3. Yann dit :

    Très bon interview qui a le mérite de clarifier si besoin était le fonctionnement de Wikio. Vive nos blogs !

  4. See Mee dit :

    @Yann : Ceci clarifie plutôt un état d’esprit.

    Pour le fonctionnement de l’algo, je referai appel à Jean Véronis pour un (ou des billets) plus didactiques.
    Dans cette perspective, que les visiteurs n’hésitent pas à m’adresser leurs questions sur l’élaboration du classement ! seemee.net [arobase] gmail.com

  5. Ferocias dit :

    Le classement c’est ce qui fait jaser mais ce qui est important ce sont les découvertes que l’on fait grâce au classement.
    Je ne crois pas que le nombre de visites soit fortement impacté par la place au classement (hormis pour le 1er de chacune des catégories qui a une visibilité plus importante).
    Si je prends le cas de mon blog, un bon billet avec un bon titre et un sujet intéressant une communauté plus large que les seuls amateurs de fictions mettant en scène des peuples précolombiens (nous sommes 4 en France :) ) reçoit des visites, le classement n’y change rien.
    Les visites viennent aussi de la publication sur certains blogs du classement et des petits mots élogieux ou non qui l’accompagnent ainsi que des commentaires que je dépose sur ces billets d’”exclusivité”.
    Il n’y aura jamais d’algo parfait. Google n’est pas à l’abri de la pratique du “google bombing”. Le Wikio Bombing sous la forme de cliques est assez naturel finalement. Certains, j’en suis, s’amusent avec le classement (ce n’est que du fun), l’un des moyens étant l’échange de backlinks. En même temps comme je l’ai indiqué dans un billet récent je donne beaucoup plus de liens que je n’en reçois (générosité tu me perdras :) ) parce que je crois à la force de la culture du partage du Web 2.0.
    Des bugs il y en a. Au mois d’août Les Peuples du Soleil se sont effondrés dans le classement du fait d’un erreur quelque part.

  6. Océane dit :

    Intéressant ! je comprends la difficulté. En novembre et décembre (et je crois janvier, dans le Top 20 divers il y avait un blog, dont je n’entendais guère parler, par curiosité j’ai cliqué, et c’était comment dire, assez vide. J’ai eu la fourberie de regarder ses backlinks, et cette petite rigolote avait simplement ouvert quelques autres blogs, avec très exactement 0 contenu, et simplement un link vers son blog principal, très régulièrement. ce genre de comportement j’ai du mal à piger: pourquoi vouloir être dans un top si on sait ne rien proposer en terme de contenu ?

    Pour ma part, je suis ravie de ma montée, surtout que le mois d février a été assez calme de mon côté, mais cela signifie surtout à mes yeux qu’il y a eu des personnes à qui j’ai manqué, et qui ont eu la gentillesse de m’évoquer chez eux ! C’est ce genre de link qui fait plaisir: non pas celui qui répond à une chaine automatisé sous couvert de création, mais celui qui fait se demander ce que X ou Y peut penser sur un sujet, ou ce qu’il devient, ou simplement mettre en exergue un texte intéressant !

  7. Petit test pour t’embêter et voir où est passé mon gravatar.

    P.S. franchement pas la peine de mettre l’edit Edith ; ça y est, j’ai l’étiquette de correcteur attaché à mes basques… (bah, ça ne me dérange pas, après tout).

  8. detoutderien dit :

    rhooo “éprouvante” est exagéré, j’ai suivi l’enquête de Mtislav et Dadavidov avec amusement surtout

    je suis moi aussi épaté par l’importance que peuvent donner certaines et certains à ce classement qui reste avant tout un jeu, non ?

  9. Nicolas dit :

    Pareil que Gaël : “je suis moi aussi épaté par l’importance que peuvent donner certaines et certaines…”.

    Très bien ce billet (j’arrive en retard…). Ca nous rend le Véronis humain. (smiley !)

  10. See Mee dit :

    @Ferocias : Bien d’accord avec toi pour parler de découvertes, même si j’avoue ne pas avoir exploré chaque blog du top (euh, “jeux d’argent” par exemple, très peu pour moi !). Cette visibilité n’est peut-être pas donnée à tout le monde, et c’est là que je rejoins Véronis : l’intérêt est que cela tourne. Bon je dis cela sans doute parce que je suis perdue dans les limbes du classement !

    @Océane : Rhôôôô, qui a osé ? Et oui, cela peut être une motivation de poursuivre son travail (périodes de démotivations ou pas), des petits signes de reconnaissance comme des backlinks. Y compris d’ailleurs lors des chaines, qui n’ont pas d’autre but que de créer du lien.

    @Des fraises et… : Alors, vas-tu le retrouver ce gravatar ? C’est pas terrible ces commentaires sans le visuel des visiteurs…

    @Detoutderien : Dans ma tête, il y avait bien évidemment des guillemets, mais j’ai oublié de les écrire !

    @Nicolas : Véronis a insisté sur la “taille humaine” de Wikio, je crois qu’on ne s’en rend pas forcément compte, vu le nombre de blogs que brasse l’outil à l’échelle européenne.

  11. buzz dit :

    Très intéressant cette interview de Jean, on y apprend quelque informations sur comment pourrait évoluer le TOP Blog de Wikio dans le temps. Et ça me parait très bon !

    Très bonne interview bravo.

  12. dadavidov dit :

    Ce qui est “éprouvant” pour Gaël, c’est que c’est toujours le classement Divers qui sort en dernier… Quelle attente (et quel stress) ;)

    [Merci pour le lien :) ]

  13. See Mee dit :

    @Buzz : Merci de votre intérêt ! Bien entendu, je vais continuer à suivre tout cela.

    @Dadavidov : Et encore, quand il sort (le mois dernier aucune exclu n’a été publiée). Je n’ai pas conservé l’historique, mais ce coup-ci le “multi-thématique” a fait parti des premières exclus sorties.

  14. Eléonora dit :

    Du coup, j’arrive sur ta page et j’ai tout lu…J’avoue que je comprends tout doucement…l’argo du net, mais à force cela ira bien dans ma petite tête…Juste une question…comment certains blogs qui ne répondent jamais aux commentaires ou ne vont jamais chez les autres, arrivent en tête du classement…????? J’ai eu beau faire 3 heures par soirée de commentaires sur un tas de blogs…et je suis juste au milieu du classement…Ou bien mon blog n’est pas intéressant, ou bien j’ai râté quelque chose en route….Du coup, je me pose des questions. Non pas que je sois accro des chiffres…ou jalouse, loin de là, j’adore mes photos. Mais savoir comment faire pour lui donner du mordant…Je pioche, je pioche des idées sur vos blogs. J’ai vu aussi les billets sur le RSS…Je tente les mots clés etc, etc….Merci de votre aide ….et de vos réponses…

  15. See Mee dit :

    @Eléonora : Bienvenue !
    Le classement est basé sur le nombre de liens entrant vers un blog donné, ce n’est pas un indicateur de l’amabilité du tenancier, hélas ! ;-)
    Quand à expliquer que tu aies du mal à monter, ne connaissant ton blog que grâce à ton message, pas facile. Une hypothèse : la concurrence est rude dans la catégorie gastronomie !

    J’ai vu tes photos, elle sont en effet très appétissantes ! Tes textes sont courts, tes recettes claires, tu as des commentaires, le thème de ton blog est efficace…

    Tout ce que je peux dire est que tu es dans la bonne démarche, en publiant régulièrement, et en essayant de le faire connaître ailleurs… du moment que tu n’y vas pas avec de gros sabots, en veillant à poster des commentaires pertinents (comme ici).

    Peut-être que tu pourrais essayer de créer des animations de temps en temps, d’imaginer des choses qui donnent envie à d’autres blogueurs d’interagir avec toi ?

    Bonne continuation !

  16. Eléonora dit :

    Merci beaucoup See Mee de ta réponse et zou, je vais aller au salon du chocolat qui se tient à Strasbourg…On a enfin un peu de soleil…alors c’est du bonheur…Bon dimanche à toi et à tous !

  17. Article très intéressant, qui montre bien que twitter prend de l’importance et se vulgarise.

  18. See Mee dit :

    @Arthur Lacoste : Bonjour et bienvenue ! Vous voulez dire Wikio ? Parce que Twitter, je ne vois pas : ce n’est pas abordé dans l’interview…

  19. Pensez BiBi dit :

    “En gros, plus une page reçoit de liens, plus elle remonte dans les pages de résultats.” (…) “Depuis la mise en place en septembre 2008, il n’y a eu qu’une adaptation mineure (pour éviter les effets de « clique », c’est-à-dire des gens qui se lient systématiquement les uns les autres).”

    Tant qu’on en reste là, tant qu’on persiste sur le critère de cet algorithme, on peut s’interroger sur le Classement Wikio et sa “domination” dans la blogosphère française.
    La “pertinence ” dont parle Jean Veronis est un leurre et une esbrouffe supplantée par “les effets de clique”.

  20. See Mee dit :

    @Pensez Bibi : Jean Véronis lui-même le dit : “Mais je suis quand même épaté de l’importance qu’accordent certains au classement”. Ce genre d’outil prend une place peut-être trop importante dans l’inconscient collectif des blogueurs.
    D’où l’intérêt d’en expliquer les mécanismes… cela le met à la portée du plus grand nombre, et cela relativise aussi un peu les choses.

    Il est finalement assez sain de considérer cela comme quelque chose de plutôt ludique !

    Après, une mise en relief des blogs qui reçoivent le plus de lien, c’est tout de même intéressant, selon moi. Cela permet de découvrir des blogs (et d’autres outils complètent cela avec leurs propres critères). Et cela stimule la dynamique des échanges entre blogs (on peut presque se demander s’il y aurait autant de liens si de tels incitations n’existaient pas !). Le tout est de continuer à en déjouer les effets pervers…

  21. Pensez BiBi dit :

    Il y en a qui sont “épatés”. D’autres trouvent ça “ludique”. On est – hélas – à l’Ere du Fun.
    Amusez-vous bien.

  22. [...] à l’intégration de Twitter dans Wikio (je vous invite par ailleurs à aller lire l’interview qu’elle a eu la gentillesse de me demander récemment). Je vous ai promis la transparence la [...]

  23. [...] de François Bon, certaines analyses de Thierry Crouzet, les algorithmes de Wikio présentés par Jean Véronis. Impossible cependant de poursuivre : BiBi ne comprend qu’un mot sur dix. Et encore ! Certes, il [...]

  24. “La première est l’explosion de Twitter: pour signaler un article intéressant, on twitte, on ne backlinke plus. C’est tellement plus facile: un clic et c’est fait, alors que pour créer un hyperlien dans un blog, quelle galère. Non seulement il faut copier-coller l’url de façon plutôt malcommode, mais en plus il faut déjà avoir écrit soi-même un billet !”

    Un peu plus d’un an plus tard (oui je ne repasse que très rarement sur les articles que j’ai commenté), See Mee, je confirme que je parlais bien de Twitter, qui est effectivement mentionné par votre intervenant.

Répondre

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Twitter picture

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Connexion à %s

Suivre

Get every new post delivered to your Inbox.

Joignez-vous à 34 followers