Vos billets, vous appréciez qu’ils circulent, et notamment qu’ils soient relayés sur Twitter, n’est-ce pas ?
Et quand quelqu’un les retweete (RT), peut-être vous attachez-vous à le remercier ?
Oui, mais voilà, comment savoir qui a fait cette recommandation ? Pas compliqué, me direz-vous, il existe pas mal de solutions pour être informé des liens vers vos billets depuis Twitter. A commencer par les alertes mail de BackTweets Alerts, ou tout bêtement le très pratique bouton vert de TweetMeme qui va jusqu’à afficher nombre de RT vers les articles de votre blog.
Ok. Mais avez-vous déjà pris le temps de comparer le nombre de RT affiché par les différents services ? Tiens, étonnant, on ne retrouve pas le même nombre de RT selon le service !
Et à l’heure où, avec Twikio, Wikio prend en compte les RT pour établir le classement des blogs, comment cela se passe-t-il ? Eh bien vous allez voir que nous avons frôlé le scandale, les cordonniers étaient les plus mal chaussés !
Je vais vous en faire la démonstration avec un cas concret. J’ai choisis un billet qui date du début du mois… et qui concerne justement Wikio.
— Une certaine disparité dans ce qui est comptabilisé
J’ai comparé le décompte des liens émis depuis Twitter (les BT, “backtweets” inclus dans le message de retweet) vers différents billets que j’ai publié. Globalement l’écart entre les différents services n’est pas trop important, mais les variations peuvent être significatives sur certains billets.
Par exemple sur celui-ci : Et si on demandait à Pierre Chappaz ce qu’il pense de l’effet Twikio ? [Interview], publié le Lundi 7 juin 2010 à 22:04.
Ce tableau comparatif est basé sur trois outils différents : Toopsy, TweetMeme et Wikio Sources de Wikio labs. Je n’ai pas fait figurer les informations obtenues du très commode Backtweets Alerts (qui m’envoie un mail dès qu’il lien vers mon blog est diffusé sur Twitter), qui lui en a repéré 11.
Les données de mon recensement sont valables au mardi 30 au soir.
| BackTweets (BT) | Toopsy | Tweet Meme |
Wikio Sources |
| 9 BT : @Lolobobo @Mement0 @Eowine @Duduffe @Blogexperience @Nwkbiz @Nbenyounes @Blogexperience RT @Blogexperience: Wikio : son PDG répond aux critiques et questions des blogueurs #BExpce http://bit.ly/aExO2Z (rappel) | ★ | ★ | ★ |
| 1 BT : @joelle_dubois RT @BlogExperience: Et on demandait à Pierre Chappaz ce qu’il pense de l’effet Twikio ? [Interview] http://monblogessai.wordpress.com/[...] #BExpce | /// | /// | ★ |
| 1 BT : @Dadavidov says: Et on demandait à Pierre Chappaz ce qu’il pense de l’effet Twikio ? [Interview] (BlogExpérience) http://bit.ly/b67Doc #wikio - | ??? | ★ | ??? |
| 4 BT : @Nborde @Eriiiic @Iboux RT @Pierrechappaz: “Interview chez Seemee “ce que je pense de l’effet Twikio sur le classement des blogs”: http://wik.io/H4mv ” | ★ | - – - | !!! |
| 2 BT : @Sigma_me @wikio_fr @: “Et on demandait à Pierre Chappaz ce qu’il pense de l’effet Twikio ? [Interview] : http://wik.io/H4mv | ★ (compté 3 BT dont 1 ”bugué”) |
- – - | !!! |
| 2 BT : @blogagency @buzzistic: “chez @BlogExperience Et on demandait à Pierre Chappaz ce qu’il pense de l’effet Twikio ? [Interview]: Pierre Chapp… http://bit.ly/d3bgnW | ★ | ★ | ★ |
| Total de backtweets comptés Total de comptes (@) émetteurs (sans compter le mien, au 26/06/2010) |
18 BT 14 @ |
12 BT 9 @ |
11 BT 8 @ |
Merci à tous ces retweeteurs ! Bon, alors, qu’est-ce ce que cela donne ?
Dans le tableau, l’étoile [★] signifie que les BT ont bien été pris en compte par le service. Voyons ce qu’il en est quand cela n’a pas été le cas…
Première observation :
Un tweet n’est pas compté par Toopsy et TweetMeme :
- [///] = Le tweet de Joëlle Dubois.
Joëlle Dubois semble avoir retweeté mon 1er tweet, mais allez savoir pourquoi, celui-ci semble avoir été tronqué : il pointe sur la page d’accueil de mon blog, et pas sur le billet. Mais alors, pourquoi Wikio l’attribue-t-il bien au billet ?
Seconde observation :
Un tweet n’est pas compté par Toopsy et Wikio :
- [???] = Le tweet de Dadavidov (via bit.ly) est sur le “more” du billet.
Cela parait surprenant qu’un lien raccourci quand la personne a cliqué sur “lire la suite” ne soit pas compté par Wikio, car cela excluerait la prise en compte des backtweets effectués après avoir lu le billet ! Je ne sais pas si on peut faire une généralité, car ce “more” est un peu bizarre : il est suivi d’un “-4101” que je ne m’explique pas… TweetMeme, lui, le relie tout de même au billet et le comptabilise.
Troisième observation :
Les deux séries de BT à partir du lien mis par Pierre Chappaz ne sont pas comptés :
- [- - -] = par TweetMeme,
- [!!!] = et par… Wikio !!!
Voyons d’abord TweetMeme : ce service ne comptabilise que les liens passés par une liste bien définie de raccourcisseurs (> voir la liste des “url shorteners” acceptés par TweetMeme). Le nombre qui apparaît donc sur leur bouton vert n’est pas tout à fait représentatif du nombre total de retweets.
Ce lien est passé par le raccourcisseur d’URL (wik.io) du portail Wikio. TweetMeme ne l’a donc pas compté (comme elle ne compte pas non plus les liens minu.me, ni ceux de wordpress wp.me). Simple à comprendre.
Mais c’est là que, mesdames et messieurs, vous allez réaliser que Wikio fut, dans ce cas de figure, pour le moins paradoxal : il n’a pas compté pas les liens composés avec son propre système recommandation, et émis par son propre patron (@Pierrechappaz) et compte Twitter (@Wikio_fr)
— Pourquoi Wikio n’a pas comptabilisé les recommandations émises avec son propre raccourcisseur ?
Quelques temps après la parution de ce billet du 7 juin, je suis allée découvrir les nouvelles pages de backweets proposées par Wikio (onglet “Twitter” dans la page Wikio Sources d’un blog donné).
C’est alors que je me suis rendue compte que les liens dont Pierre Chappaz était la source n’apparaissaient pas. J’ai cliqué, cliqué encore une fois sur ce foutu lien, et… une url fugace et passée sous mes yeux avant d’être remplacée par la mienne. Alors j’ai compris !
Techniquement, cela s’explique sans mal. Quand Pierre Chappaz a retweeté l’interview que j’ai fait de lui, il l’a fait depuis… le portail Wikio, pardi ! Et plus précisément à partir du résumé de mon billet.
C’est logique : étant l’interviewé, il en connaissait le contenu, il l’a donc facilement trouvé dans les derniers billets annoncés sur le portail et l’a tout simplement recommandé avec le bouton “Twitter” mis en place par son staff. N’importe qui retrouvant sur le portail un billet qu’il a a priori déjà lu et apprécié peut être amené à faire de même.
Conclusion : la destination est bien mon billet, mais l’url d’origine est le portail Wikio.
Quand je me suis rendue compte de cela, j’ai questionné le patron de Wikio, qui m’a fourni les explications suivantes :
Sur la page Wikio, un clic sur le bouton Twitter associé à un article publie donc sur Twitter le titre de l’article et l’url correspondante en wik.io.
Cette url redirige vers l’url correspondante de l’article sur Wikio (en wikio.fr/info), laquelle redirige vers l’url originale de l’article. Il s’agit de redirection 301 pour les robots, comme le GoogleBot ainsi que le bot de Backtype (le service auquel Wikio a souscrits pour générer cela, NDLR) qui a été ajouté dans la liste des agents que l’on détecte.
Autant Google prend bien en compte une double redirection 301, autant le bot de Backtype ne semble pas le faire comme tu l’as remarqué* :
Il s’arrête à la premiere redirection, et résoud donc “wik.io/ID” en une simple url wikio.fr/info?id=xyz.(…)En ce qui concerne Google, la redirection 301 que nous appliquons depuis 2008 transfère bien du pagerank de Wikio vers les blogs. L’url en “wikio.fr/info?id=xyz” n’a pour objet que de faciliter les statistiques internes, et d’ailleurs quand nous aurons le temps de nous occuper de ça nous nous en débarrasserons, car elle prête à confusion si on ne regarde pas le code, alors que ce que nous faisons est absolument correct.
Pierre Cappaz, PDG de Wikio
L’opération de redirection est donc complètement transparente pour le retweeteur. Mais “spolie” le blogueur auteur du billet recommandé.
Je vous le redis en clair : les backtweets émis avec wik.io n’étaient pas (au moment où j’ai fait mon comparatif) comptés par Wikio lui-même. Un comble !
— Un bug auquel Wikio a déjà remédié
Et à Wikio, apparemment, personne n’avait remarqué que leur propre système rendait Twikio bancal !
Après que je lui aie signalé cette incongruité, Pierre Chappaz m’a fait savoir que les dispositions suivantes seraient prises :
Nous allons donc régler le problème asap :
- en demandant à backtype la prise en compte de wik.io ,
- et en faisant une redirection 301 directe de wik.io vers le site de destination.(…)Dans les startups comme Wikio on avance vite, et on loupe parfois une balle. Mais on va vite la rattraper !
Depuis j’ai fait le test avec un billet du Coucou (L’ordre règne à France Inter), et voyez vous-même, 3 RT en wik.io que vous retrouverez dans Wikio sources :
- @detoutderien2 : Je vous recommande l’article de @lecoucou http://wik.io/HT5k1
- @CyCee : Le+coucou+de+Claviers:+L’ordre+règne+à+France+Inter : http://wik.io/HT5k1
- @unouveaucompte : Je vous recommande http://wik.io/HT5k1 allez commenter “l’ordre règne à france-inter” chez @lecoucou
Ouf, Wikio a flirté avec la schizophrénie, mais le portail ne nous aura pas privé trop longtemps de points au classement (6 en ce qui concerne cet exemple, heureusement que je m’y intéresse surtout à titre de curiosité) ! Enfin, pas si sûr…
En faisant aujourd’hui même le même test sur mon billet d’hier, j’obtiens à nouveau un décalage : Toopsy 10, TweetMeme 7, Twikio 6… sur un total de 12 tweets, une fois toutes les sources croisées ! Et là, je n’ai pas d’explication (à moins que Twikio ne compte pas les tinyurl ?) : on n’est pas sortis de l’auberge…
A propos de Wikio, je crois bien que j’ai un peu fait le tour de la question. Même si je n’ai pas partagé tout ce que j’ai compris sur Wikio (mais je répondrais à vos interrogations volontiers), je crois bien que je vais lever le pied sur le sujet (sauf à publier ma dernière interview à propos de E-Blogs, mais c’était prévu de longue date, et c’est à un copain que je donnerai la parole).
Et justement, je commence dès ce week-end, en me dispensant d’annoncer des tops blogs, vacances obligent ! En attendant mon retour, que diriez-vous de retweeter mes billets ? Je ferai les comptes plus tard…
* * * * *
> A voir aussi :
Twikio : pourquoi Wikio va chambouler le classement
Toute ma série Le Wikio pour les nuls
* * * * *
* Euh…, voui, vous l’avez peut-être remarqué, P. Chappaz s’est mis à me tutoyer, il l’avait déjà fait d’ailleurs quand je l’ai croisé en avril à la réunion d’info à propos de Twikio. J’avais réussi à le lui faire oublier lors de l’interview, mais ça n’a pas duré. J’ai parfois du mal à me familiariser avec ce tutoiement qui semble de mise sur le net (encore une idée de billet pas encore concrétisée !), à fortiori dans ce contexte. Mais difficile de lutter, je ne vais pas faire ma snob !



Je crois qu’une partie des bugs sont connus de longue date mais ils n’ont pas le temps de corriger…
Bonjour,
nous avons déjà longuement discuté à la soirée Twikio et par mail, mais à votre demande je vais rester sur le vouvoiement, même si le ton général de notre discussion autour de quelques verres de vin était plutôt au tutoiement
Il faudrait que je reprenne billet par billet les différents cas que vous mentionnez dans votre tableau, cependant avec le “probleme” du wik.io cela risque d’etre un peu faussé. C’est normalement corrigé (mais on est pas à l’abri d’une rechute du coté du fournisseur de données, c’est pourquoi on met en place différents outils pour gérer correctement ces cas), mais je ne sais pas si on va pouvoir être complètement rétroactifs.
Tout d’abord, avant d’aller plus en avant, il faut assimiler le fait que nous fonctionnons sur la base du data provider BackType, qui est la société éditant backtweets.com
On a évalué plusieurs fournisseurs de données (ainsi que la possibilité de scanner nous même le firehose de twitter), et BackType semblait répondre parfaitement à notre demande. Nous avons de bons contacts avec l’équipe de backtype, même si on peut avoir de temps en temps un petit quack technique, ce qui est arrivé sur le cas de notre service wik.io
Nous étudions également d’autres alternatives, notamment le fameux “gnip.com” qui est un serieux candidat dans le domaine, mais bien plus touffu et générique que backtype.
Il faut savoir qu’il n’y a pas tant que ca de fournisseur de données _sérieux_ sur le cas des backtweets. Lorsqu’on en a discuté, Christopher Golda (le fondateur de backtype) me parlait de 5M/jour de liens capturés dans le firehose de twitter. Concernant les éventuels “gaps” et pertes de liens, je vous retransmet sa réponse (de décembre, donc le volume a du encore augmenter..) :
“This number has since exceeded 5M per day; we don’t get them all, but I can assure you we generally get more than anyone else. This is a limitation with the Twitter APIs (even with our more exclusive access to their dataset) — unfortunately not all tweets w/ links are always made available. ”
On est donc jamais garant d’avoir la totalité des backtweets, les méthodes varient et il y a de nombreux _pièges_ dans la résolution des URLs.. ceci explique que vous pouvez trouver des différences entre les services qui exploitent ces données.
Partant de la, j’ai repris votre dernier exemple : http://monblogessai.wordpress.com/2010/06/28/quand-les-shortcodes-compensent-les-limitations-de-wordpress-com/
A l’instant, je vois les stats suivantes :
TweetMeme : 7 (6 présentés)
Topsy : 10 (3 présentés)
Twikio : 8
Twikio a donc un peu plus de tweets que TweetMeme
Vous remarquerez par ailleurs que tous les tweets ne sont pas montrés sur tweetmeme et topsy.
Topsy en annonce 10 mais n’en montre que 3 (j’ai raté une fonctionnalité ?)
Je soupconne Topsy de se baser également sur BackTweets, et d’afficher simplement les scores sans forcement tout capturer.
En effet, voici ce que montre backtweets.com : http://backtweets.com/search?q=http://monblogessai.wordpress.com/2010/06/28/quand-les-shortcodes-compensent-les-limitations-de-wordpress-com/
10 résultats indexés donc.
Cependant regardez les deux derniers listés.
Les tweets semblent avoir des soucis de balisage.
Voici ce que l’on récupère dans le flux : http://pastebin.com/brePVLLE
Il semblerait donc que des erreurs de balisage se soient glissées dans ces tweets, pour je ne sais quelle raison.
Il y a également l’ajout de paramètres de tracking : ?utm_source=twitterfeed&utm_medium=twitter
Normalement nous nettoyons correctement ces URLs afin d’associer les tweets aux articles des sources que nous référençons. C’est un cas classique de problèmes d’ “urls canoniques”..
Entre ce problème d’urls canoniques et le balisage explosé, il est possible que ces tweets aient été mis de coté par nos agents, c’est un cas qui vient d’etre remonté et qui sera étudié par notre équipe de développement.
On vous tiendra au courant bien évidemment
C’était un peu long, mais tout cela devrait vous montrer que nous essayons vraiment de faire en sorte que tous les cas particuliers soient pris en compte, et que c’est loin d’être un processus simple lorsque l’on traite ces informations sur plusieurs centaines de milliers de sources (et donc des millions d’articles chaque mois..). Il y aura forcement des correctifs à apporter, et nous sommes à l’écoute de vos remarques afin de faire évoluer le service au mieux.
Nous allons d’ailleurs par la suite faire en sorte de vous présenter pour chaque article les différents backtweets/backlinks/etc.. directement sur le site www, afin de rendre tout cela un peu plus visible en dehors du labs.
Voila, en espérant avoir éclairci un peu les zones d’ombres..
Cordialement,
Alexis
Product Manager – Wikio
@Nicolas : On dirait que c’est pas ça…
@Alexis : Wahou, je n’imaginais pas que ce soit si complexe, notamment ces histoires de balises… Merci en tous cas Alexis d’avoir apporté ces compléments utiles à ceux qui ont besoin d’explications techniques plus pointues.
Concernant les stats sur le billet à propos des shortcodes, je crois avoir compris qu’il y avait eu un petit délai dans la prise en compte des 2 derniers RT (je ne les voyais pas hier). Et comme Topsy — et TweetMeme — “effacent” progressivement la liste des résultats, il est effectivement difficile de retrouver l’écart de 2 qui reste avec Topsy. Je sais juste qu’un de ceux-ci est de moi, m’adressant @Tregor.
Bon sinon, pour le tutoiement, le tien ne me perturbe pas !
C’est juste que je ne suis pas encore habituée aux manières des entreprises 2.0, où le patron de la boite tutoie ses utilisateurs et vice-versa ! Sans doute une vielle image ancrée dans mes représentations, mais pas que : le tutoiement entretient l’illusion d’être au même niveau. Il ya aurait plein de choses à ajouter, il va vraiment falloir que je l’écrive, ce billet !
Pierre est une personne très accessible, qui est également un blogueur et un des principaux utilisateurs de Wikio. Ce qui explique le tutoiement à mon avis puisqu’il part effectivement sur un pied d’égalité.
D’ailleurs, comme il est un de nos plus gros utilisateurs, c’est également notre utilisateur qui remonte de nombreux bugs.. Un vrai casse tête pour un responsable produit, mais également la garantie de ne pas laisser trop de problèmes non detectés
Mais au final, il vaut mieux avoir un pdg d’une boite proche de ses utilisateurs non ?
Concernant la partie technique de ton commentaire, ce n’est effectivement pas quelquechose de trivial :
- Très gros volume de tweets contenant des liens
- Pas de garantie d’exhaustivité de la part de Twitter
- Obligation de “résoudre” les URLs-Shorteners par millions tous les jours
- Problèmes d’urls canoniques (plusieurs URLs qui sont en fait une seule et même page)
- etc..
Au final, tout ces éléments font qu’il est impossible pour n’importe quel service de garantir l’exhaustivité de tous les cas de figures. Mais bien évidemment le but est de s’en rapprocher !
L’autre point non trivial, c’est le décalage entre le moment ou un article est publié, le moment ou il est backtweeté, et la prise en compte de tout cela.
Le fait que tout ca passe par de nombreux “tuyaux” fait que l’on aura _forcément_ des décalages temporels. On en est pas encore au vrai real-time sous forme de “push” au lieu de “pull”.
C’est ce que l’on met en place progressivement sur la partie capture des billets (en gros, lorsqu’un billet est publié, on recoit directement une notification pour que la capture s’enclenche le plus rapidement possible du coté de Wikio, plutot que de procéder par “polling”)
Par contre ce sera un peu plus long et compliqué à mettre en place pour l’ensemble des données complémentaires que l’on aggrège depuis les médias sociaux.
Voila, n’hésitez pas si vous avez d’autres questions
Tu (vous ?) as une vraie qualité d’investigation. C’est rare, et rafraichissant. Merci pour l’éclaircissement (et merci à Alexis pour les informations complémentaires).
@Memento : Ne me charrie pas, sinon tu auras droit au vouvoiement ! Sans rire, merci. Certains feraient bien de comprendre que si je m’intéresse à Wikio, c’est parce que c’est un super terrain d’investigation pour qui aime bien faire tourner ses méninges ! Avec l’avantage non négligeable d’avoir toujours quelqu’un pour répondre aux questions avec amabilité et même intérêt, y compris celles de non-influenceurs. Finalement peut-être que P. Chappaz me tutoie parce que j’ai le culot de le solliciter le week-end ?
Tout ça est magnifiquement décortiqué, mais qu’est-ce que c’est compliqué! Je ne me vois pas surveiller les RT, j’ai déjà du mal à bloguer en ce moment!
[...] En attendant BlogExpérience : A quel service se vouer pour recenser les backtweets ? [...]
Les RT, c’est un truc terrible… Après la lecture de ton article, je me suis amusé à comptabilisé les RT réels de mes derniers billets et ce que me donne Tweetmeme… D’office pour le dernier, sur 10 il en manque 2 qui pourtant ont été RT normalement.
Il en manque aussi qui ont utilisés la fonction RT native de Twitter et bien plus embêtant pour des stats il manque bien évidemment toutes les citations de l’article hors RT et ça, c’est presqu’impossible à trouver de manière automatique (j’ai utilisé la recherche en utilisant le titre de l’article ainsi que quelques hashtags). Et pourtant, ils sont aussi importants que les autres surtout qu’ils sont à leur tour RT.
Dans ton tableau d’ailleurs, tu ne t’es pas amusée à chercher qui avait pu parler de ton article en écrivant son propre tweet, des fois on a vraiment des surprises de voir que ce n’est pas notre tweet qui est le + RT mais celui de quelqu’un d’autre.
Je pense qu’il est techniquement impossible d’avoir quelque chose de réellement fiable sur le sujet, peu importe comment l’on s’y prend. Même les stats du site lui-même se fourvoient sur la source qui peut passer de Twitter à bit.ly en passant par hootsuite (et là forcément t’as juste en stats ceux qui cliquent). C’est un gigantesque bordel statistique
Alors celui qui nous conçoit un bot capable de faire des recherches fiables et tient compte des RT, il a moyen de rentabiliser son truc je crois… (bon il faut aussi les serveurs pour emmagasiner le truc, oublier le temps réel et faire des millions de requêtes par jour ce qui, avec l’API est impossible)
Bonjour,
J’aimerais bien comprendre un truc, les backlinks qui sont pris en compte sur wikio sont ceux uniquement des articles ? Lorsqu’on figure dans les blogroll de blogueuses ça compte ?
Et aussi quand je cherche ma source ici (http://labs.wikio.net/fr/source?url=www.orphea.be) je vois que je n’ai rien de relier à twitter, comment le faire ? Comment savoir via wikio le nombre de RT que j’ai ?
Merci d’avance pour vos réponses
Ca fait longtemps qu’on n’a pas vu la taulière, ici ! Au fait, j’espère qu’elle va bien. Je me permets de répondre à sa place.
Dans les labs, de Wikio, il n’y a effectivement que les liens présents dans les billets, pas les blogrolls. Pour être précis, il faut évidemment que le blog citant le tien soit référencé par Wikio mais aussi que ces flux soient complets.
Pour les backtweets, il n’y a plus d’outil chez Wikio permettant de les visualiser. Je recommande l’utilisation de http://backtweets.com/ qui permet de voir les tweets où le blog est cité (en page de résultat, il y a même une option pour recevoir un mail quand on est cité mais elle n’est pas toujours opérationnelles).
Hop !
Merci beaucoup pour cette rapide réponse
Du coup je ne sais plus si je dois retweeter mes articles via wikio ou via un autre raccourcisseur d’url
A priori, Wikio reconnait tous les raccourcisseurs. Mais ce n’est pas très important, Wikio utilise Backtweets, donc on peut facilement voir si nos tweets sont pris en compte (attention, ça n’est pas immédiat, aujourd’hui par exemple, ça merde, il vient juste de me repérer les backtweets de ce matin).
Bienvenue à Orphéa, et merci à Nicolas d’avoir apporté ces réponses !
Dingue, moi qui croyais que cela faisait presque partie de mon identité, à force…
La taulière va bien mais tant d’investissements à prodiguer par ailleurs qu’elle a presque oublié ce que bloguer veut dire.
La bise à tous les amis qui lisent ce commentaire.