mardi 10 novembre 2009

Surprises avec l'indexation du contenu Twitter par les engins de recherche

Le 5 novemvre 2009, j'ai voulu vérifier si les engins de recherche avaient déjà indexé mon billet du 2 novembre: "Web analytics ou cybermétrie - mesurer la valeur de ses décisions web". J'ai donc entré comme critère de recherche "Web analytics ou cybermétrie" sans les apostrophes. J'ai eu quelques surprises.
  • Mon billet était le premier lien non commandité de la page de résultat de Google. Comme mon blogue est hébergé chez Blogger, un service de Google, je m'attendais d'y trouver mon billet mais pas dans le premier lien.
  • Dans Bing, mon billet n'était pas dans la première page de résultats.
  • Sur la page de résultats de Google, le deuxième lien non commandité était mon tweet de 12h12 le 2 novembre où j'annonçais la publication du billet. Ça c'était toute une surprise. Dans les dernières semaines, la presse techno avait parlé d'accords entre Twitter et Google pour l'indexation des tweets. Je croyais que ça viendrait dans quelques mois. Il semble que ce soit déjà là, du moins en partie.
 Pour les autres surprises, je vous invite à jouer aux différences.
Dans l'image ci-dessous, on voit le tweet original et dessous, ce qui est présenté dans la page de résultats de recherche.


 Vous remarquerez 2 choses étranges:
  • les URLs de bit.ly diffèrent;
  • l'heure présentée par Google précède de 9 minutes celle fournie par Twitter.

Finalement, un autre mystère demeure. En allant voir la page en cache de Google, je vois mon profil Twitter datant du 29 octobre, soit quelques jours avant l'indexation du tweet. C'est donc dire que la cache de Google ne reflète pas le contenu du jour de indexation. Curieux...


Aucun commentaire:

Publier un commentaire