Pourquoi je n’aime pas wikio ?
Thomas SOUDAZdans Référencement le 19 septembre 2008 à 1 h 32 minpour ça : Disallow: /webinfo
cette ligne astucieusement placée dans le robots.txt empêche les robots de suivre les liens vers les articles / billets originaux, bonjour l’hypocrisie avec les éditeurs de contenu.
Apparement je ne suis pas le seul à trouver la politique SEO de wikio discutable d’autres n’aiment pas wikio, sa capacité à se positionner devant les contenus originaux, sa méthode assimilable au scrapping, et enfin ses redirections*.
Le volume des pages indexées de wikio.fr (hors activité shopping) qui, rappelons le, est un agrégateur suffira à éclairer mes propos.
*Si Otto croit avoir été entendu au sujet des redirections, il s’est fait rouler dans la farine par le robots.txt.
edit : wikio a modifier son robots.txt quelques heures après la publication de ce billet, un sans faute dans la gestion du bad buzz.
oui j’ai vu ça …
c’est honteux !
Otto c’est pas le gars qui a réinventé le lien hypertexte ?
Bonjour,
La vocation première de Wikio est de proposer un service utile aux internautes et notamment aux blogueurs, et pas seulement un outil pour améliorer le référencement. Notre service n’est pas parfait, nous faisons parfois des erreurs (comme pour le frame dont se plaignait Moteur News, que nous avons enlevé), mais nous faisons de notre mieux pour proposer une alternative valable aux outils américains.
Il me semble utile de vous faire connaitre le commentaire publié par Alexis (Wikio) sur AJblog:
4. Le lundi 16 juin 2008 à 17:07, par Alex / Wikio
voir : http://www.ajblog.fr/wikio-scrap-le-contenu-html#c91970
modération : je me suis permis de mettre un lien vers le commentaire que vous avez copié collé
Vous nous avez habitué à des réponses de meilleure qualité Pierre
la question centrale de ce billet est le "Disallow: /webinfo"
Heu, il a du se tromper d’article pour la réponse. Il faudrait voir les commentaires sur les autres blogs, il a du inverser les fenêtres
Bon et bien merci encore pour l’info. 2 Jaunes = 1 rouge http://www.tout-marseille.fr/blo...
Il serait peut être utile de faire comprendre à M. Chappaz que cette réponse donne une impression de dédain particulièrement désagréable vis à vis des blogueurs.
Même si l’on avait bien compris que le but était de faire du business et pas d’aider les blogs dans leur référencement. Faudrait pas nous prendre pour des attardés non plus.
ça commence a bien faire ces services qui me font penser à des lichens qui poussent sur le dos des blogs en les amadouant, tout en intégra,t une conception technique destinée délibérément à leur marcher dessus.
M. Chappaz, si vous voulez du buzz, vous risquez d’en avoir, mais plus forcément dans le même sens que jusqu’à présent.
Moi aussi j’attends des meilleures explications et surtout un changement car si ça reste comme ça, je ferai désindexer mes flux de Wikio…
Bonjour Fred ,
Thomas a linké plusieurs posts parus dans les derniers mois, qui traitent de divers problèmes , j’essayais d’y répondre. Sans aucun dédain, au contraire, j’essaye de comprendre les questions posées, et si ce que nous faisons est juste ou non. Nous pouvons nous tromper, c’est pourquoi j’écoute énormément l’avis des blogueurs, mais crois-moi, ce n’est pas si simple de construire un service qui marche, avec des moyens sans aucune comparaison avec les américains. Pour ton info, au cas où tu en douterais, Wikio perd de l’argent, nous ne sommes pas des ‘vilains exploiteurs’.
> Thomas: sur la question du "Disallow: /webinfo", je suis en train d’en discuter en profondeur avec nos développeurs et aussi avec des conseils extérieurs.Je vais aussi expliquer pourquoi nous avons ces redirections. J’écoute tout le monde, j’essaye de voir si on pourrait éventuellement s’en passer.
Pierre, mon problème est qu’utiliser le robots.txt après le méa culpa du passage 302 –> 301, c’est refaire en douce ce qui avait été demandé par les bloggueurs.
J’aurais pu comprendre le choix d’un passage en nofollow, mais là au moins la franchise aurait été de rigueur.
"J’aurais" car j’ai demandé la suppression de mes comptes.
@Pierre Chappaz, je gagne aussi quelque argent via internet pierre, avec des moyens bien inférieurs et c’est loin d’être rentable aussi. C’est tout a fait honnête lorsque cela est fait correctement.
je ne critique pas cela, mais la façon de l’obtenir. Car ce peu d’argent qui rentre, il est là grâce aux blogueurs. Après le billet de chauffeurdebuzz, une attention particulière a forcément été portée aux liens. Le résultat nous pouvons le voir, il est plus que décevant.
Mais lorsque vous dites "Nous pouvons nous tromper," je ne le pense pas, car lorsque l’on code de cette manière un robot.txt c’est tout à fait délibéré.
Alors puisque vous êtes à l’écoute des blogueurs, écoutez ceci : "nous voulons être respectés". C’est le message que cet article et ses commentaires vous envoient.
Dans le détail, cela donne :
– la correction de ce code de toute urgence,
– la possibilité de désindexation définitive de son blog dans wikio (et d’ailleurs la mise en place d’un lien bien en évidence pour cela) ? ce qui est un minimum
– et un petit coup d’oeil a des atrocités légales telles qu’on peut en lire ici : champignac.hautetfort.com…
Nous partageons le web, nous ne le détenons pas.
On me pose la question du pourquoi ce robots.txt pose problème.
le robots.txt permet aux propriétaires de sites d’interdire le crawl (le suivi) et l’indexation des Urls par les robots des moteurs de recherche.
Si les bloquer n’améliore pas le référencement des sites sources comme le dit Pierre (c’est un euphémisme
), il y a quelquechose d’encore plus gênant dans "cette technique".
C’est inhérent au fonctionnement de Google (et surement des autres moteurs) qui attribue la paternité des contenus en fonction de la popularité des sites mais surtout grâce aux liens qui pointent vers les contenus originaux.
En bloquant les liens Wikio empêche les moteurs de recherche de reconnaître facilement qui de l’agrégateur ou de la source est le véritable auteur des contenus.
cas pratique :
les urls de redirections sur wikio sont au format : http://www.wikio.fr/webinfo?id=x...
Or les moteurs de recherche ont interdiction de suivre toutes les URLs commençants par http://www.wikio.fr/webinfo*
Résultats les bloggeurs ne comprennent pas pourquoi wikio remonte dans les résultats de recherche grâce à leur contenu. (en fait ils prennent un filtre de duplicate content).
ne nous méprenons pas).
Même si une partie des visiteurs retourne sur la source, il y a toujours du déchêt : clics sur Adsense, pages mises à jour entre temps, frustration d’avoir un niveau de navigation en plus inutile + tous les outils mis en place par wikio pour conserver ses visiteurs (ce dernier point est tout à fait légitime
Quand on connait la qualité technique des équipes de wikio.fr, il est plus que probable que ce disallow ait été placé à dessein.
/webinfo c’est la page de tracking qui redirige en 301 vers l’article original, c’est ça ?
De mon côté, je ne vois pas de Disallow: /webinfo dans le robot.txt ou alors elle a été enlevée ?
@ranks : à l’instant oui.
Ce billet aura été efficace.
Reste à voir l’impact sur les positions.
cette réactivité doit être soulignée.
Il reste donc à voir le lien de désindexation et les conditions générales.
Bon, si le Disallow: /webinfo a été retiré, ça va m’éviter de faire un billet sur le problème.
Joli coup thomas.
Blog Powa
Ben merde, moi qui attendais de rentrer pour poster à ce sujet.
Ce qui n’enlève pas ma certitude que Pierre Chappaz se fiche éperdument des blogueurs, voire la renforce, vu que le disallow confirmait une de mes craintes passées…
C’est clairement pas une erreur, mais une intention délibérée de passer devant la source dans Google, de la façon la plus cachée possible. Scandaleux !
La réponse de Pierre est drôlement hypocrite. Comme s’ils ne savaient pas ce qu’ils faisaient en codant la page robots !
Wikio dépasse les bornes de plus en plus, au mépris des sources. Pratiques détestables.
@<b>pierre chappaz</b> : Ce n’est pas parce que « Wikio perd de l’argent » que Wikio est le gentil chevalier blanc (« nous ne sommes pas des ‘vilains exploiteurs’ »). Il est un fait que Wikio utilise le contenu tiers comme base à son service. Il est donc primordial que les fournisseurs de ce contenu puissent y trouver leur compte, à défaut de quoi Wikio sera une jolie coquille bien vide… qu’elle soit dorée ou pas.
Le vrai problème, c’est que wikio créé des pages destinées à prendre nos positions sur le web. Ex d’un article publié sur ce blog: http://www.getbacktowork.fr/2008...
Si je google "Si seulement créer un thème WordPress était aussi simple", voila ce que j’obtiens:
http://www.google.fr/search?q=Si...
L’article original est moins bien référencé que la page de wikio. Pourquoi? Tout simplement car vous êtes des centaines a mettre des liens vers wikio pour une raison que je ne m’explique pas… Comme nous le savons tous, c’est le site qui profite du plus grand nombre de backlink de qualité qui sort en premier. Bref, le plus simple serait de retirer les liens qui mènent vers wikio… qui lance la mode?
@José : "Tout simplement car vous êtes des centaines a mettre des liens vers wikio pour une raison que je ne m’explique pas…"
l’auto-satisfaction des blogueurs face à leur classement dans le top.
@José et VinZ: Et le pire c’est qu’en rédigeant des tas d’article comme celui-ci, il y a de nombreuses pubs indirect qui sont faites pour Wikio. Car c’est bien connu: "que ce soit en bien ou en mal, l’important c’est qu’on parle de moi".
C’est vrai qu’au vu de tout ce qui se passe, j’ai envie de jeter la pierre à … Wikio (non désolé, j’ai évité le jeu de mot à la noix). Néanmoins, avec le nombre d’employé qui bosse sur Wikio, on ne peux s’empêcher de se dire qu’il faut les rémunérés. Visiblement, les internautes lambda n’utilisent pas suffisamment Wikio pour aller y chercher l’information, sinon Wikio ne serait pas obligé d’aller grappiller des parts de marché en provenance des moteurs de recherche (au profit des articles originaux).
Funnycat : « Néanmoins, avec le nombre d’employé qui bosse sur Wikio, on ne peux s’empêcher de se dire qu’il faut les rémunérés. »
Dans mon monde, on n’embauche que quand on est sûr de rémunérer. Ou alors, on fait appel à ses méninges.
Dans le monde de Pierre Chappaz, on fait du cashburn puis on se justifie par le cashburn.
ça n’a pas de sens, et je ne vois pas en quoi ça justifie de maltraiter le contenu de blogueurs qui n’ont rien demandé.
Quant aux internautes lambda, ils vivent tout aussi bien sans ce parasite. Wikio, c’est l’équivalent de tous ces putains de comparateurs de prix quand tu cherches une info sur un produit. ça se place devant l’info pertinente dans Google, pour un bénéfice mince voire nul.
D’ailleurs, qui a fait un comparateur de prix bien envahissant dans le passé ? Son nom va me revenir… ô surprise, serait-ce Pierre Chappaz ?
C’est clair qu’il vaut mieux un bon vrai Digg-like qui envoit des milliers de visiteurs sur votre blog chaque jours…
Petite précision sur les redirections 302 qui semblent avoir mis le feu aux poudres.
Les moteurs font la différence entre les 302 "on domain" et "off domain".
En bref, une redirection 302 de monsite.fr vers monsite.fr/ref=123 va effectivement donner priorité à l’URL source.
Mais, et c’était le cas avec wikio avant la tourmente, une redirection 302 de wikio.fr vers monblog.fr ne fera pas passer wikio devant monblog.fr dans les SERPs. Les moteurs sont parfaitement au fait de la méthode, utilisée d’ailleurs par de nombreux aggrégateurs et annuaires, et garderont l’URL de destination comme la source du contenu (plus d’info à ce sujet avec Matt Cutt ici : http://www.mattcutts.com/blog/se...
A mon sens, ce qui place wikio devant les blogs qu’il référence, ce sont les milliers de liens faits par les bloggeurs vers wikio (sous forme du compteur "top blog" notamment que les bloggeurs affichent coutoisement sur la totalité des pages de leur blog.
La pratique du 302 n’était donc pas si mauvaise.
Finalement, sur le coup du robot.txt, je confirme que c’est une pratique que Wikio avait mis en place dès son lancement. Ils prétendent l’avoir fait pour contrer le spam (c’est l’une des raisons d’être du fichier robot.txt), et non pour servir "d’aspirateur de page rank" (ce dont Wikipedia a été accusé en implémentant les tag nofollow il y a 1 ou 2 ans)… Perso, je pense que les deux ont joué dans la décision, le 2ème étant plus la cerise sur le gâteau.
Bref, je crois qu’il n’y avait aucune mauvaise volonté de la part de Wikio. Ceci dit, la situation actuelle va clairement être à l’avantage de la blogosphère avec des 301 à tout va (301 qui, au passage, ne sont pas du tout appropriés à un aggrégateur).
Maintenant, Wikio devient effectivement (aussi) un outil de référencement, ce qui n’était pas sa vocation première.
@toma : le point que tu relèves sur les top blog est intéressant en effet, il y a aussi les boutons de vote.
je suis moins d’accord avec toi en ce qui concerne l’utilisation de la 302.
.
Une redirection 302 doit correspondre à une redirection temporaire – je vois mal ce que les liens de wikio avaient de temporaires… non vraiment
"301 qui, au passage, ne sont pas du tout appropriés à un aggrégateur"
Digg.com utilise des liens en dur, je n’ai pas la sensation que cela leur pose problème.
Enfin concernant ta dernière phrase…. si un agrégateur doit linker sa source alors oui indirectement l’agrégateur est un outil de référencement – Hello world – That’s just the way it works
!
Cette page a vraiment bien buzzer compte-tenu de la qualité de l’article.
Je le savais pas, merci
Bonjour, Pourriez vous s’il vous plait m’indiquer le nom du robot de Wikio ? Je suis novice et je ne sais pas comment connaître le nom d’un robot.
Pour la petite histoire, je ne connaissais pas Wikio mais ces derniers ont mis un de mes articles chez eux alors que je le souhaite pas, le pire c’est que j’avais retiré l’article exprès et Wikio continu à le publier alors que je ne savais même pas que Wikio existait. Je ne comprends pas du tout ce qui se passe. Bon en attendant je leur ai écrit mais pas de réponse. Je souhaite donc, s’il vous plait, qu’on me donne le nom de leur robot afin de mettre une balise pour empêcher qu’ils répertorient mon site. Merci.