Plaidoyer pour le rel canonical
Thomas SOUDAZ dans Référencement le 30 octobre 2009 à 17 h 23 min<link rel="canonical" href="http://blog.sitxpress.com/rel-canonical/"/>

Rappel : l’attribut rel="canonical" permet de déclarer comme son nom l’indique une URL canonique aux moteurs de recherche.
En clair, lorsque plusieurs URLs permettent d’accéder à un même contenu au sein d’un même site, vous avez la possibilité d’indiquer grâce à l’attribut rel="canonical" l’URL que vous souhaitez utiliser et voir indexée.
Cette fonctionnalité a été lancée en Février 2009, si Google, Yahoo!, Ask et Bing annonçaient tous en cœur la prendre en compte, seuls Google, Yahoo! et Ask semblent l’avoir effectivement intégrée, Bing en bon dernier de la classe fait de la résistance, puisque le moteur ignore cette indication précieuse et continue d’afficher des URLs secondaires pourtant « relcanonisée » proprement.
Toujours est-il que cet attribut donne aux webmasters un outil supplémentaire pour améliorer la structure des URLs de leur site. Et… force est de constater, que le rewriting et la simplification des URLs est une pratique qui se démocratise.
Les CMS, forum, blogs, sites institutionels et toutes les plateformes s’y mettent à tel point qu’un site qui utilise encore des paramètres fait presque vieux et ringard.
Mais ne me faîtes pas dire ce que je n’ai pas dit, c’est toujours dans les vieux pots qu’on trouve le meilleur jus et le rewriting est une composante qui n’a qu’un faible (voir très faible) impact dans l’algorythme de ranking Google. Eh oui ! S’appliquer à faire de belles règles de réécriture et structurer ses URLs parfaitement ne rendra pas pour autant votre site beaucoup plus pertinent, mais grâce à la magie du <strong> vous augmenterez sans nul doute votre CTR dans les SERPs.
Dans quel cas peut-on utiliser efficacement le rel="canonical" ?
- Éliminer des URLs dupliquées
- Simplifier vos URLs
exemple : je ne veux plus que google affiche mon /index.html dans les SERPs
Mise en garde préalables
- Les moteurs se réservent le droit d’utiliser ou pas les URLs canoniques, dans les faits quand votre utilisation de l’attribut est sain ils se plient à votre demande.
- Utilisez de préférence des URLs absolues.
- Utiliser le rel="canonical" ne vous dispense pas de lier proprement depuis votre site l’URL canonique en place.
- Ne pas faire boucler un moteur en utilisant un rel canonical qui pointe vers une redirection.
- N’effacez surtout pas les anciennes pages, une fois que les nouvelles URLs ont fait leur apparition dans l’index des moteurs.
- Monitorer régulièrement la structure de vos liens internes (Xenu sur Windows est parfait pour ça) et vos erreurs 404 (logs serveur ou console Google webmaster tools), ces deux outils fournissent les referer.
Pourquoi privilégier le rel="canonical" à la redirection 301 ?
Si la redirection classique 301 est irremplaçable sur des hosts différents, l’utilisation du rel canonical est nettement plus avantageuse au sein d’un même site.
#1 Performance : Temps de chargement côté utilisateur réduit
Quelque soit la page chargée (l’ancienne URLs ou la nouvelle) le naviateur renvoit un HTTP 200 et charge immédiatement les éléments de la page, si la page est amenée à disparaître progressivement de l’index des moteurs; le changement est tout à fait transparent pour l’utilisateur. Il ne subit pas de redirection qui fait perdre quelques précieuses fractions de secondes.
#2 Economie : Bande passante et logs serveur allégés
A chaque fois qu’une redirection 301 se fait le serveur envoit une requête HTTP pour signifier au client (votre navigateur), ou au robot crawler si c’est un moteur, que l’adresse a déménagé de façon définitive. Il a plusieurs façon de gérer ces redirections, dans tous les cas cette opération consomme des ressources machines.
#3 Propreté : Small is beautifull
Pour peu que le site ait subit des refontes ou évolutions de structure, soit passé entre les mains de plusieurs équipes de developpement, ou tout simplement qu’il existe déjà beaucoup de règles de récriture d’URL, vous n’aurez pas besoin d’alourdir une fois de plus les fichiers de config serveur, votre .htaccess ou ajouter des redirections dans votre code.
#4 Perénité : Et si je change d’avis ?
Comme avait l’indélicatesse de dire Brice Hortefeux, quand il y a une ça va c’est quand il y en a plusieurs que ça pose des problèmes, c’est un peu pareil pour les redirections. Si changer ses URLs n’est clairement pas idéal, il existe beaucoup de mauvaises raisons qui peuvent nous pousser à le faire : la moins mauvaise d’entre elles étant de vouloir raccourcir et simplifier la structure de ses URLs (et accesoirement y mettre un mot-clé). Là ou ça se complique c’est quand on superpose les redirections.
#5 Efficacité : ça marche !
Le jus ou ce que l’on nomme plus communément la popularité est bien transmise et permet aux pages qui font l’objet d’un rel canonical de faire réceptacle du jus de l’ensemble des pages concernées.
Pour aller plus loin :
En Anglais: 20 minutes de vidéo par Matt Cutts sur le duplicate content et le rel canonical
La page avec des FAQ Google en français : http://www.google.com/support/webmasters/bin/answer.py?hl=fr&answer=139394
Techniques alternatives :
- l’utilisation du sitemap classique ou sitemap news vous permet de spécifier vos URLs principales un peu à la manière d’un rel canonical.
- Via les google webmaster tools vous pouvez choisir en la version avec ou sans www.
Rel="canonical" et Black Hat SEO
Le rel canonical fonctionne entre sous-domaines, si vous arriviez à prendre le contrôle d’un host voisin sur *.free.fr par exemple, il vous serait alors simple de dupliquer pour voler le plus discrètement du monde tout le trafic en provenance des résultats organiques des moteurs de votre malheureux voisin.
PS : En parlant de SEO Black hat, l’actualité m’oblige à caser un petit BL de dernière minute pour le super billet black hattitude de Paul.
Edit : Le rel canonical fonctionne désormais sur des domaines différents, pratique lorsqu’on souhaite syndiquer son contenu.
Il me semble avoir vu passer une news à propos du rel canonical entre différents domaines.
Reste plus qu’à trouver comment bidouille ça et le Google Bowling sera reparti de plus belle
En tout cas, nickel ton article
Très bon article, merci
une petite question pratique: Dans le cas d’un catalogue avec pagination, tri, filtre, etc Est ce qu’il est bon de faire indexer chacune de ces pages (à savoir les /catalogue/page/17, /catalogue/tri/prix, etc) ou il vaut mieux utiliser un rel=canonical sur chacune de ces pages?
Le rel canonical, c’est comme l’url rewriting : c’est un palliatif. Pourquoi ne pas traiter le problème à la source en implémentant les URL comme elles devraient l’être, à savoir des identifiants (=uniques).
Effectivement pourquoi s’en priver aujourd’hui. Des plugins existent est permettent d’intégrer cette balise à son site les doigts dans le nez
@LaurentB : a priori c’est assez simple à verouiller côté Google. Toutefois cette balise est jeune et vu l’imagination de certains SEO je ne doute pas qu’on lui découvre des propriétés exotiques un jour prochain
.
@Loris : bonne question,
d’abord ne perd pas de vue que le rel canonical ne s’utilise et n’est pris en compte que pour des pages avec un contenu identique ou presque, si tu n’as qu’une page oui. Mais vu tu me parles de pagination j’aurai tendance à dire que tu devrais plutôt oublier le rel canonical.
Si tu veux à tout prix éviter les redondances (ce qui n’est pas critique à mon sens sauf peut-être si tu as 10 tris/filtres différents), tu peux toujours mettre tes tris (hors tri par défaut) en noindex,follow et là tu es ultra propre.
A toi d’arbitrer, car tu risques de passer à côté de quelques combinaisons de MC, mais tes pages produits auront un poil plus de jus.
@nico : oui ça serait l’idéal en effet
.
@dan : clairement, All in One SEO Pack par exemple gère ça très bien pour WordPress.
Mais ne me faîtes pas dire ce que je n’ai pas dit, c’est toujours dans les vieux pots qu’on trouve le meilleur jus et le rewriting est une composante qui n’a qu’un faible (voir très faible) impact dans l’algorythme de ranking Google.
Un complément
C’est vrai dans Google comme vous le dites, mais alors pas du tout sur Yahoo d’après ce que j’ai pu tester.
« prendre le contrôle d’un host voisin sur *.free.fr » alors, ca, c’est vicieux ! j’aime…
Salut Thomas et bonne année à tous !
ce n’est pas bien de donner ce genre d’idées en public !! surtout que sur free ya déjà pas mal de tarlouzeries !!
Ca marche quand ca veut cette balise ou quoi ?