De la capacité de Google à éliminer le contenu inintéressant
Thomas SOUDAZ dans Référencement le 2 juin 2007 à 1 h 38 min
Comment expliquer le succès de Google ? Plusieurs théories s’opposent et se rejoignent. Certains vous répondront qu’il est dû à l’incroyable simplicité de la page d’accueil du site dépourvu de tout artifice. Cette particularité de Google a, c’est indéniable, réconcilier l’expérience utilisateur et la recherche sur internet. Cependant cette théorie s’effrite lorsqu’on observe à quel point le phénomène s’est inscrit dans la durée.
D’autres pensent que c’est grâce à la rapidité à laquelle les réponses sont affichées. Aujourd’hui les différences de temps de réponse entre les moteurs tiennent beaucoup plus de la qualité de la connexion utilisateur que de la vitesse de réponse des moteurs de recherche, qui sont sommes toute assez semblables. Ce constat balaye l’argument de la vitesse.
Non, l’immense majorité des utilisateurs prétendront que Google est le moteur de recherche le plus pertinent. Et que le succès de Google est dû à la qualité intrinsèque des résultats. Au delà de la dimension business et de l’extraordinaire business model qu’est le lien sponsorisé le fondement de la réussite de ce moteur de recherche est bel bien la précision de son outil de recherche.
On entend par pertinence, la capacité du moteur de recherche à fournir l’information attendue par l’utilisateur… Oui la réponse que Google affiche en premier n’est pas forcément la bonne information mais bel et bien l’information la plus communément admise, l’information la plus populaire, l’information la plus relayée, la requête qui aura le meilleur CTR (taux de clic) dans la page de résultat murmure-t-on ici et là. C’est du moins ce modèle qui a fait la popularité de Google depuis 1998. Seulement non content d’être un moteur populaire, Google n’a eu de cesse d’affiner son algorithme introduisant des garde-fous :
Le TrustRank, considéré dans l’univers du référencement comme le digne successeur du PageRank, n’est au final qu’un élément supplémentaire pesant dans l’algorithme de Google. A pertinence de contenu égal sur une même requête, ce n’est pas uniquement l’addition des backlinks vers une page donnée qui prime, même si cela reste tout de même important, mais aussi la qualité du site qui est évalué. Après la note de popularité, voici la note de fiabilité. Un site comme Wikipédia qui trust les premières places sur une grande partie des articles publiés n’est pas loin d’avoir la note de TrustRank maximum si tant est qu’on vulgarise un peu l’algorithme de Google.

Deuxième garde-fous le duplicate content duquel découle tout un tas d’application :
- La première application vise à fournir à l’internaute des résultats de recherche différents, en éliminant le contenu dupliqué des résultats de recherche. Cela permet de détecter les sites qui font du plagiat et qui ne représente qu’un intéret assez limité. Dans l’ensemble Google arrive assez bien à determiner la source d’origine d’un contenu.
- La possibilité d’identifier le contenu éditorial du site (par comparaison des contenus des différentes pages d’un site). Google est capable de déterminer ou commence l’article quel est son titre et ou il s’achève. Google News en est l’application parfaite, un robot va visiter les pages des grands sites d’information en extraire les articles il en analyse la pertinence et les classe sur sont portail http://news.google.fr


Voilà le genre d’articles que j’aime ! Moi qui suis un néophyte en la matière j’ai réussi à tout comprendre lol