fermer
ActualitésGoogle

Oh, alors c’est la façon dont la recherche fonctionne ? Merci, Google !

oh alors cest la facon dont la recherche fonctionne merci google 1

Dès que vous voulez en savoir un petit peu plus sur quelque chose, quoique ce soit – vraiment – il est quasi certain que votre premier réflexe est d’automatiquement “googler”. Par ce verbe, j’entends l’action de se rendre sur le moteur de recherche par n’importe quel moyen – smartphone, tablette, ordinateur de bureau – et taper les mots clés de notre recherche voir même poser la question.

Et, pour bien expliquer pourquoi Google est le mastodonte Internet qu’il est aujourd’hui, la société a dévoilé How Search Works, un site animé qui vous emmène à travers le processus du moteur de recherche. Cet effort particulier pour sensibiliser les internautes sur leurs services suit quelques autres initiatives ayant le même objectif, comme Inside For Search, un site web publié en 2011, et More Than A Map, un site publié l’an dernier spécifiquement pour Google Maps.

Oh, alors c'est la façon dont la recherche fonctionne ? Merci, Google ! - How Search Works, une infographie interactive pour comprendre comment marche la recherche sur Google

Intelligemment conçus, les graphiques de Google Recherche se décomposent en trois parties distinctes : exploration et indexation, algorithmes, et la lutte contre le spam. Tout ceci est expliqué à l’aide d’une représentation interactive qui invite les utilisateurs à cliquer pour en savoir plus sur leur passage. A la fin de la page, il vous est rappelé combien de temps s’est écoulé depuis que vous avez commencé à vérifier sur la page, ainsi que le nombre de recherches qui ont été réalisées depuis lors. À noter que si l’animation est disponible uniquement en anglais, une version texte contenant tous les détails du processus est disponible en 43 langues.

Oh, alors c'est la façon dont la recherche fonctionne ? Merci, Google ! - Le temps écoulé à visionner l'infographie est affiché ainsi que le nombre de recherches effectué durant la même période

Lorsque quelqu’un tape une requête dans la barre de recherche, Google explore les possibilités de réponses à travers 30 milliards de pages individuelles disponibles sur le World Wide Web (un nombre qui est en constante augmentation).
Ensuite, en fonction du contenu et de divers facteurs sous-jacents, Google trie toutes ces pages et les maintient dans un index qui contient plus d’une centaine de millions de gigaoctets de données, plus d’un million d’heures de calcul ont été dédiées à son élaboration. Cette courte vidéo vous en dit plus sur les principes de base :

Enfin, les rouages bien huilés des machines de Google Recherche tournent à plein régime à travers les algorithmes (composé de formules et programmes) que la firme a conçu pour rendre le processus de recherche d’information plus rapide et plus efficace. Pour ce faire, Google adopte et améliore régulièrement d’autres systèmes importants, qu’il nomme “projets de recherche” et qui fournissent un aperçu des nombreux aspects de la recherche.
L’index permet de faciliter la localisation des éléments dont vous avez besoin et envie, et à la fin, le service retourne la liste de ces choses, disposés selon leur rang. Pour deviner plus précisément ce que vous recherchez, les algorithmes de Google font appel à plus de 200 signaux ou indices uniques, qui comprennent entre autres les termes figurant sur les sites Web, le niveau d’actualisation du contenu, votre région, ainsi que la fonctionnalité PageRank.

Pendant que tout cela se passe, les mécanismes qui filtrent les spams sont en place pour s’assurer de la pertinence de vos résultats de recherche Google. La section “Live Spam Screenshots” de l’animation est la plus intéressante. Celle-ci va vous montrer une page – en cliquant sur “See what we’ve removed lately”, par exemple, qui a été supprimé des résultats de recherche il y a 34 minutes. Actuellement je peux regarder 47 sites qui ont été retirés il y a peu près 33 minutes dans un diaporama.
Lorsque vous cliquez sur le bouton “Next” du diaporama, vous avec un avertissement qui mentionne que “les captures d’écran sont générées automatiquement et ne sont pas filtrés manuellement. Bien que rare, vous pouvez voir des images vulgaires, sexuellement explicites ou violentes”. Il y a encore une note sous le diaporama, qui indique qu’une partie du contenu pornographique et des logiciels malveillants ont été retirés de cette démo, mais sinon, c’est un flux non filtré et sont des exemples “purs” de spams.

Oh, alors c'est la façon dont la recherche fonctionne ? Merci, Google ! - Lutte contre le spam active par Google

Google passe ensuite par les différents types de spam : Techniques de dissimulation (cloaking) et redirections trompeuses, Spam pur, Liens artificiels depuis un site, Site piraté, Hébergeurs et fournisseurs de DNS dynamiques gratuits générant du spam, Liens artificiels redirigeant vers un site, Texte caché et accumulation de mots clés, Contenu peu informatif à valeur ajoutée faible ou nulle, Spam généré par l’utilisateur et Domaines parqués.

Elle est suivie par la liste des étapes de la lutte manuelle contre le spam, et quelques autres graphiques intéressants sur les notifications et les demandes de réexamen des webmasters.

Enfin, le site vous donne un bref aperçu de la politique de Google, dont le principal objectif est l’accès aux informations, que la priorité est données aux algorithmes par rapport aux actions manuelles – logique vu la quantité de données même si cela permettrait d’avoir moins de chômage dans le monde mais la vitesse de réponses ne serait pas la même – ou encore que la lutte contre le spam et les logiciels malveillants sont une priorité pour le géant de la recherche.

Vous n’arrivez toujours pas à l’imaginer ? Découvrez l’histoire derrière ce projet et plongez-vous dans la présentation.

Tags : algorithmesindexationInside Searchrecherchespam
Yohann Poiron

The author Yohann Poiron

J’ai fondé le BlogNT en 2010. Autodidacte en matière de développement de sites en PHP, j’ai toujours poussé ma curiosité sur les sujets et les actualités du Web. Je suis actuellement engagé en tant qu’architecte interopérabilité.