Google peut maintenant indexer le contenu interactif d'une page Web

Google se nourrit de l’indexation de son moteur de recherche avec les données du site recueillies à partir d’une armée virtuelle de “bots”, nommés GoogleBot, donc utilisés par le moteur de recherche Google afin de recenser et indexer les pages Web, qui écument ainsi chaque jour des milliards de pages Web. Mais, par le passé les robots d’indexation de Google se heurtaient à un mur dès qu’ils devaient parcourir du contenu interactif qui étaient chargé en JavaScript, surtout dès lors que les pages usaient et abusaient de la technologie AJAX, Asynchronous JavaScript and XML, et ce dans le but de permettre aux utilisateurs d’accéder à du contenu supplémentaire sans avoir à recharger les pages.

Mais, maintenant si l’on en croit le développeur Alex Pankratov, il semble que les robots de Google soient capables d’agir plus comme des êtres humains à tel point qu’ils pourraient d’exploiter le contenu interactif d’un site Web, exécutant ainsi le JavaScript sur les pages lors de l’indexation permettant ainsi de voir ce qui se cache derrière les différentes pages !

Google a par le passé offert des propositions visant à rendre le contenu AJAX plus consultable, mais ce travail était à la charge des développeurs plutôt que les GoogleBots, mais celles-ci n’ont pas convaincus autant que Google l’avait espéré.
Au cours du dernier trimestre 2011, Google a finalement commencé à comprendre comment résoudre efficacement le problème, et a commencé à déployer les robots d’indexation qui pourrait explorer le contenu dynamique des pages en mode limité. En effet, cette version permettait simplement de récupérer à travers le code JavaScript d’une page, de trouver les URL et les ajouter à l’analyse.
Il a fallu que Google puisse permettre, dans certains cas, à ses robots d’envoyer des requêtes dîtes POST vers des sites Web, selon comment le code JavaScript était écrit, plutôt que de simplement effectuer une requête traditionnelle GET pour en extraire le contenu.
Par conséquent, par exemple Google a pu commencer à l’indexation des commentaires sur Facebook, ainsi que d’autres des systèmes de commentaires “dynamiques”.

Googlebot keeps getting smarter. Now has the ability to execute AJAX/JS to index some dynamic comments goo.gl/F9et1
— Matt Cutts (@mattcutts) Novembre 1, 2011

Maintenant, sur la base des logs de Pankratov, il semble que plutôt que de simplement exploiter de façon mineure les URL dans les scripts, les robots se promènent encore plus profondément que les commentaires, en traitement des fonctions JavaScript de telle manière qu’ils imitent l’action utilisateur lorsqu’il clique sur les objets qu’ils activent.

Cette nouvelle va fournir à Google d’avoir un meilleur accès au “Web profond”, en permettant ainsi d’accéder à du contenu caché dans des bases de données, ou encore d’autres sources qui ne sont généralement pas indexables.

Que pensez-vous de cette nouvelle ? Y voyez-vous comme quelque-chose de dangereux pour le Web ?

Découvrez Blend d’Instagram : Fusionnez vos Reels favoris avec ceux de vos amis

Microsoft teste des publicités dans le menu Démarrer de Windows 11

Fin de route pour le VPN Google One : Google annonce sa suppression

Apple innove en réparation : utilisation de pièces d’occasion pour l’iPhone 15 et plus

Découverte de Google Gemini : l’assistant IA qui comprend vraiment

Test de la Navee S65C : une conduite urbaine et tout-terrain sans compromis

Test de la TaHoma Switch : découvrez la domotique moderne par Somfy

Test du Microsoft Surface Laptop Go 3 : du luxe mais compromis pour les étudiants

Révolution technologique avec la Galaxy Watch 7 : Puce 3 nm en primeur

Axon 60 Ultra : Le dernier cri de ZTE en matière de smartphone haut de gamme

Retour aux sources avec les nouveaux Nokia : Simple, basique, efficace

OnePlus Pad 2 : Un concurrent de taille pour fin 2024

Western Digital révolutionne le stockage avec une carte SD de 4 To

Elon Musk et Starship : Vers une civilisation multi-planétaire

Insta360 One X4 : L’avènement de la résolution 8K

Google lance MedLM pour la santé : modèles d’IA accessibles aux organisations aux États-Unis

Google dévoile Gemini Code Assist : Une révolution IA pour les développeurs

Nouvelle ère de codage avec Gemini Pro dans Android Studio

Canva embrasse l’avenir du design en s’offrant Affinity

Simplifiez votre Terminal avec GitHub Copilot CLI : L’innovation au service des développeurs

Les secrets du sommeil : comment la qualité du repos influence l’espérance de vie

9 outils d’IA pour vous aider à organiser votre vie en 2024

Optimisez votre MacBook : Guide des meilleures astuces de productivité

Maîtrisez votre Mac avec Homebrew : Un guide des outils indispensables

Google peut maintenant indexer le contenu interactif d’une page Web

Casual Games Cup : Un concours national de création de jeux Web !

Suivre l’ouverture du NASDAQ en direct avec l’arrivée des actions Facebook !

The author Yohann Poiron

Google peut maintenant indexer le contenu interactif d’une page Web

The author Yohann Poiron

vous pourriez aussi aimer