<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>BlogNT : Le Blog des Nouvelles Technologies dédié au Web, aux nouvelles technologies et au développement Web &#187; SEO</title>
	<atom:link href="http://www.blog-nouvelles-technologies.fr/archives/category/developpement/seo-developpement/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.blog-nouvelles-technologies.fr</link>
	<description>Web, Nouvelles technologies, Programmation, Développement ...</description>
	<lastBuildDate>Mon, 20 May 2013 06:32:09 +0000</lastBuildDate>
	<language>fr-FR</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.5.1</generator>
		<item>
		<title>Google peut maintenant indexer le contenu interactif d&#8217;une page Web</title>
		<link>http://www.blog-nouvelles-technologies.fr/archives/13655/google-peut-maintenant-indexer-le-contenu-interactif-dune-page-web/</link>
		<comments>http://www.blog-nouvelles-technologies.fr/archives/13655/google-peut-maintenant-indexer-le-contenu-interactif-dune-page-web/#comments</comments>
		<pubDate>Fri, 18 May 2012 12:05:18 +0000</pubDate>
		<dc:creator>Yohann Poiron</dc:creator>
				<category><![CDATA[Développement]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[AJAX]]></category>
		<category><![CDATA[crawl]]></category>
		<category><![CDATA[exploration]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[GoogleBot]]></category>
		<category><![CDATA[indexation]]></category>

		<guid isPermaLink="false">http://www.blog-nouvelles-technologies.fr/?p=13655</guid>
		<description><![CDATA[Google se nourrit de l&#8217;indexation de son moteur de recherche avec les données du site recueillies à partir d&#8217;une armée virtuelle de &#171;&#160;bots&#160;&#187;, nommés GoogleBot, donc utilisés par le moteur de recherche Google afin de recenser et indexer les pages Web, qui écument ainsi chaque jour des milliards de pages Web. Mais, par le passé [...]]]></description>
				<content:encoded><![CDATA[<p class="dropcap-first">Google se nourrit de l&rsquo;indexation de son moteur de recherche avec les données du site recueillies à partir d&rsquo;une armée virtuelle de &laquo;&nbsp;bots&nbsp;&raquo;, nommés <a href="http://www.blog-nouvelles-technologies.fr/?s=GoogleBot" >GoogleBot</a>, donc utilisés par le moteur de recherche Google afin de recenser et indexer les pages Web, qui écument ainsi chaque jour des milliards de pages Web. Mais, par le passé les robots d&rsquo;indexation de <strong>Google se heurtaient à un mur dès qu&rsquo;ils devaient parcourir du contenu interactif</strong> qui étaient chargé en <em>JavaScript</em>, surtout dès lors que ​​les pages usaient et abusaient de la technologie <em>AJAX</em>, <em>Asynchronous JavaScript and XML</em>, et ce dans le but de permettre aux utilisateurs d&rsquo;accéder à du contenu supplémentaire sans avoir à recharger les pages. </p>
<p>Mais, maintenant si l&rsquo;on en croit le <a target="_blank" href="http://swapped.tumblr.com/post/23133779276/google-bot-now-crawls-arbitrary-javascript-sites" >développeur Alex Pankratov</a>, il semble que <strong>les robots de Google soient capables d&rsquo;agir plus comme des êtres humains</strong> à tel point qu&rsquo;ils pourraient d&rsquo;<strong>exploiter le contenu interactif</strong> d&rsquo;un site Web, exécutant ainsi le <em>JavaScript</em> sur ​​les pages lors de l&rsquo;indexation permettant ainsi de voir ce qui se cache derrière les différentes pages !</p>
<p>Google a par le passé <a target="_blank" href="https://developers.google.com/webmasters/ajax-crawling/docs/specification" >offert des propositions</a> visant à <strong>rendre le contenu <em>AJAX</em> plus consultable</strong>, mais ce travail était à la charge des développeurs plutôt que les GoogleBots, mais celles-ci n&rsquo;ont pas convaincus autant que Google l&rsquo;avait espéré.<br />
Au cours du dernier trimestre 2011, Google a finalement commencé à comprendre comment résoudre efficacement le problème, et a <a target="_blank" href="http://googlewebmastercentral.blogspot.com/2011/11/get-post-and-safely-surfacing-more-of.html" >commencé à déployer</a> les robots d&rsquo;indexation qui pourrait explorer le contenu dynamique des pages en mode limité. En effet, cette version permettait simplement de récupérer à travers le code JavaScript d&rsquo;une page, de trouver les URL et les ajouter à l&rsquo;analyse.<br />
Il a fallu que Google puisse permettre, dans certains cas, à ses robots d&rsquo;envoyer des requêtes dîtes <code>POST</code> vers des sites Web, selon comment le code JavaScript était écrit, plutôt que de simplement effectuer une requête traditionnelle <code>GET</code> pour en extraire le contenu.<br />
Par conséquent, par exemple Google a pu commencer à l&rsquo;indexation des commentaires sur Facebook, ainsi que d&rsquo;autres  des systèmes de commentaires &laquo;&nbsp;dynamiques&nbsp;&raquo;.</p>
<blockquote class="twitter-tweet tw-align-center" lang="fr"><p>Googlebot keeps getting smarter. Now has the ability to execute AJAX/JS to index some dynamic comments <a target="_blank" href="http://t.co/NsTvJExd"  title="http://goo.gl/F9et1">goo.gl/F9et1</a></p>
<p>&mdash; Matt Cutts (@mattcutts) <a target="_blank" href="https://twitter.com/mattcutts/status/131425949597179904"  data-datetime="2011-11-01T17:42:42+00:00">Novembre 1, 2011</a></p></blockquote>
<p><script src="//platform.twitter.com/widgets.js" charset="utf-8"></script></p>
<p>Maintenant, sur la base des logs de Pankratov, il semble que plutôt que de simplement exploiter de façon mineure les URL dans les scripts, <strong>les robots se promènent encore plus profondément que les commentaires</strong>, en traitement des fonctions <em>JavaScript</em> de telle manière qu&rsquo;ils <strong>imitent l&rsquo;action utilisateur</strong> lorsqu&rsquo;il clique sur les objets qu&rsquo;ils activent. </p>
<p>Cette nouvelle va fournir à Google d&rsquo;avoir un meilleur accès au &laquo;&nbsp;Web profond&nbsp;&raquo;, en permettant ainsi d&rsquo;accéder à du contenu caché dans des bases de données, ou encore d&rsquo;autres sources qui ne sont généralement pas indexables. </p>
<p>Que pensez-vous de cette nouvelle ? Y voyez-vous comme quelque-chose de dangereux pour le Web ?</p>
 <p><a href="http://www.blog-nouvelles-technologies.fr/?flattrss_redirect&amp;id=13655&amp;md5=12a71c9bb7760bcaf076b9cee3997776" title="Flattr" target="_blank"><img src="http://www.blog-nouvelles-technologies.fr/wp-content/plugins/flattr/img/flattr-badge-large.png" alt="flattr this!"/></a></p>]]></content:encoded>
			<wfw:commentRss>http://www.blog-nouvelles-technologies.fr/archives/13655/google-peut-maintenant-indexer-le-contenu-interactif-dune-page-web/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		<atom:link rel="payment" title="Flattr this!" href="https://flattr.com/submit/auto?user_id=lryo&amp;popout=1&amp;url=http%3A%2F%2Fwww.blog-nouvelles-technologies.fr%2Farchives%2F13655%2Fgoogle-peut-maintenant-indexer-le-contenu-interactif-dune-page-web%2F&amp;language=fr_FR&amp;category=text&amp;title=Google+peut+maintenant+indexer+le+contenu+interactif+d%26rsquo%3Bune+page+Web&amp;description=Google+se+nourrit+de+l%26rsquo%3Bindexation+de+son+moteur+de+recherche+avec+les+donn%C3%A9es+du+site+recueillies+%C3%A0+partir+d%26rsquo%3Bune+arm%C3%A9e+virtuelle+de+%26laquo%3B%26nbsp%3Bbots%26nbsp%3B%26raquo%3B%2C+nomm%C3%A9s+GoogleBot%2C+donc+utilis%C3%A9s+par+le+moteur...&amp;tags=AJAX%2Ccrawl%2Cexploration%2Cgoogle%2CGoogleBot%2Cindexation%2Cblog" type="text/html" />
	</item>
	</channel>
</rss>
