Rechercher  
Les flux RSS d'Indexel.net    
publicité
publicité

Par
Jérôme Charron 


14/06/2006

''Les moteurs de recherche n'indexeront pas les sites Ajax''

L'indexation des sites web 2.0 reposant sur l'architecture Ajax pose de nombreux problèmes aux moteurs de recherche. Spécialiste de la question, Jérôme Charron répond aux questions d'indexel.

Fondateur de Motrech (une liste de discussion consacrée aux moteurs de recherche sur internet) et de Frutch (un groupe de travail francophone sur le moteur de recherche open source Nutch), Jérôme Charron

(photo) nous explique l'impact de la technologie Ajax sur le référencement.

 

Quel est l'impact du ''web 2.0'' sur le référencement ?

 

Les moteurs de recherche ont toujours eu un train de retard. Ils refusent par exemple d'indexer le Javascript ou les animations Flash. Ils contraignent donc les web designers et les spécialistes du référencement à se plier à leurs règles. Or, les interfaces graphiques du web 2.0 reposent sur Ajax (Asynchronous Javascript and XML). Comme son nom l'indique, cette architecture utilise massivement du code Javascript.

 

Cela signifie-t-il qu'il est impossible de référencer un site construit en Ajax ?

 

Non. Mais la tâche des moteurs de recherche se complique. Imaginons par exemple que je souhaite publier un ouvrage sur le web. Plutôt que de proposer une série de pages HTML, je souhaite offrir à l'utilisateur une nouvelle expérience : charger à la volée de petites portions du livre au fur et à mesure de la lecture de l'utilisateur. Le moteur se trouve face à une page HTML dépourvue de contenu textuel, mais contenant essentiellement du Javascript. Le code Javascript charge le texte au fur et à mesure de la lecture. Quel moteur est aujourd'hui en mesure d'indexer un tel contenu? Aucun ! Les problèmes d'indexation que nous connaissions déjà avec le Javascript et le Flash vont se trouver démultipliés par le développement d'Ajax.

 

Google et Yahoo pourraient s'adapter à cette nouvelle donne?

 

Oui. Mais je ne pense pas qu'ils le feront. Le jeu n'en vaut pas la chandelle. Les efforts nécessaires à l'indexation du Javascript sont démesurés face à ce que cela apporte à l'intérêt d'un moteur. Le problème vient du fait que le moteur doit se comporter comme un véritable navigateur et extraire le contenu textuel tel qu'il serait affiché à un utilisateur. Sans être insurmontable, cette tâche requiert beaucoup plus de puissance de calcul que ne le nécessitent les moteurs actuels.

 

Pourquoi est-ce si complexe ?

 

La navigation au sein des documents n'est plus réalisée par de simples liens hypertextes, mais par des événements Javascript. Il ne s'agit donc plus de lire un document et de trouver tous ceux se cachant derrière un lien hypertexte. Le moteur doit être en mesure d'identifier toutes les actions offertes à l'utilisateur. Il doit pouvoir effectuer ces actions comme le ferait un utilisateur, et, dans les cas ou le contenu textuel change après une action, il doit récupérer ce nouveau contenu textuel. Ce qui complexifie notablement l'indexation. Et les problèmes ne s'arrêtent pas là ! Le moteur doit également être en mesure d'effectuer la même action plusieurs fois, tout en repérant les actions cycliques. Enfin, et ce n'est pas la partie la plus simple, comment un moteur de recherche pourrait-il présenter à l'utilisateur les résultats d'un tel document ? Il y a des milliers de possibilités.

 

Cela ne revient-il pas à chercher à indexer des applications plutôt que des documents ?

 

Tout à fait ! Le moteur de recherche se trouve face à des applications et non plus à des documents. Il ne s'agit plus d'indexer des contenus textuels, mais de pouvoir indexer tous les contenus possibles offerts par un service. Nous nous confrontons à des problèmes informatiques d'une extrême complexité : la preuve de programme et leur prédictibilité. Interpréter le code Javascript, n'est pas complexe en soi : il existe de nombreux interpréteurs Javascript.

 

Est-ce le seul problème d'Ajax et comment le contourner ?

 

Ajax réduit aussi l'accessibilité. Par exemple, on ne peut pas générer une version imprimable à partir d-un document Ajax, obtenir le même affichage sur tous les navigateurs, etc. Si l'on souhaite que le document soit indexé et qu'il soit plus accessible, il faut proposer un contenu alternatif (pages HTML) dédié aux moteurs de recherche et à l'accessibilité.

 

Pour en savoir plus : consulter le blog de Jérôme Charron.

 

Lire aussi :

Mais que font les moteurs de recherche ?

Développement d'applications : Ajax récure le web


Envoyer
à un ami

Ecrire à la
rédaction

Imprimer
l'article
publicité
Lire aussi

Six livres pour comprendre Web 2.0

Exploiter les richesses du web invisible

Développement d'applications : Ajax récure le web

Web 2.0 : le glossaire

Mais que font les moteurs de recherche ?

  L'actualité
Newsletter
Abonnez-vous gratuitement à notre newsletter hebdomadaire
  >> valider <<
Glossaire

Un terme technique, une interrogation, l'informatique de A comme adresse IP à Z comme zip, découvrez notre glossaire.

>> cliquez ICI <<
  Appel à témoignage

Pour partager votre expérience avec nous

>> cliquez ICI <<
Toutes les actualités

VMware virtualise les téléphones portables

ERP et CRM : Microsoft propose un prêt à 0 %

Antivirus : AVG plante Windows XP... et s'excuse

Processeurs : AMD revient dans la course avec Shanghai

SAP muscle son offre de maintenance

Bureautique : ODF reçoit à nouveau le soutien des poids lourds de l'informatique

|  Contact  || Qui sommes nous ?  || Conditions d'utilisation  || Publicité | | Indexel.com |