Un plan de site XML regroupe l’ensemble des URLs d’un site ainsi que leurs métadonnées associées. Généralement accessible via l’URL http://www.example.com/sitemap.xml, ce type de plan de site indique précisément aux robots des moteurs de recherche l’ensemble des pages à visiter, ce qui est un des moyens de prévenir ou de pallier les problèmes d’indexation, bien que ce ne soit pas infaillible. Un fichier Sitemap correspond à un protocole dont les tenants et aboutissants sont expliqués sur le site Sitemaps.org (en plusieurs langues): il doit être enregistré avec un codage UTF-8, le nombre d’URLs maximum est de 50 000 et le poids total du fichier ne peut dépasser 10 Mo (10 485 760 octets).
Source de l’image : metropublisher.com Pourquoi utiliser un sitemap ? Comme évoqué plus haut, les plans de site XML aident à pallier les problèmes d’indexation des sites contenant notamment des contenus dynamiques ou des pages avec des contenus en AJAX ou Flash. Il est fortement recommandé d’accompagner la création d’un site avec celle d’un sitemap. En effet, les robots des moteurs explorent les sites en allant d’un lien à l’autre et si votre site est récent, il ne disposera pas d’un grand éventail de liens pointant vers ses pages, notamment vers les URLs les plus profonds. De manière générale, un sitemap XML permet aux robots de repérer et d’indexer les pages solitaires, bien qu’il soit fortement conseillé de doter son site d’un maillage de liens permettant aux moteurs d’identifier l’ensemble des pages, mais aussi leur hiérarchie. Comment créer un sitemap XML Cet extrait correspond à l’entrée d’un URL dans un plan de site. Les balises en italique sont facultatives. <?xml version=”1.0″ encoding=”UTF-8″?> <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″> <url> <loc>http://www.example.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url </urlset> Bien que facultatives, les balises suivantes s’avèrent tout à fait intéressantes. La balise <changefreq>monthly</changefreq> identifie la fréquence de modification de la page. « Never » doit ainsi être utilisé si la page est archivée. Cependant, ces balises ne sont que des indications pour les robots des moteurs de recherche, cela ne garantit en rien la fréquence de visite de ces pages. Une page notifiée « hourly » pourrait très bien être moins souvent visitée qu’une page marquée « never ». La balise <priority>0.8</priority> identifie la hiérarchie des pages au sein d’un même site uniquement. Spécifier la valeur des priorités des pages n’aide en aucun cas à obtenir un meilleur positionnement dans les résultats de recherche. En revanche, cela a l’immense avantage de différencier aux robots les pages principales des pages secondaires, ce qui soutient le travail d’optimisation SEO et l’attribution des mots clés aux différents URLs en termes de volume de recherche et de pertinence. Par défaut, la priorité est fixée à 0,5. Avis aux petits malins qui désireraient jouer de ruse avec les moteurs, il est absolument inutile de donner la valeur maximale à l’ensemble des URLs. Pourquoi doter son site de plusieurs sitemaps ? Un site internet est composé d’URLs correspondant à plusieurs types de contenus : des pages web classiques, mais aussi des images, des vidéos ou encore des contenus mobiles. Pour soumettre à l’index des moteurs de recherche l’ensemble de ces contenus, l’usage de sitemaps différenciés est recommandé. Chacun de ces fichiers XML sera regroupé dans un fichier racine http://www.exemple.com/sitemap_index.xml indiquant aux robots l’ensemble des plans de site XML d’un seul et même site. Pour les sous-domaines, il faudra procéder de manière indépendante.
Voici l’exemple d’un index de sitemap contenant deux entrées : <?xml version=”1.0″ encoding=”UTF-8″?> <sitemapindex xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″> <sitemap> <loc>http://www.example.com/sitemap1.xml.gz</loc> <lastmod>2004-10-01T18:23:17+00:00</lastmod> </sitemap> <sitemap> <loc>http://www.example.com/sitemap2.xml.gz</loc> <lastmod>2005-01-01</lastmod> </sitemap> </sitemapindex> Sitemaps et contenus multimédias Alors que les vidéos ou les infographies ne cessent de gagner en popularité parmi les résultats de recherche, leur indexation devient un enjeu majeur de référencement. C’est pour cette raison que spécifier les contenus multimédias au sein de sitemaps XML est particulièrement recommandé. Chaque entrée d’un sitemap vidéo permet de spécifier aux robots des moteurs un certain nombre d’informations précieuses pour le référencement. Vous devrez renseigner les informations suivantes : titre, description, URL de la page de lecture, URL de la vignette et URL de la vidéo brute ou URL du lecteur Flash. Les formats supportés sont .swf, .mpg, .mpeg, .mp4, .mov, .wmv, .asf, .avi, .ra, .ram, .rm, .flv Les entrées d’un sitemap images permettent de fournir des informations supplémentaires qui viennent compléter la seule balise ALT. Outre le titre, une légende ou une indication de localisation peut être fournie. Un sitemap image permet également d’indexer les images contenues dans des pages codées en JavaScript ou d’attribuer des priorités aux différentes images associées à un URL.
Soumettre votre sitemap aux moteurs de recherche Une fois votre sitemap crée, il est temps de le soumettre aux moteurs de recherche supportant ce protocole. Pour ce faire, plusieurs moyens sont à votre disposition : 1. Vous pouvez le fournir directement aux moteurs selon leurs propres règles. 2. Vous pouvez utiliser votre robots.txt afin de spécifier son emplacement comme ici : Sitemap: http://www.exemple.com/sitemap.xml 3. Vous pouvez envoyer une requête http à l’aide de wget ou de curl par exemple. 4. Une fois votre site inscrit à Google Webmaster Tools, vous pouvez soumettre votre sitemap par le biais de cette plateforme. En cas de modification ou d’ajout de nouvelles entrées, vous devez soumettre de nouveau votre sitemap aux moteurs de recherche, ce qui est tout à fait possible en utilisant Webmaster Tool. En 5 jours, votre sitemap devrait être pris en compte. Si vous éprouviez des difficultés, vous pouvez consulter cette ressource de dépannage http://www.google.com/support/webmasters/bin/answer.py?answer=178644. Outils et ressources : XML.com (en anglais) W3.org (en anglais) Centre d’aide pour les Webmasters – à propos des sitemaps (en français)
Source de l’image : metropublisher.com Pourquoi utiliser un sitemap ? Comme évoqué plus haut, les plans de site XML aident à pallier les problèmes d’indexation des sites contenant notamment des contenus dynamiques ou des pages avec des contenus en AJAX ou Flash. Il est fortement recommandé d’accompagner la création d’un site avec celle d’un sitemap. En effet, les robots des moteurs explorent les sites en allant d’un lien à l’autre et si votre site est récent, il ne disposera pas d’un grand éventail de liens pointant vers ses pages, notamment vers les URLs les plus profonds. De manière générale, un sitemap XML permet aux robots de repérer et d’indexer les pages solitaires, bien qu’il soit fortement conseillé de doter son site d’un maillage de liens permettant aux moteurs d’identifier l’ensemble des pages, mais aussi leur hiérarchie. Comment créer un sitemap XML Cet extrait correspond à l’entrée d’un URL dans un plan de site. Les balises en italique sont facultatives. <?xml version=”1.0″ encoding=”UTF-8″?> <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″> <url> <loc>http://www.example.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url </urlset> Bien que facultatives, les balises suivantes s’avèrent tout à fait intéressantes. La balise <changefreq>monthly</changefreq> identifie la fréquence de modification de la page. « Never » doit ainsi être utilisé si la page est archivée. Cependant, ces balises ne sont que des indications pour les robots des moteurs de recherche, cela ne garantit en rien la fréquence de visite de ces pages. Une page notifiée « hourly » pourrait très bien être moins souvent visitée qu’une page marquée « never ». La balise <priority>0.8</priority> identifie la hiérarchie des pages au sein d’un même site uniquement. Spécifier la valeur des priorités des pages n’aide en aucun cas à obtenir un meilleur positionnement dans les résultats de recherche. En revanche, cela a l’immense avantage de différencier aux robots les pages principales des pages secondaires, ce qui soutient le travail d’optimisation SEO et l’attribution des mots clés aux différents URLs en termes de volume de recherche et de pertinence. Par défaut, la priorité est fixée à 0,5. Avis aux petits malins qui désireraient jouer de ruse avec les moteurs, il est absolument inutile de donner la valeur maximale à l’ensemble des URLs. Pourquoi doter son site de plusieurs sitemaps ? Un site internet est composé d’URLs correspondant à plusieurs types de contenus : des pages web classiques, mais aussi des images, des vidéos ou encore des contenus mobiles. Pour soumettre à l’index des moteurs de recherche l’ensemble de ces contenus, l’usage de sitemaps différenciés est recommandé. Chacun de ces fichiers XML sera regroupé dans un fichier racine http://www.exemple.com/sitemap_index.xml indiquant aux robots l’ensemble des plans de site XML d’un seul et même site. Pour les sous-domaines, il faudra procéder de manière indépendante.
Voici l’exemple d’un index de sitemap contenant deux entrées : <?xml version=”1.0″ encoding=”UTF-8″?> <sitemapindex xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″> <sitemap> <loc>http://www.example.com/sitemap1.xml.gz</loc> <lastmod>2004-10-01T18:23:17+00:00</lastmod> </sitemap> <sitemap> <loc>http://www.example.com/sitemap2.xml.gz</loc> <lastmod>2005-01-01</lastmod> </sitemap> </sitemapindex> Sitemaps et contenus multimédias Alors que les vidéos ou les infographies ne cessent de gagner en popularité parmi les résultats de recherche, leur indexation devient un enjeu majeur de référencement. C’est pour cette raison que spécifier les contenus multimédias au sein de sitemaps XML est particulièrement recommandé. Chaque entrée d’un sitemap vidéo permet de spécifier aux robots des moteurs un certain nombre d’informations précieuses pour le référencement. Vous devrez renseigner les informations suivantes : titre, description, URL de la page de lecture, URL de la vignette et URL de la vidéo brute ou URL du lecteur Flash. Les formats supportés sont .swf, .mpg, .mpeg, .mp4, .mov, .wmv, .asf, .avi, .ra, .ram, .rm, .flv Les entrées d’un sitemap images permettent de fournir des informations supplémentaires qui viennent compléter la seule balise ALT. Outre le titre, une légende ou une indication de localisation peut être fournie. Un sitemap image permet également d’indexer les images contenues dans des pages codées en JavaScript ou d’attribuer des priorités aux différentes images associées à un URL.
Soumettre votre sitemap aux moteurs de recherche Une fois votre sitemap crée, il est temps de le soumettre aux moteurs de recherche supportant ce protocole. Pour ce faire, plusieurs moyens sont à votre disposition : 1. Vous pouvez le fournir directement aux moteurs selon leurs propres règles. 2. Vous pouvez utiliser votre robots.txt afin de spécifier son emplacement comme ici : Sitemap: http://www.exemple.com/sitemap.xml 3. Vous pouvez envoyer une requête http à l’aide de wget ou de curl par exemple. 4. Une fois votre site inscrit à Google Webmaster Tools, vous pouvez soumettre votre sitemap par le biais de cette plateforme. En cas de modification ou d’ajout de nouvelles entrées, vous devez soumettre de nouveau votre sitemap aux moteurs de recherche, ce qui est tout à fait possible en utilisant Webmaster Tool. En 5 jours, votre sitemap devrait être pris en compte. Si vous éprouviez des difficultés, vous pouvez consulter cette ressource de dépannage http://www.google.com/support/webmasters/bin/answer.py?answer=178644. Outils et ressources : XML.com (en anglais) W3.org (en anglais) Centre d’aide pour les Webmasters – à propos des sitemaps (en français)
Comments are closed.






