XML-sitemap eller HTML-sitemap?

Det uppstår fortfarande oklarheter kring sitemaps där en återkommande fråga är vilken typ man ska ha: HTML eller XML? Frågan ställs inte alltid direkt men eftersom jag ser att fler och fler sajter väljer antingen det ena eller det andra lite på måfå, verkar det som att det är lite oklart.

En sitemap i XML är ett dokument som används av sökmotorer för att läsa av vilka sidor (url:er) som din webbplats är uppbyggt av och i vilken ordning sökmotorers spindlar ska indexera din webbplats i.

En HTML sitemap är däremot enbart till för att hjälpa besökaren att orientera sig på webbplatsen.

  • HTML sitemap= en sitemap för besökarna
  • XML sitemap = en sitemap för sökmotorerna

Google rekommenderar är att man använder både en HTML sitemap och en XML sitemap. Det finns även ett tredje alternativ som kallas XSLT som innebär att man kan skapa html och css för sin XML sitemap.

Verktyg för att skapa en sitemap

http://www.xml-sitemaps.com/

http://code.google.com/p/googlesitemapgenerator/

http://wordpress.org/extend/plugins/google-sitemap-generator/

XML Sitemap

  • En sitemap  måste ha vissa XML-taggar.
  • All data måste vara entity escaped
  • Filen måste vara UTF-8 encoded.
  • Sitemappen bör ligga i roten och döpt enligt exempel: www.exempel.se/sitemap.xml

En XML sitemap måste:

  • Börja med en <urlset> och sluta med </urlset>
  • Specificera namespace (protocol standard)  i <urlset>
  • <url> för varje url som en rottag
  • <loc> för varje <url>

Alla andra taggar är tillval.

Nedan är ett exempel på en sitemap med nödvändiga taggar för en URL:

<?xml version=”1.0″ encoding=”UTF-8″?>

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

<url>

<loc>http://www.exampel.se/</loc>

</url>

</urlset>

Ersättningskoder

Alla datavärden inklusive webbadresser måste använda ersättningskoder för de tecken som anges i tabellen nedan.

Tecken               Ersättningstecken

Ampersand &         &amp;

Single Quote ‘         &apos;

Double Quote ”      &quot;

Mindre än >           &gt;

Större än  <            &lt;

Valfria element för en XML-sitemap

<lastmod> berättar när URL senast var förändrad. Tiden är utformad enligt W3C Datetime, alltså exempel 2009-11-25.

<changefreq> definierar hur frekvent URL:n troligtvis kommer att uppdateras.  De värden som finns att välja på är: always, hourly, daily, weekly, monthly, yearly och never.

<priority>  är ett relativt värde mellan 0.0 till 1.0 som berättar hur viktig en URL är jämfört med de andra URL:erna.

Om flera URL:er har samma värde är de lika viktiga

Om en (exempel) en URL har värde 0.1 och en annan URL har värde 1.0 innebär det att den med värdet 1.0 är mycket viktigare.

 Nedan är en exempelsitemap med valfria värden:

<?xml version=”1.0″ encoding=”UTF-8″?>

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

<url>

<loc>http://www.exampel.se/</loc>

<lastmod>2005-0801</lastmod>

<changefreq>monthly</changefreq>

<priority>0.7</priority>

</url>

</urlset>

Validera din sitemap:

Innan du låter sökmotorer veta om din XML-sitemap bör du validera den.

Registrera din XML-sitemap i Googles verktyg för webbansvariga så kommer Google kolla om den är ok.

Validome: Google Sitemap Validator

The W3C Markup Validation Service

Källor:

http://www.sitemaps.org/protocol.html

http://www.seo-guide.se/xml-sitemap

Author: Joakim Trolle

Om du gillade det här inlägget, lämna gärna en kommentar eller prenumerera via RSS så du inte missar framtida inlägg.

Speak Your Mind

*