Hur duplicerat innehåll påverkar din sajt negativt

Ett av de viktigaste målen för Google är att leverera relevanta och precisa sökresultat. När du gör en sökning och vi vet nog alla hur frustrerande det kan vara när man gör en sökning för att sedan hitta flera olika sidor med exakt samma innehåll i sökresultatet. Vilken länk ska jag klicka på?

Google lever och frodas så bra som de gör bland annat  eftersom de är fullt medvetna om att relevanta sökresultat är otroligt viktigt. Annars kommer folk i slutändan att överge dem för en annan sökmotor som kan leverera resultat som är mer relevant.

När Google indexerar Internet tittar de på innehållet och oavsett om det är innehåll på samma domän eller utspridda på flera olika helt orelaterade till varandra kommer någon av dem att straffas för det duplicerade innehållet.

Anledningen till att man har duplicerat innehåll på sin egna sajt kan bero på många olika saker och här tänkte jag gå igenom några av de vanligaste.

Duplicerat innehåll = minskad synlighet

Till att börja med vet vi att Google straffar sajter med duplicerat innehåll, men det går inte att säga att “så här hårt är straffet för just dig” då deras algoritmer som räknar ut detta inte är officiella utan enbart kända av ett par väldigt högt uppsatta ingenjörer hos Google. Detta är alltså en algoritm som vi inte kan kontrollera, så vi får helt enkelt anpassa oss efter den om vi vill ha en chans att synas i det alltjämt viktiga sökresultatet som många livnär sig på idag.

Hur hårt skulle det drabba dig ekonomiskt om dina viktigaste sökord helt plötsligt försvann från Googles förstasida som du så hårt och länge kämpat för att nå?

Genom att aktivt jobba med att minimera för att slutligen utesluta duplicerat innehåll säkerställer du att du inte kan straffas för det och förlora viktiga positioner i det organiska sökresultatet.

Vart kommer duplicerat innehåll ifrån?

Eftersom sidor med samma innehåll på ens sajt är ett av de största problem som webbansvariga möter idag gäller det att ha koll på vart på din sajt du har det, samt hur du kommer till botten med problemet för att bli av med det.

Ett väldigt enkelt exempel är att använda sig av Google för att kolla hur många sidor de faktiskt har indexerat på din sajt.

Genom att göra en sökning på Google där du skriver site:dindomän.se (se exempel med dn.se ovan) får du en idé om hur många olika sidor som Google faktiskt har indexerat på din sajt. I DN:s fall visar Google 999,000 sidor vilket kan vara sant då det är en nyhetssajt med väldigt mycket innehåll.

Som webbansvarig har du säkerligen koll på hur många sidor du faktiskt har på din sajt (om inte annat borde ditt CMS ha det), och om siffran som Google visar är avsevärt mycket högre än din faktiska siffra står du inför ett problem.

Fisherman's Morning (Foto: Alexander Kuznetsov)

Flera URL:er för samma innehåll

Det CMS man använder sig av kan ofta ställa till med en del problem i och med att det mer än gärna skapar flera olika sidor med samma innehåll på olika URL:er.

Ett exempel här är den populära plattformen WordPress som mer än gärna skapar samma innehåll på olika URL:er. Föreställ dig detta scenario:

  • Startsidan innehåller en nyhet, kategoriserad under “nyhet”, som även länkar till en URL med enbart denna nyhet. (www.domän.se). På startsidan finns det allt som oftast mycket mer innehåll så detta är sällan ett problem.
  • Sidan som innehåller själva nyheten, och som borde vara huvudsidan för den specifika söktermen. (www.domän.se/nyhet/nya-produkter/)
  • Översiktssidan med alla nyheter innehåller texten i sin helhet med en länk tillbaka till originalinlägget. (www.domän.se/kategori/nyhet/)
  • Kanske är nyheten taggad (i WordPress) med “produkter”, vilket innebär att vi kommer att se samma innehåll även på översiktssidan för alla inlägg taggade med “produkter”. (www.domän.se/tag/produkter/)

Ett annat inte fullt lika vanligt problem är att man har en sajt med www.domän.se och en med domän.se med exakt samma innehåll. Även om man kan tro att detta är samma sida kommer Google att tolka detta som två helt olika sidor. Här handlar det bara om att bestämma sig för om man vill köra med eller utan www.

Förslag på lösningar:

  • Använd dig av “Läs mer…”-funktionalitet på översiktssidor och dylikt så du bara visar en del av innehållet. Låt sedan besökaren (och Google) klicka sig vidare till originalinlägget med all text.
  • Använd dig av attributet noindex på de undersidor som inte ska indexeras, som exempelvis kategoriöversikter, så tillvida att det inte är produktöversikter där det är mycket relevant med en stark och bra indexerad sida.
  • Använd dig av rel=”canonical” i de fall det går och är relevant.
  • Om en URL har skapats med innehåll identiskt med en annan som du inte längre behöver behålla använder du dig av en 301 Redirect för att peka om den gamla till den nya.

Parametrar i URLen

En annan vanlig sak som bidrar till duplicerat innehåll är att man har en URL med en eller flera olika parametrar efteråt som alla visar samma sida.

  • www.domän.se/produkt/svart-cykel/
  • www.domän.se/produkt/svart-cykel/?color=black
  • www.domän.se/produkt/svart-cykel/?campaign=rea
  • www.domän.se/produkt/svart-cykel/?campaign=rea&color=black&loggedin=true

Alla dessa påhittade URL:er visar i grund och botten samma sida, en produktsida med en svart cykel som man har REA på. Problemet ligger i att Google ser skillnad på de olika varianterna och därmed skapas duplicerat innehåll.

Lösningen på problemet

I det här fallet kommer rel=”canonical” in som räddaren i nöden. Med denna meta tagg får du en möjlighet att i själva koden tala om för sökroboten som är och hälsar på vilken sida som är originalsidan som de ska fokusera och trycka länkkraften emot.

<head>
<title>Svart Cykel</title>
<link rel=”canonical” href=”http://www.domän.se/produkt/svart-cykel/”/>
</head>

Genom att använda sig av rel=”canonical” på alla de dynamiska URL:er som kan skapas så pekar du helt enkelt om sökroboten till att indexera din utvalda URL istället.

Blanda stora och små bokstäver i URLen

Praxis är att använda sig av små bokstäver i sina URLer. Se på nedan exempel och problematiken som kan uppstå.

  • www.domän.se/produkter/
  • www.domän.se/Produkter/

Vid första anblick kan man tro att detta är samma URL, men så är inte fallet då bokstaven “p” finns med både som gemen och som versal. Om du som sajtägare väljer att använda dig av stort “P” och i någon länk på sidan råkar skriva med litet “p” drabbas du faktiskt inte av duplicerat innehåll utan du kommer att mötas av en 404: Sidan finns inte. 

Detsamma gäller om någon väljer att länka till din sajt och skriver med ett litet “p”, som de allra flesta faktiskt gör.

Skulle du däremot råka skapa ytterligare en sida (eller om ditt CMS gör det åt dig) så drabbas du av duplicerat innehåll.

Lösningen på problemet

Den här är väldigt enkel: Använd dig uteslutande av små bokstäver i dina URLer!

Skulle du idag använda dig av stora URLer är min rekommendation att du successivt byter ut dessa mot små, ändrar på målsidan till liten bokstav/bokstäver och sedan gör en 301 Redirect från den “felaktiga” URLen till den mer korrekta med små bokstäver.

Session ID

En sista variant som vi ser till och från är att man lägger till ett session ID i slutet av URL:en för att följa en användare genom sitt besök. En url med ett session ID kan exempelvis se ut så här:

  • www.domän.se/?sessionID=j6oAOxCWZhCD723LGeXlf

I det här läget har med största sannolikhet Google indexerat din sida som www.domän.se eller kanske till och med en annan session ID. Detta innebär kort och gott att varje besökare presenteras med en unik sida i Googles ögon och återigen ser vi problemet med duplicerat innehåll.

Att använda sig av session ID’s är vanligt förekommande och ett annat exempel kan vara att hålla reda på om en besökare är inloggad eller inte.

Föreställ dig:

  • www.domän.se/?loggenin=true
  • www.domän.se/?loggedin=false

Lösningen på problemet

Här skulle jag rekommendera att du istället för att använda dig av detta ID i själva URL:en sparar den direkt i koden och använder den “bakom kulisserna” så att du utåt sett kan presentera samma URL för alla besökare.

Använd alltid unikt innehåll på varje sida!

Foto: Alexander Kuznetsov

Det är allt för enkelt att använda sig av en och samma mall där man bara ändrar lite småsaker (färg, storlek, etc) och sedan publicerar flera olika sidor med allt för lika innehåll.

Denna punkt har man som webbredaktör hört otaliga gånger, men den tål att upprepas.

Skriv bra och unikt innehåll, det lönar sig!

Behöver du hjälp?

Har du problem med din sajt som du inte lyckas lösa är du alltid välkommen att kontakta oss. Exakt hur man går tillväga för att lösa problemet med duplicerat innehåll varierar från plattform till plattform även om grundtänket alltid är densamma.

Om du gillade det här inlägget, lämna gärna en kommentar eller prenumerera via RSS så du inte missar framtida inlägg.

Comments

  1. Michael Baggelin says:

    Detta är enligt Google själva ett väldigt litet problem som var aktuellt några år sedan… Det känns lite gammalt 😉

    • Hej Michael,

      Här får vi nog vara oeniga då jag är helt övertygad om att duplicerat innehåll än idag påverkar sajter negativt.

      Om inte annat så ser jag det på olika sajter dagligen, och genom att aktivt jobba bort det så ökar synligheten och rankingen i SERPen.

    • Odonald says:

      Vadå liten problem? I och med detta så kan vem som helst duplicera en konkurrents innehåll och få den straffad.

  2. Lars Eriksson says:

    Duplicerat innehåll kan ge andra problem (på samma domän). Säg att du har en site med några tusen sidor (typiskt e-handel eller nyhetssite). När Google ska indexera siten så behöver den “crawla” igenom extra många sidor och det innebär att det tar helt enkelt längre tid innan de sidor, eller förändringar du gjort syns i Google. Ett par tusen sidor kan lätt bli flera hundra tusen sidor om man har otur.

    Vanliga anledningar kan vara url parametrar för exempelvis filter eller annat som orsakar dessa “extrasidor”.

    Nu är Google ganska smart och kan hitta sidor som är väldigt lika och helt enkelt ignorera dem, men det är absolut ingen garanti. Titta gärna i webmaster tools, där går det se indexerings status, tryck avancerat så får ni mer information.

Trackbacks

  1. […] ett SEO-perspektiv är detta inte speciellt genomtänkt. Google känner i detta fall av att det är duplicerat innehåll och kan därmed bestämma att innehållet inte är relevant och intressant nog för läsaren. Då […]

Speak Your Mind

*