11 Oorzaken van duplicate content (mét oplossing)

30 maart 2011, 07:44

Het is één van de meest gevreesde situaties voor elke online marketeer: je komt erachter dat een groot deel van je content dubbel voorkomt op je site. Die mooie tekst die je hebt geschreven over blauwe fietsen staat op minstens drie pagina’s binnen je site! Deksels! Als Google dat ziet dan gaat het mis! Nu gaan al je rankings down the drain! Je wordt uit de index gegooid! Google komt langs en scheert je hond kaal! Toch?

Duplicate content penalty?

Zo’n vaart zal het niet lopen. In de meeste gevallen zul je van Google geen penalty krijgen als er duplicate content voorkomt op je site. Zoekmachines zijn behoorlijk slim als het gaat om het herkennen van gelijke stukken content. Als Google twee versies van een pagina van je site in de index heeft zal de versie die het beste is gaan ranken, de ander wordt simpelweg niet vertoond in de resultaten. Welke pagina het beste is zal liggen aan de kwaliteit en de hoeveelheid van inkomende links, de sitestructuur, clickdata en nog een handvol redenen.

Oorzaken van duplicate content

Hoe kom je aan duplicate content? En vooral, hoe kom je er weer vanaf? Hieronder de 11 meest voorkomende redenen met bijpassende oplossingen.

  • www en non-www

    Voorbeeld: domein.nl en www.domein.nl

    Oplossing: redirect één van beiden naar de ander. Gebruik hiervoor een 301 redirect

  • Trailing slash

    Voorbeeld: domein.nl/blauwe-fiets en domein.nl/blauwe-fiets/

    Oplossing: redirect één van beiden naar de ander. Gebruik hiervoor een 301 redirect of de canonical tag

  • Product in meerdere categorieën

    Voorbeeld: domein.nl/blauwe-fiets/blauwe-gazelle-herenfiets.html en domein.nl/gazelle/blauwe-gazelle-herenfiets.html

    Oplossing: gebruik de canonical tag of vermijd het gebruik van categorieën in de url

  • URL rewrite + oude URL communiceren

    Voorbeeld: domein.nl/blauwe-fiets en domein.nl/?page_id=6, waarbij geen redirect wordt toegevoegd aan de rewrite regel

    Oplossing: gebruik een redirect

  • Filter criteria in URL

    Voorbeeld: domein.nl/blauwe-fiets?size=20&sort=asc

    Oplossing: gebruik de canonical tag, de meta robots noindex,follow of maak filters niet indexeerbaar

  • Paginering

    Voorbeeld: domein.nl en domein.nl/page/2

    Oplossing: gebruik de meta robots noindex,follow of de canonical tag

  • Session ID in URL

    Voorbeeld: domein.nl/?sessionid=123456

    Oplossing: geef geen session id mee aan de url of gebruik de canonical tag

  • Https & http

    Voorbeeld: http://domein.nl en https://domein.nl

    Oplossing: vermijd gebruikvan https of gebruik een user-agent 301 redirect voor crawlers

  • Printer friendly versie

    Voorbeeld: domein.nl/blauwe-fiets.html?print=true

    Oplossing: link naar printversie niet indexeerbaar, noindex,follow, uitsluiten in robots.txt

  • Interne campagne tagging

    Voorbeeld: domein.nl/blauwe-fiets.html?utm_source=internal&utm_medium=footer-links&utm_campaign=homepage

    Oplossing: Gebruik hash (#) voor campagne tagging of gebruik de canonical tag

  • Content syndication

    Voorbeeld: domein.nl/blauwe-fiets.html en affiliate.nl/blauwe-fiets.html

    Oplossing: Plaats een link naar de bron, cross domain canonical

Toch opzettelijk spammen?

Als je ervoor kiest om heel bewust de zoekresultaten te beïnvloeden door zowel blauwe-fiets.html als blauwe-fietsen.html aan te maken en daar dezelfde content voor te gebruiken, dan wordt het een iets ander verhaal. In dat geval bestaat de kans dat je inderdaad op termijn je rankings en dus je verkeer kwijt bent. Een quality rater die jouw site voorbij ziet komen en er een vlaggetje bij zet, een concurrent die je aangeeft bij Google of het algoritme dat jouw pagina’s er zelfstandig uitvist, er zijn genoeg manieren waarop je in een slecht daglicht komt te staan. Maar wees gerust, je hond laten ze sowieso met rust.

Dit bericht verscheen eerder op: Traffic4u weblog

Wouter Kiel
Global SEO Manager bij Travix

Travix is het grootste online reisbedrijf van Nederland en beheert een portfolio van zes onafhankelijke websites in meer dan 40 landen. Als Global SEO Manager ben ik verantwoordelijk voor de SEO strategie van alle labels, waaronder CheapTickets.nl en vliegwinkel.nl in Nederland, en Budgetair.fr, Budgetair.co.uk en Flugladen.de in het buitenland.

Categorie
Tags

9 Reacties

    Hardcopy

    “Dit bericht verscheen eerder op: Traffic4u weblog” Ehm… is het dan geen duplicate content? 😉


    30 maart 2011 om 08:15
    Richard Theuws

    hahahaha David!


    30 maart 2011 om 08:16
    mgvandenbroek

    @davidbrinks: daar is natuurljik expres over nagedacht. Toch Wouter? 😉


    30 maart 2011 om 08:21
    Richard Theuws

    Duh. Ik heb ook nog wel een blog vol met posts die ik een keer op MF wil zetten hoor, als jullie zitten te wachten op ’tips om meer merchandise te verkopen’ of ‘hoe ontwerp ik een t-shirt’.


    30 maart 2011 om 08:24
    wouterkiel

    @David Of het duplicate content is? Ik hoop het!


    30 maart 2011 om 08:43
    wouterkiel

    @merchboer Het moet wel relevant blijven natuurlijk, :).


    30 maart 2011 om 08:45
    Richard Theuws

    hehe oh, begrijp me niet verkeerd, prima artikel en ik vind het prima dat het (ook) hier staat 😉


    30 maart 2011 om 08:53
    Rik Louist

    Veel voorkomende oorzaak van duplicate content is het overmatig gebruik van tags, zoals op weblogs vaak gebeurt. Met name door weinig voorkomende sleutelwoorden ontstaan binnen een site vaak talloze, nutteloze pagina’s waar steeds één en hetzelfde nieuws-/blogbericht staat. Spam dus, bedoeld of onbedoeld. Bij blogs liggen vaak nog andere gevaren op de loer, zoals de verhouding main content / sidebar op individuele itempagina’s (permalinks). Een beetje CMS of blogpakket (als WordPress) houdt daar tegenwoordig gelukkig rekening mee.


    30 maart 2011 om 18:01
    Keesjan Deelstra

    @wouter ik heb er nog eentje:

    Heeft u andere domeinen die niet met een 301 geredirect staan maar met een alias waardoor ze beide in Google staan?


    31 maart 2011 om 18:59

Marketingfacts. Elke dag vers. Mis niks!