11 Oorzaken van duplicate content (mét oplossing)
Het is één van de meest gevreesde situaties voor elke online marketeer: je komt erachter dat een groot deel van je content dubbel voorkomt op je site. Die mooie tekst die je hebt geschreven over blauwe fietsen staat op minstens drie pagina’s binnen je site! Deksels! Als Google dat ziet dan gaat het mis! Nu gaan al je rankings down the drain! Je wordt uit de index gegooid! Google komt langs en scheert je hond kaal! Toch?
Duplicate content penalty?
Zo’n vaart zal het niet lopen. In de meeste gevallen zul je van Google geen penalty krijgen als er duplicate content voorkomt op je site. Zoekmachines zijn behoorlijk slim als het gaat om het herkennen van gelijke stukken content. Als Google twee versies van een pagina van je site in de index heeft zal de versie die het beste is gaan ranken, de ander wordt simpelweg niet vertoond in de resultaten. Welke pagina het beste is zal liggen aan de kwaliteit en de hoeveelheid van inkomende links, de sitestructuur, clickdata en nog een handvol redenen.
Oorzaken van duplicate content
Hoe kom je aan duplicate content? En vooral, hoe kom je er weer vanaf? Hieronder de 11 meest voorkomende redenen met bijpassende oplossingen.
- www en non-www
Voorbeeld: domein.nl en www.domein.nl
Oplossing: redirect één van beiden naar de ander. Gebruik hiervoor een 301 redirect
- Trailing slash
Voorbeeld: domein.nl/blauwe-fiets en domein.nl/blauwe-fiets/
Oplossing: redirect één van beiden naar de ander. Gebruik hiervoor een 301 redirect of de canonical tag
- Product in meerdere categorieën
Voorbeeld: domein.nl/blauwe-fiets/blauwe-gazelle-herenfiets.html en domein.nl/gazelle/blauwe-gazelle-herenfiets.html
Oplossing: gebruik de canonical tag of vermijd het gebruik van categorieën in de url
- URL rewrite + oude URL communiceren
Voorbeeld: domein.nl/blauwe-fiets en domein.nl/?page_id=6, waarbij geen redirect wordt toegevoegd aan de rewrite regel
Oplossing: gebruik een redirect
- Filter criteria in URL
Voorbeeld: domein.nl/blauwe-fiets?size=20&sort=asc
Oplossing: gebruik de canonical tag, de meta robots noindex,follow of maak filters niet indexeerbaar
- Paginering
Voorbeeld: domein.nl en domein.nl/page/2
Oplossing: gebruik de meta robots noindex,follow of de canonical tag
- Session ID in URL
Voorbeeld: domein.nl/?sessionid=123456
Oplossing: geef geen session id mee aan de url of gebruik de canonical tag
- Https & http
Voorbeeld: http://domein.nl en https://domein.nl
Oplossing: vermijd gebruikvan https of gebruik een user-agent 301 redirect voor crawlers
- Printer friendly versie
Voorbeeld: domein.nl/blauwe-fiets.html?print=true
Oplossing: link naar printversie niet indexeerbaar, noindex,follow, uitsluiten in robots.txt
- Interne campagne tagging
Voorbeeld: domein.nl/blauwe-fiets.html?utm_source=internal&utm_medium=footer-links&utm_campaign=homepage
Oplossing: Gebruik hash (#) voor campagne tagging of gebruik de canonical tag
- Content syndication
Voorbeeld: domein.nl/blauwe-fiets.html en affiliate.nl/blauwe-fiets.html
Oplossing: Plaats een link naar de bron, cross domain canonical
Toch opzettelijk spammen?
Als je ervoor kiest om heel bewust de zoekresultaten te beïnvloeden door zowel blauwe-fiets.html als blauwe-fietsen.html aan te maken en daar dezelfde content voor te gebruiken, dan wordt het een iets ander verhaal. In dat geval bestaat de kans dat je inderdaad op termijn je rankings en dus je verkeer kwijt bent. Een quality rater die jouw site voorbij ziet komen en er een vlaggetje bij zet, een concurrent die je aangeeft bij Google of het algoritme dat jouw pagina’s er zelfstandig uitvist, er zijn genoeg manieren waarop je in een slecht daglicht komt te staan. Maar wees gerust, je hond laten ze sowieso met rust.
Dit bericht verscheen eerder op: Traffic4u weblog
“Dit bericht verscheen eerder op: Traffic4u weblog” Ehm… is het dan geen duplicate content? 😉
hahahaha David!
@davidbrinks: daar is natuurljik expres over nagedacht. Toch Wouter? 😉
Duh. Ik heb ook nog wel een blog vol met posts die ik een keer op MF wil zetten hoor, als jullie zitten te wachten op ’tips om meer merchandise te verkopen’ of ‘hoe ontwerp ik een t-shirt’.
@David Of het duplicate content is? Ik hoop het!
@merchboer Het moet wel relevant blijven natuurlijk, :).
hehe oh, begrijp me niet verkeerd, prima artikel en ik vind het prima dat het (ook) hier staat 😉
Veel voorkomende oorzaak van duplicate content is het overmatig gebruik van tags, zoals op weblogs vaak gebeurt. Met name door weinig voorkomende sleutelwoorden ontstaan binnen een site vaak talloze, nutteloze pagina’s waar steeds één en hetzelfde nieuws-/blogbericht staat. Spam dus, bedoeld of onbedoeld. Bij blogs liggen vaak nog andere gevaren op de loer, zoals de verhouding main content / sidebar op individuele itempagina’s (permalinks). Een beetje CMS of blogpakket (als WordPress) houdt daar tegenwoordig gelukkig rekening mee.
@wouter ik heb er nog eentje:
Heeft u andere domeinen die niet met een 301 geredirect staan maar met een alias waardoor ze beide in Google staan?
Gerelateerde artikelen
Marketingfacts. Elke dag vers. Mis niks!
Marketingfacts. Elke dag vers. Mis niks!