Google Nieuws alleen geschikt voor zoekmachine onvriendelijke websites?

22 februari 2006, 06:03

Hebben we net met trots de nieuwe website gelanceerd, waarbij we rekening hebben gehouden dat de URL-structuur zoekmachine- en gebruikersvriendelijk is, krijgen we van Google Nieuws te horen dat de nieuwe website niet kan worden opgenomen in de index:

Hallo Marco,

Bedankt voor uw vraag met betrekking tot opname in Google Nieuws. Na enig onderzoek hebben we vastgesteld dat ons systeem enkele van uw artikelen niet kan doorzoeken vanwege het formaat van hun URL’s. De artikel-URL moet een getal bevatten van ten minste drie cijfers, anders kan het artikel niet door Google Nieuws worden doorzocht.

Zo zal onze nieuwscrawler geen artikelen selecteren met de volgende URL’s:

http://www.marketingfacts.nl/berichten/ilsenl_converteert_het_beste/

http://www.marketingfacts.nl/berichten/postbank_start_proef_met_skype1/

Deze pagina’s zou de crawler wel doorzoeken:

http://www.marketingfacts.nl/berichten/ilsenl_converteert_het_beste/112233

http://www.marketingfacts.nl/berichten/123546postbank_start_proef_met_skype1/

Een voorbeeld van een site die we wel kunnen doorzoeken is http://english.chosun.com. U zult zien dat elk artikel op deze site een unieke URL heeft.

Onze excuses voor deze beperking van ons systeem. Laat het ons weten als u van uw kant veranderingen kunt doorvoeren die ons in staat stellen uw inhoud te doorzoeken.

Met vriendelijke groet,

Het Google-team

Ben benieuwd welke ‘briljante programmeur’ dit heeft bedacht maar het is werkelijk te zot voor woorden. Dan maar geen Google Nieuws!

Marco Derksen
Partner bij Upstream

Oprichter/partner Upstream, Marketingfacts, Arnhem Direct, SportNext, TravelNext, RvT VPRO, Bestuur Luxor Live, social business, onderwijs, fotografie en vader!

Categorie
Tags

35 Reacties

    Wilbert

    Het klinkt inderdaad wel vreemd. Ik denk dat wat Simon aangeeft ook niet mogelijk is. Je URL zal altijd uniek zijn, dus wat is het probleem?


    22 februari 2006 om 07:03
    media

    Simon, EE geeft in dat geval het tweede artikel automatisch een volgnummer.

    Het voorstel dat je geeft waarin gebruik wordt gemaakt maakt van meerdere subdirectories levert een slechtere score op in zoekmachines als Google dus heeft niet mijn voorkeur. Of zeg ik nu iets dat niet juist is? SEO-experts, wat denken jullie hiervan?


    22 februari 2006 om 07:04
    Arnout Veenman

    De huidige url’s zijn juist niet zoekmachine of nieuwscrawler vriendelijk, maar alleen voor de gebruiker van de zoekmachines, wat bovenstaande e-mail letterlijk bewijst. Een nieuwscrawler moet het verschil tussen nieuws en reguliere pagina’s kunnen opmerken en het verschil tussen een permalink en verschillende overzichts pagina’s. Vanuit het perspectief van een marketeer in eerste instantie totaal onlogisch, maar als programmeur kan ik je zeggen dat als je deze beperking niet zou hebben dat de nieuwscrawler nog velen malen gecompliceerder zou moeten zijn.


    22 februari 2006 om 07:06
    schief

    Als de normale url’s blijven werken en je alleen de url’s met nummer opgeeft aan Google news is er toch geen man overboord?


    22 februari 2006 om 07:07
    Sander Duivestein

    Marco,

    Als het goed is heeft ieder item op Marketingfacts een uniek nummer (zit in je database, primary key veld), waarom knal je die niet aan het einde van je url? Probleem opgelost. Waarschijnlijk 2 regels code aanpassen.


    22 februari 2006 om 07:35
    Simon

    @Marco: Ah, dan is EE nog beter dan ik dacht…

    En ook weer minder: heb ik met mijn reactie iets stuk gemaakt? Alle reacties na mij zijn vet… EE heeft van een < br >

    een <b r=””> (wtf?) gemaakt… :}

    Maar waarom geeft /22/02/06/ ervoor een slechte score in zoekmachines? Ik ben geen SEO expert maar ik weet dat heel veel weblog(systemen) deze structuur gebruiken.


    22 februari 2006 om 07:43
    Onno

    Ik neem aan dat het CMS ook in staat is om artikel id gebaseerde pagina’s uit te spugen? Waarom dan niet een tweede voorpagina maken die buiten beeld van de menselijke lezers is, maar die je wel bij Google nieuws aanmeldt?


    22 februari 2006 om 07:58
    Jelmer Voogel

    Wanneer je de url korter maakt of letters vervangt krijg je het laatste artikel uit de db te zien.


    22 februari 2006 om 08:05
    Anders

    “Wanneer je de url korter maakt of letters vervangt krijg je het laatste artikel uit de db te zien.”

    Als je cijfers in een telefoonnummer vervangt krijg je ook iemand anders aan de telefoon. Lijkt me logisch.

    Wat het “onhandige” betreft, dit valt wel mee. Wanneer je achteraf als schrijver de titel van een artikel aanpast, blijft de URL onveranderd. Het enige probleem zou kunnen zijn dat de woorden in de url niet overeenkomen met de nieuwe titel maar aangezien titels in de praktijk praktisch nooit worden gewijzigd, lijkt dat me niet zo’n probleem.


    22 februari 2006 om 08:20
    BasW

    Dit is toch oud nieuws? Ik heb die vraag, dan ivm de Amerikaanse Google News, al maanden geleden zien circuleren. Nu kun je dit natuurlijk heel gemakkelijk oplossen door de URL van ieder artikel even uit te breiden met de publicatiedatum, dus: “/de_naam_of _url_220206”.

    Lijkt me niet zo moeilijk om dit op te lossen, toch?

    Ander punt van aandacht is dat Google Nieuws alleen de artikelen van één van mijn sites oppikte als dit een ‘lees meer’ link bevatte, hou dit even in de gaten, en anders is het een kwestie van een mailtje naar Google, over het algemeen wordt daar adequaat op gereageerd.


    22 februari 2006 om 08:59
    Willem

    Marco, in EE kun je ook url’s met nummertjes genereren hè.

    Als je hulp nodig hebt, geef maar een gil, dan kan ik evt wel helpen.

    Raar btw, dat ze nummertjes nodig hebben, Telegraaf werkt toch ook niet met URL’s waar nummers in zitten?

    Groet,

    Willem


    22 februari 2006 om 09:09
    finzend

    Als optie zou je de feedburner-url kunnen gebruiken… die heeft een ID en je kunt meteen zien op welke artikelen geklikt wordt;)


    22 februari 2006 om 09:12
    Bart Noppen

    Wat is dat nu voor BS, een website waar ik recent aan meewerkte werd sinds vorige week opgenomen in Google News en de url’s bevatten helemaal geen cijfers ?!


    22 februari 2006 om 12:28
    media

    Bart, kun je aangeven om welke website dat ging?


    22 februari 2006 om 12:39
    Remi van Beekum

    We hebben het ID van een artikel uit de url gehaald en vervangen door de titel om een aantal redenen. Het is mooier, duidelijker, geeft een mooier resultaat in de zoekmachines en scoort beter. (keywords in url helpen beter te scoren)

    We zouden zowel het nummer als de titel in de url kunnen gebruiken, maar dat is totaal onlogisch. Zowel de titel als het id zijn uniek en daarmee kun je dus in de database het betreffende bericht opzoeken. Waarom dan beide gebruiken?

    Er is in mijn ogen geen enkele reden om die nummers in de url op te nemen. Zowel voor gebruikers als zoekmachines voegt dat simpelweg niets toe. Alleen voor Google News is het een voordeel.

    Maar inmiddels zijn ruimn 20.000 pagina’s van de nieuwe site geïndexeerd. Passen we de url nu weer aan, dan moeten die allemaal opnieuw geïndexeerd worden waardoor het langer duurt voordat we weer goed vindbaar zijn.

    Er zijn volgens mij 2 mogelijke oplossingen:

    – 2 varianten van de url’s gebruiken, en de versie met nummer aan de SE aanbieden. Maar dat is zo onlogisch dat ik dat een slecht idee vind.

    – Vanaf nu bij nieuwe artikelen het nummer toevoegen, maar bij oude niet.

    Die laatste is misschien een optie al moeten we even kijken of dat in de praktijk uit te voeren is.

    Maar eigenlijk vind ik het een enorme tekortkoming van Google News. Elk artikel heeft nu een unieke url en die is gewoon indexeerbaar en uniek identificeerbaar (bij de organische resultaten is er ook geen spiderprobleem). Je mag dus van Google verwachten dat ze dit op termijn op zullen lossen.

    Verder vraag ik me af of Google News MarketingFacts veel bezoekers op zal leveren. Ik zie nu vaak dat als bron voor een nieuwsartikel een blog wordt gebruikt. Even later pakken de ‘grote jongens’ (de kranten) het zelfde nieuws op, en dan worden zij als bron gebruikt. Zij krijgen dus het gros van de traffic en niet de blogs.


    22 februari 2006 om 13:41
    martijn

    “..2 varianten van de url’s gebruiken..” zou ik voorzichtig mee zijn mbt duplicaat-filters van Google

    Als het mogelijk is zou ik voor de variant kiezen “vanaf nu bij nieuwe artikelen het nummer toevoegen” en anders helemaal opnieuw indexeren, zoveel maakt het toch niet uit als je een week later goed vindbaar bent?


    22 februari 2006 om 14:59
    Bart Noppen

    Marco, ik heb je een mailtje gestuurd.


    22 februari 2006 om 15:18
    Anders

    Goed, dus nu moeten we de url gaan aanpassen vanwege een “programmeersfout” van Google News. Hoe lang duurt het voordat de boel opnieuw overhoop gegooid moet worden? Omdat bijvoorbeeld Flickr, Technorati, Del.ic.io.us, Yahoo of de zaterdagmiddagweblogzoekmachine van tante Katrijn uit Heerhugowaard niet met een standaard (!) url-structuur overweg kunnen?

    De groeten met je Google News, zou ik zeggen.


    22 februari 2006 om 18:19
    Anders

    “Google prefereert het minus teken”

    Ik vind dit een interessante discussie maar hoe goed ik ook zoek, ik kan hier alleen natte-vinger-meningen van so-called “experts” over vinden. Zijn er ook bronnen die deze stelling enigzins wetenschappelijk onderbouwen?

    “Als je in Google zoekt op bijvoorbeeld zoekmachine_marketing, staat marketingfacts op 2, laat je de underscores weg staat marketingfacts niet meer in de resultaten.”

    Wil je hiermee nou beweren dat Marketingfacts in het laatste geval op nummer 2 zou staan als het minus-teken gebruikt zou zijn in plaats van een underscore in de url? Net zeg je nog dat de url praktisch geen rol van betekenig speelt.

    Overigens: zoekmachinemarketing is één woord.


    22 februari 2006 om 23:33
    Paul Molenaar

    Zo proberen wij al een tijdje een antwoord te krijgen waarom een site als – laten we zeggen – Tubantia meer getoond wordt op news.google.nl dan Nu.nl… Voor mij nog volkomen onverklaarbaar.


    23 februari 2006 om 14:22
    Barry

    Hmm, dus als ik het goed begrijp heeft

    1. Marketingfacts geen unieke nummers in de URL

    2. Marketingfacts geen ‘dashes’ maar underscores in de URL.

    Goed werk Traffic4u 😉


    27 februari 2006 om 11:49
    media

    Jan, zou aardig zijn als je ons ook kunt laten weten wat het aan traffic oplevert en daarmee of het de moeite waard is om de URL-structuur aan te passen.


    1 maart 2006 om 09:44
    Jan

    Als statistiekenjunkie houd ik de boel natuurlijk goed in de gaten. Met de huidige 4 artikelen zal het niet al teveel traffic opleveren vermoed ik, maar ik zal tzt een update geven.


    1 maart 2006 om 09:56

Marketingfacts. Elke dag vers. Mis niks!