RTL voorloper in big data met eigen platform
De afdeling data-analyse van RTL Nederland bouwde haar eigen technisch platform voor dataverwerking. Nu nog leren de data nuttig toe te passen. En ten dienste van de creatieve geesten, zonder hen voor de voeten te lopen. In aanloop naar Mediapark Jaarcongres sprak Peter Olsthoorn met Geoffrey van Meer, manager consumer intelligence bij RTL Nederland, over de manier waarop RTL in dit videotijdperk omgaat met data bij de productie van content, marketing en verkoop.
Op 23 juni staat Mediapark Jaarcongres in het teken van ‘The Video Age’, met aandacht voor allerlei video-innovaties, bijvoorbeeld op het gebied van data, search en personalisatie. Peter Olsthoorn sprak van tevoren met Geoffrey van Meer over de manier waarop RTL omgaat met data.
Let op: met de speciale kortingscode voor Marketingfacts-lezers betaal je geen 299, maar slechts 195 euro voor je ticket voor Mediapark Jaarcongres! Zie onderaan dit artikel voor meer informatie.
Vorig jaar april sprak Van Meer al tijdens het Cross Media Café over media & data, met als uitgangspunt het antwoord op de vraag: welke content scoort op welk platform? Van Meer onderscheidde daarbij drie doelen van data-analyse:
- Marketing-intelligence: behoud en toename van de klandizie dankzij kijk- en klik-gedrag.
- Sales-intelligence: data voor verhoging van omzetgerichte reclame.
- Content-intelligence: aanbevelingen en inkoop verbeteren.
RTL heeft een groot ecosysteem met vijf lineaire zenders, Videoland video on demand en RTL XL, maar ook het reclameverkoopplatform Spotexchange, de website inclusief Buienradar en de evenementen. Allemaal met eigen datastromen, met momenteel in totaal een kleine vijf miljoen geregistreerde en/of herkende personen.
Van Meer: “Die data brengen we bij elkaar en we halen er subsets uit om te analyseren naar gelang de behoefte van het platform. Dus met Buienradar kunnen we straks locaties van bezoekers vaststellen en – als we ze identificeren – dat koppelen aan kijkgedrag en interesse in reclame.”
De aanbieder met de meeste data en vooral de slimste algoritmes zal de strijd in de media winnen, verwacht Van Meer. Tenminste, in wisselwerking met de creatieve kracht van mensen, want het is in een creatief bedrijf altijd de combinatie van mens en machine. Een megapakhuis vol met data leidt niet vanzelfsprekend tot een optimaal videobedrijf. RTL moet nog grote stappen zetten in toepassing van data.
Beeld en geluid in data
“De marketing- en de sales-intelligence staan wel in de stijgers, maar de content-intelligence moet de komende jaren goed op de rit komen. Concurrenten als Netflix en YouTube doen het ook. Ze analyseren al beelden en scripts”, zegt Van Meer nu, een jaar later.
Content-intelligence behelst het vergaren en analyseren van heel veel informatie over series, films en spelletjes teneinde de productie en inkoop daarvan te optimaliseren. Dat kan bijvoorbeeld door het vergaren en analyseren van teksten van ondertiteling. Van Meer: “Ik wil weten wat ze zeggen. Dat gaat van ‘veel vloeken’ in een film tot bepaalde conversaties tussen geliefde acteurs. Bij welke daarvan haken kijkers af en wat bindt hen juist? Welke combinaties van content kiest het publiek, een doelgroep of zelfs individu?”
Een tweede middel is het vergaren van data uit gezichtsherkenning. De dataclub van RTL heeft een eigen algoritme ontwikkeld (met open source software) voor herkenning en dat getest op Videoland in de langlopende serie Blacklist. “Alle acteurs herkennen we in alle scènes en ook daarbij kunnen we bepalen wie en wat goed en minder goed scoort. We hebben ook herkenning toegepast op de gezichten aan tafel in de tv-praatprogramma’s Voetbal Inside en RTL Late Night met Humberto Tan. We kunnen dus de reacties van kijkers naar kenmerken per moment van de uitzending bepalen.”
Al jaren kan Kijkonderzoek (SKO) precies het tijdstip van afhaken tijdens tv-programma’s bepalen, dus wat voegt dit toe? “Je legt kwantitatief vast hoe lang een persoon in beeld is, de kenmerken van een gast, welke gasten er op welke manier converseren – en je zet dit af tegen kijkcijfers per moment en naar groep of individu.”
RTL kan de content-intelligence nu grafisch weergegeven. De data-analisten kunnen op een dashboard op het scherm scrollen door de weergave van het programma in beelden en op die manier snel afhaakpunten analyseren. Zo heeft RTL de stickiness van de kijker als maatstaf ontwikkeld, oftewel het beklijven. Van Meer: “Dat is iets heel anders dan de kijkdichtheid. We kunnen straks per zender, per programma, tijdstip en soort beeld de attractie vaststellen.”
Volgens Van Meer is dit een fraai middel voor zijn RTL-collega’s die programma’s ontwikkelen. “Die scriptwriters willen weten wat er wel en niet werkt en hoe. En ze kunnen straks hun argumenten kracht bijzetten met data. Dit is een instrument om in discussie te gaan met producenten – en met adverteerders die altijd een mening hebben over het programma.”
Data bepalend voor content?
Kon je zien welke gasten bij Tan en Derksen en welke uitingen er wel en niet voor afhaken zorgden en is dat boeiend? Van Meer: “Ja, ongeveer wel, maar dat hebben we niet met de makers besproken. We zitten nu in een fase van het leren. We moeten meer onderzoek doen om bevindingen beter te onderbouwen.”
Dus de datajongens permitteren zich straks uitspraken over de kwaliteit en attractiviteit van programma’s? Van Meer: “Ik zal nooit op de stoel van de contentdirecteur gaan zitten. Dat kan ik helemaal niet, hij heeft het talent. Ik kan wel helpen om de keuzes voor kwaliteit beter te funderen, de besluitvorming te ondersteunen.”
Van Meer is dus voorzichtig. RTL is gestoeld op creativiteit en de content wordt gemaakt, ingekocht en gedurende het vertonen geanalyseerd door creatieve geesten. “We doen dat al 25 jaar met succes, want we hebben in belangrijke doelgroepen de hoogste kijkcijfers. Ik moet dus heel goed uitkijken met opmerkingen en helder hebben wat de toegevoegde waarde is. Het heeft geen zin om met feit te komen die al bekend zijn bij de makers.”
Treedt er toch een zekere spanning op tussen besluitvorming op grond van data en van creativiteit? Van Meer: “Je kunt niet alles oplossen en bepalen met data. Wij gebruiken altijd historische data, dus kijken terug om te voorspellen. Het risico is dat je in een tunnel blijft zitten, terwijl de creatieve collega’s unieke combinaties bedenken waar je met onze achteruitkijkspiegel nooit op komt. Ik kan met data geen volledig nieuw format berekenen.”
Maar kunnen data ook creativiteit losmaken en stimuleren? Stel, een programma gemaakt voor vrouwen trekt onverwacht veel hoogopgeleide mannen tussen de 25 en 35 jaar. Kan een programmamaker daarop inspelen met een nieuw format dat zij niet zelf bedacht zou hebben? “Ja, dat kan heel goed, maar je kunt de creatief niet vervangen, integendeel”, zo blijft Van Meer voorzichtig.
Dataplatform: bijdrage aan marketing en verkoopanalyse
De afdeling data-analyse van RTL Nederland bouwde haar eigen technisch platform voor dataverwerking. Welke bijdrage levert de data-afdeling aan de verhoging van online omzet bij gebruikers en adverteerders? Van Meer: “Keuzes voor aanbevelingen van RTL XL en Videoland ondersteun ik met data, maar ik kan de financiële bijdrage hiervan niet tastbaar maken. Data-analyse ondersteunt prijsvorming, inkoop van content, maar ook de samenstelling van nieuwsbrieven en uiteraard de aanbevelingen voor kijkers.”
De reclameclub van RTL biedt nu audience-based sales aan op basis van data, net als Facebook en Google dat bieden. RTL begon er met een aantal adverteerders voorzichtig mee. Wat levert dat extra op naast de bestaande segmentatie naar zenders voor doelgroepen, de programma’s voor nog smallere doelgroepen? Van Meer: “Voorheen boden we adverteerders de voetballiefhebbers aan – met name mannen – rond Voetbal Inside. We kunnen nu de groepen kijkers naar geslacht, leeftijd, interesses en omvang bieden bij elk programma.”
En is niet elk individu een doelgroep? “We weten individueel via welke apparatuur ze welke content bekijken. We kunnen bijvoorbeeld ook sport kijkende vrouwen onderscheiden, of de geïnteresseerden in tech op grond van het nieuws dat ze online bekijken.’
Klinkt dit klinkt niet grofmazig anno 2016? Van Meer beaamt: “Vooralsnog blijven we hangen in de tv-doelgroepen, leeftijd, geslacht, boodschapper. Die blijven belangrijk. Adverteerders en mediabureaus moeten immers ook wennen aan nieuwe indelingen en banderingen, maar ze vinden bijvoorbeeld het traceren van mannen met tech-interesse wel boeiend.”
Maar dan heb je het nog over een heel diverse groep. Willen adverteerders niet veel specifieker personen benaderen die de nieuwste Samsung willen of fervente Apple-gebruikers zijn? “Ja, op dit vlak zijn er nog veel stappen te zetten. Ik vermoed dat we bij televisie allemaal moeten wennen aan de overgang naar kleinere doelgroepen. We zijn gewend te denken in honderdduizenden kijkers.”
Hokjesman spelen
Wat zijn de successen met data? Van Meer: “We hebben hele mooie modellen draaien om leeftijd en geslacht te voorspellen. En het is leuk om uit het brede ecosysteem heel veel profielen te distilleren. We koppelen de gebruiksdata van Videoland, RTL XL en Buienradar geavanceerd aan elkaar in look-a-like modelling.”
Look-alike werken betekent het modelleren van gedrag. “Je hebt overeenkomende karakteristieken van soorten tv-kijkers. Op basis van kijk- en klikgedrag bepalen we zo exact mogelijk de kenmerken en interesses van elke bezoeker, en delen die dan in hokjes in op grond van de look-alike.”
Zelfs bij niet-geregistreerden is niet enkel het geslacht, maar ook de leeftijd steeds nauwkeuriger vast te stellen met statistische marges. “Dat zijn geavanceerde modellen waarmee adverteerders veel kunnen. Op tv schiet je doorgaans met hagel rondom een programma, online kun je veel scherper vaststellen met wie je te maken hebt.”
De hokjes die tot nu toe gehanteerd worden voor Videoland zijn nog schaars in aantal met de drama kijkende vrouwen, de actie kijkende mannen, de familiekijker, etcetera. “De segmentaties moeten we steeds bijstellen op grond van verandering van kijkgedrag met het aanbod van nieuwe content. Een nieuwe collectie genereert ander kijkgedrag en nieuwe segmenten. Bij de bank ging een segmentatie van de klantbestanden vijf jaar mee, maar bij video gaat het veel sneller en is het dus veel leuker.”
Zo voegt Videoland een flinke hoeveelheid kindertitels toe, wat veel data van huishoudens met kinderen zal genereren. “Wij analyseren en komen tot nieuwe segmenten, maar de business plakt de labels op de groepen. Dat is het leukste, je gaat als een detective trekken aan en duwen tegen die data tot er concrete, relevante correlaties naar boven komen.”
Wat zijn verrassende uitkomsten van data-analyse buiten de bekende voorbeelden van mannen-sport-bier? “Veel uitkomsten komen nu eenmaal overeen met je intuïtie, maar we kwantificeren die correlaties veel nauwkeuriger dan voorheen. Inderdaad is het leukste als een uitkomst je intuïtie tegenspreekt.” Voorbeelden houdt Van Meer graag in de eigen keuken.
Wordt kijkgedrag minder voorspelbaar? Van Meer: “Mediagedrag is zeer veranderlijk op verschillende platforms. Vooral die scharnier tussen televisie en online vereist constante aandacht en is strategisch van groot belang. Want de digitale disruptie in distributie en consumptie gaat ineens heel snel in de media.”
Privacy vooruit zijn
RTL heeft een kleine vijf miljoen individuen in de databank, vaak op naam. Ook huishoudens per persoon worden in kaart gebracht de komende jaren. Nu al kan RTL personen met meer ID’s in de databank traceren en ‘ontdubbelen’. Hoe ver mag RTL gaan? Privacy is de afgelopen twee jaar aangehaald. Een eigen privacy-officer kijkt mee bij de ‘targeting’. De teksten van de privacyvoorwaarden van verschillende diensten zijn recent uniform gemaakt.
Van Meer: “We willen verder gaan dan snel toestemming vragen. We willen niet tegen de wettelijke grens aan zitten, maar het omdraaien. Het mag voor klanten niet vaag blijven wat we met hun persoonsgegevens doen. En we moeten niet alles willen wat we mogen.”
Gaat RTL actief aanbieden dat klanten hun profiel kunnen verwijderen? Van Meer: “Als klanten willen dat we hun profiel verwijderen, dan doen we dat uiteraard meteen, nu al.” [Mail daarvoor naar privacy@rtl.nl, red.]
Geheel nieuwe technologie
In het afgelopen halfjaar heeft RTL een eigen big-dataplatform gebouwd in een team van vijf mensen met datawetenschappers en datatechnici (“scientists en engineers“). “Onze datawetenschappers kunnen zelf goed programmeren. Dus als eindgebruiker van de data kunnen ze hun eigen systeem bouwen, wat een enorme winst betekent. We bouwden het, het werkt ook nog goed en dus zijn we er apetrots op. Andere partijen gaan die richting ook uit en consultants proberen hier kennis op te doen.”
De bouw is allesbehalve traditioneel verlopen. Doorgaans gaat een opdracht voor systeembouw naar een IT-afdeling. Van Meer: “Bij de vertaling van vereisten naar systeemspecificaties en in het bouwen ging altijd wel het nodige fout, met een suboptimale uitkomst en dus informatieverlies tot gevolg. Toen ik bij ING en Rabobank werkte, zaten de IT-afdelingen nu eenmaal anders in de wedstrijd dan de dataverwerkers zelf.”
Van Meer heeft lang en intensief moeten zoeken, en investeren in werving. “Ik vertel kandidaten uiteraard een heel bevlogen verhaal waarom datawerk bij RTL veel boeiender is dan elders, zoals bol.com of Booking.com, maar dan nog moet je geluk hebben met het treffen van de juiste mensen.”
Buitenland kijkt mee
RTL is een Europees tv-bedrijf, maar dit datasysteem is door en voor RTL Nederland opgetuigd. Gebruik ervan elders ligt voor de hand: “In Nederland lopen we misschien iets voorop op Duitsland en Frankrijk, waar ze nog niet intensief met data in de weer zijn. Ik spreek ook regelmatig voor buitenlandse collega’s. Dus inzet van ons systeem in andere landen is een optie.”
Zelf Europese databaas worden? Van Meer: “Dat heeft behalve voor- ook nadelen: het staat goed op je c.v., maar het kost ook grijze haren. Ik heb wel de ervaring van toepassing van nieuwe, steeds dezelfde technologie met RaboDirect in Duitsland, Ierland, Australië, etcetera. Dat was erg leuk, maar niet zo makkelijk.”
Het datasysteem is gebouwd in de cloud, dus RTL kan eenvoudig capaciteit uitbreiden. Het is gebaseerd op het populaire HDFS: Hadoop Distributed File System. Het hart wordt gevormd door Spark, de nieuwe big-datatechnologie die het mogelijk maakt om met dezelfde logica zowel grote bestaande bestanden als realtime datastromen te verwerken.
Van Meer: “Dat wilde ik al meer dan tien jaar, maar nu is de technologie voorhanden. Hadoop miste realtime. Spark verenigt die werelden en is ook nog open source.
Je wilt realtime analyse, want uitkomsten moeten stante pede relevantie hebben, en je moet toch data uit het verleden kunnen matchen. We verwerken miljarden records per dag. We hebben in Python een aantal datascience-toepassingen gebouwd: aanbevelingen, reclameverkoop, beeldanalyse.”
Moesten jullie opnieuw beginnen? “Deels wel. De logica en principes van de big-dataverwerking blijven hetzelfde. Ook was het werk van het ontsluiten van de databronnen al gedaan. Technologisch is het nieuw.”
Schrijf je nu met korting in voor Mediapark Jaarcongres
Meer weten over het gebruik van data in video? Op 23 juni staat het Mediapark Jaarcongres in het teken van ‘The Video Age’! Een dag innovatie en inspiratie met onder andere bijdragen van Pim Schmitz (Talpa), Jildou van der Bijl (LINDA.), Jan de Jong (NOS) en Bert Habets (RTL).
Hoor tijdens MPJC meer over het gebruik van data, search en personalisatie bij Nederlandse omroepen. Schrijf je in met de speciale kortingscode voor Marketingfacts-lezers (X4E27 CDEA 4844 2BAC), dan betaal je 195 in plaats van 299 euro!
Interessant artikel! En hulde voor de uitspraak “Het mag voor klanten niet vaag blijven wat we met hun persoonsgegevens doen. En we moeten niet alles willen wat we mogen.”
Beetje off topic, maar zo vraag ik me wel eens af wat de maatschappelijke gevolgen ‘in the long run’ gaan zijn van het zo specifiek kunnen targetten van producten en diensten.