Waarom webanalytics-systemen niet geschikt zijn voor business intelligence
Is er in het huidige omnichannel-tijdperk nog plek voor traditionele webanalytics-tools? Mijn antwoord is 'nee'. Voor datagedreven bedrijven is het vasthouden aan traditionele datasilo’s geen optie meer. Een business intelligence-infrastructuur met eenduidige definities waarin de complete customer journey zichtbaar is, begint meer en meer de standaard te worden.
Dit artikel is geschreven door Peter Lem, operational manager platform bij Adversitement.
Even terug naar een heel dik decennium geleden, naar de opkomst van webanalytics. Het begon allemaal met online shopping. Mensen bestelden niet meer alleen in winkels, maar ook online. Met analysepakketten werden steeds meer interacties van het gedigitaliseerde gedrag vastgelegd en geanalyseerd. Grote hoeveelheden data kwamen beschikbaar voor optimalisaties; een ware datarevolutie.
Black box analytics
Rapporten en heldere visualisaties, dat is wat marketeers wilden zien. En daarom richtten pakketleveranciers zich op het belangrijkste element van analytics: visualiseren. Met die insteek zijn die analyticssystemen de verzamelde data direct gaan bewerken, om deze dusdanig voor te bereiden dat de visualisaties snel en overzichtelijk beschikbaar zijn. Met als gevolg dat webanalytics-systemen een soort ‘black box-werking’ gekregen hebben. Data worden opgehaald, in een black box gestopt (het is niet duidelijk wat er gebeurt) en daarin bewerkt voor visualisatie, waarbij alleen het resultaat te zien is. Ideaal voor webanalytics, maar wat als je over de randen van datasilo’s heen wilt kijken? Wat als je de data voor andere doeleinden wil gebruiken?
Centrale BI-interface
Anno nu willen marketeers data vanuit alle kanalen bij elkaar brengen en vanuit een uniforme manier met data omgaan. Daarbij hanteer je eenduidige definities, bijvoorbeeld voor een contactmoment van een klant. Binnen één centrale BI-interface kijk je naar de complete customer journey, die via meerdere kanalen en contactmomenten verloopt.
Traditionele webanalytics-tools en nieuwe alternatieven
Uiteraard spelen je websitedata een belangrijke rol in zo’n BI-interface. Het lijkt dus een logische stap om de webanalytics-oplossing te gebruiken en de verzamelde data naar de BI-infrastructuur te brengen. Maar in de praktijk loop je tegen een aantal problemen aan met deze ‘traditionele’ tools.
Het verschil tussen de traditionele tools als SiteCatalyst en de alternatieve oplossingen is namelijk dat het einddoel bij de eerste categorie tools visualisatie van de verzamelde (webanalytics-)data is. De alternatieve oplossingen zijn daarentegen erop gericht zo veel mogelijk data te verzamelen en die zo snel mogelijk beschikbaar te maken aan een andere omgeving.
Optimalisatie voor visualisatie
Traditionele webanalytics-systemen zijn niet gemaakt om ruwe data als eindproduct te hebben en in deze vorm de data door te sturen. Omdat ze een totaaldienst zijn, met visualisatie als laatste component, worden de data al verwerkt en geoptimaliseerd. Hiermee wordt de visualisatie in die tools sneller, maar een gedeelte van de informatie gaat door deze verwerkingsslag verloren.
Niet alleen heb je dus minder hoogstaande data om te sturen naar je BI-omgeving, ook zijn de traditionele systemen niet gemaakt om snel de data aan te leveren. Dat maakt deze systemen niet geschikt om binnen een BI-omgeving te functioneren. Binnen hun eigen silo zijn ze een vedette, maar de rol van teamplayer binnen BI past ze totaal niet.
Complicaties
Hieronder de vijf voornaamste complicaties die je tegenkomt.
1 Niet real-time
De eerste hobbel is tijd. In een actiegerichte BI-omgeving wil je realtime data zien. De meeste webanalytics-tools hebben echter een dag nodig om data te verwerken en beschikbaar te maken voor andere applicaties. Dat is een onnodige vertraging die niet past in een omgeving gericht op – al dan niet geautomatiseerde – instant decision making.
2 Moeilijkheden met grote volumes
Webanalytics-tools houden niet van grote volumes data. Veelal komt dat door de eerder besproken black box-werking. Ze voeren een bewerkingsproces op de data uit voordat ze er iets mee kunnen. Maar daardoor zijn ze niet in staat om onbewerkte, ‘ruwe’ data in grote hoeveelheden te verwerken en beschikbaar te stellen.
3 Onflexibele user interface
Ook is de user interface vaak weinig flexibel. Webanalytics-systemen zijn berekend op vooraf gedefinieerde datamodellen en niet op ad hoc vragen die worden losgelaten op een enorme bak data. En dus ook niet op het visualiseren daarvan.
Je kunt wel wat, maar vaak moet je een tool als Adobe Discover erbij nemen om echt ad-hoc-analyses terug in de tijd te kunnen doen. Die additionele tools zijn allesbehalve goedkoop. Een andere optie vormen technologieën als Hadoop en Splunk, maar die vragen om onbewerkte, streaming data en niet de bewerkte data uit een webanalyticstool.
4 Geen ownership
Met de meeste webanalytics-tools houd je je data niet in eigen huis. De tools slaan data namelijk aan hun kant op. Als dat in de VS is, betekent dat vaak dat Uncle Sam mee kan kijken, maar ook in andere landen kun je een compliance-risico lopen. En in een tijd waarin transparantie en privacy terecht steeds grotere topics worden, is data ownership een zwaarwegende factor.
5 Te duur voor alleen datacollectie
Je zou nog kunnen overwegen om de black box open te breken en de webdata voor je BI-omgeving te verzamelen met een webanalytics-tool, maar dan loop je al snel tegen een laatste bezwaar aan. Als je kijkt naar de prijsopbouw van webanalytics-tools, kun je niet kiezen voor alleen dataverzameling. Je moet een totaalpakket afnemen en dat is een achterhaalde constructie. Daardoor worden webanalytics-tools simpelweg te duur om alleen te gebruiken voor je datacollectie.
Daarnaast kost een losse tool ook meer investering op het gebied van trainingen en kennis. En die investering is natuurlijk veel beperkter als je een visualisatietool kunt gebruiken waar je als bedrijf al bekend mee bent.
Streaming data to BI
Door deze eigenschappen zijn webanalytics-tools in essentie niet geschikt om een rol te spelen in een realtime BI-infrastructuur die big data omzet in business value. Misschien zijn ze met flink wat tijd, geld en moeite de kant van BI op te buigen, maar je loopt altijd tegen beperkingen aan. Daardoor geven steeds meer organisaties de voorkeur aan een oplossing die streaming data direct naar je BI-omgeving brengt. En geef ze eens ongelijk.
BI binnen je organisatie
Maar hoe ga je te werk om zo’n infrastructuur te creëren? Waar begin je?
De eerste stap is het besef dat je vaak niet vanaf nul hoeft te beginnen. Inventariseer eerst eens welke mogelijkheden je hebt op het gebied van BI:
- Welke BI-initiatieven en -processen zijn er al binnen je organisatie?
- Is er een BI-architect of iemand anders verantwoordelijk voor BI?
- Welke mogelijkheden en technologieën voor datavisualisatie zijn er?
Datacollectie
Ga daarna op zoek naar een datacollectiemethode die goed binnen die omgeving past. Er zijn meerdere opties om ruwe data direct van je website op te slaan. Denk bijvoorbeeld aan serverlogs en afgeleiden daarvan. De juiste methode verschilt per organisatie. Vaak zijn externe platforms geschikt, maar soms voldoet ook een in huis gecreëerde oplossing.
Houd bij je zoektocht echter één ding in gedachten: de match met je bestaande business-intelligence-structuur is de zwaarstwegende factor. Vaak beschikt een BI-architectuur over een bepaalde kracht om data te verwerken en op te slaan. In zo’n geval kun je je infrastructuur relatief gemakkelijk uitbreiden.
Daarnaast is er de vraag of je BI-structuur je data host, of er juist verbinding mee maakt. Ook dat speelt een rol bij het bepalen van de juiste datacollectiemethode. Voorkom in elk geval dat je dingen dubbel doet; dat je dezelfde data twee keer opslaat of definieert.
Gebruik wat je hebt en voeg, stap voor stap, toe wat er mist. Door van een bestaande omgeving gebruik te maken zal het draagvlak aanzienlijk hoger zijn dan bij het werken vanuit een losse silo.
Voorkom dubbel werk
Laatste tip: zorg voor voldoende kennis, draagvlak en feedback. Ga het gesprek daarom ook aan met je collega’s, zoals de business-intelligence-architect of een andere persoon die daar verantwoordelijk voor is. Geef aan welke data je kunt leveren en ga na hoe je elkaar kunt helpen. Alleen dan kom je tot een BI-infrastructuur van teamplayers.
Goed verhaal!
Je geeft aan dat serverlogs een goede mogelijkheid bieden om webdata naar BI te krijgen. Op zich zou daar mee gestart kunnen worden, maar uiteindelijk vraagt het nog wel de nodige bewerking voor de serverlogs lees- en bruikbaar zijn. Juist die bewerking wil je volgens mij tot een minimum beperken en direct die data die je nodig hebt naar je BI omgeving streamen. Dit hoeft niet ingewikkeld te zijn, als je inderdaad maar goed weet wat je nodig hebt.