Big data: van bytes naar business case

4 december 2015, 09:00

Een verslag van de 10e Data Donderdag

Op 19 november stond al weer de 10e editie gepland van Data Donderdag, de business meetup over big data zonder technische details. In een zeer druk bezochte Beurs van Berlage werd onder het genot van een hapje en een drankje geluisterd naar vijf diverse sprekers die allen een kijkje gaven in de enorme kansen en mogelijkheden van Big Data.

Huidige sentimentanalyse mist het grote plaatje

De eerste spreker van de avond was Piek Vossen, Hoogleraar Computationele Lexicologie aan de VU. Piek ging in op hoe bedrijven tekst-mining kunnen gebruiken voor reputatiemanagement en sentimentanalyse.

Sentimentanalyse van teksten heeft vaak twee mogelijke uitkomsten: positief of negatief. Maar het analyseren van teksten is ingewikkelder. Om een tekst goed te kunnen begrijpen dien je met meer zaken rekening te houden, door bijvoorbeeld te kijken naar vanuit welke context de tekst is geschreven en wat de achtergrond van de schrijver is. Alleen sentimentanalyse geeft niet goed weer wat mensen met een tekst willen zeggen. Daarom werkt Piek met zijn onderzoeksgroep van twintig man aan de ontwikkeling van software die teksten in verschillende talen kan lezen en kan interpreteren wat er echt staat.

Bedrijven zijn geïnteresseerd in meningen van mensen, voor bijvoorbeeld productfeedback, marktanalyse of concurrentieanalyse. Ook voor de politiek en overheden is het interessant om te weten hoe mensen reageren op dingen die ze uitspoken. Daarnaast is ieder persoon zelf geïnteresseerd in wat anderen vinden, bijvoorbeeld als je op zoek bent naar een vakantie, naar stemadvies of medisch advies.

“Het analyseren van reviews is ingewikkeld. Duitsers en Engelsen drukken zich bijvoorbeeld subtieler uit dan Nederlanders en Spanjaarden. Daar moet je rekening mee houden”

Er is een enorme industrie rondom sentimentanalysetechnologie, maar veel meer dan het leveren van een dashboard waarop aangegeven wordt of het sentiment positief of negatief is, is het vaak niet. Eigenlijk weet je dan nog niks. Wil je echt begrijpen wat er speelt dan moet je dieper in de mening duiken. Waarover gaat de mening, maar ook wie is de persoon die de mening geeft, wat is zijn achtergrond, welke emotie heeft hij, waarom geeft hij een mening, wanneer is de mening gedeeld en wat is zijn relatie met hetgeen waar de mening over gaat.

Een mooi voorbeeld waarbij sentimentanalyse goed van pas komt is die van reviews. In reviews staat heel veel informatie, zowel positief als negatief. Een review staat vol met subtiele sentimenten, sommige zijn esthetisch, sommige hebben te maken met ervaring, hygiëne en comfort. Allerlei factoren spelen een rol en hierdoor is het lastig om zomaar een sentiment uit een review te destilleren.

Ook speelt taal een belangrijke rol bij reviews. Uit analyse die Piek had uitgevoerd bleek dat Engelsen en Duitsers meer uitgesproken zijn bij het geven van een rating, maar in hun tekst drukken ze zich subtieler uit dan bijvoorbeeld Nederlanders en Spanjaarden. Dus als je reviews gaat analyseren neem je dit mee, om erachter te kunnen komen hoe ontevreden of tevreden iemand nu eigenlijk is.

Het analyseren van reviews is ingewikkeld. Taal waarin meningen uitgedrukt worden zijn veel complexer dan zakelijke teksten. Je moet naar ontzettend veel verschillende zaken kijken, wil je een goed beeld kunnen vormen van de opinie van een persoon. Het perspectief van die persoon is daarbij ontzettend belangrijk.

Van hardlopen tot data science

Marcel van der Kuil vertelde over wat hardlopen en data science met elkaar gemeen hebben. Marcel is oprichter van de startup Sensorun en hun expertise ligt in sensor-gebaseerde metingen. Oftewel kijken naar hoe het lichaam beweegt en hoe daarop persoonlijke feedback gegeven kan worden.

Sensorun wil een automatische hardloopcoach aanbieden, welke verder gaat dan de standaard hardloop apps zoals Runkeeper. Door middel van sensoren die op het lichaam gedragen worden, verwerkt in kleding, krijgt de hardloper een coach op zijn of haar smartphone. Deze coach geeft vervolgens aanwijzingen over hoe er gelopen is, waar er verbeteringen mogelijk zijn en voor welke blessures de hardloper moet uitkijken.

Als we hardlopen kunnen we namelijk een enorme hoeveelheid data genereren. Daar wordt tot nu toe weinig mee gedaan, maar hoe zou het nu zijn als we bijvoorbeeld gewaarschuwd worden voor blessures door toepassing van deze data?

Op dit moment heeft Sensorrun mensen met meetapparatuur hardlopen. De sensoren zitten in het pak en in de schoenen. In de rugzak van de loper zit een tablet die data ontvangt. Door data op deze manier te analyseren kunnen ze zien wanneer de vermoeidheid toeslaat en welke ledenmaten overbelast raken.

Het einddoel is een ‘next gen running app’ die in realtime laat zien hoe jij beweegt en hoe dat eruit ziet. Onze kennis markeert waar het niet goed gaat, bijvoorbeeld in de knie, zodat de hardloper op tijd actie kan ondernemen. De app is er nog niet, maar uiteindelijk moet die voor iedereen beschikbaar worden en gratis zijn.

Een slimme #DIY thermostaat

De slimme thermostaat zien we steeds vaker. Maar hoe ontwikkel je een slimme thermostaat met behulp van machine-learning en big-data technologie? Niek Temme vertelde in zijn verhaal hoe hij eigenhandig een zelflerende slimme thermostaat heeft gemaakt.

Met behulp van een Raspberry Pi computer en een oude cv-ketel heeft hij een thermostaat ontwikkeld die duizenden waardes per seconden kan verzamelen. Dit leverde in een jaar 800 Gigabyte aan data op.

De data gaf inzicht hoe de thermostaat werkte. Zo kwam hij erachter dat de cv-ketel standaard zes keer per uur werd aangezet. Als de temperatuur in huis hoger moest worden, werd de ketel langer aangezet. Hier bleek een patroon in te zitten: de eerste keer dat de ketel werd ingeschakeld, werd het huis zes minuten verwarmd, vervolgens vijf minuten en zo verder.

Het doel was om achter het meest efficiënte patroon te komen om een kamer te verwarmen, dan wel de temperatuur gelijk te houden. Door gebruik te maken van gegevens over de binnen- en de buitentemperatuur. Uiteindelijk leerde zijn thermostaat dat het efficiënter kon dan standaard was. Dus werd zijn verwarming energiezuiniger.

Startup Pitch: visualisatie van datamodellen

Een vast onderdeel van Data Donderdag is de startuppitch, waarbij een interessante big data-startup over zijn product mag komen vertellen. Dit keer was het Whatifolution.

Whatifolution verandert datamodellen in sets van onderling verbonden grafieken waardoor visuele manipulatie door het gebruik van een muis of een vinger mogelijk wordt.

Zij gaan verder waar andere dashboards stoppen. In een visuele, dynamische omgeving wordt data gegenereerd of bewerkt en is het resultaat direct zichtbaar. Veel bedrijven doen aan scenarioanalyse: wat zijn de gevolgen van beslissingen die je neemt. Iedereen werkt echter met excelmodellen en die bevatten vaak fouten.

Whatifolution heeft bedacht dat je in plaats van de input aanpassen, je het resultaat en de uitkomsten als input neemt. Wat als je bijvoorbeeld winst als uitgangspunt neemt, welke invloed heeft dat dan op het besluitproces?

Data die in het model gaat, resulteert in een uitkomst, maar die uitkomst kan ook gebruikt worden als input. Je kunt heen en weer rekenen naar wat je wilt. Je kunt iedere uitkomstparameter als inputparameter gebruiken en het resultaat wordt direct visueel weergeven.

Whatifolution laat zien dat als je bijvoorbeeld een investering wilt doen in een bedrijf, wat je dan het beste kan doen. Wat betekent dat voor het rendement op je vermogen? In het model kun je met je vinger de omzet omhoog trekken en ziet direct de gevolgen; wat hiervan de invloed is op je ROI bijvoorbeeld. Trek bijvoorbeeld de omzet omhoog, dan neemt ook je ROI toe.

De kracht van Whatifolution is dat het je kan helpen om op een eenvoudige manier beslissingen te nemen. Het is een geavanceerde rekentechnologie die gemakkelijk inzicht kan geven in complexe situaties.

De 11e editie van Data Donderdag

De 10e editie van Data Donderdag werd mede-mogelijk gemaakt door Achmea. Bekijk ook de visuele notulen. De volgende editie (#11) staat gepland op 28 januari 2016, wederom in de Beurs van Berlage Amsterdam. Meld je aan via de meetup of bekijk onze vernieuwde website waar we tijdens elk evenement een liveblog en streaming uitzenden.

Mark van Rijmenam is oprichter van Datafloq. Hij is naast ondernemer ook Big Data strateeg en een veel gevraagd, internationaal, spreker op dit onderwerp. Hij is auteur van het boek Think Bigger – Developing a Successful Big Data Strategy for Your Business. Tevens is hij medeorganisator van Data Donderdag, een tweemaandelijks netwerk evenement in Amsterdam om organisaties Big Data beter te laten begrijpen.

Categorie
Tags

Marketingfacts. Elke dag vers. Mis niks!