Big Data, AI en machine learning – CloudFest 2018 deel 3

Vandaag dag 3 van #CloudFest. Naast veel inhoudelijke sessies en een bomvolle beursvloer met allerlei leveranciers van software, producten en diensten is er veel aandacht voor “networking” en dus veel social events. Er is een app waarmee je afspraken kunt maken, waar je de deelnemers in kan zien en zelfs badges van andere bezoekers kan scannen om je eigen lead- en contactenlijst te maken. Persoonlijk stuur ik nieuwe contacten bij voorkeur een LinkedIn uitnodiging om ze op die manier aan mijn netwerk toe te voegen. Mijn “database” met relaties neem ik dus af uit de Cloud. Die database houden mijn contacten zelf bij en is verrijkt met allerlei informatie over studie, hobby’s, interesses, certificeringen etc.

Gisteren was het onderwerp dat door verschillende sessies, presentaties en gesprekken heen schemerde; Big Data, de waarde van data als het “nieuwe goud”. Toen Microsoft LinkedIn kocht voor 26 miljard dollar vroeg ik me wel af hoe ze dit ooit gingen terugverdienen. Wanneer ik nu zie hoeveel rijke, actuele data er in LinkedIn zit en de diensten die daar bovenop aangeboden worden, begrijp ik het in relatie tot “data is het nieuwe goud” al iets beter.

Een interessante vergelijking, “data als het nieuwe goud”. Die hele grote bak met data is namelijk pas geld waard wanneer je er waardevolle informatie uit haalt. Ik kijk weleens naar Gold Rush op Discovery. Er zijn grote hoeveelheden grond waar goud in zit. Je moet duizenden kubieke meters grond afgraven, er komen grote machines aan te pas en een grote hoeveelheid water om aan het einde van het proces het goud (in hele kleine stukjes) over te houden. De verschillende soorten grond vereisen een verschillende aanpak, verschillende soorten machines en de hoeveelheid goud dat je overhoud is altijd een vraag.

Met Data is het eigenlijk ook zo, die hele grote bak met data op zich is geen geld waard. De waardevolle informatie in die bak met data wél en deze waardevolle informatie eruit halen gaat niet van zelf!

Het begint bij het selecteren, verzamelen en opslaan van data. Daarin kan je de keuze maken of je data zelf verzamelt of koopt en of je dit zelf opslaat of dit over laat aan een “as a Service”-provider. Dan komt het graven in de data (datamining) en het bewerken van de data om het “goud” eruit te halen. Algoritmen, processen, intelligentie is nodig om dit slim te doen, daar komt Artificial Intelligence (AI) om de hoek kijken. De algoritmen om waardevolle informatie uit een berg met data te halen is het verschil tussen geen of een beetje goud en veel goud! Ook bij Gold Rush zie je soms dat een beproefde methode niet goed werkt en ze dus het algoritme moeten aanpassen om een optimaal resultaat te krijgen. Leren dus van het resultaat en van de methode die je gebruikt. Op basis daarvan de methode aanpassen (machine learning).

Gisteren was er een mooi voorbeeld van Mastercard dat aangehaald werd. Mastercard heeft een grote bak met data en had een algoritme (AI) toegepast om fraude te detecteren. Daar was goed over nagedacht, echter zaten er onvolkomenheden in waardoor regelmatig fraude gedetecteerd werd (en er dus een Creditcard werd geblokkeerd) terwijl dit niet het geval was (False Positives dus). Dit zorgde voor ontevreden klanten, al was het bedoeld om de klant te beschermen. Pas nadat er machine learning werd toegepast om van iedere detectie te leren ging het aantal False Positives snel naar beneden en zijn deze nu bijna verdwenen. Op deze manier kan je allerlei vraagstukken aanvliegen, eerst de selectie van data, daarna deze data slim sorteren, in kleine brokjes knippen, sorteren etc. middels AI en dan leren van de resultaten door Machine Learning om het proces en daarmee het resultaat optimaal te krijgen.

Terug naar het CloudFest en de Serviceproviders en andere dienstverleners hier aanwezig, uiteindelijk bieden deze allemaal diensten aan rondom Data. Data moet onder andere opgeslagen, getransporteerd, bewerkt, verrijkt en ontsloten worden en waar de baas van Microsoft, Satya Nadella, aangeeft dat ieder bedrijf een softwarebedrijf is geworden, zegt de CTO van Vijfhart, Taco Hettema, ‘ieder bedrijf is een data bedrijf!’ Ook in training- en opleidingenland heb je beschikking over data in allerlei vormen (boeken, video’s, labs, presentaties) en is het de kunst om daar de waardevolle informatie uit te halen, daar de methode voor te kiezen en te ontwikkelen passend bij het onderwerp, de persoon of de situatie en bijsturen om het optimaal te maken en te houden. Die data verandert snel, er is heel veel data beschikbaar en in allerlei vormen dus “leren leren” (als parallel met Machine Learning) is belangrijker dan ooit.

Er zijn nog meer vergelijkingen te maken tussen de waarde van informatie en goud (hoe bepaal je de waarde, hoe sla je het op, hoe zit het met uitwisselen van die informatie, beveiliging en vertrouwen), daarover morgen meer!

Groeten uit Duitsland!
Taco.

Tags:
biBig DataCloudfestinnovatieITmachine learningontwikkelingTaco Hettemavernieuwing
Onderwerpen
Actieve filters: Wis alle filters
Loading...
PRIVACY VOORWAARDEN

Jouw persoonsgegevens worden opgenomen in onze beschermde database en worden niet aan derden verstrekt. Je stemt hiermee in dat wij jou van onze aanbiedingen op de hoogte houden. In al onze correspondentie zit een afmeldmogelijkheid