Putting predictive analytics to work: the role of open source software

Predictive analytics is een hot topic, vooral omdat er meer en meer toepassingen (of cases) opduiken die gebruik makende van deze technologie zeer goede resultaten halen. Zo werd er op Predictive Analytics World in Londen een heel gevarieerd programma aangeboden met cases die hun nut bewezen hebben in domeinen als healthcare, customer retention, financial services, supply chain management, etc.

Het inzetten van predictive analytics is echter niet triviaal, zoals we al aangehaald hebben in een vorige blogpost. Men moet zich namelijk bewust worden van de sterktes en zwaktes van de bestaande technieken alsook hoe men deze het best inzet. Hier komt meer bij kijken dan het aankopen van de juiste software. Zo moeten er ook voldoende analytics-skills aanwezig zijn en moet er een organisatie bestaan rond het afhandelen van analytics-vragen. Het gevaar bestaat ook, vaak na aankoop van de software, dat men predictive analytics gaat gebruiken voor problemen die beter opgelost kunnen worden met andere -eerder klassieke- technieken.

rlogoDe ideale manier om bewust te worden van de mogelijkheden van predictive analytics is het uitvoeren van projecten met open-source analytics software. Op deze manier krijgt men een beter inzicht in welke taken/knelpunten er bij analytics projecten komen kijken, kan men een organisatie op poten zetten en verwerft men betere skills en inzichten in de onderliggende technieken.  Zelf doorlopen wij op dit moment het open-source traject, meer bepaald het R software pakket. Een andere voorbeeld van open-source data analytics is de Zimmo analytics case, uitgevoerd door de bigdata.be community.

Naast  'bewustwording' heeft het gebruik maken van open-source analytics software ook een ander belangrijk voordeel. Uit een recente discussie op de R-datamining LinkedIn group onthouden we dat state-of-the-art analytics technieken bijna altijd eerst beschikbaar zijn in open-source software (zeker in het geval van R). Deze implementaties worden vaak gemaakt door universiteiten en dienen ter validatie van nieuwe technieken. Door gebruik te maken van open-source software heb je dus meestal een voorsprong op commerciële pakketten.

Als besluit kunnen we stellen dat open source analytics een logische stap is in het uitbouwen van een predictive analytics dienstverlening. Wanneer de organisatie en juiste kennis voorhanden is kan men (indien nodig) overstappen naar een commercieel ondersteunde tool.   Het open-source voortraject laat ook toe beter inzicht op te bouwen in de eigen behoeftes en tegelijk de sterktes en zwaktes van commerciële spelers, zodat het kiezen van de juiste tool voor een bepaald probleem makkelijker wordt.

Leave a Reply

Your email address will not be published.