peered.

Data Mining.

data is overal

Data Mining is een combinatie van statistiek, kunstmatige intelligentie en machine learning. Het is de verzamelnaam voor technieken die in grote datasets zoeken naar statistische verbanden. Het doel is om waardevolle informatie te extraheren uit Big Data. De vier overkoepelende toepassingen zijn: 1) classificeren, 2) clusteren, 3) voorspellen en 4) outlier detection. De mogelijkheden zijn enorm. Je kunt denken aan bijvoorbeeld:

  • Patronen herkennen in aankoopgegevens (clusteren)
  • In kaart brengen van netwerken (clusteren)
  • Automatisch categoriseren van (nieuws)berichten (classificeren)
  • Gepersonaliseerde advertenties (voorspellen)
  • Detecteren van fraude (outlier detection)

Privacy en ethiek

Wanneer je te maken hebt met data die herleid kan worden naar mensen, heb je te maken met privacy. Het feit dat data beschikbaar is, geeft niet simpelweg het recht om deze data te gebruiken. Het privacy-aspect is hierbij van groot belang. Als de data gaat over medische of politieke informatie, brengt dit een nog groter debat op gang.

kent de nieuwe Europese wet databescherming (GDPR). Als je wilt weten of jouw Data Mining project ethisch verantwoord is en conform de databescherming wetgeving, ben je hier aan het juiste adres.