Machine learning in de toekomst

Machine learning in de toekomst

Op woensdag 26 juni organiseerde Visser & van Baars de allereerste meetup in het hart van de technologie: The High Tech Campus in Eindhoven. Veysel Kocaman (Senior Data Scientist) en Richard Benoit (Data Solutions Architect) spraken over het belang van machine learning voor bedrijven en de eventuele gevaren die erbij komen kijken. Ze gebruikten hierbij voorbeelden van automatisering en bedrijfsprocessen uit hun eigen vakgebied.

Artificial Intelligence is niet te vergelijken met elke andere technologie. Door de mogelijkheid om zijn eigen functies te leren en verbeteren, verwachten we dat AI de komende jaren verbluffende doorbraken zal brengen. In 2018 werd kunstmatige intelligentie al veel gebruikt in grootschalige bedrijven, maar ook midden- en kleinbedrijven omarmen deze technologie steeds vaker. Maar hoe leiden we kunstmatige intelligentie in goede banen?

Wat is machine learning?

Om het belang van machine learning te begrijpen is het essentieel om eerst te weten hoe het werkt. We beginnen met een eenvoudig voorbeeld:

Een arts die een MRI-scan afneemt stelt een diagnose op basis van wat hij ziet. Hij controleert daarnaast vorige scans, patiëntgeschiedenis en bijvoorbeeld bloedtesten. Uit alle gegevens samen maakt hij een beslissing. Hoe meer ervaring de arts heeft met soortgelijke zaken, hoe beter zijn beoordeling is.

Machine learning werkt op een soortgelijke manier: op basis van historische gegevens en actuele resultaten produceert het een ‘uitkomst’. Nieuwe gegevens worden naar het programma verstuurd, waarna de uitkomst wordt herrekend en wellicht veranderd. Het is een onderdeel van Artificial Intelligence. Om het overzicht goed te bewaren geven we drie definities:

  • Artificial Intelligence; een programma dat kan waarnemen, redeneren, handelen en aanpassen.
  • Machine learning; algoritmen waarvan de prestaties verbeteren als ze worden blootgesteld aan meer gegevens naarmate tijd verstrijkt.
  • Deep learning; zijtak van machine learning waarin meerlaagse neurale netwerken leren van enorme hoeveelheden data.

De ‘uitkomsten’ die kunstmatige intelligentie hierdoor kan bieden, helpt ons om een gedeelte van onze 35.000 beslissingen per dag uit handen te nemen. Denk hierbij aan de aanbevelingen die Netflix geeft of het automatisch scherpstellen van je mobiele camera.

GAN: Generative Adversarial Network

Deze kleine alledaagse beslissingen zijn niet het enige wat kunstmatige intelligentie kan overnemen. De technologie gaat zelfs zo ver, dat er via deep learning een neuraal netwerk is ontwikkeld dat gezichten genereert: het GAN (generative adversarial network). Het werkt als volgt: Eén neuraal netwerk (het generatornetwerk) probeert realistische gegevens te genereren, terwijl het andere netwerk (het discriminatornetwerk) onderscheid probeert te maken tussen echte gegevens en gegevens die door het netwerk worden gegenereerd. Het generatornetwerk leert hiervan en gebruikt de parameters om gegevens te genereren die er nóg realistischer uitzien. Het discriminatornetwerk leert hier vervolgens weer van om nóg beter te worden in het ontdekken van ‘nepgegevens’. De twee netwerken trainen elkaar dusdanig, dat de gezichten die eruit voortkomen zó echt lijken, dat er uiteindelijk alleen nog maar gegist kan worden naar de waarheid.

GAN wordt veel gebruikt bij het maken van videogames, maar het heeft ook een belangrijke invloed in het echte leven. Het kan bijvoorbeeld foto’s verouderen, waardoor mensen die al jaren vermist zijn, zoals Madeleine McCann, makkelijker kunnen worden herkend. Technologieën zoals GAN zorgen echter ook voor veel bezorgdheid. Het is namelijk redelijk eenvoudig voor criminelen om nep-profielen te creëren op social media of om pornografische beelden te verspreiden van afgebeelde personen die niet echt aanwezig waren.

Adversarial Attacks

Dit soort kwade bedoelingen worden niet alleen bij Generative Adversarial Networks toegepast. Machine learning systemen zijn over het algemeen nog kwetsbaar voor digitale aanvallen. Neem bijvoorbeeld een adversarial attack, waarbij gegevens in het systeem worden gevoerd die minimale verschillen vertonen met de originele gegevens. Deze nieuwe gegevens moeten ervoor zorgen dat machine learning de invoer verkeerd classificeert. Deze aanvallen vormen een grote bedreiging, omdat ze niet afhankelijk zijn van een neuraal netwerk. Een adversarial die getraind is om één netwerk te verwarren, doet dit ook bij een andere. Hierdoor kunnen machine learning systemen worden aangevallen zonder dat er toegang is tot het onderliggende model. Dit worden ook wel “black box attacks” genoemd.

Deze aanvallen zijn op meerdere manieren te voorkomen. We lichten er twee voor je uit:

  • Adversarial training; hierbij doe je je voor als de aanvaller, waardoor je je eigen netwerk traint om de goede classificatie aan te houden, wanneer er andere gegevens worden ingevoerd. Je moet hierbij echter wel exact dezelfde misleidende gegevens invoeren als je aanvaller, waardoor het moeilijk te voorspellen is.
  • Defensive distillation; hierbij train je een tweede model richting het mogelijke uitgangspunt van een aanvaller. Vervolgens train je hem dusdanig dat de twee modellen samen alsnog dezelfde uitkomst krijgen als die in eerste instantie bedoeld was, waardoor ze dus niet verkeerd classificeren door de aanval. 

Tot nu toe blijft het moeilijk om je model goed te verdedigen tegen adversarial attacks. Dit kan een groot probleem zijn als kunstmatige intelligentie in veelvoorkomende real-life scenario’s optreedt. Denk bijvoorbeeld aan zelfrijdende auto’s: als een machine learning systeem op de weg een situatie verkeerd classificeert, kan dat levens kosten. Naarmate werknemers meer ervaring krijgen met deze technologie, kunnen ze het ook beter beschermen.

Impact op de mens

IBM voorspelt dat er, naast het optimaliseren van machine learning systemen, 120 miljoen werknemers moeten worden omgeschoold om levensbedreigende situaties door toedoen van kunstmatige intelligentie te voorkomen. Dit moet ook nog eens snel gebeuren, want als bedrijf in de tien grootste economieën ter wereld verlies je snel je concurrentievoordeel. Met goed geschoolde werknemers en het besef dat ook deze technologie sterke en zwakke punten bevat, moet artificial intelligence in goede banen te leiden zijn. Uiteindelijk moeten we er met zijn allen op vooruitgaan.

BI & Big Data Network – See you there?

Visser en van Baars organiseert regelmatig events om Business Intelligence en Big Data professionals bij elkaar te brengen. Houd onze agenda in de gaten om te kijken wanneer de volgende plaatsvindt!

Heb jij nog vragen naar aanleiding van dit artikel? Neem dan contact met ons op.

Dit artikel is geschreven door Claire Babai