Hoe correct algoritme kiezen voor specifieke taak?

Algoritmes zijn vandaag bij de vleet beschikbaar in bibliotheken of toolkits voor data analytics. Maar hoe kiest u het juiste algoritme voor een specifieke taak? En wat zijn best practices en valkuilen? Dat en veel meer leert u in onze nieuwe webinarsessie op 18 en 21 mei.

De volgende webinar in onze Mastercourse ‘Data innovation’ 2021 focust op een van de laatste en centrale stappen in de data science-workflow: de keuze voor het meest geschikte algoritme om een specifiek probleem op te lossen. Maar hoe pakt u dit aan? En wat zijn de voornaamste valkuilen? Onze tweedelige webinarsessie op 18 en 21 mei 2021 gaat dieper in op deze materie en zet u op weg naar succes.

Waarom deelnemen aan deze webinar?

Het juiste algoritme kiezen is cruciaal bij de toepassing van data science. Door de rijkdom aan beschikbare algoritmes, is het niet de vraag of er een algoritme bestaat om uw probleem op te lossen, maar vooral welk algoritme het meest geschikt is. Bovendien kan de manier waarop u uw businessdoelstelling formuleert als een data-science-taak bepalend zijn voor het type van algoritme dat u kunt toepassen.

Het doel van deze webinar is om u een basiskennis bij te brengen van de belangrijkste data-science-taken (classificatie, clustering, regressie, ...) en u een helder overzicht te geven van de meest courante algoritmes en technieken om elk van deze taken op te lossen. Deze webinarsessie is geschikt voor elke ondernemer die interesse heeft in de toepassing van data science.

Voor elke methode worden de kenmerken, maar ook voor- en nadelen toegelicht. Op die manier willen we u begeleiden bij een bewuste keuze in termen van beschikbare data (dimensionaliteit, type van attribuut, ...) en de vereisten van het verwachte model (interpreteerbaarheid, accuraatheid, schaalbaarheid, ...).

Tot slot staan we ook uitgebreid stil bij de best practices voor het leren en evalueren van de resulterende modellen, en krijgt u ook een overzicht van enkele  veelgebruikte evaluatiemethodes en vaak voorkomende valstrikken.

In deze sessie worden onder meer de volgende vragen beantwoord:
  • Hoe vertaalt u uw zakelijke doelstelling(en) naar een data science-taak?
  • Wat zijn de belangrijkste data science-taken en welke bestaande machine learning-algoritmes en -technieken kunnen deze taken oplossen?
  • Hoe kiest u het gepaste algoritme op basis van belangrijke kenmerken van de beschikbare data en vereisten van het vereiste model zoals accuraatheid, interpreteerbaarheid, schaalbaarheid, ...?
  • Hoe leert en evalueert u het resulterende model om tot de meest optimale prestaties te komen?
> Schrijf u in voor de webinar


Use case: Sensorfouten in zonnepanelen identificeren

Zonnepanelen zijn uitgerust met sensoren die de operationele en omgevingscondities meten. Om een veelheid aan redenen kunnen er met deze sensoren problemen optreden. Denk bijvoorbeeld aan een foute klokinstelling, slechte oriëntatie, een sensor die vervuild is of geherkalibreerd moet worden, ...

In industriële zonneparken staan vaak honderden of duizenden zonnepanelen opgesteld, die continu nauwkeurig worden gemonitord. Loopt er iets fout met een van de panelen, dan is het van belang om te weten of de fout te wijten is aan het paneel zelf, de sensor, de omvormer die de energie omzet, ...

Indien de fout bij de sensor ligt, is het ook nuttig om te weten wat die fout precies inhoudt, zodat deze vervolgens snel kan worden rechtgezet en onderhoudstechnici al op voorhand weten wat er aan de hand is. Voor dit specifieke probleem hebben we een machine learning-model ontwikkeld. 

Het machine learning-model is een classificatiemodel: uit een reeks gekende oorzaken voor fouten, probeert het model de juiste oorzaak te identificeren op basis van meetwaarden en afgeleide karakteristieken: de features. Dit betekent dat het model wordt geleerd op basis van een reeks voorbeelden waarbij we al weten wat de oorzaak van de fout is (gelabelde data). Vervolgens kan het geleerde model gebruikt worden om op die basis nieuwe (ongelabelde) data te classificeren (en dus het juiste fouttype toe te kennen). 

Classificatie is een van de data science-taken die aan bod komen in onze nieuwe webinar, samen met een aantal vaak gebruikte algoritmes om dergelijke modellen te leren. Daarnaast behandelen we ook verschillende andere taken, zoals clustering, regressie, ... 

Praktische informatie

De webinar ‘Hoe kiest u het juiste algoritme voor een specifieke taak?’ maakt deel uit van de Mastercourse ‘Data Innovation’ 2021 van het Sirris Data and AI Competence Lab (EluciDATA Lab). De sessie wordt gegeven over twee halve dagen en kan als stand-alone sessie worden gevolgd of in combinatie met andere sessies. Het traject bestaat in totaal uit zes sessies, elk gericht op verschillende stappen in het data-innovatieproces.

Wanneer?

  • Eerste halve dag: 18 mei 09:30 - 12:00
  • Tweede halve dag: 21 mei 09:30 - 12:00

> Neem deel aan de webinar

 


#industriepartnerschap #sterkondernemen