Comment choisir le bon algorithme pour la bonne tâche?

Un éventail d'algorithmes est aujourd'hui disponible dans différentes librairies d'analyse de données et boîtes à outils. Par conséquent, la question n'est donc pas de savoir s'il existe un algorithme pour résoudre votre problème, mais plutôt lequel correspond le mieux au problème que vous essayez de résoudre. Apprenez à choisir le bon algorithme pour la bonne tâche lors de notre prochain webinaire les 18 et 21 mai.

Le prochain webinaire de notre Mastercourse 'Data innovation' 2021 se concentrera sur l'une des étapes finales et centrales du flux de travail de la science des données: choisir l'algorithme le plus approprié pour résoudre un problème spécifique. Mais quelle est la meilleure façon de commencer? Et quels sont les pièges les plus courants? Notre session de webinaire en deux parties les 18 et 21 mai 2021 approfondira ces questions et vous fournira des réponses claires.

Pourquoi participer à ce webinaire ?

Le choix du bon algorithme est crucial lors de l'application de la science des données. En raison de la richesse d'algorithmes compris dans les bibliothèques d'analyse de données et les boîtes à outils, la question n'est pas de savoir s'il existe un algorithme pour le contexte, mais plutôt celui qui convient le mieux. En outre, la façon dont vous formulez votre objectif commercial en tant que tâche en science des données peut déterminer le type d'algorithme que vous pouvez appliquer.

Le but de cette session est de présenter aux participants les tâches les plus importantes en science des données (classification, groupement, régression, etc.) et de donner un aperçu des algorithmes et techniques les plus couramment utilisés pour résoudre chacune de ces tâches. Elle est ouverte à toute personne intéressée par l'application de la science des données.

Pour chacune des méthodes, ses caractéristiques, avantages et inconvénients seront expliqués afin de guider les participants à faire un choix conscient en termes de données disponibles (dimensionnalité, types d'attributs, etc.) et d'exigences du modèle attendu (interprétabilité, précision, évolutivité, etc.). Enfin, les principes directeurs pour apprendre et évaluer les modèles résultants, y compris un aperçu des pièges courants et des mesures d'évaluation fréquemment utilisées, seront présentés.

Cette session vise à répondre aux questions suivantes:
  • Comment traduire votre/vos objectif(s) professionnel(s) en une tâche en science des données ?
  • Quelles sont les tâches les plus importantes en science des données et quels algorithmes et techniques d'apprentissage automatique existent pour résoudre ces tâches ?
  • Comment choisir l'algorithme approprié en fonction des caractéristiques importantes des données disponibles et des exigences du modèle attendu telles que la précision, l'interprétabilité, l'évolutivité, etc. ?
  • Comment apprendre et évaluer les modèles qui en résultent, afin d'arriver à la performance la plus optimale ?
> Inscrivez-vous dès maintenant au webinaire


Cas d’utilisation : Identifier les problèmes de capteurs des panneaux solaires

Les panneaux solaires sont équipés de capteurs qui mesurent les conditions opérationnelles et environnementales. Des problèmes peuvent survenir avec ces capteurs pour diverses raisons. Considérez, par exemple, un réglage d'horloge incorrect, une mauvaise orientation, un capteur sale ou qui doit être recalibré, etc.

Les parcs solaires industriels ont souvent des centaines ou des milliers de panneaux solaires installés, qui sont constamment surveillés de près. S'il y a un défaut dans l'un des panneaux solaires, il est important de savoir si le défaut est dû au panneau lui-même, au capteur, à l'onduleur convertissant l'énergie, etc.

Si le défaut concerne le capteur, il est également utile de savoir ce qu'est le défaut, afin qu'il puisse être corrigé rapidement et que les techniciens de service sachent à l'avance ce qui se passe. Pour ce problème spécifique, nous avons développé un modèle d'apprentissage automatique.

Le modèle d'apprentissage automatique est un modèle de classification: à partir d'une série de causes d'erreurs connues, le modèle tente d'identifier la cause correcte en fonction des valeurs mesurées et des caractéristiques dérivées: les caractéristiques. Cela signifie que le modèle est appris à partir d'une série d'exemples où nous connaissons déjà la cause de l'erreur (données étiquetées). Par la suite, le modèle appris peut être utilisé pour classer les nouvelles données (non étiquetées) sur cette base (et attribuer ainsi le type d'erreur correct).

La classification est l'une des tâches de science des données couvertes dans notre nouveau webinaire, ainsi que certains algorithmes couramment utilisés pour apprendre de tels modèles. En outre, nous couvrons également diverses autres tâches telles que le clustering, la régression, etc. 

Informations pratiques

Le webinaire « Comment choisir le bon algorithme pour la bonne tâche » fait partie du mastercourse « Data Innovation » 2021 organisé par le Sirris Data and AI Competence Lab (EluciDATA Lab). Il est donné sur deux demi-journées et peut être suivi de manière indépendante ou en combinaison avec d'autres sessions. Le cours consiste en six sessions, axées chacune sur une étape différente du processus d'innovation par les données.

Quand ?

  • Première demi-journée: 18 mai 09:30 - 12:00
  • Deuxième demi-journée: 21 mai 09:30 - 12:00

> Inscrivez-vous dès maintenant au webinaire


#industriepartnerschap #sterkondernemen