Leer de kunst van feature engineering te beheersen

Feature engineering is het proces dat erin bestaat relevante, informatieve en onderscheidende eigenschappen uit uw data te extraheren en te selecteren, die dan vervolgens als input voor een intelligent algoritme kunnen worden gebruikt. Omdat de kwaliteit van uw eigenschappen in grote mate de kwaliteit van de resultaten beïnvloedt, is feature engineering een van de belangrijkste elementen voor een geslaagde toepassing van machineleren. Hoewel het een creatief en arbeidsintensief proces is, kan een beter inzicht in de methodologie, de knepen van het vak en de meest voorkomende valkuilen, u al een heel stuk op weg helpen.

Standaard intelligente algoritmen voor data mining en machineleren worden gebruiksklaar door tal van bibliotheken, toolkits en platforms aangereikt en kunnen bijgevolg door vrijwel iedereen worden toegepast. Echter, het feit alleen van uw data door het geselecteerde algoritme te halen is nog geen garantie voor een goed resultaat.

De data dienen ook op de juiste manier aan het algoritme te worden voorgesteld. U dient meer bepaald de meest relevante, informatieve en onderscheidende informatie uit uw data te extraheren; net dat proces wordt feature engineering genoemd.

Feature engineering is niet alleen een van de belangrijkste stappen in de hele data science workflow, maar ook de stap die het meeste van uw tijd zal vergen, aangezien het onvermijdelijk een creatief en ambachtelijk proces is, met testen en fouten. Tijdens dit iteratieve proces zult u ontdekken dat het mogelijk is om een brede waaier van eigenschappen uit uw data te extraheren. Bijgevolg zult u moeten bepalen welke eigenschappen werken en welke niet, ze verfijnen of er bijkomende definiëren, die opnieuw valideren, enz.

Hoewel feature engineering een proces is van testen en fouten, stoelt het op een methodologie waar bepaalde standaardbenaderingen, richtsnoeren, aanbevelingen, knepen van het vak en valkuilen komen bij kijken. Een degelijke kennis van deze methodologie kan u helpen de meest relevante eigenschappen te identificeren.

Wilt u een beter inzicht in deze materie verwerven en meer te weten komen over het creatieve proces van karakterisering van de eigenschappen die u betere resultaten kunnen bezorgen bij de toepassing van een algoritme voor data mining/machineleren? Schrijf u dan in voor onze volgende trainingsessie over feature engineering. Tijdens deze sessie gaan we uitvoerig in op de achterliggende methodologie, inclusief diverse methodes voor feature construction, selection, normalization, enz.