Statistics and Machine Learning Toolbox™ offre des fonctions et des applications pour décrire, analyser et modéliser des données. Vous pouvez utiliser des statistiques descriptives, des visualisations et le clustering pour l’analyse exploratoire des données, les ajustements de loi de probabilité, la génération des nombres aléatoires pour les simulations Monte-Carlo et pour réaliser des tests d’hypothèse. Les algorithmes de régression et de classification vous permettent de déduire des comportements à partir des données et de construire des modèles prédictifs soit de manière interactive, en utilisant les applications Classification Learner et Regression Learners, soit de manière programmatique, en utilisant AutoML.
Pour l’analyse de données multidimensionnelles et l'extraction de caractéristiques, la toolbox propose l’analyse en composantes principales (ACP), la régularisation, la réduction de la dimension et des méthodes de sélection de variables pertinentes qui vous permettent d’identifier les variables qui offrent les meilleures capacités de prédiction.
La toolbox comprend des algorithmes de Machine Learning supervisés, semi-supervisés et non supervisés, notamment les machines à vecteurs de support (SVM), le boosting, les k-means et autres méthodes de clustering. Vous pouvez utiliser des techniques d'interprétabilité, comme des tracés de dépendance partielle et la méthode de LIME, et générer automatiquement du code C/C++ pour un déploiement embarqué. De nombreux algorithmes de la toolbox peuvent être appliqués à des jeux de données trop volumineux pour être stockés en mémoire.