Centre de formation Informatique et Ressources Humaines

Machine Learning en Python

THBI1215

3 jours (21 heures) – Perfectionnement / Avancé

3 jours (21 heures)
Perfectionnement / Avancé

Formation : Machine Learning en Python

Domaine : Informatique

Présentiel
Présentiel

Objectifs pédagogiques

  • Comprendre l’apport du Machine Learning et ses limites
  • Maîtriser les principaux algorithmes
  • Savoir créer et optimiser un modèle prédictif en python
  • Mesurer la qualité des modèles et les performances attendues en production
  • Connaître le workflow global du projet
  • Savoir mettre en œuvre les bonnes pratiques pour éviter les écueils de ce type de projet
  • Pouvoir déployer un modèle, le superviser et le mettre à jour en production
  • Comprendre comment appliquer le Machine Learning sur des données structurées, sur du texte, et sur des séries temporelles

Niveau requis

  • Connaitre un langage de programmation, idéalement python

Public concerné

  • Développeur, data engineer, data analyst, data scientist, chercheur, ingénieur R&D, chef de projet technique, statisticien, et toute personne travaillant dans la data et sachant manipuler du code informatique

Dates de formations

  • Du 25 au 27 Mai 2020 à Toulouse

Programme de formation

3 jours (21 heures)

Perfectionnement / Avancé

Introduction au Machine Learning

  • Principe général et concepts basiques
  • Exemples de cas d’usage dans différents secteurs : industrie, marketing, IoT, web, énergie…
  • Cadre d’utilisation : possibilités et limitations
  • Bien formuler la problématique : comment passer d’un problème métier à un problème Machine Learning

Ecosystème Python 

  • Python scientifique : numpy, pandas, matplotlib, scipy
  • La lirairie Scikit-learn
  • Notebook Jupyter, Anaconda

Algorithmes de Machine Learning, première partie : les bases

  • Régression linéaire et régression logistique
  • K plus proches voisins : KNN
  • Arbres de décision et Random Forests

Critères d’évaluation 

  • Régression : MAE, MSE, RMSLE, R²…
  • Classification : accuracy, precision, recall, F1 score…
  • Procédures d’évaluation : train-test split, cross-validation, validation set

Optimisation des hyper-paramètres 

  • Gridsearch, randomsearch
  • Soft optimisation et hard optimisation

Méthodologie et bonnes pratiques 

  • Déroulé d’un projet de data science : une procédure itérative
  • Workflow complet du projet
  • Pipeline de transformation
  • Ecueils à éviter et comment s’en prémunir : surrapprentissage (overfitting) et fuite de données (data leakage)

Data prepration et feature extraction 

  • Traitement des données aberrantes et manquantes
  • Normalisation et standardisation
  • Combinaison de features

Mise en production 

  • Déployer un modèle en production via une API
  • Monitoring des modèles
  • Mise à jour des modèles

Algorithmes de Machine Learning, deuxième partie : les autres catégories

  • Boosting et gradient boosting
  • Clustering
  • Détection d’anomalie
  • Réseaux de neurones et Deep Learning

Adapter selon le type de données 

  • Comment traiter du texte
  • Comment traiter des séries temporelles
Nous contacter pour une session de formation.

Qualité et certification

Rejoignez-nous