Trouver la formation qui vous correspond.

Plus de 500 formations dans les domaines informatique, bureautique et développement professionnel
Generic selectors
Exact matches only
Search in title
Search in content
Search in posts
Search in pages
Filter by Categories
Actus
Financement
Formations
Non classé

Ex. : ExcelWordPhotoshopJavaAgile

Centre de formation Informatique et Ressources Humaines

Trouver la formation qui vous correspond.

Plus de 500 formations dans les domaines informatique, bureautique et développement professionnel
Generic selectors
Exact matches only
Search in title
Search in content
Search in posts
Search in pages
Filter by Categories
Actus
Financement
Formations
Non classé

Ex. : ExcelWordPhotoshopJavaAgile

Machine Learning en Python

THBI1215

3 jours (21 heures) – Initiation / Fondamentaux

3 jours (21 heures)
Initiation / Fondamentaux

Formation : Machine Learning en Python

Domaine : Informatique

Présentiel
Présentiel
Online
En ligne
Coût
1500€ HT

Objectifs pédagogiques

  • Identifier l’apport du Machine Learning et ses limites
  • Créer et optimiser un modèle prédictif en python
  • Mesurer la qualité des modèles et les performances attendues en production

Niveau requis

  • Maîtriser les principaux algorithmes d'un langage (Python)

Public concerné

  • Développeur, data engineer, data analyst, data scientist, chercheur, ingénieur R&D, chef de projet technique, statisticien, et toute personne travaillant dans la data et sachant manipuler du code informatique

Dates de formations

  • Aucune session est planifiée actuellement pour cette formation.

Programme de formation

3 jours (21 heures)

Initiation / Fondamentaux

Introduction au Machine Learning

  • Principe général et concepts basiques
  • Exemples de cas d’usage dans différents secteurs : industrie, marketing, IoT, web, énergie…
  • Cadre d’utilisation : possibilités et limitations
  • Bien formuler la problématique : comment passer d’un problème métier à un problème Machine Learning

Ecosystème Python

  • Python scientifique : numpy, pandas, matplotlib, scipy
  • La librairie Scikit-learn
  • Notebook Jupyter, Anaconda

Algorithmes de Machine Learning, première partie : les bases

  • Régression linéaire et régression logistique
  • K plus proches voisins : KNN
  • Arbres de décision et Random Forests

Critères d’évaluation

  • Régression : MAE, MSE, RMSLE, R²…
  • Classification : accuracy, precision, recall, F1 score…
  • Procédures d’évaluation : train-test split, cross-validation, validation set

Optimisation des hyper-paramètres

  • Gridsearch, randomsearch
  • Soft optimisation et hard optimisation

Méthodologie et bonnes pratiques

  • Déroulé d’un projet de data science : une procédure itérative
  • Workflow complet du projet
  • Pipeline de transformation
  • Ecueils à éviter et comment s’en prémunir : surrapprentissage (overfitting) et fuite de données

Data prepration et feature extraction

  • Traitement des données aberrantes et manquantes
  • Normalisation et standardisation
  • Combinaison de features

Mise en production

  • Déployer un modèle en production via une API
  • Monitoring des modèles et mise à jour des modèles

Algorithmes de Machine Learning, deuxième partie : les autres catégories

  • Boosting et gradient boosting
  • Clustering et détection d’anomalie
  • Réseaux de neurones et Deep Learning

Adapter selon le type de données

  • Comment traiter du texte
  • Comment traiter des séries temporelles

Qualité et certification

Rejoignez-nous