Data Classification et Machine Learning (Live Virtual Class)

Blended learning

Durée

 2,00 jour(s)

Langue(s) de prestation

FR EN

Prochaine session

Qui organise cette formation ?

OXiane est spécialisé dans la conception et la réalisation de formations informatiques et de supports de cours pédagogiques sur les dernières technologies. Nos différentes filières permettent de couvrir tous les besoins en formation que ce soit en IT au sens large, mais également "Utilisateurs" et "Soft Skills" en Management, Communication & leadership.

À qui s'adresse la formation?

Architectes, Chefs de projets, Data Scientist, Developpeurs

Objectifs

Ces 2 jours de formation vous permettront d’appréhender le machine learning (aussi appelé apprentissage automatique en français). Une fois que le ou la Data Scientist a effectué son travail de collecte, de nettoyage et d’exploration des données, il s’attaque à la partie de modélisation statistique.

C’est ce processus que nous allons explorer ensemble dans cette formation au machine learning, un ensemble de techniques puissantes permettant de créer des modèles prédictifs à partir de données, sans avoir été explicitement programmées.

  • Définir les étapes de préparation des données, et les algorithmes de Machine Learning.
  • Organiser le traitement des données et structurer les processus de Machine Learning.

Contenu

Introduction
  • Zoom sur les données: format, volumes, structures, …
  • et les requêtes, attentes, des utilisateurs
  • Étapes de la préparation des données
  • Définitions, présentation du data munging
  • Le rôle du data scientist
Étude de cas
  • Mise en oeuvre pratique des différentes phases: nettoyage, enrichissement, organisation des données.
Machine Learning
  • Définition, les attentes par rapport au Machine Learning
  • Les valeurs d’observation, et les variables cibles
  • Ingénierie des variables
Apprentissage automatique
  • Les méthodes: apprentissage supervisé et non supervisé
  • Classification des données
  • Algorithmes: régression linéaire, k-voisins,classification naïve bayésienne, arbres de décision, etc..
Les risques et écueils
  • Importance de la préparation des données
  • L’écueil du "surapprentissage"
Visualisation des données
  • L’intérêt de la visualisation
  • Outils disponibles
  • Exemples de visualisation avec R et Python

Certificat, diplôme

Une attestation de participation sera transmise aux participants

Ces formations pourraient vous intéresser

EN
Journée
Sur demande
Informatique et systèmes d'information - Qualité informatique
FR
Journée
Informatique et systèmes d'information - Informatique verte - Système information - Architecture système information
16.09.2026