Data Science - Data Science et Machine Learning sous Python

Formation inter et intra-entreprise

À qui s'adresse la formation?

Responsables Infocentre (Datamining, Marketing, Qualité...), utilisateurs et gestionnaires métiers de bases de données, futurs Data Scientists.

Durée

4,00 jour(s)

Langues(s) de prestation

EN FR

Prochaine session

Prérequis

Connaissances équivalentes aux stages "initiation à la programmation Python" et "introduction à la Statistique".

Objectifs

  • Utiliser des méthodes d’exploration de données
  • Comprendre le principe de la modélisation statistique
  • Choisir entre la régression et la classification
  • Évaluer les performances prédictives d'un modèle

Contenu

La Data Science repose sur la maîtrise de techniques d'exploration de données fondamentales: statistiques descriptives, prédictives ou exploratoires. Ce stage pratique vous présentera les méthodes indispensables en Data Science, et particulièrement en Machine Learning, sous Python.

Points abordés

RAPPELS DU LANGAGE PYTHON (0,25 JOUR)

  • Les types de données dans Python.
  • Importation-exportation de données.
  • Techniques pour tracer des courbes et des graphiques
  • Introduction au logiciel Jupiter Notebook

ANALYSE EN COMPOSANTES (1 JOUR)

  • Analyse en Composantes Principales
  • Analyse Factorielle des Correspondances
  • Analyse des Correspondances Multiple

LA MODÉLISATION (0,25 JOUR)

  • Les algorithmes supervisés et non supervisés
  • Le choix entre la régression et la classification
  • Les étapes de construction d'un modèle

LES ALGORITHMES NON SUPERVISES (1 JOUR)

  • Le clustering hiérarchique
  • Le clustering non hiérarchique
  • Les approches mixtes

PROCÉDURES D’ÉVALUATION DE MODÈLES (0,5 JOUR)

  • Les techniques de rééchantillonnage
  • Mesures de performance des modèles prédictifs
  • Matrice de confusion, de coût et la courbe ROC et AUC

LES ALGORITHMES SUPERVISES (1 JOUR)

  • Le principe de régression linéaire univariée
  • La régression multivariée
  • La régression polynomiale
  • La régression logistique
  • Le Naive Bayes
  • L’arbre de décision
  • Les K plus proches voisins

Méthodes pédagogiques

Notre méthode, adaptée à votre contexte, associe implication des participants et supports concrets.

Certificat, diplôme

Attestation de présence

Mode d'organisation

En présentiel ou en classe virtuelle

Ces formations pourraient vous intéresser

FR
Journée
Informatique et systèmes d'information - Système information - Architecture système information - Cloud Computing