Langage R : Data Science

Inter-company training

Who is the training for?

Développeurs R

Duration

2,00 day(s)

Language(s) of service

EN FR

Next session

05.03.2026
Location
A distance

Price

1975,00€

Prerequisites

Avoir suivi la formation Langage R: fondamentaux ou notions équivalentes

Goals

Acquérir les bases solides pour importer, nettoyer et manipuler des données avec R.
Explorer et visualiser des données de façon efficace.
Produire des analyses statistiques descriptives et inférentielles.
Implémenter des algorithmes simples de machine learning supervisés et non supervisés.
Savoir utiliser les principaux packages R pour la Data Science.

Contents

Importation et manipulation des données 

Importer des données de formats variés
CSV avec readr, base R
Excel avec readxl
JSON avec jsonlite
Connexion bases de données (dbplyr, DBI)
Aperçu des packages : haven (SPSS, Stata)

Atelier pratique : Importer différents formats de données

Maîtriser la manipulation des données dans R

Filtrage, sélection, mutation
Agrégation et group_by
Tri et réorganisation
Jointures (left_join, inner_join, etc.)
Gestion des valeurs manquantes : is.na, replace_na
Nettoyage des formats de colonnes (dates, facteurs, strings)

Atelier pratique : pipeline complet avec dplyr et tidyr

Visualisation des données 

Principes de la data visualisation
Importance de la visualisation exploratoire
Types de graphiques adaptés aux données
Représentations graphiques classiques et avancées
Création de graphiques avec ggplot2
Syntaxe de base
Types : histogrammes, boxplots, scatterplots, bar charts
Facets et thèmes

Atelier pratique : Créer des graphiques statiques avec ggplot2

Visualisations interactives

Introduction à plotly pour ggplot
Cartes interactives avec leaflet (optionnel)

Atelier pratique : Transformer un ggplot en graphique interactif

Statistiques descriptives et inférentielles 

Écrire des statistiques descriptives à l'aide de R
Moyenne, médiane, écart-type
Résumés et quantiles
Tableaux de fréquence
Outils pour la description statistique

Atelier pratique : Résumer un jeu de données réelles

Tests d’hypothèses

t-tests (une ou deux échantillons)
ANOVA
Test du chi-deux
Corrélation de Pearson et Spearman
Packages : base R, broom

Atelier pratique : Réaliser et interpréter des tests statistiques

Modélisation statistique et Machine Learning 

Analyse descriptive des datasets multivariés et techniques de réduction dimensionnelle
ACP (Analyse en Composantes Principales)
Packages : FactoMineR, factoextra
Analyse Factorielle des Correspondances (AFC)

Atelier pratique : Réaliser une ACP et interpréter les axes

Algorithmes supervisés avec études de cas sur R

Régression linéaire simple et multiple (lm)
Régression logistique (glm)
Analyse des résidus
Visualisation des résultats
Exemple pratique sur un jeu de données

Atelier pratique : Ajuster et interpréter des modèles supervisés

Algorithmes non supervisés avec études de cas sur R

K-means clustering
Préparation des données
Choix du nombre de clusters
Visualisation des clusters

Atelier pratique : Segmenter des données avec k-means

Introduction à l’Analyse des séries temporelles

Composantes d’une série
Modèles ARIMA, SARIMA avec forecast
Visualisation des prévisions

Atelier pratique : Prévoir des valeurs avec ARIMA

Teaching methods

Active Learning

Evaluation

contrôle continu ou certification si prévue dans le financement

Next session

Datum
City
Language and price
05.03.2026

06.03.2026
A distance
FR 1975,00€
21.05.2026

22.05.2026
A distance
FR 1975,00€
25.06.2026

26.06.2026
A distance
FR 1975,00€
17.09.2026

18.09.2026
A distance
FR 1975,00€
19.11.2026

20.11.2026
A distance
FR 1975,00€

These courses might interest you

EN
Day
On request
Computer language - Java language