Langage R : Fondamentaux + Data Science

Inter-company training

Duration

 5,00 day(s)

Language(s) of service

EN FR

Next session

 22.06.2026
Location
 A distance

Price

3475,00€

Who is organizing this training?

Dawan is a training organisation that offers more than 2000 training courses in IT, management, project management and sales in instructor-led live online or on-site trainings. We have 11 centres in France and we have developed partnerships with local structures in Brussels, Luxembourg and Geneva. Our catalogue includes hundreds of topics: Java, PHP, Webmaster, E-Marketing, Linux, Windows Server, Vmware, Autocad, Photoshop, IA etc. Our courses have been created and designed by in-house trainers who have over 20 years of teaching experience. Constantly renewed, they are adapted to the requirements of our customers and to the evolution of technologies.

Who is the training for?

Développeurs

Prerequisites

Notions d'algorithmique

Goals

Découvrir le langage R et son écosystème pour la data science.
Apprendre à écrire du code structuré, lisible et maintenable en R.
Importer, nettoyer et préparer des données issues de multiples sources.
Maîtriser la manipulation de données avec le tidyverse et les pipelines.
Créer des visualisations statiques et interactives impactantes.
Produire des documents reproductibles pour le reporting.
Réaliser des analyses statistiques descriptives et inférentielles.
S’initier à la modélisation statistique et au machine learning avec R.

Contents

Introduction à R et à son écosystème

Présentation de R et usages

Statistique, data science, visualisation
Exemples de secteurs
Écosystème R
CRAN
Packages : définition, installation, gestion
Atelier : installation et chargement de packages
RStudio et organisation de projet
Création de projets
Organisation des répertoires, chemins relatifs

Atelier : créer un projet RStudio

Écrire du code en R
Vecteurs
Listes
Data frames
Matrices
Facteurs

Atelier : création et manipulation de chaque type

Programmation en R : structures, fonctions et bonnes pratiques

Normes de codage
Nommage, commentaires
Organisation des scripts
Structures de contrôle
Conditionnelles : if, else
Boucles : for, while, repeat
apply, lapply, map

Atelier : écrire des structures conditionnelles et des boucles

Création de fonctions

Syntaxe de base
Arguments, valeurs de retour
Fonctions anonymes
Bonnes pratiques

Atelier : automatiser des analyses avec ses propres fonctions

Importation et préparation des données

Techniques d’importation

Formats : .csv, .txt, .xls(x), .sav, JSON
Packages : readr, readxl, haven, jsonlite
Connexions bases de données : DBI, dbplyr
Encodage, séparateur, gestion des NA

Atelier pratique : importer différents formats

Introduction au tidyverse 

Notion de pipeline 
Manipulation avec dplyr et tidyr
Filtrer, sélectionner, trier
Créer des variables
Fusionner, joindre
Reshaping : pivot_longer, pivot_wider
Gestion des valeurs manquantes

Atelier : pipeline complet avec dplyr et tidyr

Visualisation et reporting avec R

Principes de la data visualisation

Importance exploratoire
Types de graphiques adaptés

Introduction à ggplot2

Syntaxe de base
Histogrammes, boxplots, scatterplots, bar charts
Facets et thèmes

Atelier pratique: graphiques statiques

Visualisations interactives

plotly pour ggplot
Cartes interactives avec leaflet (optionnel)

Atelier pratique : transformer un ggplot en interactif

Production de documents

RMarkdown, Quarto, Notebooks
Avantages et usages
Atelier : création d’un document reproductible
Gestion de versions avec Git
Intégration RStudio
Initialisation, commits

Atelier pratique : prise en main de Git avec RStudio

Analyse statistique et Machine Learning avec R

Statistiques descriptives

Moyenne, médiane, écart-type
Résumés, quantiles, tableaux de fréquence

Atelier  pratique: résumer un dataset

Tests d’hypothèses

t-tests, ANOVA, chi-deux
Corrélations : Pearson, Spearman
Packages : base R, broom

Atelier pratique : réaliser et interpréter des tests

Modélisation supervisée

Régressions linéaire et logistique
Analyse des résidus
Visualisation des résultats

Atelier : ajuster et interpréter des modèles

Analyse multivariée : ACP, AFC (FactoMineR, factoextra)

Atelier pratique : réaliser une ACP

Apprentissage non supervisé

K-means clustering
Préparation des données, choix du k
Visualisation des clusters

Atelier pratique : segmentation (identifier des sous-populations aux caractéristiques similaires)

Introduction aux séries temporelles

Composantes d’une série
Modèles ARIMA, SARIMA (forecast)
Visualisation des prévisions

Teaching methods

Active Learning

Evaluation

contrôle continu ou certification si prévue dans le financement

Course material

Support de cours + sources des exercices

Next session

Datum
City
Language and price
22.06.2026

26.06.2026
A distance
FR 3475,00€
14.09.2026

18.09.2026
A distance
FR 3475,00€
16.11.2026

20.11.2026
A distance
FR 3475,00€

These courses might interest you