Développeurs
Notions d'algorithmique
Découvrir le langage R et son écosystème pour la data science.Apprendre à écrire du code structuré, lisible et maintenable en R.Importer, nettoyer et préparer des données issues de multiples sources.Maîtriser la manipulation de données avec le tidyverse et les pipelines.Créer des visualisations statiques et interactives impactantes.Produire des documents reproductibles pour le reporting.Réaliser des analyses statistiques descriptives et inférentielles.S’initier à la modélisation statistique et au machine learning avec R.
Statistique, data science, visualisationExemples de secteursÉcosystème RCRANPackages : définition, installation, gestionAtelier : installation et chargement de packagesRStudio et organisation de projetCréation de projetsOrganisation des répertoires, chemins relatifs
Écrire du code en RVecteursListesData framesMatricesFacteurs
Normes de codageNommage, commentairesOrganisation des scriptsStructures de contrôleConditionnelles : if, elseBoucles : for, while, repeatapply, lapply, map
Syntaxe de baseArguments, valeurs de retourFonctions anonymesBonnes pratiques
Formats : .csv, .txt, .xls(x), .sav, JSONPackages : readr, readxl, haven, jsonliteConnexions bases de données : DBI, dbplyrEncodage, séparateur, gestion des NA
Notion de pipeline Manipulation avec dplyr et tidyrFiltrer, sélectionner, trierCréer des variablesFusionner, joindreReshaping : pivot_longer, pivot_widerGestion des valeurs manquantes
Importance exploratoireTypes de graphiques adaptés
Syntaxe de baseHistogrammes, boxplots, scatterplots, bar chartsFacets et thèmes
plotly pour ggplotCartes interactives avec leaflet (optionnel)
RMarkdown, Quarto, NotebooksAvantages et usagesAtelier : création d’un document reproductibleGestion de versions avec GitIntégration RStudioInitialisation, commits
Moyenne, médiane, écart-typeRésumés, quantiles, tableaux de fréquence
t-tests, ANOVA, chi-deuxCorrélations : Pearson, SpearmanPackages : base R, broom
Régressions linéaire et logistiqueAnalyse des résidusVisualisation des résultats
K-means clusteringPréparation des données, choix du kVisualisation des clusters
Composantes d’une sérieModèles ARIMA, SARIMA (forecast)Visualisation des prévisions
Active Learning
contrôle continu ou certification si prévue dans le financement
Nos formateurs sont habitués à travailler en classe virtuelle (visio-conférence). Au préalable, nous réalisons un audit afin de s’assurer systématiquement en amont de la possibilité pour les stagiaires de suivre à distance (équipement, qualité de la connexion, etc...).
Cela vous permet d'interagir pleinement lors de la session.
Pour un déroulement optimal en visioconférence (et après test de connexion en amont) nous vous suggérons de prévoir:
Le(s) logiciel(s) installé(s) sur le poste du participant, Une connexion internet stable, Idéalement 2 écrans (dont 1 pour interactivité et 1 pour poste de travail et prise en main éventuelle à distance par le formateur), Un micro et haut-parleur ou kit mains-libres (pour interagir avec le formateur) et en option une webcam
Le participant devra être dégagé de ses contraintes professionnelles et/ou personnelles durant la formation.
Plus d'informations sur le déroulement de nos formations à distance: https://youtu.be/GsZhStn1OgI