Dawan is a training organisation that offers more than 2000 training courses in IT, management, project management and sales in instructor-led live online or on-site trainings. We have 11 centres in France and we have developed partnerships with local structures in Brussels, Luxembourg and Geneva. Our catalogue includes hundreds of topics: Java, PHP, Webmaster, E-Marketing, Linux, Windows Server, Vmware, Autocad, Photoshop, IA etc. Our courses have been created and designed by in-house trainers who have over 20 years of teaching experience. Constantly renewed, they are adapted to the requirements of our customers and to the evolution of technologies.
The content of this page is not available in English
Développeurs R
Avoir suivi la formation Langage R: fondamentaux ou notions équivalentes
Acquérir les bases solides pour importer, nettoyer et manipuler des données avec R.Explorer et visualiser des données de façon efficace.Produire des analyses statistiques descriptives et inférentielles.Implémenter des algorithmes simples de machine learning supervisés et non supervisés.Savoir utiliser les principaux packages R pour la Data Science.
Importer des données de formats variésCSV avec readr, base RExcel avec readxlJSON avec jsonliteConnexion bases de données (dbplyr, DBI)Aperçu des packages : haven (SPSS, Stata)
Filtrage, sélection, mutationAgrégation et group_byTri et réorganisationJointures (left_join, inner_join, etc.)Gestion des valeurs manquantes : is.na, replace_naNettoyage des formats de colonnes (dates, facteurs, strings)
Principes de la data visualisationImportance de la visualisation exploratoireTypes de graphiques adaptés aux donnéesReprésentations graphiques classiques et avancéesCréation de graphiques avec ggplot2Syntaxe de baseTypes : histogrammes, boxplots, scatterplots, bar chartsFacets et thèmes
Introduction à plotly pour ggplotCartes interactives avec leaflet (optionnel)
Écrire des statistiques descriptives à l'aide de RMoyenne, médiane, écart-typeRésumés et quantilesTableaux de fréquenceOutils pour la description statistique
t-tests (une ou deux échantillons)ANOVATest du chi-deuxCorrélation de Pearson et SpearmanPackages : base R, broom
Analyse descriptive des datasets multivariés et techniques de réduction dimensionnelleACP (Analyse en Composantes Principales)Packages : FactoMineR, factoextraAnalyse Factorielle des Correspondances (AFC)
Régression linéaire simple et multiple (lm)Régression logistique (glm)Analyse des résidusVisualisation des résultatsExemple pratique sur un jeu de données
K-means clusteringPréparation des donnéesChoix du nombre de clustersVisualisation des clusters
Composantes d’une sérieModèles ARIMA, SARIMA avec forecastVisualisation des prévisions
Active Learning
contrôle continu ou certification si prévue dans le financement
Support de cours + sources des exercices
Nos formateurs sont habitués à travailler en classe virtuelle (visio-conférence). Au préalable, nous réalisons un audit afin de s’assurer systématiquement en amont de la possibilité pour les stagiaires de suivre à distance (équipement, qualité de la connexion, etc...).
Cela vous permet d'interagir pleinement lors de la session.
Pour un déroulement optimal en visioconférence (et après test de connexion en amont) nous vous suggérons de prévoir:
Le(s) logiciel(s) installé(s) sur le poste du participant, Une connexion internet stable, Idéalement 2 écrans (dont 1 pour interactivité et 1 pour poste de travail et prise en main éventuelle à distance par le formateur), Un micro et haut-parleur ou kit mains-libres (pour interagir avec le formateur) et en option une webcam
Le participant devra être dégagé de ses contraintes professionnelles et/ou personnelles durant la formation.
Plus d'informations sur le déroulement de nos formations à distance: https://youtu.be/GsZhStn1OgI