ALLER AU CONTENU
Le portail de la formation tout au long de la vie
LU
DE
EN
FR
PT
Vous êtes ici: Accueil > Formations > DAWAN

Data Science (R et Hadoop)

5 jour(s)

Objectifs

  • Appliquer des techniques d'exploration des données pour améliorer la prise de décisions métier à partir de sources de données internes et externes.
  • Prendre une longueur d'avance sur vos concurrents avec l'analyse des données structurées et non structurées.
  • Prédire un résultat en utilisant des techniques d'apprentissage automatique supervisé.

Contenu

Exploration et analyse des données avec R

Charger, interroger et manipuler des données avec R
Nettoyer les données brutes avant la modélisation
Réduire les dimensions avec l'analyse en composantes principales (ACP)
Développer les fonctionnalités de R avec les packages définis par l'utilisateur

Faciliter la pensée analytique avec la visualisation des données

Explorer les caractéristiques d'un ensemble de données à travers la visualisation
Représenter graphiquement la distribution des données avec des boîtes à moustaches, des histogrammes et des diagrammes de densité
Identifier les valeurs hors normes

Explorer les données non structurées pour les applications métier

Traitement préliminaire et préparation des données non structurées pour une analyse plus approfondie
Décrire un ensemble de documents avec une matrice termes-documents

Difficultés supplémentaires liées au Big Data

Examiner les architectures de MapReduce et Hadoop
Intégrer R et Hadoop à RHadoop

Estimer les valeurs avec les règles de régression linéaire et logistique

Modéliser la relation entre une variable de sortie et plusieurs variables d'entrée
Interpréter correctement les coefficients des données continues et qualitatives

Techniques de régression pour manipuler le Big Data

Traiter les ensembles de données volumineux avec RHadoop
Créer des modules de régression pour RHadoop

Identification automatique de chaque nouvel élément de données

Utiliser des arbres de décision pour prédire les valeurs cible
Appliquer des règles de probabilité pour prédire les résultats avec le modèle Naive Bayes
Combiner les variables de prédiction des arbres et les forêts aléatoires dans RHadoop

Évaluer les performances des modèles

Visualiser les performances des modèles avec une courbe ROC
Évaluer les modèles de classification avec des matrices de confusion

Identifier des groupes encore inconnus dans un ensemble de données

Segmenter le marché client avec l'algorithme K-Means
Trouver des similarités avec les mesures des distances
Créer des clusters en forme d'arbres et des mises en cluster hiérarchiques
Mettre en cluster les tweets et les fichiers texte pour mieux les comprendre

Mettre à jour les connexions avec l'analyse des associations

Identifier les connexions importantes avec l'analyse des réseaux sociaux
Comprendre l'utilisation des résultats de l'analyse des réseaux sociaux à des fins marketing

Définir et évaluer des règles d'association

Identifier les préférences réelles des clients à partir d'un ensemble de données transactionnelles pour améliorer l'expérience utilisateur
Calculer les indices de support et de confiance et le lift pour différencier les bonnes règles des mauvaises

Méthodes pédagogiques

Méthodologie basée sur l'Active Learning : 75% de pratique minimum. Chaque point théorique est systématiquement suivi d'exemples et exercices.

Public cible

A qui s'adresse la formation?

Professionnels des bases de données, managers, analystes de données, data scientists et assistants à  maîtrise d'ouvrage. Cette formation est très utile pour les professionnels chargés de gérer les prévisions et les tendances

 
Prérequis

Connaissances en matière de programmation et de statistiques sont utiles sans toutefois être obligatoires

Evaluation

Méthodes d'évaluation

Contrôle continu

 
Certificat, diplôme

Attestation de fin de stage mentionnant le résultat des acquis

Voir les coordonnées de l'organisme
DAWAN

Dawan - Service commercial

commercial@dawan.fr

+33 (0)9 72 37 73 73

Partager sur

 



Le contenu de ce descriptif de formation est de la seule responsabilité de son auteur, l'organisme de formation DAWAN.

Imprimer Tout voir/cacher Envoyer à un ami
Voir les coordonnées de l'organisme
DAWAN

Dawan - Service commercial

commercial@dawan.fr

+33 (0)9 72 37 73 73

Caractéristiques
Organisation Formation inter-entreprise
Langues de prestation
Utilisation des cookies

lifelong-learning.lu utilise des cookies pour vous offrir une expérience utilisateur de qualité, mesurer l’audience, optimiser les fonctionnalités des réseaux sociaux et vous proposer du contenu personnalisé.

En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies dans les conditions prévues par notre politique en la matière. En savoir plus.

Cookies nécessaires
Ces cookies permettent d'utiliser les principales fonctionnalités de notre site (par exemple l'accès à votre espace réservé). Sans ces cookies, vous ne pourrez pas utiliser notre site normalement.
Statistiques
Ces cookies permettent d'établir des statistiques de fréquentation de notre site. Les désactiver nous empêche de suivre et d'améliorer la qualité de nos services.
Publicité ciblée
Ces cookies permettent de vous proposer sur internet et les réseaux sociaux des informations et des offres de formation qui répondent mieux à vos besoins.

Consulter notre politique d’utilisation des cookies

Accepter tout Paramétrer les cookies
Veuillez patienter...