SKIP TO CONTENT
The portal for lifelong-learning
LU
DE
EN
FR
PT
You are here: Home > Training courses > OXiane Luxembourg

Programmation R et intégration Big Data (Live Virtual Class)

3 day(s)

Objectives

Langage R: Programmation R pour Hadoop.

  • Connaître les principales fonctions statistiques de R
  • Utiliser des programmes R dans un environnement Hadoop en s'appuyant sur le système distribué hdfs et le stockage avec HBase
  • Intégrer R à un environnement Hadoop

Content

Présentation R
  • Le projet R Programming
  • Calculs statistiques et génération de graphiques
  • Points forts de R Programming
  • Besoins du BigData
  • Positionnement R programming par rapport à Hadoop
Mise en oeuvre de R
  • Travaux pratiques: installation et tests sur une plate-forme CentOS
  • Utilisation de R en mode commande
  • Commandes de base
  • Syntaxe
  • Manipulations de nombres, vecteurs, tableaux, matrices, listes, …
Tableaux et matrices
  • Déclaration, dimensionnement, indexation
  • Opérations de base: produit de tableaux, transposition, produits de matrices
  • Matrices: équations linéaires, inversion, valeur propre, vecteur propre, déterminant, moindre carré, …
Liste et DataFrames
  • Définitions, cas d’utilisation
  • Attachement, détachement
  • Chargement d’un dataframe
  • La fonction scan
Statistiques
  • Distributions embarquées: uniforme, normale, poisson, exponentielle, …
  • Calculs statistiques. Modèles statistiques
  • Affichage en graphes, histogrammes
Import/export
  • Formats texte, csv, xml, binaire, largeur fixe, images (jpeg, png)
  • Encodage
  • Filtrage
  • Importation SQL
  • Importation depuis un socket réseau
  • Travaux pratiques: importation de données géodésiques et export au format Json
Intégration Hadoop
  • Association de la puissance du calcul distribué fourni par les outils hadoop et de la richesse des outils d’analyse statistique de R
  • Différents moyens d’intégration:sparkR, RHbase, RHDFS, RHadoop, rmr2 pour utiliser le système distribué hdfs depuis R, pour accéder à HBase depuis les programmes en R
  • Transformation d’un dataframe R en un dataframe Spark
  • Travaux pratiques avec Hadoop
Fonctions spécifiques
  • Définition de nouvelles fonctions
  • Appels
  • Passage d’argument
  • Construction d’une bibliothèque
  • Diffusion, installation avec R CMD INSTALL
Évolutions
  • Les acteurs: IBM avec BigInsights, Revolution R avec ScaleR

Target group

Who is the course aimed at?

Chefs de projets, Data Scientist, Developpeurs

 
Prerequisites

Connaissances de base en statistiques et en programmation

Assessment

Certficate, diploma

Une attestation de participation sera transmise aux participants

Contact the training provider
OXiane Luxembourg

Nathalie Thielemans / Nassera Aici

formation@oxiane.lu

+352 27 39 35

Share this content

 



Responsibility for the content of this training description lies solely with its author, the training provider OXiane Luxembourg.

Use of cookies

lifelong-learning.lu uses cookies to offer you a quality user experience, measure audiences, optimise functions on social media, and offer you personalised content.

By continuing to browse this website, you accept the use of cookies subject to the conditions provided for in our policy on the subject. Find out more.

Essential cookies
These cookies make it possible to use the main functions of our website (including access to your personal space). Normal use of our website is not possible unless these cookies are enabled.
Statistics
These cookies make it possible to compile statistics on visits to our website. Disabling them stops us monitoring and improving the quality of the services we provide.
Targeted advertising
These cookies make it possible to provide you with information via the Internet and the social media, with offers of training that match your needs.

Read our policy on the use of cookies.

Accept all Manage your cookie settings
Veuillez patienter...