Analyse statistique de données avec le langage R



Objectifs, programme, validation de la formation

Objectifs

Connaître et comprendre l’environnement R :
Importer et exporter des données
Concevoir des opérations de manipulation de données (filtrer, trier, agréger, transformer...) comme un flux de traitement organisé
Dessiner le graphique approprié à la représentation souhaitée
Manipuler les dates
Manipuler les chaines de caractères
Maîtriser le paramétrage de rapports mis en forme d’analyse de données

Description, programmation

Présentation de R, premiers pas dans la console :
Démystifier la console, une « super-calculatrice » qui exécute du code
Prendre ses marques dans RStudio, créer son premier projet
Comprendre ce qu’est un vecteur
Se familiariser avec les packages et le moyen de les utiliser
Utiliser Rmarkdown pour la prise de notes
Visualiser des données
Construire, modifier et exporter des graphiques avec le package ggplot2
Importer des données
Importer des fichiers plats de type .csv et .xls avec les packages readr et readxl
Vérifier la qualité de l’import
Typer les données (déterminer si chaque colonne est une date, une valeur numérique, un texte...)
Manipuler et nettoyer des données
Se familiariser avec les packages dplyr et tidyr
Concevoir les opérations de manipulation de données comme un flux de traitement organisé :
introduction de l’opérateur %>%
Manipuler, transformer et résumer des données avec dplyr
Remodeler les données sous un format adéquat avec tidyr
Produire des rapports d’analyse
Appréhender le concept de recherche reproductible
Compiler des rapports commentés imbriqués de code R avec Rmarkdown.
Savoir exporter en docx, en html et en pdf
Mise en forme de tableau avec DT
Décrire des données
Calculer des paramètres descriptifs pertinents pour décrire des données (effectifs, moyennes, médianes, écart-types...)
Utilisation du package skimr
Autonomisation
Approfondir les connaissances sur les packages
Exporter des données
Savoir comment trouver de l’aide face à un problème rencontré sur R
Paramétrer finement les rapports d’analyse réalisés avec Rmarkdown
Réaliser des jointures de données
Réaliser une jointure simple
Réaliser une jointure complexe
Gérer des dates
Formater, manipuler et opérer des calculs sur des dates avec le package lubridate
Comprendre, appréhender et utiliser les formats dates dans R
Gérer les chaînes de caractères
Manipuler les chaînes de caractères avec le package stringr
Gérer la présence de données manquantes dans les données

Validation et sanction

Analyse statistique de données avec le langage R ;Attestation de suivi de présence

Type de formation

Professionnalisation

Niveau de sortie sans niveau spécifique


Durée, rythme, financement

Durée 35 heures en centre
Durée indicative : 38 jours

Modalités de l'alternance FOAD : 35 h

Conventionnement Non

Conditions d'accès

Modalités de recrutement et d'admission Test

Niveau d'entrée niveau III (BTS, DUT)

Conditions spécifiques et prérequis - Affinité pour la programmation. - Affinité pour les données. - Aisance informatique.

Inscription

Contact renseignement Mme Diane Beldame

Téléphone 01 85 09 14 03


Éligibilité de cette formation au compte personnel de formation pour les salariés


Code CPF 328425 - Validité du 31/01/2020 au 31/12/2115


Périodes prévisibles de déroulement des sessions

Session débutant le : 08/11/2022

Adresse d'inscription
50 Rue Arthur Rimbaud 93300 Aubervilliers

Lieu de formation


Organisme de formation responsable