Analyse statistique de données avec le langage R
Objectifs, programme, validation de la formation
Objectifs
Connaître et comprendre l’environnement R :
Importer et exporter des données
Concevoir des opérations de manipulation de données (filtrer, trier, agréger, transformer...) comme un flux de traitement organisé
Dessiner le graphique approprié à la représentation souhaitée
Manipuler les dates
Manipuler les chaines de caractères
Maîtriser le paramétrage de rapports mis en forme d’analyse de données
Description, programmation
Présentation de R, premiers pas dans la console :
Démystifier la console, une « super-calculatrice » qui exécute du code
Prendre ses marques dans RStudio, créer son premier projet
Comprendre ce qu’est un vecteur
Se familiariser avec les packages et le moyen de les utiliser
Utiliser Rmarkdown pour la prise de notes
Visualiser des données
Construire, modifier et exporter des graphiques avec le package ggplot2
Importer des données
Importer des fichiers plats de type .csv et .xls avec les packages readr et readxl
Vérifier la qualité de l’import
Typer les données (déterminer si chaque colonne est une date, une valeur numérique, un texte...)
Manipuler et nettoyer des données
Se familiariser avec les packages dplyr et tidyr
Concevoir les opérations de manipulation de données comme un flux de traitement organisé :
introduction de l’opérateur %>%
Manipuler, transformer et résumer des données avec dplyr
Remodeler les données sous un format adéquat avec tidyr
Produire des rapports d’analyse
Appréhender le concept de recherche reproductible
Compiler des rapports commentés imbriqués de code R avec Rmarkdown.
Savoir exporter en docx, en html et en pdf
Mise en forme de tableau avec DT
Décrire des données
Calculer des paramètres descriptifs pertinents pour décrire des données (effectifs, moyennes, médianes, écart-types...)
Utilisation du package skimr
Autonomisation
Approfondir les connaissances sur les packages
Exporter des données
Savoir comment trouver de l’aide face à un problème rencontré sur R
Paramétrer finement les rapports d’analyse réalisés avec Rmarkdown
Réaliser des jointures de données
Réaliser une jointure simple
Réaliser une jointure complexe
Gérer des dates
Formater, manipuler et opérer des calculs sur des dates avec le package lubridate
Comprendre, appréhender et utiliser les formats dates dans R
Gérer les chaînes de caractères
Manipuler les chaînes de caractères avec le package stringr
Gérer la présence de données manquantes dans les données
Validation et sanction
Analyse statistique de données avec le langage R ;Attestation de suivi de présence
Type de formation
Professionnalisation
Niveau de sortie sans niveau spécifique
Durée, rythme, financement
Durée
35 heures en centre
Durée indicative : 38 jours
Modalités de l'alternance FOAD : 35 h
Conventionnement Non
Conditions d'accès
Modalités de recrutement et d'admission Test
Niveau d'entrée niveau III (BTS, DUT)
Conditions spécifiques et prérequis - Affinité pour la programmation. - Affinité pour les données. - Aisance informatique.
Inscription
Contact renseignement Mme Diane Beldame
Téléphone 01 85 09 14 03
Éligibilité de cette formation au compte personnel de formation pour les salariés
Code CPF 328425 - Validité du 31/01/2020 au 31/12/2115
Périodes prévisibles de déroulement des sessions
Session débutant le : 08/11/2022
Adresse d'inscription
50 Rue Arthur Rimbaud 93300 Aubervilliers