Certification DiGiTT - Data Full - Bootcamp



Objectifs, programme, validation de la formation

Objectifs

Développer les apports théoriques indispensables aux métiers de Data Scientists, Data Engineer et Data Analyst
Apprendre à analyser, visualiser et explorer ses données
Apprendre à mettre en production des projets Data
Savoir entraîner des modèles de machine learning et deep learning
Connaitre et maitriser les technologies Big Data

Description, programmation

Module 1 : Les fondamentaux

  • Kit de survie. Maitriser les outils indispensables : Github, Jupyter Notebook, PyCharm...
  • Python pour la Data Science. Manipulation des librairies python : Pandas, Matplotlib, NumPy, SciPy
  • Les fondamentaux mathématiques. Développer les acquis théoriques fondamentaux en algèbre linéaire, statistiques et probabilités

Module 2 : Data Analysis

  • Data analysis et Data Cleaning. Apprendre à utiliser Github, lancer des requêtes SQL, utiliser une API
  • Data Visualization. Apprendre à utiliser les principales librairies de data viz comme Bokeh, Seaborn ou encore Plotly
  • Data Exploration. Explorer vos données en python afin d’en extraire les principaux insights

Module 3 : Data Engineering

  • Manipulation d’API. Apprendre à développer et manipuler vos propres API.
  • Mise en production d’un projet Data. Découvrir les notions de dockerisation, clusters kubernetes.
  • Cloud. Maitriser les solutions cloud d’Amazon AWS et Google Cloud. Apprendre à monitorer l’activité de vos serveurs.

Module 4 : Machine Learning

  • Apprentissage supervisé / Non Supervisé. Explorer ces différentes méthodes d’apprentissages grâce à la librairie Sickit-Learn : SVM, kNN, PCA, Random Forest.
  • Généralisation des modèles. Apprendre à choisir les bonnes méthodes de régularisation.
  • Natural Language Processing. Développer les acquis techniques en gestion de données textes : NLTK, SpaCy...

Module 5 : Big Data Engineering

  • Ecosystème Hadoop. Pouvoir comprendre l’architecture des applicatifs Hadoop et savoir quels sont les apports et les cas d’usage des solutions Hadoop.
  • Bases de données SQL/NoSQL. Apprendre à manipuler les bases de données SQL et NoSQL : MongoDB, ElasticSearch, Neo4J
  • Data Streaming. Apprendre à créer un Data Streaming Pipeline et à maitriser l’utilisation de Kafka

Module 6 : Deep Learning

  • Réseaux de Neurones. Apprendre à construire et entrainer vos premiers réseaux de neurones.
  • Computer Vision. Entrainer vos modèles de détections et de classifications d’images et déployer vos premières applications.
  • Deep Reinforcement Learning et Recurrent Neural Networks. Apprendre à entrainer vos premiers agents ainsi qu’à évaluer un modèle RNN

+ Coaching professionnel

  • Aide à la rédaction de CV et lettre de motivation
  • Préparations aux entretiens d’embauche
  • Sessions de Q/A DATA
  • Aide à la recherche d’emploi sur notre plateforme

Validation et sanction

Certification DiGiTT ;Attestation d’acquis ou de compétences ;Attestation de suivi de présence

Type de formation

Professionnalisation

Niveau de sortie sans niveau spécifique

Métiers visés

K2111 :

M1805 :


Durée, rythme, financement

Durée 440 heures en centre
Durée indicative : 80 jours

Modalités de l'alternance FOAD : 440 h

Conventionnement Non

Conditions d'accès

Modalités de recrutement et d'admission Test;Entretien

Niveau d'entrée niveau IV (BP, BT, baccalauréat professionnel ou technologique)

Conditions spécifiques et prérequis Connaissances en mathématiques de base (niveau Bac scientifique)

Inscription

Contact renseignement Mme Ikram EL KHAYAR


Éligibilité de cette formation au compte personnel de formation pour les salariés


Code CPF 235908 - Validité du 02/01/2019 au 31/12/2115


Périodes prévisibles de déroulement des sessions

Session débutant le : 13/09/2021

Adresse d'inscription
7 Cours Valmy 92800 Puteaux

Lieu de formation


Organisme de formation responsable