DU Big data et statistique pour l'ingénieur



Objectifs, programme, validation de la formation

Objectifs

  • Former aux bases de la statistique et à l’utilisation des méthodes et outils statistiques les ingénieurs de l’industrie, de la santé, des transports, des services ou de la défense, confrontés à des problèmes de traitement des données et à leur compréhension.
  • Sensibiliser les acteurs aux problématiques et outils actuels et futurs du Big Data.
  • Permettre la compréhension des domaines d’application de la statistique et du traitement des données.
  • Mettre en oeuvre les méthodes.
  • Maîtriser les outils statistiques, pour des applications concrètes dans l’entreprise.

Description, programmation

Session 1 :

  • Enjeux socio-économiques du Big Data.
  • Introduction à la Statistique.
  • Statistique descriptive univariée et bivariée.
  • Initiation au logiciel statistique R.
    Session 2 :
  • Statistique inférentielle : estimateurs, intervalles de confiance et tests d’hypothèses paramétriques et non paramétriques.
  • Illustration à l’aide du logiciel R.

Session 3 :

  • Statistique multidimensionnelle : analyse en composantes principales, analyse factorielle des correspondances, analyse des données mixtes, analyse discriminante, classification automatique (clustering), classification de variables, réseaux de neurones.
  • Illustration à l’aide du logiciel R.

Session 4 :

  • Big Data : stockage de très grands volumes de données dans des architectures passant à l’échelle, calcul parallèle, méthodologie adaptée, etc.
  • Mise en œuvre pratique.

Session 5 :

  • Modélisation statistique : régression linéaire simple et régression linéaire multiple, analyse de la variance (ANOVA), analyse de la covariance (ANCOVA).
  • Illustration à l’aide du logiciel R.

Session 6 :

  • Modélisation statistique : forêts aléatoires, régression non paramétrique, régression semi paramétrique.
  • Illustration à l’aide du logiciel R.

Session 7 :

  • Etudes de cas.
  • Deep learning.
  • Analyse des données du web et gestion de la qualité des données.

Niveau de sortie information non communiquée

Métiers visés

M1403 :


Durée, rythme, financement

Durée 164 heures en centre

Modalités de l'alternance -

Conventionnement Non

Conditions d'accès

Modalités de recrutement et d'admission - Titulaires d'un diplôme d'ingénieur ou d'un niveau équivalent. - Docteurs en poste dans l'entreprise. - Personnes ayant une expérience professionnelle attestée équivalente. La liste des secteurs d'activité concernés est : l'industrie, le numérique, l'aérospatiale, le ferroviaire et l'automobile, le transport et les services, l'énergie, la défense et les grands systèmes à risque, etc…

Niveau d'entrée niveau II (licence ou maîtrise universitaire)

Conditions spécifiques et prérequis -

Inscription

Contact renseignement Chardron Chrystelle

Téléphone 0557006727


Périodes prévisibles de déroulement des sessions

Session débutant le : 01/01/2020

Adresse d'inscription
ENSC
109, avenue Roul 33400 Talence

Lieu de formation


Organisme de formation responsable