Data Science pour l’Ingénieur – École Sigma Clermont – Programme
Objectifs de l’enseignement
- Former à la data science de l’ingénieur les élèves ingénieurs et les salariés d’entreprises.
- Exprimer le type de données nécessaires, choisir la méthodologie, les outils de traitement ad hoc pour déployer son travail et distinguer un problème de statistiques d’un problème de big data.
- Formaliser un problème industriel et porter un regard métier en utilisant les outils du data scientist complémentairement à l’ensemble des outils disponibles dans l’ingénierie.
- Porter un regard d’ingénieur sur le monde des données, de la donnée à la prise de décision.
- Pour les étudiants Sigma : susciter l’envie d’approfondir ses connaissances…
- Pour les salariés d’entreprises : introduire la data science parmi les outils à leur disposition.
En résumé, ce cours propose de fournir les bases des outils pour la résolution de problèmes industriels par la modélisation et l’algorithmie, en s’appuyant sur des données fiables et en grand nombre.
Plan de l’enseignement
Le cours se déroule comme suit :
- Enjeux, problématiques. (Introduction : 1 heure)
- Fiabilité des données mesurées, (Incertitude de mesure : 3 heures)
- Lien données modèles, simulation, … (3 heures)
- Technologies et algorithmie: passage à l’échelle, parallélisation, … (3 heures)
- Apprentissage supervisé et non supervisé (4 heures)
- Objets connectés (2 heures)
- Aspects réglementaires, valeur de la donnée, propriété, valorisation de la donnée fiabilité, data privacy (2 heures)
Liens avec d’autres enseignements
Informatique, analyse numérique, approches probabilistes
Ouvrages de référence
La Smart Metrology – De la métrologie des instruments à la métrologie des décisions.
Data science : fondamentaux et études de cas : Machine learning avec Python et R.
Big data et machine learning. Les concepts et les outils de la data science
Évaluation
Contrôle de connaissances, 6 questions par modules (2 heures).
Mots clés
Big data, ingénieur, classification, réseau de neurones, modélisation, algorithmie, approche probabiliste, inférence statistique, High Performance Computing, entrepôt de données, fouille de données, apprentissage automatique, réseaux convolutifs, autoencodeurs, fiabilité des données, simulation, parallélisation, objets connectés, data privacy, industrie du futur