Niveau d'étude
BAC +5
Composante
Polytech Dijon (Ex-ESIREM)
Description
Ce cours couvre les thèmes classiques et émergents de traitement et de fouille de données massives en intégrant trois parties principales : les questions conceptuelles et historiques, les principes d’utilisation des algorithmes et leur développement, ainsi que le traitement éthique de données y compris la sécurité et la vie privée. Le cours comprend les éléments suivants : l’histoire et philosophie du Big Data et Data Mining; l’extrait, transformation, chargement et nettoyage de données massives ; stockage et modélisation de données massives ; la complexité des données et rappel sur la complexité des algorithmes ; langages et outils Big Data et Data Mining; méthodes classiques d’analyse de données et les méthodes adaptées à de gros volumes de données, e.g. Partitionnement de données (K-means), réduction de dimensionnalité (PCA), map reduce, streaming ; visualisation des données massives ; traitement éthique de données, sécurité et la vie privée, anonymisation des données.
Objectifs
- Comprendre les principes de traitement et de fouille de données massives
- Utiliser des algorithmes du Big Data et Data Mining, améliorer leur compréhension
- Appliquer les méthodes d’analyse de la complexité des algorithmes et des données massives
- Visualiser et présenter les résultats
- Savoir lire, comprendre et rédiger le code, la documentation et les rapports techniques, présenter les résultats
- Comprendre l’importance d’analyse des données massives, le traitement éthique, le respecte de la vie privée, RGPD, connaître les risques associés
Heures d'enseignement
- CMCours Magistral14h
- TDTravaux Dirigés10,5h
- TPTravaux Pratiques14h
Pré-requis obligatoires
- Algèbre linéaire
- Langage de programmation, e.g. Python
Modalités de contrôle des connaissances
Évaluation initiale / Session principale - Épreuves
Type d'évaluation | Nature de l'épreuve | Durée (en minutes) | Nombre d'épreuves | Coefficient de l'épreuve | Note éliminatoire de l'épreuve | Remarques |
---|---|---|---|---|---|---|
CC (contrôle continu) | Ecrit sur table | |||||
CC (contrôle continu) | Production écrite |
Seconde chance / Session de rattrapage - Épreuves
Type d'évaluation | Nature de l'épreuve | Durée (en minutes) | Nombre d'épreuves | Coefficient de l'épreuve | Note éliminatoire de l'épreuve | Remarques |
---|---|---|---|---|---|---|
CC (contrôle continu) 2nde chance | Ecrit sur table | |||||
CC (contrôle continu) 2nde chance | Production écrite |