24 h
Informatique
Science des données (datascience) – Niveau 3
Préalables
Cours Science des données (datascience) – intermédiaire, connaissances de base en programmation et en mathématiques ainsi que des langages Python et R.
Objectif général
Ce cours a pour objectif l’acquisition de connaissances avancées en sciences des données et plus spécifiquement les algorithmes de Machine Learning non supervisés (« Clustering »). À la fin de ce cours, les étudiants seront capables de mettre en place une solution de « Clustering » selon un besoin exprimé, en langage Python ou R, en réalisant un projet intégrateur.
Objectifs spécifiques
- Décrire et exécuter des algorithmes de Machine Learning non supervisé et de processus de « texte mining »
- Appliquer une technique de « Clustering »
- Appliquer une technique d’extraction de connaissances
Contenu
- Contexte et application des approches de « Clustering »
- Algorithmes de « Clustering »
- Évaluation et mesures
- Implémentation, évaluation et qualité
- Projet intégrateur en approche non supervisé