Passer au contenu
24 h

Informatique

Sciences des données (datascience) – Avancé

Préalables

- Avoir suivi le cours Science des données (datascience) – intermédiaire, - Avoir des connaissances de base en programmation et en mathématiques ainsi que des langages Python et R

Objectif général

Ce cours a pour objectif l’acquisition de connaissances avancées en sciences des données et plus spécifiquement les algorithmes de Machine Learning non supervisés (« Clustering »). À la fin de ce cours, les étudiants seront capables de mettre en place une solution de « Clustering » selon un besoin exprimé, en langage Python ou R, en réalisant un projet intégrateur.

Objectifs spécifiques

  • Décrire et exécuter des algorithmes de Machine Learning non supervisé et de processus de « texte mining »
  • Appliquer une technique de « Clustering » 
  • Appliquer une technique d’extraction de connaissances

Contenu

  • Contexte et application des approches de « Clustering »
  • Algorithmes de « Clustering »
  • Évaluation et mesures
  • Implémentation, évaluation et qualité
  • Projet intégrateur en approche non supervisé