Passer au contenu
24 h

Gestion de données

Spark pour le traitement de données massives

Préalables

• Avoir suivi les cours Info17 et Info41. • Expérience basique en ligne de commande Linux. • Connaissances basiques SQL. • Connaissances de base en programmation ou en scripting (Python/Java/Scala) est un atout.

OBJECTIFS PÉDAGOGIQUES:

• Appréhender le fonctionnement de Spark
• Développer des applications avec Apache Spark
• Optimiser une application Spark
• Utiliser Spark SQL et les dataframes
• Faire de l’analyse en temps réel avec Spark streaming
• Découvrir MLLib pour du machine learning sur Spark
• Explorer, manipuler et visualiser votre donnée avec Zeppelin