Passer au contenu
30 h

Gestion de données

2$/h – Framework Spark pour le traitement distribué des données

Objectif :

Avec Spark, les développeurs peuvent écrire simplement des applications distribuées complexes qui permettent de prendre des meilleures décisions plus rapidement et des actions en temps réel, appliquées à une grande variété de cas d’utilisations, d’architecture et de secteurs d’activités.

Contenu

  • Appréhender le fonctionnement de Spark
  • Développer des applications avec Apache Spark
  • Optimiser une application Spark
  • Utiliser Spark SQL et les dataframes
  • Faire de l’analyse en temps réel avec Spark streaming
  • Découvrir MLLib pour du machine learning sur Spark
  • Explorer, manipuler et visualiser votre donnée avec Zeppelin

Préalables

  • Expérience basique en ligne de commande Linux
  • Des connaissances basiques SQL
  • Des connaissances de base en programmation ou en Scripting (Python/Java/Scala) est un atout