Spark SQL et DataFrames

Moyen 22 points

Utilisez Spark SQL et DataFrames pour manipuler des données structurées.

Spark SQL permet d'utiliser SQL sur les données distribuées. Les DataFrames offrent une API optimisée similaire à Pandas mais distribuée. Ils sont plus performants que les RDDs pour les données structurées.

Bravo ! 🎉
Votre réponse est correcte ! Vous avez gagné 22 points.
Pas tout à fait...
Réessayez ! Vous pouvez le faire.

Votre code

Indice
Utilisez spark.read.csv(), createOrReplaceTempView(), spark.sql()

Résultat

Cliquez sur "Exécuter le code" pour voir le résultat de votre code. Cliquez sur "Soumettre" pour vérifier si votre réponse est correcte.