#pyspark
5 éléments
snippet
PySpark ML: VectorAssembler + StandardScaler
assembler des features et normaliser pour MLlib
ouvrir
snippet
PySpark SQL: lire Parquet et agréger
charger un dataset Parquet et faire des agrégations SQL
ouvrir
snippet
PySpark: fonctions de fenêtre
utiliser Window pour lags, rangs et moyennes mobiles
ouvrir
snippet
PySpark UDF: appliquer une fonction Python
créer un UDF scalaire et l'appliquer à une colonne
ouvrir
snippet
PySpark: écrire Parquet partitionné
sauvegarder un DataFrame Parquet partitionné par colonnes
ouvrir
page 1 sur 1