dask: read_parquet et agrégation

Charger un dossier Parquet et calculer paresseusement.

16 août 2025

objectif

Charger un dossier Parquet et calculer paresseusement.

import dask.dataframe as dd

# ddf = dd.read_parquet("s3://bucket/data/")
# print(ddf.x.mean().compute())
print("concept ok")

import dask.dataframe as dd
# ddf = dd.read_csv("*.csv")
print("csv concept")

# ddf.to_parquet("out/")
print("variants ok")