Snippets
Du code concis, avec une explication claire.
pandas: read_sql avec sqlite3
Lire depuis une base SQLite en mémoire.
#pandas#sqlite#sql
pandas: rolling apply custom
Appliquer une fonction sur fenêtres glissantes.
#pandas#rolling#apply
pandas: sample (frac, random_state)
Échantillonner des lignes de manière reproductible.
#pandas#sample#random
pandas: shift (features de lag)
Créer des colonnes retardées pour séries temporelles.
#pandas#shift#features
pandas: to_datetime/to_numeric safe
Convertir en gérant erreurs via coercition.
#pandas#parse#datetime
pandas: value_counts(normalize)
Compter et obtenir des proportions rapidement.
#pandas#counts#normalize
Pandera: schémas pour DataFrames
valider types, plages et contraintes au runtime
#pandera#validation#schema
Plotly: cartes choroplèthes et scattergeo
afficher des données géospatiales interactives
#plotly#geo#map
PuLP: programmation linéaire simple
résoudre un problème de PL (maximisation) avec PuLP
#pulp#optimization#linear-programming
PySpark ML: VectorAssembler + StandardScaler
assembler des features et normaliser pour MLlib
#pyspark#mllib#pipeline
pyproj: transformer des coordonnées
convertir des coordonnées entre systèmes de projection
#pyproj#projection#crs
PySpark SQL: lire Parquet et agréger
charger un dataset Parquet et faire des agrégations SQL
#pyspark#sql#parquet