Snippets

Du code concis, avec une explication claire.

python

Dask delayed: construire un graphe de tâches

composer des fonctions Python en DAG et exécuter en parallèle

#dask#parallel#delayed
python

Featuretools: feature engineering automatique

générer des features relationnelles automatiquement

#featuretools#auto-fe#feature-engineering
python

gensim Word2Vec: entraîner vite

entraîner un petit Word2Vec et obtenir des similarités

#gensim#word2vec#embeddings
python

FAISS: recherche de voisins rapide (CPU)

indexer des vecteurs et interroger les plus proches voisins avec FAISS

#faiss#ann#neighbors
python

GeoPandas: lire un shapefile et tracer

charger un shapefile et afficher une carte simple

#geopandas#shapefile#plot
python

GeoPandas: jointure spatiale

faire une jointure spatiale (points dans polygones)

#geopandas#spatial-join#gis
python

HDBSCAN: clustering de densité robuste

clusteriser des données avec HDBSCAN et détecter le bruit

#hdbscan#clustering#density
python

Great Expectations: valider un DataFrame

définir et évaluer des attentes de qualité de données

#great-expectations#quality#validation
python

imblearn RandomUnder/OverSampler

rééchantillonnage simple pour équilibrer les classes

#imblearn#sampling#imbalance
python

imblearn SMOTE: suréchantillonnage synthétique

équilibrer une classe minoritaire avec SMOTE

#imblearn#smote#imbalance
python

lightgbm: classifier et features catégorielles

Utiliser LGBMClassifier avec colonnes catégorielles et early stopping.

#lightgbm#categorical#classification
python

lightgbm: importances et sauvegarde

Extraire importances (gain/split) et sauvegarder/charger le modèle.

#lightgbm#importance#io