Snippets
Du code concis, avec une explication claire.
Dask delayed: construire un graphe de tâches
composer des fonctions Python en DAG et exécuter en parallèle
#dask#parallel#delayed
Featuretools: feature engineering automatique
générer des features relationnelles automatiquement
#featuretools#auto-fe#feature-engineering
gensim Word2Vec: entraîner vite
entraîner un petit Word2Vec et obtenir des similarités
#gensim#word2vec#embeddings
FAISS: recherche de voisins rapide (CPU)
indexer des vecteurs et interroger les plus proches voisins avec FAISS
#faiss#ann#neighbors
GeoPandas: lire un shapefile et tracer
charger un shapefile et afficher une carte simple
#geopandas#shapefile#plot
GeoPandas: jointure spatiale
faire une jointure spatiale (points dans polygones)
#geopandas#spatial-join#gis
HDBSCAN: clustering de densité robuste
clusteriser des données avec HDBSCAN et détecter le bruit
#hdbscan#clustering#density
Great Expectations: valider un DataFrame
définir et évaluer des attentes de qualité de données
#great-expectations#quality#validation
imblearn RandomUnder/OverSampler
rééchantillonnage simple pour équilibrer les classes
#imblearn#sampling#imbalance
imblearn SMOTE: suréchantillonnage synthétique
équilibrer une classe minoritaire avec SMOTE
#imblearn#smote#imbalance
lightgbm: classifier et features catégorielles
Utiliser LGBMClassifier avec colonnes catégorielles et early stopping.
#lightgbm#categorical#classification
lightgbm: importances et sauvegarde
Extraire importances (gain/split) et sauvegarder/charger le modèle.
#lightgbm#importance#io