umap-learn: réduction 2D pour visualiser
objectif
Expliquer et montrer comment projeter des vecteurs en 2D avec UMAP pour exploration.
code minimal
import umap
import numpy as np
X = np.random.randn(1000, 50)
u = umap.UMAP(n_neighbors=15, min_dist=0.1, random_state=0).fit_transform(X)
u[:3]
utilisation
# colorier par cluster (ex: kmeans)
from sklearn.cluster import KMeans
labels = KMeans(n_clusters=5, random_state=0).fit_predict(X)
# plt.scatter(u[:,0], u[:,1], c=labels, s=5) # voir matplotlib
variante(s) utile(s)
# accélérer avec n_neighbors plus petits, ou densmap=True pour densité
notes
- UMAP préserve mieux la structure locale que t-SNE et est plus rapide.
- Paramètres clés: n_neighbors, min_dist.