objectif
Calculer des corrélations entre colonnes numériques.
code minimal
import pandas as pd
df = pd.DataFrame({"x":[1,2,3], "y":[1,2,3]})
print(round(df["x"].corr(df["y"]),1))
utilisation
import pandas as pd
df = pd.DataFrame({"a":[1,2,3], "b":[3,2,1]})
print(abs(df.corr().loc["a","b"]) >= 0.9)
variante(s) utile(s)
import pandas as pd
df = pd.DataFrame({"x":[1,1,1], "y":[1,2,3]})
print(df.corr(numeric_only=True).shape[0])
notes
- Corrélation de Pearson par défaut; Spearman possible.