← retour aux snippets

pandas: corrélation Pearson

Calculer des corrélations entre colonnes numériques.

python pandas #pandas#corr#stats

objectif

Calculer des corrélations entre colonnes numériques.

code minimal

import pandas as pd
df = pd.DataFrame({"x":[1,2,3], "y":[1,2,3]})
print(round(df["x"].corr(df["y"]),1))

utilisation

import pandas as pd
df = pd.DataFrame({"a":[1,2,3], "b":[3,2,1]})
print(abs(df.corr().loc["a","b"]) >= 0.9)

variante(s) utile(s)

import pandas as pd
df = pd.DataFrame({"x":[1,1,1], "y":[1,2,3]})
print(df.corr(numeric_only=True).shape[0])

notes

  • Corrélation de Pearson par défaut; Spearman possible.