objectif
Nettoyer et extraire des chaînes avec str.* et regex.
code minimal
import pandas as pd
s = pd.Series([" Foo-123 ", "Bar_456"])
print(s.str.strip().str.lower().str.replace(r"[^a-z0-9]+","_", regex=True).tolist())
utilisation
import pandas as pd
s = pd.Series(["id=42", "id=7"])
print(s.str.extract(r"id=(\d+)")[0].astype(int).tolist())
variante(s) utile(s)
import pandas as pd
s = pd.Series(["a;b;c","x;y"])
print(s.str.split(";").explode().tolist())
notes
- Préférez les méthodes vectorisées à
apply.