← retour aux snippets

pandas: string methods et regex

Nettoyer et extraire des chaînes avec str.* et regex.

python pandas #pandas#string#regex

objectif

Nettoyer et extraire des chaînes avec str.* et regex.

code minimal

import pandas as pd

s = pd.Series(["  Foo-123 ", "Bar_456"])
print(s.str.strip().str.lower().str.replace(r"[^a-z0-9]+","_", regex=True).tolist())

utilisation

import pandas as pd

s = pd.Series(["id=42", "id=7"])
print(s.str.extract(r"id=(\d+)")[0].astype(int).tolist())

variante(s) utile(s)

import pandas as pd

s = pd.Series(["a;b;c","x;y"])
print(s.str.split(";").explode().tolist())

notes

  • Préférez les méthodes vectorisées à apply.