← retour aux snippets

pandas: read_csv parsing et dtypes

Lire un CSV avec parse_dates, dtypes et valeurs manquantes.

python pandas #pandas#csv#io

objectif

Lire un CSV avec parse_dates, dtypes et valeurs manquantes.

code minimal

import pandas as pd

df = pd.read_csv("data.csv", parse_dates=["ts"], dtype={"id":"Int64"}, na_values=["","NA"])
print(df.dtypes.to_dict())

utilisation

import pandas as pd

df = pd.DataFrame({"id":[1,2], "ts":pd.to_datetime(["2025-01-01","2025-01-02"])})
df.to_csv("out.csv", index=False)
print(pd.read_csv("out.csv").head(1).to_dict(orient="records"))

variante(s) utile(s)

import pandas as pd

df = pd.read_csv("data.csv", on_bad_lines="skip", engine="c")
print(isinstance(df, pd.DataFrame))

notes

  • Spécifier les dtypes évite des conversions coûteuses.