objectif
Lire un CSV avec parse_dates, dtypes et valeurs manquantes.
code minimal
import pandas as pd
df = pd.read_csv("data.csv", parse_dates=["ts"], dtype={"id":"Int64"}, na_values=["","NA"])
print(df.dtypes.to_dict())
utilisation
import pandas as pd
df = pd.DataFrame({"id":[1,2], "ts":pd.to_datetime(["2025-01-01","2025-01-02"])})
df.to_csv("out.csv", index=False)
print(pd.read_csv("out.csv").head(1).to_dict(orient="records"))
variante(s) utile(s)
import pandas as pd
df = pd.read_csv("data.csv", on_bad_lines="skip", engine="c")
print(isinstance(df, pd.DataFrame))
notes
- Spécifier les dtypes évite des conversions coûteuses.