Hub 文件
檔案格式
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
檔案格式
Polars 支援從 Hugging Face 讀取以下檔案格式:
以下示例僅展示預設設定。使用上方連結可檢視 API 參考指南中所有可用引數。
Parquet
Parquet 是首選檔案格式,因為它在檔案中儲存了帶有型別資訊的模式。這避免瞭解析時的任何歧義並加快了讀取速度。要使用 Polars 讀取 Parquet 檔案,請使用 read_parquet
函式
pl.read_parquet("hf://datasets/roneneldan/TinyStories/data/train-00000-of-00004-2d5a1467fff1081b.parquet")
CSV
可以使用 read_csv
函式讀取 CSV 檔案
pl.read_csv("hf://datasets/lhoestq/demo1/data/train.csv")
JSON
Polars 支援使用 read_ndjson
函式讀取以換行符分隔的 JSON(也稱為 json lines)
pl.read_ndjson("hf://datasets/proj-persona/PersonaHub/persona.jsonl")