Hub 文件

檔案格式

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

檔案格式

Polars 支援從 Hugging Face 讀取以下檔案格式:

以下示例僅展示預設設定。使用上方連結可檢視 API 參考指南中所有可用引數。

Parquet

Parquet 是首選檔案格式,因為它在檔案中儲存了帶有型別資訊的模式。這避免瞭解析時的任何歧義並加快了讀取速度。要使用 Polars 讀取 Parquet 檔案,請使用 read_parquet 函式

pl.read_parquet("hf://datasets/roneneldan/TinyStories/data/train-00000-of-00004-2d5a1467fff1081b.parquet")

CSV

可以使用 read_csv 函式讀取 CSV 檔案

pl.read_csv("hf://datasets/lhoestq/demo1/data/train.csv")

JSON

Polars 支援使用 read_ndjson 函式讀取以換行符分隔的 JSON(也稱為 json lines

pl.read_ndjson("hf://datasets/proj-persona/PersonaHub/persona.jsonl")
< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.