Hub 文件

使用 🤗 Datasets

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

使用 🤗 Datasets

當您在 Hugging Face Hub 上找到感興趣的資料集後,可以使用 🤗 Datasets 來載入它。您可以點選 Use this dataset 按鈕 來複制程式碼以載入資料集。

首先,您需要使用您的 Hugging Face 賬戶登入,例如使用

hf auth login

然後您可以使用以下程式碼從 Hugging Face Hub 載入資料集

from datasets import load_dataset

dataset = load_dataset("username/my_dataset")

# or load the separate splits if the dataset has train/validation/test splits
train_dataset = load_dataset("username/my_dataset", split="train")
valid_dataset = load_dataset("username/my_dataset", split="validation")
test_dataset  = load_dataset("username/my_dataset", split="test")

您也可以將資料集上傳到 Hugging Face Hub

my_new_dataset.push_to_hub("username/my_new_dataset")

這會建立一個名為 username/my_new_dataset 的資料集倉庫,其中包含了 Parquet 格式的資料集,您之後可以重新載入它。

有關使用 🤗 Datasets 的更多資訊,請檢視 🤗 Datasets 文件中提供的教程操作指南

< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.