Hub Python 庫文件

搜尋中心

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

搜尋中心

在本教程中,您將學習如何使用 huggingface_hub 在 Hub 上搜索模型、資料集和空間。

如何列出倉庫?

huggingface_hub 庫包含一個 HTTP 客戶端 HfApi,用於與 Hub 進行互動。除此之外,它還可以列出儲存在 Hub 上的模型、資料集和空間。

>>> from huggingface_hub import HfApi
>>> api = HfApi()
>>> models = api.list_models()

list_models() 的輸出是 Hub 上儲存的模型的迭代器。

類似地,您可以使用 list_datasets() 來列出資料集,使用 list_spaces() 來列出空間。

如何篩選倉庫?

列出倉庫很棒,但現在您可能想要篩選搜尋結果。列表助手有幾個屬性,例如

  • 過濾器
  • 作者
  • 搜尋
  • ...

讓我們看一個例子,獲取 Hub 上所有執行影像分類、已在 imagenet 資料集上訓練並使用 PyTorch 執行的模型。

models = hf_api.list_models(
	task="image-classification",
	library="pytorch",
	trained_dataset="imagenet",
)

在篩選時,您還可以對模型進行排序,並僅獲取頂部結果。例如,以下示例獲取 Hub 上下載量最多的前 5 個數據集。

>>> list(list_datasets(sort="downloads", direction=-1, limit=5))
[DatasetInfo(
	id='argilla/databricks-dolly-15k-curated-en',
	author='argilla',
	sha='4dcd1dedbe148307a833c931b21ca456a1fc4281',
	last_modified=datetime.datetime(2023, 10, 2, 12, 32, 53, tzinfo=datetime.timezone.utc),
	private=False,
	downloads=8889377,
	(...)

要探索 Hub 上可用的過濾器,請在瀏覽器中訪問 模型資料集 頁面,搜尋一些引數並檢視 URL 中的值。

< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.