Hub Python 庫文件

搜尋 Hub

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

在 Hub 上搜索

在本教程中,您將學習如何使用 huggingface_hub 搜尋 Hub 上的模型、資料集和 Spaces。

如何列出儲存庫?

huggingface_hub 庫包含一個 HTTP 客戶端 HfApi,用於與 Hub 進行互動。除其他功能外,它還可以列出儲存在 Hub 上的模型、資料集和 Spaces。

>>> from huggingface_hub import HfApi
>>> api = HfApi()
>>> models = api.list_models()

list_models() 的輸出是一個迭代器,用於遍歷 Hub 上儲存的模型。

同樣,您可以使用 list_datasets() 來列出資料集,使用 list_spaces() 來列出 Spaces。

如何過濾儲存庫?

列出儲存庫固然有用,但您可能希望過濾搜尋結果。列表助手具有多個屬性,例如:

  • 過濾器
  • 作者
  • 搜尋
  • ...

讓我們看一個例子,獲取 Hub 上所有進行影像分類、已在 imagenet 資料集上訓練且可與 PyTorch 一起執行的模型。

models = hf_api.list_models(filter=["image-classification", "pytorch", "imagenet"])

在過濾時,您還可以對模型進行排序並僅獲取前幾條結果。例如,以下示例會獲取 Hub 上下載次數最多的前 5 個數據集。

>>> list(list_datasets(sort="downloads", limit=5))
[DatasetInfo(
	id='argilla/databricks-dolly-15k-curated-en',
	author='argilla',
	sha='4dcd1dedbe148307a833c931b21ca456a1fc4281',
	last_modified=datetime.datetime(2023, 10, 2, 12, 32, 53, tzinfo=datetime.timezone.utc),
	private=False,
	downloads=8889377,
	(...)

要探索 Hub 上可用的過濾器,請在瀏覽器中訪問 modelsdatasets 頁面,搜尋一些引數,然後檢視 URL 中的值。

使用 CLI

您還可以使用 hf 命令列介面來列出和搜尋模型、資料集和 Spaces。

# List models
>>> hf models ls --search "llama" --sort downloads --limit 5

# List datasets
>>> hf datasets ls --author Qwen

# List Spaces
>>> hf spaces ls --search "3d"

# Get info about a specific model
>>> hf models info Lightricks/LTX-2

有關更多詳細資訊,請參閱 CLI 指南

在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.