Hub Python 庫文件
搜尋中心
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
搜尋中心
在本教程中,您將學習如何使用 huggingface_hub
在 Hub 上搜索模型、資料集和空間。
如何列出倉庫?
huggingface_hub
庫包含一個 HTTP 客戶端 HfApi,用於與 Hub 進行互動。除此之外,它還可以列出儲存在 Hub 上的模型、資料集和空間。
>>> from huggingface_hub import HfApi
>>> api = HfApi()
>>> models = api.list_models()
list_models() 的輸出是 Hub 上儲存的模型的迭代器。
類似地,您可以使用 list_datasets() 來列出資料集,使用 list_spaces() 來列出空間。
如何篩選倉庫?
列出倉庫很棒,但現在您可能想要篩選搜尋結果。列表助手有幾個屬性,例如
過濾器
作者
搜尋
- ...
讓我們看一個例子,獲取 Hub 上所有執行影像分類、已在 imagenet 資料集上訓練並使用 PyTorch 執行的模型。
models = hf_api.list_models(
task="image-classification",
library="pytorch",
trained_dataset="imagenet",
)
在篩選時,您還可以對模型進行排序,並僅獲取頂部結果。例如,以下示例獲取 Hub 上下載量最多的前 5 個數據集。
>>> list(list_datasets(sort="downloads", direction=-1, limit=5))
[DatasetInfo(
id='argilla/databricks-dolly-15k-curated-en',
author='argilla',
sha='4dcd1dedbe148307a833c931b21ca456a1fc4281',
last_modified=datetime.datetime(2023, 10, 2, 12, 32, 53, tzinfo=datetime.timezone.utc),
private=False,
downloads=8889377,
(...)
要探索 Hub 上可用的過濾器,請在瀏覽器中訪問 模型 和 資料集 頁面,搜尋一些引數並檢視 URL 中的值。
< > 在 GitHub 上更新