Hub Python 庫文件
搜尋 Hub
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
在 Hub 上搜索
在本教程中,您將學習如何使用 huggingface_hub 搜尋 Hub 上的模型、資料集和 Spaces。
如何列出儲存庫?
huggingface_hub 庫包含一個 HTTP 客戶端 HfApi,用於與 Hub 進行互動。除其他功能外,它還可以列出儲存在 Hub 上的模型、資料集和 Spaces。
>>> from huggingface_hub import HfApi
>>> api = HfApi()
>>> models = api.list_models()list_models() 的輸出是一個迭代器,用於遍歷 Hub 上儲存的模型。
同樣,您可以使用 list_datasets() 來列出資料集,使用 list_spaces() 來列出 Spaces。
如何過濾儲存庫?
列出儲存庫固然有用,但您可能希望過濾搜尋結果。列表助手具有多個屬性,例如:
過濾器作者搜尋- ...
讓我們看一個例子,獲取 Hub 上所有進行影像分類、已在 imagenet 資料集上訓練且可與 PyTorch 一起執行的模型。
models = hf_api.list_models(filter=["image-classification", "pytorch", "imagenet"])在過濾時,您還可以對模型進行排序並僅獲取前幾條結果。例如,以下示例會獲取 Hub 上下載次數最多的前 5 個數據集。
>>> list(list_datasets(sort="downloads", limit=5))
[DatasetInfo(
id='argilla/databricks-dolly-15k-curated-en',
author='argilla',
sha='4dcd1dedbe148307a833c931b21ca456a1fc4281',
last_modified=datetime.datetime(2023, 10, 2, 12, 32, 53, tzinfo=datetime.timezone.utc),
private=False,
downloads=8889377,
(...)要探索 Hub 上可用的過濾器,請在瀏覽器中訪問 models 和 datasets 頁面,搜尋一些引數,然後檢視 URL 中的值。
使用 CLI
您還可以使用 hf 命令列介面來列出和搜尋模型、資料集和 Spaces。
# List models
>>> hf models ls --search "llama" --sort downloads --limit 5
# List datasets
>>> hf datasets ls --author Qwen
# List Spaces
>>> hf spaces ls --search "3d"
# Get info about a specific model
>>> hf models info Lightricks/LTX-2有關更多詳細資訊,請參閱 CLI 指南。
在 GitHub 上更新