為資料集和模型引入 DOI (數字物件識別符號)

釋出於 2022 年 10 月 7 日
在 GitHub 上更新

Hugging Face 的使命是普及優秀的機器學習。這包括推廣最佳實踐,使機器學習模型和資料集更具可復現性、文件更完善、更易於使用和共享。

為了應對這一挑戰,我們激動地宣佈,您現在可以直接從 Hub 為您的模型或資料集生成 DOI

您可以直接從程式碼倉庫的設定中生成 DOI,之後任何人都可以透過點選您模型或資料集頁面上的“引用此模型/資料集”來引用您的工作 🔥。

Generating DOI

DOI 簡介及其重要性

DOI (數字物件識別符號) 是唯一標識數字物件的字串,涵蓋從文章到圖表,也包括資料集和模型。DOI 與物件的元資料繫結,包括物件的 URL、版本、建立日期、描述等。它們是科研和學術界廣泛接受的數字資源引用標準,類似於書籍的 ISBN。

DOI 使查詢模型或資料集的資訊變得更加容易,並透過一個永不過期或更改的永久連結與世界分享。因此,帶有 DOI 的資料集/模型旨在永久儲存,只有在向我們的支援團隊提交請求後才可能被刪除。

Hugging Face 如何分配 DOI?

我們與 DataCite 合作,允許 Hub 的註冊使用者為其模型或資料集申請 DOI。一旦他們填寫完必要的元資料,就能獲得一個嶄新的 DOI 🌟!

Cite DOI

如果模型或資料集有新版本,DOI 可以輕鬆更新,而舊版本的 DOI 則會被標記為過時。這使得引用物件的特定版本變得很容易,即使它已經發生了變化。

對我們還有什麼改進建議嗎?許多功能,就像這個一樣,都直接來自社群的反饋。請給我們留言或在 Twitter 上 @HuggingFace 分享您的想法,或者在 huggingface/hub-docs 上提一個 issue 🤗

感謝 DataCite 團隊的這次合作!同時感謝 Alix Leroy、Bram Vanroy、Daniel van Strien 和 Yoshitomo Matsubara 在 這個 hub-docs GitHub issue 中發起並推動了討論。

社群

註冊登入 以發表評論

© . This site is unofficial and not affiliated with Hugging Face, Inc.