Hub 文件

🟧 Spaces 上的 Label Studio

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

🟧 Spaces 上的 Label Studio

Label Studio 是一個開源資料標註平臺,用於標註、註釋和探索多種不同資料型別。此外,Label Studio 還包含一個強大的機器學習介面,可用於新模型訓練、主動學習、監督學習以及許多其他訓練技術。

本指南將教你如何在使用 Hugging Face Hub 內部署 Label Studio 以進行資料標註和註釋。你可以將 Label Studio 的預設配置作為完全託管在 Hub 上的獨立應用程式,使用 Docker 進行演示和評估,或者你可以連線自己的資料庫和雲端儲存,以在 Spaces 上託管一個功能齊全的生產就緒應用程式。

⚡️ 在 Spaces 上部署 Label Studio

你可以通過幾次點選在 Spaces 上部署 Label Studio

Spaces 要求你定義:

  • 一個 所有者:你的個人賬戶或你所屬的組織。

  • 一個 Space 名稱:你在建立 Space 的賬戶中給 Space 起的名稱。

  • 可見性:如果你希望 Space 僅對你或你的組織可見,則選擇 private;如果你希望其他使用 Label Studio API 的使用者或應用程式可見(建議),則選擇 public

🚀 使用預設配置

預設情況下,Label Studio 在 Spaces 中安裝時使用的配置是將應用程式資料庫(用於儲存配置、賬戶憑據和專案資訊)儲存在本地儲存中。標註任務和資料項也儲存在本地儲存中。

Hugging Face Spaces 中的儲存是短暫的,預設配置中儲存的資料在 Spaces 重啟或重置時可能會丟失。因此,我們強烈建議你僅將預設配置用於測試和演示目的。

啟動 Label Studio 後,你將看到標準登入螢幕。你可以透過使用電子郵件地址建立新賬戶並使用新憑據登入來開始。登入後,Label Studio 會定期警告你儲存是短暫的,如果你的 Space 重新啟動,資料可能會丟失。你還會收到來自 Heidi(Label Studio 有用的吉祥物)的提示,要求你建立一個新專案以開始標註你的資料。要開始使用,請檢視 Label Studio 的“從零到一”教程,其中包含有關如何構建情感分析標註介面的指南。

🛠️ 配置生產就緒的 Label Studio 例項

為了使你的 Space 達到生產就緒狀態,你需要進行三項配置更改:

  • 停用無限制的新賬戶建立。

  • 透過連線外部資料庫啟用永續性。

  • 為標註任務連線雲端儲存。

停用無限制的新賬戶建立

Label Studio 的預設配置允許任何人只要有你的應用程式 URL 就可以無限制地建立新賬戶。你可以透過在你的 Space 設定中新增以下配置密文來限制註冊

  • LABEL_STUDIO_DISABLE_SIGNUP_WITHOUT_LINK:將此值設定為 true 將停用無限制的賬戶建立。

  • LABEL_STUDIO_USERNAME:這是你將在 Label Studio Space 中作為第一個使用者使用的賬戶使用者名稱。它應該是一個有效的電子郵件地址。

  • LABEL_STUDIO_PASSWORD:與第一個使用者賬戶關聯的密碼。

重啟 Space 以應用這些設定。從登入螢幕建立新賬戶的功能將被停用。要建立新賬戶,你需要在 Label Studio 應用程式的組織設定中邀請新使用者。

啟用配置永續性

預設情況下,此 Space 將所有專案配置和資料註釋儲存在 SQLite 的本地儲存中。如果 Space 被重置,Space 中的所有配置和註釋資料都將丟失。你可以透過將外部 Postgres 資料庫連線到你的 Space 來啟用配置永續性,從而確保所有專案和註釋設定都得到保留。

設定以下密文變數以匹配你自己的託管 Postgres 例項。我們強烈建議將這些變數設定為密文,以防止你的資料庫服務資訊在 Space 定義中洩露給公眾。

  • DJANGO_DB:將其設定為 default

  • POSTGRE_NAME:將其設定為 Postgres 資料庫的名稱。

  • POSTGRE_USER:將其設定為 Postgres 使用者名稱。

  • POSTGRE_PASSWORD:將其設定為 Postgres 使用者的密碼。

  • POSTGRE_HOST:將其設定為你的 Postgres 資料庫執行的主機。

  • POSTGRE_PORT:將其設定為你的 Postgres 資料庫執行的埠。

  • STORAGE_PERSISTENCE:將其設定為 1 以消除關於短暫儲存的警告。

重新啟動 Space 以應用這些設定。關於使用者、專案和註釋的資訊將儲存在資料庫中,如果 Space 重新啟動或重置,Label Studio 將重新載入這些資訊。

啟用雲端儲存

預設情況下,此 Space 僅啟用本地資料儲存。如果 Space 重置,所有資料都將丟失。要啟用永久儲存,你必須啟用雲端儲存聯結器。選擇合適的雲聯結器併為其配置密文。

Amazon S3

  • STORAGE_TYPE:設定為 s3

  • STORAGE_AWS_ACCESS_KEY_ID<你的_ACCESS_KEY_ID>

  • STORAGE_AWS_SECRET_ACCESS_KEY<你的_SECRET_ACCESS_KEY>

  • STORAGE_AWS_BUCKET_NAME<你的_BUCKET_NAME>

  • STORAGE_AWS_REGION_NAME<你的_BUCKET_REGION>

  • STORAGE_AWS_FOLDER:將其設定為空字串。

Google Cloud Storage

  • STORAGE_TYPE:將其設定為 gcs

  • STORAGE_GCS_BUCKET_NAME<你的_BUCKET_NAME>

  • STORAGE_GCS_PROJECT_ID<你的_PROJECT_ID>

  • STORAGE_GCS_FOLDER:將其設定為空字串。

  • GOOGLE_APPLICATION_CREDENTIALS:將其設定為 /opt/heartex/secrets/key.json

Azure Blob Storage

  • STORAGE_TYPE:將其設定為 azure

  • STORAGE_AZURE_ACCOUNT_NAME<你的_儲存賬戶>

  • STORAGE_AZURE_ACCOUNT_KEY<你的_儲存金鑰>

  • STORAGE_AZURE_CONTAINER_NAME<你的_容器名稱>

  • STORAGE_AZURE_FOLDER:將其設定為空字串。

🤗 後續步驟、反饋和支援

要開始使用 Label Studio,請檢視 Label Studio 的“從零到一”教程,其中包含一個情感分析標註專案的示例。你可以在Label Studio 主頁上找到關於 Label Studio 和 Label Studio 社群的完整資源。這包括完整文件、用於嘗試不同標註介面的互動式遊樂場以及加入Label Studio Slack 社群的連結。

< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.