Hub 文件
🟧 Spaces 上的 Label Studio
並獲得增強的文件體驗
開始使用
🟧 Spaces 上的 Label Studio
Label Studio 是一個開源資料標註平臺,用於標註、註釋和探索多種不同資料型別。此外,Label Studio 還包含一個強大的機器學習介面,可用於新模型訓練、主動學習、監督學習以及許多其他訓練技術。
本指南將教你如何在使用 Hugging Face Hub 內部署 Label Studio 以進行資料標註和註釋。你可以將 Label Studio 的預設配置作為完全託管在 Hub 上的獨立應用程式,使用 Docker 進行演示和評估,或者你可以連線自己的資料庫和雲端儲存,以在 Spaces 上託管一個功能齊全的生產就緒應用程式。
⚡️ 在 Spaces 上部署 Label Studio
你可以通過幾次點選在 Spaces 上部署 Label Studio
Spaces 要求你定義:
一個 所有者:你的個人賬戶或你所屬的組織。
一個 Space 名稱:你在建立 Space 的賬戶中給 Space 起的名稱。
可見性:如果你希望 Space 僅對你或你的組織可見,則選擇 private;如果你希望其他使用 Label Studio API 的使用者或應用程式可見(建議),則選擇 public。
🚀 使用預設配置
預設情況下,Label Studio 在 Spaces 中安裝時使用的配置是將應用程式資料庫(用於儲存配置、賬戶憑據和專案資訊)儲存在本地儲存中。標註任務和資料項也儲存在本地儲存中。
啟動 Label Studio 後,你將看到標準登入螢幕。你可以透過使用電子郵件地址建立新賬戶並使用新憑據登入來開始。登入後,Label Studio 會定期警告你儲存是短暫的,如果你的 Space 重新啟動,資料可能會丟失。你還會收到來自 Heidi(Label Studio 有用的吉祥物)的提示,要求你建立一個新專案以開始標註你的資料。要開始使用,請檢視 Label Studio 的“從零到一”教程,其中包含有關如何構建情感分析標註介面的指南。
🛠️ 配置生產就緒的 Label Studio 例項
為了使你的 Space 達到生產就緒狀態,你需要進行三項配置更改:
停用無限制的新賬戶建立。
透過連線外部資料庫啟用永續性。
為標註任務連線雲端儲存。
停用無限制的新賬戶建立
Label Studio 的預設配置允許任何人只要有你的應用程式 URL 就可以無限制地建立新賬戶。你可以透過在你的 Space 設定中新增以下配置密文來限制註冊。
LABEL_STUDIO_DISABLE_SIGNUP_WITHOUT_LINK
:將此值設定為true
將停用無限制的賬戶建立。LABEL_STUDIO_USERNAME
:這是你將在 Label Studio Space 中作為第一個使用者使用的賬戶使用者名稱。它應該是一個有效的電子郵件地址。LABEL_STUDIO_PASSWORD
:與第一個使用者賬戶關聯的密碼。
重啟 Space 以應用這些設定。從登入螢幕建立新賬戶的功能將被停用。要建立新賬戶,你需要在 Label Studio 應用程式的組織
設定中邀請新使用者。
啟用配置永續性
預設情況下,此 Space 將所有專案配置和資料註釋儲存在 SQLite 的本地儲存中。如果 Space 被重置,Space 中的所有配置和註釋資料都將丟失。你可以透過將外部 Postgres 資料庫連線到你的 Space 來啟用配置永續性,從而確保所有專案和註釋設定都得到保留。
設定以下密文變數以匹配你自己的託管 Postgres 例項。我們強烈建議將這些變數設定為密文,以防止你的資料庫服務資訊在 Space 定義中洩露給公眾。
DJANGO_DB
:將其設定為default
。POSTGRE_NAME
:將其設定為 Postgres 資料庫的名稱。POSTGRE_USER
:將其設定為 Postgres 使用者名稱。POSTGRE_PASSWORD
:將其設定為 Postgres 使用者的密碼。POSTGRE_HOST
:將其設定為你的 Postgres 資料庫執行的主機。POSTGRE_PORT
:將其設定為你的 Postgres 資料庫執行的埠。STORAGE_PERSISTENCE
:將其設定為1
以消除關於短暫儲存的警告。
重新啟動 Space 以應用這些設定。關於使用者、專案和註釋的資訊將儲存在資料庫中,如果 Space 重新啟動或重置,Label Studio 將重新載入這些資訊。
啟用雲端儲存
預設情況下,此 Space 僅啟用本地資料儲存。如果 Space 重置,所有資料都將丟失。要啟用永久儲存,你必須啟用雲端儲存聯結器。選擇合適的雲聯結器併為其配置密文。
Amazon S3
STORAGE_TYPE
:設定為s3
。STORAGE_AWS_ACCESS_KEY_ID
:<你的_ACCESS_KEY_ID>
STORAGE_AWS_SECRET_ACCESS_KEY
:<你的_SECRET_ACCESS_KEY>
STORAGE_AWS_BUCKET_NAME
:<你的_BUCKET_NAME>
STORAGE_AWS_REGION_NAME
:<你的_BUCKET_REGION>
STORAGE_AWS_FOLDER
:將其設定為空字串。
Google Cloud Storage
STORAGE_TYPE
:將其設定為gcs
。STORAGE_GCS_BUCKET_NAME
:<你的_BUCKET_NAME>
STORAGE_GCS_PROJECT_ID
:<你的_PROJECT_ID>
STORAGE_GCS_FOLDER
:將其設定為空字串。GOOGLE_APPLICATION_CREDENTIALS
:將其設定為/opt/heartex/secrets/key.json
。
Azure Blob Storage
STORAGE_TYPE
:將其設定為azure
。STORAGE_AZURE_ACCOUNT_NAME
:<你的_儲存賬戶>
STORAGE_AZURE_ACCOUNT_KEY
:<你的_儲存金鑰>
STORAGE_AZURE_CONTAINER_NAME
:<你的_容器名稱>
STORAGE_AZURE_FOLDER
:將其設定為空字串。
🤗 後續步驟、反饋和支援
要開始使用 Label Studio,請檢視 Label Studio 的“從零到一”教程,其中包含一個情感分析標註專案的示例。你可以在Label Studio 主頁上找到關於 Label Studio 和 Label Studio 社群的完整資源。這包括完整文件、用於嘗試不同標註介面的互動式遊樂場以及加入Label Studio Slack 社群的連結。
< > 在 GitHub 上更新