Hub 文件
顯示模型的碳排放量
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
顯示模型的碳排放量
計算模型碳排放量的好處是什麼?
訓練機器學習模型通常是能源密集型的,可能會產生大量的碳足跡,正如Strubell 等人所述。因此,**跟蹤**和**報告**模型的排放量對於更好地瞭解我們領域的環境影響至關重要。
關於模型碳足跡,我應該包含哪些資訊?
如果可能,您應該包含以下資訊:
- 模型的訓練地點
- 使用的硬體——例如 GPU、TPU 或 CPU,以及數量
- 訓練型別:預訓練或微調
- 模型的估計碳足跡,可以使用 Code Carbon 包即時計算,或者在訓練後使用 ML CO2 Calculator 進行計算。
碳足跡元資料
您可以將碳足跡資料新增到模型卡片元資料(在 README.md 檔案中)。元資料的結構應為
---
co2_eq_emissions:
emissions: number (in grams of CO2)
source: "source of the information, either directly from AutoTrain, code carbon or from a scientific article documenting the model"
training_type: "pre-training or fine-tuning"
geographical_location: "as granular as possible, for instance Quebec, Canada or Brooklyn, NY, USA. To check your compute's electricity grid, you can check out https://app.electricitymap.org."
hardware_used: "how much compute and what kind, e.g. 8 v100 GPUs"
---
我的模型碳足跡是如何計算的?🌎
考慮到計算硬體、位置、使用情況和訓練時間,您可以估算模型產生了多少 CO2。
計算方法相當簡單!➕
首先,您需要獲取用於訓練的電網的*碳強度*——這是每千瓦時電力產生的 CO2 量。碳強度取決於硬體的位置和該位置使用的能源組合——無論是太陽能 🌞、風能 🌬️ 和水力 💧 等可再生能源,還是煤炭 ⚫ 和天然氣 💨 等不可再生能源。訓練中使用的可再生能源越多,碳強度就越低!
然後,您使用 `pynvml` 庫獲取訓練期間 GPU 的功耗。
最後,將功耗和碳強度乘以模型的訓練時間,您就得到了 CO2 排放量的估算值。
請記住,這並不是一個精確的數字,因為還有其他因素會影響碳排放——例如資料中心供暖和製冷所消耗的能源——這些因素會增加碳排放。但這將使您很好地瞭解模型產生的 CO2 排放量規模!
要將**碳排放**元資料新增到模型中
- 如果您正在使用 **AutoTrain**,系統會自動為您跟蹤 🔥
- 否則,在您的訓練程式碼中使用 Code Carbon 等跟蹤器,然後指定
co2_eq_emissions:
emissions: 1.2345
在您的模型卡片元資料中,其中 `1.2345` 是以**克**為單位的排放值。
要了解有關 Transformer 碳足跡的更多資訊,請檢視 Hugging Face 課程中的影片!
< > 在 GitHub 上更新