顯示模型的碳排放量

計算模型碳排放量的好處是什麼？

訓練機器學習模型通常是能源密集型的，可能會產生大量的碳足跡，正如Strubell 等人所述。因此，**跟蹤**和**報告**模型的排放量對於更好地瞭解我們領域的環境影響至關重要。

關於模型碳足跡，我應該包含哪些資訊？

如果可能，您應該包含以下資訊：

模型的訓練地點
使用的硬體——例如 GPU、TPU 或 CPU，以及數量
訓練型別：預訓練或微調
模型的估計碳足跡，可以使用 Code Carbon 包即時計算，或者在訓練後使用 ML CO2 Calculator 進行計算。

碳足跡元資料

您可以將碳足跡資料新增到模型卡片元資料（在 README.md 檔案中）。元資料的結構應為

---
co2_eq_emissions:
  emissions: number (in grams of CO2)
  source: "source of the information, either directly from AutoTrain, code carbon or from a scientific article documenting the model"
  training_type: "pre-training or fine-tuning"
  geographical_location: "as granular as possible, for instance Quebec, Canada or Brooklyn, NY, USA. To check your compute's electricity grid, you can check out https://app.electricitymap.org."
  hardware_used: "how much compute and what kind, e.g. 8 v100 GPUs"
---

我的模型碳足跡是如何計算的？🌎

考慮到計算硬體、位置、使用情況和訓練時間，您可以估算模型產生了多少 CO₂。

計算方法相當簡單！➕

首先，您需要獲取用於訓練的電網的*碳強度*——這是每千瓦時電力產生的 CO₂ 量。碳強度取決於硬體的位置和該位置使用的能源組合——無論是太陽能 🌞、風能 🌬️ 和水力 💧 等可再生能源，還是煤炭 ⚫ 和天然氣 💨 等不可再生能源。訓練中使用的可再生能源越多，碳強度就越低！

然後，您使用 `pynvml` 庫獲取訓練期間 GPU 的功耗。

最後，將功耗和碳強度乘以模型的訓練時間，您就得到了 CO₂ 排放量的估算值。

請記住，這並不是一個精確的數字，因為還有其他因素會影響碳排放——例如資料中心供暖和製冷所消耗的能源——這些因素會增加碳排放。但這將使您很好地瞭解模型產生的 CO₂ 排放量規模！

要將**碳排放**元資料新增到模型中

如果您正在使用 **AutoTrain**，系統會自動為您跟蹤 🔥
否則，在您的訓練程式碼中使用 Code Carbon 等跟蹤器，然後指定

co2_eq_emissions: 
  emissions: 1.2345

在您的模型卡片元資料中，其中 `1.2345` 是以**克**為單位的排放值。

要了解有關 Transformer 碳足跡的更多資訊，請檢視 Hugging Face 課程中的影片！

< > 在 GitHub 上更新