袖珍課程文件

歡迎來到 🤗 smol-course

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

歡迎來到 🤗 smol-course

Fine-Tuning Course thumbnail

歡迎來到這門關於 微調語言模型 的全面(且精簡)課程!

這門免費課程將帶你踏上一段旅程,從初學者到專家,理解、實現和最佳化大型語言模型的微調技術。

本第一單元將幫助你入門

  • 探索課程大綱
  • 獲取有關認證流程和時間表的更多資訊.
  • 認識課程背後的團隊。
  • 建立你的 賬戶
  • 註冊我們的 Discord 伺服器,與你的同學和我們見面。

讓我們開始吧!

這門課程精簡但進度快!它面向希望快速提升 LLM 微調技能的軟體開發人員和工程師。如果你不屬於此類,請檢視 LLM 課程

這門課程有什麼期待?

在本課程中,你將

  • 📖 學習指令微調、監督微調、偏好對齊、評估、視覺語言模型……等等!
  • 🧑‍💻 學習使用已建立的微調框架和工具,如 TRL 和 Transformers。
  • 💾 分享你的專案並探索社群建立的微調應用。
  • 🏆 參與挑戰,你將與其他學生一起評估你微調的模型。
  • 🎓 完成作業即可獲得結業證書。

課程結束時,你將理解 如何有效微調語言模型並利用最新的微調技術構建專門的 AI 應用

別忘了 報名參加課程!

課程內容是什麼樣的?

課程由以下部分組成

  • 基礎單元:你將在其中學習微調的 理論概念
  • 實踐環節:你將學習 使用已建立的微調框架 來調整你的模型。這些實踐環節將提供預配置的環境。
  • 用例作業:你將在這裡運用所學概念解決你選擇的一個真實世界問題。
  • 合作專案:我們正在與 Hugging Face 的合作伙伴合作,為你提供最新的微調實現和工具。

這門 課程是一個活的工程,會隨著你的反饋和貢獻而不斷發展! 歡迎在 GitHub 上提交問題和 PR,並在我們的 Discord 伺服器中參與討論。

課程大綱是什麼?

這是課程的總體大綱。每個單元都會發布更詳細的主題列表。

# 主題 描述 已釋出
1 指令微調 監督微調、聊天模板、指令遵循
2 評估 基準測試和自定義領域評估
3 偏好對齊 使用 DPO 等演算法將模型與人類偏好對齊。
4 視覺語言模型 適應和使用多模態模型
5 強化學習 基於強化策略最佳化模型。 十月
6 合成數據 為自定義領域生成合成資料集 十一月
7 頒獎典禮 展示專案並慶祝 十二月

需要哪些先決條件?

要能跟上本課程,你應該具備

  • 對 AI 和 LLM 概念的基本理解
  • 熟悉 Python 程式設計和機器學習基礎知識
  • 具備 PyTorch 或類似深度學習框架的經驗
  • 理解 transformer 架構基礎知識

如果你不具備其中任何一項,別擔心。請檢視 LLM 課程 以開始學習。

上述課程本身並非先決條件,所以如果你理解 LLM 和 transformer 的概念,現在就可以開始課程了!

我需要哪些工具?

你只需要兩樣東西

  • 一臺帶網際網路連線的電腦,最好能訪問 GPU(Hugging Face Pro 效果很好)。
  • 一個賬戶:用於訪問課程資源和建立專案。如果你還沒有賬戶,可以在這裡建立一個(免費)。

認證流程

你可以選擇旁聽本課程,或者完成活動並獲得我們頒發的兩份證書之一。如果你旁聽課程,你可以參與所有挑戰並完成作業(如果需要),並且你無需通知我們

認證過程完全免費

  • 要獲得基礎認證:你需要完成課程單元 1。這適用於希望瞭解指令微調基礎知識但不想構建高階應用的學生。
  • 要獲得結業證書:你需要完成所有課程單元並提交最終專案。這適用於希望展示微調技術掌握程度的學生。

推薦的學習進度是什麼?

本課程的每個章節都設計為每週完成,每週大約需要 3-4 小時的工作量

由於有截止日期,我們為您提供了一個推薦的學習進度

Fine-Tuning Course thumbnail

如何充分利用這門課程?

為了最大限度地利用課程,我們有一些建議

  1. 加入 Discord 學習小組:小組學習總是更容易。為此,你需要加入我們的 Discord 伺服器並驗證你的賬戶。
  2. 完成小測驗和作業:學習的最佳方式是透過實踐和自我評估。
  3. 制定一個時間表以保持同步:你可以使用我們下面推薦的學習進度,或者建立你自己的。

Course advice

我們是誰

關於作者

本·伯滕肖 (Ben Burtenshaw)

Ben 是 Hugging Face 的機器學習工程師,專注於構建 LLM 應用,採用後期訓練和智慧體方法。在 Hub 上關注 Ben,檢視他的最新專案。

致謝

我們要感謝以下個人和合作夥伴的寶貴貢獻和支援

我發現了 bug,或者我想改進課程

歡迎貢獻 🤗

我還有問題

請在我們的 Discord 伺服器 #fine-tuning-course-questions 中提出你的問題。

現在你已經掌握了所有資訊,讓我們開始吧 ⛵

在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.