袖珍課程文件
歡迎來到 🤗 smol-course
並獲得增強的文件體驗
開始使用
歡迎來到 🤗 smol-course

歡迎來到這門關於 微調語言模型 的全面(且精簡)課程!
這門免費課程將帶你踏上一段旅程,從初學者到專家,理解、實現和最佳化大型語言模型的微調技術。
本第一單元將幫助你入門
- 探索課程大綱。
- 獲取有關認證流程和時間表的更多資訊.
- 認識課程背後的團隊。
- 建立你的 賬戶。
- 註冊我們的 Discord 伺服器,與你的同學和我們見面。
讓我們開始吧!
這門課程精簡但進度快!它面向希望快速提升 LLM 微調技能的軟體開發人員和工程師。如果你不屬於此類,請檢視 LLM 課程。
這門課程有什麼期待?
在本課程中,你將
- 📖 學習指令微調、監督微調、偏好對齊、評估、視覺語言模型……等等!
- 🧑💻 學習使用已建立的微調框架和工具,如 TRL 和 Transformers。
- 💾 分享你的專案並探索社群建立的微調應用。
- 🏆 參與挑戰,你將與其他學生一起評估你微調的模型。
- 🎓 完成作業即可獲得結業證書。
課程結束時,你將理解 如何有效微調語言模型並利用最新的微調技術構建專門的 AI 應用。
別忘了 報名參加課程!
課程內容是什麼樣的?
課程由以下部分組成
- 基礎單元:你將在其中學習微調的 理論概念。
- 實踐環節:你將學習 使用已建立的微調框架 來調整你的模型。這些實踐環節將提供預配置的環境。
- 用例作業:你將在這裡運用所學概念解決你選擇的一個真實世界問題。
- 合作專案:我們正在與 Hugging Face 的合作伙伴合作,為你提供最新的微調實現和工具。
這門 課程是一個活的工程,會隨著你的反饋和貢獻而不斷發展! 歡迎在 GitHub 上提交問題和 PR,並在我們的 Discord 伺服器中參與討論。
課程大綱是什麼?
這是課程的總體大綱。每個單元都會發布更詳細的主題列表。
| # | 主題 | 描述 | 已釋出 |
|---|---|---|---|
| 1 | 指令微調 | 監督微調、聊天模板、指令遵循 | ✅ |
| 2 | 評估 | 基準測試和自定義領域評估 | ✅ |
| 3 | 偏好對齊 | 使用 DPO 等演算法將模型與人類偏好對齊。 | ✅ |
| 4 | 視覺語言模型 | 適應和使用多模態模型 | ✅ |
| 5 | 強化學習 | 基於強化策略最佳化模型。 | 十月 |
| 6 | 合成數據 | 為自定義領域生成合成資料集 | 十一月 |
| 7 | 頒獎典禮 | 展示專案並慶祝 | 十二月 |
需要哪些先決條件?
要能跟上本課程,你應該具備
- 對 AI 和 LLM 概念的基本理解
- 熟悉 Python 程式設計和機器學習基礎知識
- 具備 PyTorch 或類似深度學習框架的經驗
- 理解 transformer 架構基礎知識
如果你不具備其中任何一項,別擔心。請檢視 LLM 課程 以開始學習。
上述課程本身並非先決條件,所以如果你理解 LLM 和 transformer 的概念,現在就可以開始課程了!
我需要哪些工具?
你只需要兩樣東西
- 一臺帶網際網路連線的電腦,最好能訪問 GPU(Hugging Face Pro 效果很好)。
- 一個賬戶:用於訪問課程資源和建立專案。如果你還沒有賬戶,可以在這裡建立一個(免費)。
認證流程
你可以選擇旁聽本課程,或者完成活動並獲得我們頒發的兩份證書之一。如果你旁聽課程,你可以參與所有挑戰並完成作業(如果需要),並且你無需通知我們。
認證過程完全免費
- 要獲得基礎認證:你需要完成課程單元 1。這適用於希望瞭解指令微調基礎知識但不想構建高階應用的學生。
- 要獲得結業證書:你需要完成所有課程單元並提交最終專案。這適用於希望展示微調技術掌握程度的學生。
推薦的學習進度是什麼?
本課程的每個章節都設計為每週完成,每週大約需要 3-4 小時的工作量。
由於有截止日期,我們為您提供了一個推薦的學習進度

如何充分利用這門課程?
為了最大限度地利用課程,我們有一些建議
- 加入 Discord 學習小組:小組學習總是更容易。為此,你需要加入我們的 Discord 伺服器並驗證你的賬戶。
- 完成小測驗和作業:學習的最佳方式是透過實踐和自我評估。
- 制定一個時間表以保持同步:你可以使用我們下面推薦的學習進度,或者建立你自己的。

我們是誰
關於作者
本·伯滕肖 (Ben Burtenshaw)
Ben 是 Hugging Face 的機器學習工程師,專注於構建 LLM 應用,採用後期訓練和智慧體方法。在 Hub 上關注 Ben,檢視他的最新專案。
致謝
我們要感謝以下個人和合作夥伴的寶貴貢獻和支援
我發現了 bug,或者我想改進課程
歡迎貢獻 🤗
- 如果你在 Jupyter Notebook 中發現了一個 bug 🐛,請提交一個 issue 並描述問題。
- 如果你想改進課程,可以提交一個拉取請求 (Pull Request)。
- 如果你想新增一個完整的章節或新的單元,最好提交一個 issue,並在開始編寫之前描述你想要新增的內容,以便我們為你提供指導。
我還有問題
請在我們的 Discord 伺服器 #fine-tuning-course-questions 中提出你的問題。
現在你已經掌握了所有資訊,讓我們開始吧 ⛵
在 GitHub 上更新