LLM 課程文件
🤗 Datasets,檢查完畢!
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
🤗 Datasets,檢查完畢!
好了,這是一次對 🤗 Datasets 庫的完整瀏覽——祝賀你走到這一步!有了本章所學的知識,你應該能夠:
- 從任何地方載入資料集,無論是 Hugging Face Hub、你的筆記型電腦,還是你公司的遠端伺服器。
- 使用
Dataset.map()
和Dataset.filter()
函式的組合來處理你的資料。 - 使用
Dataset.set_format()
快速在 Pandas 和 NumPy 等資料格式之間切換。 - 建立你自己的資料集並將其推送到 Hugging Face Hub。
- 使用 Transformer 模型嵌入你的文件,並使用 FAISS 構建語義搜尋引擎。
在第 7 章中,我們將把所有這些知識付諸實踐,深入探討 Transformer 模型擅長的核心 NLP 任務。不過,在跳到下一章之前,先透過一個快速測驗來檢驗你對 🤗 Datasets 的知識!
< > 在 GitHub 上更新