加入 Hugging Face 社群
並獲得增強文件體驗的訪問許可權
開始
章節末尾測驗
本章涵蓋了很多內容!如果您沒有掌握所有細節,請不要擔心;接下來的章節將幫助您瞭解幕後事物的工作原理。
不過,在繼續之前,讓我們測試一下您在本節中學到了什麼。
1. 🤗 Datasets 中的 load_dataset() 函式允許您從以下哪些位置載入資料集?
2. 假設您如下載入 GLUE 任務之一:
from datasets import load_dataset
dataset = load_dataset("glue", "mrpc", split="train")以下哪個命令將從 dataset 中生成 50 個元素的隨機樣本?
3. 假設您有一個關於家庭寵物的資料集,稱為 pets_dataset,其中有一列 name 用於表示每隻寵物的名稱。以下哪種方法可以過濾資料集,以便僅包含名稱以字母“L”開頭的所有寵物?
4. 什麼是記憶體對映?
5. 記憶體對映的主要好處有哪些?
6. 以下程式碼為什麼失敗?
from datasets import load_dataset
dataset = load_dataset("allocine", streaming=True, split="train")
dataset[0]