NLP 課程文件

章節末尾測驗

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強文件體驗的訪問許可權

開始

章節末尾測驗

Ask a Question

本章涵蓋了很多內容!如果您沒有掌握所有細節,請不要擔心;接下來的章節將幫助您瞭解幕後事物的工作原理。

不過,在繼續之前,讓我們測試一下您在本節中學到了什麼。

1. 🤗 Datasets 中的 load_dataset() 函式允許您從以下哪些位置載入資料集?

2. 假設您如下載入 GLUE 任務之一:

from datasets import load_dataset

dataset = load_dataset("glue", "mrpc", split="train")

以下哪個命令將從 dataset 中生成 50 個元素的隨機樣本?

3. 假設您有一個關於家庭寵物的資料集,稱為 pets_dataset,其中有一列 name 用於表示每隻寵物的名稱。以下哪種方法可以過濾資料集,以便僅包含名稱以字母“L”開頭的所有寵物?

4. 什麼是記憶體對映?

5. 記憶體對映的主要好處有哪些?

6. 以下程式碼為什麼失敗?

from datasets import load_dataset

dataset = load_dataset("allocine", streaming=True, split="train")
dataset[0]

7. 建立資料集卡片的主要好處有哪些?

8. 什麼是語義搜尋?

9. 對於非對稱語義搜尋,你通常會有:

10. 我可以利用 🤗 Datasets 載入資料並在其他領域(如語音處理)中使用嗎?

© . This site is unofficial and not affiliated with Hugging Face, Inc.