章末小測試
本章涵蓋了很多方面! 如果你沒有掌握所有細節, 不用擔心; 在下一章將幫助你瞭解內部的事情是如何工作的。
不過, 在繼續下一章之前, 讓我們測試一下你在本章學到的內容。
1.🤗 Datasets中的 load_dataset () 函數允許你從下列哪個位置加載數據集?
2.假設您加載了 GLUE 任務,如下所示:
from datasets import load_dataset
dataset = load_dataset("glue", "mrpc", split="train")
以下哪個命令將從 dataset
中生成50個元素的隨機樣本?
3.假設你有一個叫做寵物數據集的家庭寵物數據集,它有一個名字列表示每個寵物的名字。下列哪種方法可以讓你過濾所有名字以字母”L”開頭的寵物的數據?
4.什麼是內存映射?
5.下列哪一項是內存映射的主要好處?
6.為什麼下面的代碼是錯誤的?
from datasets import load_dataset
dataset = load_dataset("allocine", streaming=True, split="train")
dataset[0]