國立空中大學 107 學年度下學期期中考試題【 副參】077
科目:巨量資料處理與應用實務 一律橫式作答 3 頁 一、選擇題﹙60%,每題 5 分﹚
1. 下列的資料量等級,哪一個最大? (b,1.1.2) a.GB
b.EB c.PB d.TB
2. 社交網路內容屬於下列哪一類的資料? (b,1.1.3) a.人為產生的結構化的資料
b.人為產生的非結構化的資料 c.機器產生的結構化的資料 d.機器產生的非結構化的資料。
3. 大數據所使用的ETL 工具所指的是下列哪一項所描述的功能? (d,2.1.4) a.extract, transfer and load
b.extend, train and list c.extend, test and list
d.extract, transform and load
4. 下列有關於虛擬化技術中Hypervisor 描述,哪一項是錯誤的? (b,2.2.2) a.Type I 的 hypervisor 可以在新電腦上直接安裝 hypervisor 的軟體
b.Type II 的 hypervisor 也可以在新電腦上直接安裝
c.屬於 Type II hypervisor 的軟體則包括 VMWare Workstation、VirtualBox 等 d.屬於 Type I hypervisor 的軟體包括 VMWare ESX/ESXi、Microsoft Hyper-V 等
5. 「雲端基礎設施由多種雲組成,透過標準化或特定的技術結合為單一的資源,透過技術加強資 料與應用的可移植性」,以上的描述所指的是下列哪一個名詞? (a,2.3.2)
a.公有雲(Public Cloud)
b.私有雲(Private Cloud)
c.社群雲(Community Cloud)
d.混合雲(Hybrid Cloud)
6. 非關聯式的資料庫系統採用所謂的BASE 概念,其中 E 代表什麼涵義? (b,3.1.2) a.Extensibility
b.Eventual Consistency c.Existence
d.External
7. 下列有關於Hadoop ecosystem 之描述,哪一項是錯誤的? (d,3.3) a.使用 HDFS 檔案系統
b.利用 YARN 來管理資源與應用
c.利用 HBase 來儲存大數據的資料 d.利用 Hive 來進行大數據的資料篩選
8. 「運用多種預測模型來預測各種結果,並且對應每一種結果的最佳作為。」,以上所描述的是下 面哪一類分析方法? (d,4.1)
a.敘述性的分析(descriptive analytics) b.診斷式的分析(diagnostic analytics) c.預測式的分析(predictive analytics) d.處方式的分析(prescriptive analytics)
9. 集群分析(clustering)屬於下列哪一種分析方法? (b,4.4.2) a.監督式的機器學習(supervised learning)
b.非監督式的機器學習(unsupervised learning) c.深度學習
d.人工智慧
10. 下列何者不是大數據資料處理功能的平台? (d,p15) a.Storm
b.Flink c.Spark d.Herdoop
11. NoSQL 類型的資料庫強調以下的特性,何者是不對的? (b,p99) a.可擴充性
b.不必維持資料一致性 c.不同的續存性設計 d.介面的多元性
12. 大多數的分類(classification)方法屬於下列哪一種分析方法? (a,p151) a.監督式的機器學習(supervised learning)
b.非監督式的機器學習(unsupervised learning) c.深度學習
d.人工智慧
二、簡答題﹙40%,每題 10 分﹚
1. 大數據的特性從數量(volume)、速度(velocity)與種類(variety)的 3V 變成 6V,是增加了哪三項?
(p4) (準確性 veracity、改變性 variability、價值 value)
2. 大數據的技術層次架構最底層是硬體架構,規劃的一些常用的原則除了可擴充性(scalability)以及 可用性(availability)之外,還包括哪三項。 (p40-41) (成本、彈性、效能)
3. 請列舉三種有關MapReduce 架構中執行的運算所具備的特徵。 (p106) (數值總計類型、找出排 名在前的項目、篩選、顯示互異的值、對資料進行分類、建立反向索引、排序、連結的操作,
以上任選其中三項)
4. 數據分析(data analytics)的生命週期除了「模型的建立」、「以結果確認目標」以及「進行運作」
之外,還包括哪三項? (p139) (需求的發現、資料的準備、模型的規劃)