• 沒有找到結果。

副參】077 科目:巨量資料處理與應用實務

N/A
N/A
Protected

Academic year: 2022

Share "副參】077 科目:巨量資料處理與應用實務"

Copied!
3
0
0

加載中.... (立即查看全文)

全文

(1)

國立空中大學 107 學年度下學期期中考試題【 副參】077

科目:巨量資料處理與應用實務 一律橫式作答 3 頁 一、選擇題﹙60%,每題 5 分﹚

1. 下列的資料量等級,哪一個最大? (b,1.1.2) a.GB

b.EB c.PB d.TB

2. 社交網路內容屬於下列哪一類的資料? (b,1.1.3) a.人為產生的結構化的資料

b.人為產生的非結構化的資料 c.機器產生的結構化的資料 d.機器產生的非結構化的資料。

3. 大數據所使用的ETL 工具所指的是下列哪一項所描述的功能? (d,2.1.4) a.extract, transfer and load

b.extend, train and list c.extend, test and list

d.extract, transform and load

4. 下列有關於虛擬化技術中Hypervisor 描述,哪一項是錯誤的? (b,2.2.2) a.Type I 的 hypervisor 可以在新電腦上直接安裝 hypervisor 的軟體

b.Type II 的 hypervisor 也可以在新電腦上直接安裝

c.屬於 Type II hypervisor 的軟體則包括 VMWare Workstation、VirtualBox 等 d.屬於 Type I hypervisor 的軟體包括 VMWare ESX/ESXi、Microsoft Hyper-V 等

5. 「雲端基礎設施由多種雲組成,透過標準化或特定的技術結合為單一的資源,透過技術加強資 料與應用的可移植性」,以上的描述所指的是下列哪一個名詞? (a,2.3.2)

a.公有雲(Public Cloud)

b.私有雲(Private Cloud)

c.社群雲(Community Cloud)

d.混合雲(Hybrid Cloud)

6. 非關聯式的資料庫系統採用所謂的BASE 概念,其中 E 代表什麼涵義? (b,3.1.2) a.Extensibility

b.Eventual Consistency c.Existence

d.External

7. 下列有關於Hadoop ecosystem 之描述,哪一項是錯誤的? (d,3.3) a.使用 HDFS 檔案系統

b.利用 YARN 來管理資源與應用

(2)

c.利用 HBase 來儲存大數據的資料 d.利用 Hive 來進行大數據的資料篩選

8. 「運用多種預測模型來預測各種結果,並且對應每一種結果的最佳作為。」,以上所描述的是下 面哪一類分析方法? (d,4.1)

a.敘述性的分析(descriptive analytics) b.診斷式的分析(diagnostic analytics) c.預測式的分析(predictive analytics) d.處方式的分析(prescriptive analytics)

9. 集群分析(clustering)屬於下列哪一種分析方法? (b,4.4.2) a.監督式的機器學習(supervised learning)

b.非監督式的機器學習(unsupervised learning) c.深度學習

d.人工智慧

10. 下列何者不是大數據資料處理功能的平台? (d,p15) a.Storm

b.Flink c.Spark d.Herdoop

11. NoSQL 類型的資料庫強調以下的特性,何者是不對的? (b,p99) a.可擴充性

b.不必維持資料一致性 c.不同的續存性設計 d.介面的多元性

12. 大多數的分類(classification)方法屬於下列哪一種分析方法? (a,p151) a.監督式的機器學習(supervised learning)

b.非監督式的機器學習(unsupervised learning) c.深度學習

d.人工智慧

二、簡答題﹙40%,每題 10 分﹚

1. 大數據的特性從數量(volume)、速度(velocity)與種類(variety)的 3V 變成 6V,是增加了哪三項?

(p4) (準確性 veracity、改變性 variability、價值 value)

2. 大數據的技術層次架構最底層是硬體架構,規劃的一些常用的原則除了可擴充性(scalability)以及 可用性(availability)之外,還包括哪三項。 (p40-41) (成本、彈性、效能)

3. 請列舉三種有關MapReduce 架構中執行的運算所具備的特徵。 (p106) (數值總計類型、找出排 名在前的項目、篩選、顯示互異的值、對資料進行分類、建立反向索引、排序、連結的操作,

以上任選其中三項)

4. 數據分析(data analytics)的生命週期除了「模型的建立」、「以結果確認目標」以及「進行運作」

(3)

之外,還包括哪三項? (p139) (需求的發現、資料的準備、模型的規劃)

參考文獻

相關文件

包括三維機械設計的所更的功能(SolidWorks 三維建模軟體)、資料管 理軟體 PDMWorks Client、以及用於設計交流的常用工具:eDrawings 專 業版(基於 e-mail 的設計交流工具),

④執行智能搜尋,當使用者在 Google 網頁上下指令後,便可以搜尋到網路的資料,再轉 發給使用者所有的資訊.. (4)

下列有關於「Google 相簿自動備份」之功能描述,哪一項是錯誤的? (a,8-3-2) a.照片自動備份會佔用 Google 帳號的儲存空間. b.Android 與 iOS 手機皆支援

在線上數位學習的情境中,授課者與學習者的並非在同一空間中進行互動。如何確保學生

審查整理呈現資料:蒐集到的資料應先審核 是否完整、正確、合理與一致,然後利用敘

壹、單選題:(一)三十題,題號自第 1 題至第 30

本課程的設計理念是將學生所學的線對稱與相似等幾何概念,應用於影像處 理,讓同學們在使用 GeoGebra 編輯圖形時,體驗到平常所見的圖形工具和 數學之間的關係,並發掘其中蘊含的幾何性質

[r]