國立空中大學 109 學年度上學期期中考試題【 正參】090
科目:大數據入門
一律橫式作答 1 頁一、 解釋名詞(每題 5 分,共 20 分)
1. 類神經網路(Artificial Neural Network) (P124) 2. 商業智慧(Business Intelligence, BI) (P14) 3. 資料超市(Data Mart)(P72)
4. 決策樹(Decision Tree) (P105 ~ P106)
二、 問答題(共 80 分,任選四題,每題 20 分)
(作答時請寫題號,僅依作答順序批閱前四題)
1. 資料採礦技術中群集分析(Clustering Analysis)和資料分類 (Data Classification) 有何不同? 請簡要說明之。(P81、P116)
2. 什麼是資料倉儲? 資料倉儲具有哪四項特性? 請簡要說明之。(P70~P71)
3. 請說明大數據的定義。大數據具有巨量性 (Volume)、即時性 (Velocity)、多樣 性(Variety)、不確定性 (Veracity) or 價值 (Value) 4V 特徵,請簡要說明大數 據的4V 特徵。(P5 ~ P8)
4. 請解釋什麼是機器學習。機器學習有何特色?機器學習發展有什麼瓶頸? 請簡 要說明之。(P14、P97)
5. 很多企業及公部門都知道大數據的重要性,但是一想到在運用大數據前要先進 行資料預處理(data preparation),就會望而卻步。(a)請問在運用大數據前一定 需要先進行資料預處理嗎?(b)為什麼? 以下也是很多技術長與資訊長的疑問,
請回答:(c)為什麼需要運用大數據? (d)運用大數據主要是要解決什麼樣的問 題?(本題有四個子題) (P19、P20、P104)