國立空中大學 107 學年度下學期期末考試題【 正參】077
科目:巨量資料處理與應用實務 一律橫式作答 2 頁 一、選擇題﹙80%,每題 5 分﹚
1. 大數據分析(Big data analysis)的流程可以包括探索、編碼與整合的階段,下列哪一項描述的是編 碼階段的工作? (a).發現資料的規律(pattern) (b).建立「機構」跟「機構的營運策略」之間的 關聯 (c).得到的結果與機構的資料與作業流程整合 (d).進行需求的了解 (b,5.1)
2. 下列何者是指處理連續而大量的非結構化資料的技術? (a).多媒體運算 (b).串流運算 (c).雲 端運算 (b,p.168)
3. 下列有關於即時的大數據運作之描述,哪一項是錯誤的? (a).大數據的分析方式不會以分批的 方式(batch mode)進行 (b).有很多場合可能會需要馬上針對現有的資料狀態進行決策 (c).以即 時的大數據運作來說,最主要的特性就是所處理與分析的資料即時地來自各方 (d).要維持資料 即時的運作,需要串流資料的技術與事件處理的技術 (a,5.3)
4. 企業透過策略與技術對企業資訊進行分析,也就是把前端的作業資料匯整到後端,經過分析之 後產生報表,幫助決策的進行」,以上的描述所指的是下列哪一個領域? (a).商業智慧(business intelligence) (b).智慧環境(smart environment) (c).資料採礦(data mining) (d).大數據(big data) (a,6.1)
5. 下列哪一項比較不算是金融業在大數據上的應用? (a).客戶行為分析 (b).防堵詐騙 (c).金融 信用風險分析 (d).庫存管理 (d,6.2.2)
6. 下列有關R 的一些優點,何者不正確? (a).程式撰寫風格很簡單 (b).有強力的社群支持做後 盾,有很多論壇來幫助你 (c).是開放原始碼軟體,效能有待加強 (c,7-2-1)
7. 下列有關向量的敘述何者不正確? (a).我們可以使用 c()函式來建立向量 (b).向量中的元素可 以經由索引(index)來存取 (c).要檢查物件的型態,是使用 classof("object")函式 (c,7-3-2) 8. 資料處理與清理的建議原則,何者是不正確的? (a).每一個欄位是一個變數,每一列是一個觀
察值 (b).一個欄位內只有一個數值,最好要看得懂的欄位名稱 (c).一個檔案可以包含多個表格 (c,7-4-1)
9. 下列有關Power Query 敘述,何者不正確? (a).可以執行資料清理操作 (b).無法從多個記錄檔 匯入資料 (c).可從 Facebook 建立可在 Excel 圖表中呈現的查詢 (b,8-2-1)
10. 新北市資料開放平台提供資料 API 介接的格式不包含何者? (a).JSON (b).CSV (c).PDF (c,8-2-2)
11. Power Pivot 是以什麼樣的方式存在 Excel 軟體中? (a).增益集 (b).擴充集 (c).增量集 (a,8-3- 1)
12. 有關 DAX 公式,請選出不正確者? (a).我們可以在 Power Pivot 資料表中使用 (b).Excel 的樞 紐分析表中不可使用DAX 公式 (c).可以在「量值」(Measure) 中使用公式 (b,8-4-1)
13. 下列何者不是 Python 優良特性? (a).支持功能和結構化程式設計方法以及物件導向程式設計
(b).提供非常高階的動態資料型態並支持動態型態檢查 (c).不支持自動垃圾收集 (c,9-2-1) 14. 下列有關 Python 識別字的敘述何者不正確? (a).Python 是一種不區分大小寫的程式語言 (b).
類別名稱以大寫字母,其他的識別字以小寫字母 (c).以一個底線符號開始的識別字,表示該識 別字意味著約定是私有的 (a,9-3-1)
15. 有關 Python,請選出正確的敘述 (a).串列(list)索引值從零開始 (b).值組(tuple)是以中括號'[]'來 表示 (c).串列是以小括號'()'來表示 (a,9-4-2)
16. 有關 Pandas 套件資料處理與篩選的敘述,請選出不正確的? (a).判斷是否為空值可以使用下列 isnull()、notnull()函式來判斷 (b).可以使用 insertna()函式來填補空值 (c).可以使用 fillna()函式 來填補空值 (b,9-5-3)
二、簡答題﹙20%,每題 10 分﹚
1. 請列舉三種R 語言中的進階資料型態。
(向量、矩陣、資料框、串列、因子,p.228 ) 2. 在Python 語言中,何謂函式?何謂套件?
(函式:完成特定功能的程式片段。函式用 def 開頭,然後是函式名稱,接著是參數,參數外圍以小 括弧包覆,最後是冒號,冒號之後開始函式內容的撰寫,最後傳回值是用return 指令回傳;套件:將 我們所要建立的套件儲存的副檔名指定為’.py’的檔案,再將要定義的所有函式寫在裡頭,就是所謂的 套件。 p.377-379)