• 沒有找到結果。

正參】077 科目:巨量資料處理與應用實務

N/A
N/A
Protected

Academic year: 2022

Share "正參】077 科目:巨量資料處理與應用實務"

Copied!
2
0
0

加載中.... (立即查看全文)

全文

(1)

國立空中大學 107 學年度下學期期末考試題【 正參】077

科目:巨量資料處理與應用實務 一律橫式作答 2 頁 一、選擇題﹙80%,每題 5 分﹚

1. 大數據分析(Big data analysis)的流程可以包括探索、編碼與整合的階段,下列哪一項描述的是編 碼階段的工作? (a).發現資料的規律(pattern) (b).建立「機構」跟「機構的營運策略」之間的 關聯 (c).得到的結果與機構的資料與作業流程整合 (d).進行需求的了解 (b,5.1)

2. 下列何者是指處理連續而大量的非結構化資料的技術? (a).多媒體運算 (b).串流運算 (c).雲 端運算 (b,p.168)

3. 下列有關於即時的大數據運作之描述,哪一項是錯誤的? (a).大數據的分析方式不會以分批的 方式(batch mode)進行 (b).有很多場合可能會需要馬上針對現有的資料狀態進行決策 (c).以即 時的大數據運作來說,最主要的特性就是所處理與分析的資料即時地來自各方 (d).要維持資料 即時的運作,需要串流資料的技術與事件處理的技術 (a,5.3)

4. 企業透過策略與技術對企業資訊進行分析,也就是把前端的作業資料匯整到後端,經過分析之 後產生報表,幫助決策的進行」,以上的描述所指的是下列哪一個領域? (a).商業智慧(business intelligence) (b).智慧環境(smart environment) (c).資料採礦(data mining) (d).大數據(big data) (a,6.1)

5. 下列哪一項比較不算是金融業在大數據上的應用? (a).客戶行為分析 (b).防堵詐騙 (c).金融 信用風險分析 (d).庫存管理 (d,6.2.2)

6. 下列有關R 的一些優點,何者不正確? (a).程式撰寫風格很簡單 (b).有強力的社群支持做後 盾,有很多論壇來幫助你 (c).是開放原始碼軟體,效能有待加強 (c,7-2-1)

7. 下列有關向量的敘述何者不正確? (a).我們可以使用 c()函式來建立向量 (b).向量中的元素可 以經由索引(index)來存取 (c).要檢查物件的型態,是使用 classof("object")函式 (c,7-3-2) 8. 資料處理與清理的建議原則,何者是不正確的? (a).每一個欄位是一個變數,每一列是一個觀

察值 (b).一個欄位內只有一個數值,最好要看得懂的欄位名稱 (c).一個檔案可以包含多個表格 (c,7-4-1)

9. 下列有關Power Query 敘述,何者不正確? (a).可以執行資料清理操作 (b).無法從多個記錄檔 匯入資料 (c).可從 Facebook 建立可在 Excel 圖表中呈現的查詢 (b,8-2-1)

10. 新北市資料開放平台提供資料 API 介接的格式不包含何者? (a).JSON (b).CSV (c).PDF (c,8-2-2)

11. Power Pivot 是以什麼樣的方式存在 Excel 軟體中? (a).增益集 (b).擴充集 (c).增量集 (a,8-3- 1)

12. 有關 DAX 公式,請選出不正確者? (a).我們可以在 Power Pivot 資料表中使用 (b).Excel 的樞 紐分析表中不可使用DAX 公式 (c).可以在「量值」(Measure) 中使用公式 (b,8-4-1)

13. 下列何者不是 Python 優良特性? (a).支持功能和結構化程式設計方法以及物件導向程式設計

(2)

(b).提供非常高階的動態資料型態並支持動態型態檢查 (c).不支持自動垃圾收集 (c,9-2-1) 14. 下列有關 Python 識別字的敘述何者不正確? (a).Python 是一種不區分大小寫的程式語言 (b).

類別名稱以大寫字母,其他的識別字以小寫字母 (c).以一個底線符號開始的識別字,表示該識 別字意味著約定是私有的 (a,9-3-1)

15. 有關 Python,請選出正確的敘述 (a).串列(list)索引值從零開始 (b).值組(tuple)是以中括號'[]'來 表示 (c).串列是以小括號'()'來表示 (a,9-4-2)

16. 有關 Pandas 套件資料處理與篩選的敘述,請選出不正確的? (a).判斷是否為空值可以使用下列 isnull()、notnull()函式來判斷 (b).可以使用 insertna()函式來填補空值 (c).可以使用 fillna()函式 來填補空值 (b,9-5-3)

二、簡答題﹙20%,每題 10 分﹚

1. 請列舉三種R 語言中的進階資料型態。

(向量、矩陣、資料框、串列、因子,p.228 ) 2. 在Python 語言中,何謂函式?何謂套件?

(函式:完成特定功能的程式片段。函式用 def 開頭,然後是函式名稱,接著是參數,參數外圍以小 括弧包覆,最後是冒號,冒號之後開始函式內容的撰寫,最後傳回值是用return 指令回傳;套件:將 我們所要建立的套件儲存的副檔名指定為’.py’的檔案,再將要定義的所有函式寫在裡頭,就是所謂的 套件。 p.377-379)

參考文獻

相關文件

[r]

當然實際上不是真的把整個函式作為物件推入 stack,圖中的函式事實上是代表

最後, 應當強調的是, 以上所論述的第 二種教學形式並不意味著重新回到“傳授–接 受”的傳統模式。 例如, 數學基本知識的學 習在很多情況下也可採取“問題解決”的形式,

最根本的是什麼 (—房子!) 那麼, 這裏的“任意角的三角函數”, 首先應該是什麼?(—函數!) 因此,

本文介紹的 Karamata 不等式是延森不等式 (Jensen’s Inequality) 的一種推廣, 又稱 做 蓋不等式或 Hardy-Littlewood 不等式。 延森不等式通常只能提供凸函數或凹函數的其中一 個極值(極大值或極小值),

Riordan 矩陣的應用方面, Sprugnoli [5] 利用 Riordan 矩陣找出多種組合和式的生成 函數, 由生成函數就能得到組合和式的封閉表達式或漸進值; Sprugnoli 和 Merlini [3] 也利用 Riordan 矩陣給出了

而 部份分式 (partial fraction) 分解, 又稱部份分式展開, 是將有理函數分解成許多次數 較低有理函數和的形式, 來降低分子或分母多項式的次數。

如果函數是由基本函數所組成,至少需要注意:分式函 數分母會等於 0