• 沒有找到結果。

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

第二章、文獻回顧

深度學習是近年來相當熱門的詞彙,從2011 年國際商業機器超級電腦(IBM Waston)贏得益智問答、2016 年谷歌圍棋程式(Google AlphaGo)擊敗世界棋王,到 2017 年臉書聊天機器人(Facebook Chatbot)都可看見其足跡,各大科技公司如微 軟、蘋果和百度等紛紛進軍該領域。然而深度學習並不是一個全新的概念,早在 1950 年代自電腦發明以來便已興起,人們思考如何運用電腦來解決問題,而礙 於當時硬體儲存和效能不足,且資料量更是不夠,加上僅能處理一些代數題和數 學證明,難以在實務上有所應用,人工智慧便以泡沫化收場,一直到最近科技進 步促使計算成本下降才終於死灰復燃。

透過深度學習的興起,機器變得越來越聰明,而人工智慧的應用也更加廣泛,

主要領域可分為語音辨識、影像辨識和自然語言處理,其應用面向更是無遠弗屆,

在過去文獻中已有許多學者就其領域進行研究。Sun et al. (2014)使用一系列高層 次的特徵資料進行深度學習,其稱為深度隱藏身分特徵(Deep hidden IDentity features, DeepID),亦即透過大量不同但具有少量隱含特徵的身分,以用於人臉辨 識,使用一萬組臉部類別作為訓練樣本,在僅簡單對齊好臉部輪廓後,該模型的 準確率甚至可高達 97.45%;而其模型的預測結果除了能處理身分驗證的工作,

甚至隨著臉部類別在訓練資料的數量增加,該模型的泛化能力也能隨之增加,從 而推廣到訓練資料看不到的新面孔,包括登機前的報到手續幫助加速檢查流程,

或在社群平台標記照片中的朋友和家人,簡化使用者對照片的管理。其他類似的 生物辨識系統,例如指紋和虹膜辨識等,其應用也是指日可待。

深度學習也可應用於醫療領域,協助醫療專家在診斷過程中更精確且更有效 率。過去在診療期間往往需要花費時間詳看 X 光片、電腦斷層影像或核磁共振 等報告,且通常需要專家親自執行,人力成本相當高,是一項耗時又容易誤判的

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

過程。Wang et al. (2016)使用卷積神經網路(Convolutional Neural Network, CNN) 從淋巴組織圖像中自動偵測轉移性乳癌,其目標包括該圖像是否包含轉移性細 胞,以及確定該腫瘤在圖像中的位置;該模型在評估分類準確率的曲線下面積 (Area Under roc Curve, AUC)為 0.925,而病理學家獨立判斷的曲線下面積為 0.966,若將兩者相結合則曲線下面積將提高至 0.995,表示人為錯誤率約降低 85%。這些結果證明深度學習在病理診斷方面提供顯著的改善能力,不但能加速 檢測流程,讓醫師利用更多時間進行醫學診斷,在將來面臨醫療人才汰換時,也 能透過科技方法讓寶貴的醫療經驗傳承下去。

在探討人工智慧如何提升生活品質時,自動駕駛無疑是最受到熱烈關注的話 題。自從美國研發機構(Defense Advanced Research Projects Agency, DARPA)透過 無人汽車挑戰賽掀起自動駕駛技術的浪潮,各大公司爭相投入無人汽車的研發,

安全性是自動駕駛能否普及的重要關鍵,而讓車輛本身變聰明,透過車上各種感 測器和計算硬體以預測交通環境的變化,自主判斷路況以即時分析,是加速自動 駕駛發展最有效的助力;而相比城市街道,高速公路往往具有更多的可預測性,

其路面的規律性促進自動駕駛的領先應用。Huval et al. (2015)使用卷積神經網路 在真實系統所行使的速率偵測車輛和車道情況,收集大量高速公路行駛環境的圖 像樣本,除了描述車輛和車道的位置,也測量車輛之間的距離和相對速度,以用 於偵側車道邊界的範圍,偵測結果以交聯率(Intersection Over Union, IOU)作為評 估指標,並以雷達系統作為偵測結果的基準;其結果顯示該模型在偵測車輛之間 距離的準確性明顯優於雷達系統。深度學習的技術有望為自動駕駛帶來相對便宜 並穩健的解決方案,並改善更多疲勞駕駛和交通事故的情況,甚至將來自動駕駛 領域還能加入汽車駕駛習慣的學習,讓汽車成為駕駛人的行車管家。

而人工智慧與金融界的關係更是密不可分,甚至相比其他行業,金融界擁有 更好的應用潛力。金融市場擁有大量完整且有時間序列的股價資料,過去投資人

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

通常利用這些歷史資料,透過圖表和公式進行分析,並以各式各樣的迴歸模型預 測金融資產的波動性或價格的未來走勢,以獲得正確的交易訊號,這些方法在資 料整理方面相當耗時,且判斷規則深受個人投資風格而異,若不了解股票的運作 方式和目前趨勢,想要擊敗市場將會相當困難;而深度學習的誕生正是為了擺脫 投資人對分析模型的侷限,不需要事先假定具體的分析模型,而是根據給出的訓 練資料對其參數進行自我調整,所得的最終模型便是對訓練資料內含規律的最佳 描述,雖然無法解釋輸入變數對輸出變數的影響,但在股票分析中更關心的是預 測的準確性,這也是深度學習大量應用於演算法交易的原因。

Xiong et al. (2016)使用長短期記憶(Long Short-Term Memory, LSTM)神經網 路來模擬標準普爾 500 指數(S&P 500)的波動率走勢,其參考谷歌國內動態 (Google Domestic Trends)提供的各項指標作為神經網路的特徵資料,谷歌國內動 態是谷歌財經頻道(Google Finance)一項經濟分析功能,其建立 23 種指標來追蹤 特定經濟領域的搜尋流量;另以嶺(Ridge)迴歸和套索(Lasso)迴歸兩種線性迴歸模 型,以及廣義自迴歸條件異方差模型(Generalized AutoRegressive Conditional Heteroskedasticity, GARCH)作為基準模型,並以平均絕對百分比誤差(Mean Absolute Percentage Error, MAPE)作為預測能力好壞的評估指標。其結果表明神 經網路在預測指數波動率的誤差表現上明顯優於傳統模型,顯示深度學習對於具 有大量干擾因素、呈現高度複雜且非線性關係的金融市場是較為適用的模型。

除了透過股價等數值資料轉化為指標作為特徵資料,深度學習也能對文本資 料進行學習,透過從新聞事件或市場消息萃取相關資訊,以反映投資人對股價的 預期心理,並快速對其走勢做出判斷。Poulos (2016)使用深度循環神經網路 (Recurrent Neural Network, RNN)來預測道瓊工業平均指數(Dow Jones Industrial Average, DJIA)收盤價的方向,其特徵資料採用資料科學社群平台(Kaggle)提供的 一項專案(主題為 Daily News for Stock Market Prediction)資料集,包含每日從社

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

交平台(Reddit)世界新聞版挑選討論度前二十五名的新聞標題,藉以預測每日指 數收盤價的漲跌情況,並與基準模型(三層門控循環單元(Gated Recurrent Unit, GRU))做比較。結果顯示使用十二層門控循環單元的深度循環神經網路,其分類 準確度和曲線下面積皆優於基準模型或其他使用者所提供的模型。

深度學習的特徵資料也能同時對文本資訊和數值資訊兩種特徵資料進行學 習。Akita et al. (2016)使用長短期記憶神經網路來預測選自日經 225 指數(Nikkei 225)的十家公司收盤價,其特徵資料同時考慮新聞標題和公司開盤價資訊,而該 十家公司來自相同行業,以便透過文本資訊學習公司之間的交互關係,例如日產 (Nissan)宣布原廠「召回」檢修行動的事件,可能會使日產的股價下跌,然而卻使 豐田(Toyota)的股價上升;另將預測的收盤價納入交易策略,並與其他分類模型 ( 多 層 感 知 器 (Multi-Layer Perceptron, MLP) 、 支 援 向 量 迴 歸 (Support Vector Regression, SVR)和循環神經網路)做比較。結果顯示長短期記憶神經網路有較好 的獲利能力,且更能捕獲時間序列資料所帶來的影響;此外,納入文本資訊的特 徵資料比起只考慮數值資訊,其預測結果較為準確。

而深度學習也為交易策略的改進奠定基礎,提供較為客觀的識別和預測股價 走勢的方法,其交易訊號的差異也產生不同的資產配置方法和交易時機選擇。

Nelson et al. (2017)使用長短期記憶神經網路來預測十五分鐘後收盤價的變動方 向,其 股票 選自 巴西 聖保羅 指數(IBovespa)的五檔成分股(BOVA11, BBDC4, CIEL3, ITUB4, PETR4),特徵資料除了考慮歷史價格(開盤價、收盤價、最低價、

最高價和成交量),也加入一系列來自技術分析資料庫(Technical Analysis Library, TA-Lib)的技術指標,總計多達 175 個指標;此外,該模型使用移動視窗(Moving Window)的方式,亦即將每個交易日的前十個月作為訓練期間,並使用過去一周 資料來驗證模型績效,而在交易日當天便使用該模型進行預測,並與其他基準方 式比較其交易績效,包括使用其他機器學習演算法(多層感知器、隨機森林

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

(Random Forest)、偽隨機(Pseudo-Random))和簡單投資策略(買入持有(Buy and hold))。結果顯示該模型在準確率表現皆優於其他模型,且在每次的買賣交易中 獲得較高的報酬率,而在觀察最大損失時也顯示該模型提供較少的風險。總結來 說,神經網路對於股票走勢的分類和策略建構相當具有優勢,且能根據選取的特 徵自動調整參數和權重,有時甚至能分析出我們未曾預料的影響。

至於就其神經網路特徵資料的選取種類,過去研究並無一套標準說明何種指 標有顯著能力預測股價走勢,這是因為神經網路對於輸入值和輸出值之間的關係 並無像傳統迴歸模型有很好的解釋能力,如何挑選有效的變數使得神經網路的準 確率有更好的表現,是在該領域的一大課題,然而依據資料收集及計算的簡單性 和有效性,技術指標是最常使用的方式。Khan et al. (2015)使用自組織映射圖(Self-Organizing Map, SOM),其也是一種神經網路的分類方法,搭配幾種技術指標作 為特徵資料,包括相對強弱指標(Relative Strength Index, RSI)、威廉指標(Williams

%R)、終極指標(Ultimate Oscillator)、移動平均收斂發散指標(Moving Average Convergence Divergence, MACD)、隨機指標(Stochastic Oscillator)和能量潮指標 (On Balance Volume, OBV),使用印度孟買交易所(Bombay Stock Exchange, BSE) 的股價資料進行分析,並透過該模型從中挑選股票及決定買進時點,實證結果顯

%R)、終極指標(Ultimate Oscillator)、移動平均收斂發散指標(Moving Average Convergence Divergence, MACD)、隨機指標(Stochastic Oscillator)和能量潮指標 (On Balance Volume, OBV),使用印度孟買交易所(Bombay Stock Exchange, BSE) 的股價資料進行分析,並透過該模型從中挑選股票及決定買進時點,實證結果顯

相關文件