數位家庭助理之研究與實作(III)

(1)

行政院國家科學委員會補助專題研究計畫

■ 成果報告

□期中進度報告

數位家庭助理之研究與實作(3/3)

Research and Implementation of Digital Home Assistants

計畫類別：■個別型計畫 □整合型計畫

計畫編號：NSC－96－2221－E－004－003－

執行期間：94 年 08 月 01 日至 97 年 07 月 31 日

計畫主持人：陳良弼

成果報告類型(依經費核定清單規定繳交)：□精簡報告

■

完整報告

本成果報告包括以下應繳交之附件：

□赴國外出差或研習心得報告一份

□赴大陸地區出差或研習心得報告一份

□出席國際學術會議心得報告及發表之論文各一份

□國際合作研究計畫國外研究報告書一份

處理方式：除產學合作研究計畫、提升產業技術及人才培育研究計畫、列

管計畫及下列情形者外，得立即公開查詢

□涉及專利或其他智慧財產權，□一年□二年後可公開查詢

執行單位：國立政治大學資訊科學系

中華民國 97 年 10 月 31 日

(2)

數位家庭助理之研究與實作

(3/3)

Research and Implementation of Digital Home Assistants

計畫編號：NSC－94－2213－E－004－010 執行期間：94 年 08 月 01 日至 97 年 07 月 31 日計畫主持人：陳良弼執行單位：國立政治大學資訊科學系

中文摘要

隨著電腦科技的蓬勃發展以及多媒體應用與資料分析的技術逐漸成熟，越來越多的研究人員以及企業致力於數位家庭環境以及相關應用的研究與開發。而隨著多媒體技術與產品的普及，越來越多的多媒體資料出現在使用者周遭。因此，整合使用者周遭各式不同種類的多媒體資料，並輔以個人化的呈現是數位家庭環境下的一個重要應用。此外，由於在數位家庭環境下可以利用各式數位產品取得豐富的資訊，如何協助使用者整理分析資訊並提出適當的建議則是數位家庭環境下的另外一個重要的應用。本計畫的主旨，即在於研究多媒體的查詢與跨媒體整合技術，以及股票交易資料的分析與預測，進而提供使用者在數位家庭環境下的多媒體娛樂以及理財資訊支援。為此，我們研究並發展了數種多媒體處理技術。此外，我們也研究與分析了股票的交易資料的特性，開發出股票分析預測以及即時分析的技術，提供使用者進行股票交易之參考。關鍵字：多媒體、音樂分類、高維度索引、股票資料分析、股票行為預測英文摘要

As the advance of computer technologies and the mature development of multimedia and data analysis techniques, more and more researchers are developing the digital home environment and the corresponding applications. The major characteristic of the digital home environment is the popularization of the multimedia contents, such as digital photos and home videos. Therefore, how to manage and use this large amount of multimedia data becomes an important issue. Moreover, since the large amount of information will be obtained from the digital products located in the digital home environment, how to analyze the information for users and to provide appropriate recommendations for users is another important issue.

The goals of this project are to develop the techniques of multimedia querying, cross media querying, stock transaction data analysis, and stock behavior prediction.

(3)

For this purpose, we developed many kinds of multimedia and data analysis techniques. Moreover, we also developed a technique to predict the stock behavior by analyzing the stock transaction data.

Keywords: Multimedia, Music classification, High dimensional index method, Stock

(4)

目錄

一、前言

6

(一)多媒體資料的查詢與處理 6 (二)股票交易資料的分析與預測 6

二、研究目的

8 三、文獻探討

11 四、研究方法

19 五、成果自評

37 參考文獻

(5)

表格目錄

表一：公式一計算結果 20 表二：公式二計算結果 20 表三：範例資料庫 24 表四：和弦條件機率表 28

圖片目錄

圖一：RCE-network 架構 13 圖二：公式一 19 圖三：公式二 20 圖四：多屬性表示法 22 圖五：查詢表示法 23 圖六：索引結構 --- KP suffix tree 23

圖七：The B+-tree set of reference points 24

圖八：K 最近鄰點查詢範例 25 圖九：反向K 最近鄰點查詢範例 26 圖十：半徑擴展法 27 圖十一：音樂分類步驟 28 圖十二：新增單一項目之片段 30 圖十三：新增兩種新片段 30 圖十四：ε=0.001, 時間 1000 時所有片段的時間標籤去掉一最早的一組 30 圖十五：字首樹與延遲資訊 31 圖十六：方法三所使用的表格(Lag=1, Lag=2 的例子) 31 圖十七：方法三所使用的字首樹誤差值是min_sup，並且不記錄時間標籤與延遲 資訊 31 圖十八：方法三中估計片段規則<(AB)(C)Æ(D) (延遲 i)>的方法 32 圖十九：PageRank 示意圖 33 圖二十：一股票事件法則 34 圖二十一：股票交易事件 34 圖二十二：CBS-樹 35 圖二十三：一般天際線查詢的比較原則 36 圖二十四：不確定性資料環境下的比較原則 36 圖二十五：最差天際線(WorstSky)之過濾示意圖 36

(6)

一、前言

隨著資訊與多媒體資料的容易取得，如何幫助使用者分析與整合過多的資訊與多媒體資料，成為一個重要的課題。而本計劃的數位家庭助理希望能為使用者提供兩方面的幫助，一個是在家庭娛樂方面，一個是在家庭理財方面。由於家庭娛樂方面大部分都是影像或是音樂等多媒體資料，因此，本計劃提出許多有效處理影像或是音樂等多媒體資料的方法。此外，有鑑於多媒體資料通常具有許多的特徵，因此，我們也提出能加速處理高維度資料的索引方式，以達到加快處理使用者需求的目的，而節省使用者的等待時間。而在家庭理財方面，股票作為許多家庭常用的理財工具，因此，本計劃也提出許多方法來針對股票這種時序性資料進行分析和預測，進而提供使用者在數位家庭環境下理財資訊支援。我們將家庭娛樂方面的相關技術和家庭理財方面的相關技術，分別整理成為多媒體資料查詢與處理技術與股票交易資料分析與預測技術兩大類，以下茲就此兩大類別的研究成果分別描述：

(一) 多媒體資料的查詢與處理

由於家庭娛樂方面大部分都是影像或是音樂等多媒體資料，因此，本計劃發展了影像和音樂的查詢處理技術。例如：在個人化的多媒體資訊整合方面，我們將音樂查詢與播放技術和人類的情感做結合，使得所查詢所得的結果能夠符合使用者的情感需求；在影像方面，我們也發展了處理影片物件的技術。此外，我們也提供了不同類型的資料分類技術，來幫助使用者分析與整理眾多的多媒體資料。同時，由於多媒體資料所對應的特徵空間其維度通常很高，因此一個良好的多媒體高維索引技術能加速對於多媒體資料的處理，所以為了減少使用者在使用這些技術時等待電腦處理的時間，我們也提出了針對多媒體資料高維度特徵的索引方式。最後，使用者可能會想要下達不同語意(semantic)的查詢，而為了表達不同的語義，每一次查詢所使用的距離函式可能會不同。因此，我們發展了多媒體可調整距離函式查詢技術來滿足使用者的需求。本計劃在此部份的研究成果包含了： 1.音樂查詢與播放技術 2.影像查詢技術 3.多媒體高維索引技術 4.多媒體可調整距離函式查詢技術 5.多媒體資料線上分類技術 6.以和弦和節奏為基礎之音樂分類技術

(二) 股票交易資料的分析與預測

由於股票資料為時序性資料，因此，我們分析時序性資料所具有的特色，設計了一套能夠預測時序性資料的方法，來輔助使用者做決策的判斷。此外，透過分析不同股票之間的關聯，我們可以找出在時序性上具有共同趨勢的股票來幫助預測股票未來的走勢。因此，我們發展了股價關聯分析及未來走勢預測的方法。這些資訊將提供給使用者作為買賣股票的參考。而且，我們也可利用所發展的股價關

(7)

易資料中，比對法則的前項事件，並將相對應的後項事件提供給使用者作為買賣股票的參考。最後，我們利用天際線查詢，來將各種較好的股票推薦給使用者，進而達到幫助家庭理財的目的。本計劃在此部份的研究成果包含了： 1.時序性資料走勢之分析及預測技術 2.股價關聯分析及未來走勢預測技術 3.股票事件預測技術 4.利用天際線查詢之股票推薦技術茲就依照這三類主題，分別描述其研究目的、相關文獻、研究方法於以下各節，最後一節則為本計畫執行成效的整體評估與論文成果列表。

(8)

二、研究目的

(一) 多媒體資料的查詢與處理

由於多媒體資料包含的資料型態很多，因此，我們需要針對不同型態，或是一些多媒體資料特有的特性，例如特徵空間維度很高等，來設計不同的處理技術，以下，我們分別對不同的處理技術說明其研究目的。音樂查詢與播放技術音樂資料每天都在成長，如何快速地從龐大的音樂中找到自己想要的音樂是個重要的議題。而把音樂資料輔以索引結構是加速查詢的關鍵。但是過多的音樂資料且音樂資料過長的特性將使得索引結構所需要的空間太大。因此本研究的目的在於找出音樂的重複片段，並依此將歌曲切成許多小段的樂句，以減少索引結構的大小，而能加速查詢。此外，在索引結構建立的同時，我們還需考慮到歌曲所隱含的情緒特徵，使得查詢的結果能符合使用者的情緒。影像查詢技術在多媒體資料中，影片資料佔了很大的比重，更重要影片資料是家庭生活中不可缺乏的部份。因此，如何對影片資料做有效的處理變成一個課題。本研究的目的是提出一套索引方式與演算法，使得系統能依據影片中的物件來做查詢，而且當該物件具有多屬性(例如：影片中的車子具有方向，速度等不同的屬性)時，亦能有效的查詢。多媒體高維索引技術當多媒體資料的特徵被擷取出來以後，會形成一個維度極高的特徵空間，在一些應用中，這個空間的維度可能達到上萬維。而每一個多媒體物件都會被對應到此空間中的一個點。當我們在此高維空間中進行查詢時，如何建立一個有效的索引結構來加快查詢速度，並且避免高維空間所帶來的一些問題，一直是很重要的課題。本研究的目的是設計一套在高維空間中有效的索引方法，這個方法可以減少因為高維空間所產生的大量維度運算問題。多媒體可調整距離函式查詢技術多媒體資料的數量每天都在增加，因此，如何快速且準確地搜尋使用者所需要的資料是一個很重要的議題。為了搜尋所需要的資料，我們通常需要比對多媒體資料之間的相似度。而多媒體資料之間的相似度，通常都可以使用度量空間 (metric space)的距離函式計算。另外，考慮到使用者可能會想要下達不同語意 (semantic)的查詢，而為了表達不同的語義，每一次查詢所使用的距離函式可能會不同。因此，我們設計了一套索引結構及演算法，能夠讓使用者在每次執行查

(9)

詢時，使用不同的距離函式。我們提供的查詢種類包括 k 最近鄰點(k-nearest neighbor)及反向 k 最近鄰點(Reverse k-nearest neighbor)查詢。

多媒體資料線上分類技術多媒體資料擷取系統常常利用資料分類[19]和使用者回饋[64]來提昇答案的準確度，然而，高維度的特徵空間與大量的訓練資料，往往導致分類機制的建立相當費時；在即時支援使用者回饋的考量下，我們研究如何快速建立分類機制的課題。在本研究中，我們提出一個新的建立RCE-network 分類機制的方法，也結合了去年所發展出來的多媒體高維空間索引技術來加速這整個過程中所需要的資料擷取。以和弦和節奏為基礎之音樂分類技術由於音樂內涵的多元和豐富性，音樂可分成很多種類型，因此產生許多音樂分類的系統。根據樂理上來說，可從旋律、和絃、節奏、和聲等。而每種音樂都有其特徵。比方說，佛朗明哥之於強烈的節奏，古典音樂之於繁複的和聲。也就是說特徵就可以代表每種特定的音樂方便人們去區分。所以說音樂分類中不可獲缺的重要因素就是選取特徵。在本研究中，我們提供了一套特徵選取的方法，並設計一套特徵轉換演算法，來將不同長度的特徵轉換成相同長度的特徵，以符合分類機制需要相同長度特徵的要求，來達到對音樂分類之目的。

(二) 股票交易資料的分析與預測

股票資料屬於時序性資料，因此我們需要由過去的資訊來分析其未來的走勢，這種分析基本上是一種困難的問題。為此，我們提出了許多不同的分析方法，而這些方法能互相結合已達到最好的分析效果。以下，我們分別對不同的方法說明其研究目的。時序性資料走勢之分析及預測在本計畫中，我們藉由分析時序性資料，用以推導出具有高信賴度的關聯法則，以期利用導出之法則來預測時序性資料未來的走勢。本計畫主要著重在時序性資料的線上（online）分析，我們希望所設計出的系統能夠立即掌握時序性資料的變化，並且在極短的時間內建議使用者勝率較高的操作方式（買進或者賣出）。而時序性資料的分析結果，可用於輔助家庭的金融理財活動，如：股票投資等。股價關聯分析及未來走勢預測試圖在股票市場中投資獲利者，不可不重視股票價格的變化。然而影響股票價格的因素極為廣泛，對於如此大量且複雜的資訊，實非一般投資人可以輕易掌

(10)

股價的歷史資料來推導出群體股價變化之關聯法則，進而達到預測未來股價走勢的目的。本研究著重在於非即時資料分析，以「日」作為預測時間單位，讓忙碌現代人不需花費太多時間在每日的交易上。股票事件預測技術根據之前的研究成果，我們可以推導出股價具備高度關聯的股票事件法則，並可以進而達到預測未來股價走勢的目的。然而，面對大量且瞬息萬變的股票交易資料，我們需要一套能夠立即反應股價變化的預測系統。本研究基於股票事件法則，著重於從當時股票交易資料中，可立即性的比對法則前項事件，以利在有效時間內對股價未來的價格作出預測（利用相對應的法則後項事件）。利用天際線查詢之股票推薦技術為了達成對股票推薦之目的，我們利用天際線查詢的比較原則做為資料間比較的基本策略，並同時考慮股票資料可能具有不確定性且使用者進行查詢的特徵子空間不一，發展一套查詢演算法，以幫助使用者對於龐雜的股票資料進行篩選，以挑選出合適於購買的股票。

(11)

三、文獻探討

以下，我們分別就兩大類別過去的相關研究進行探討。

(一) 多媒體資料的查詢與處理

在多媒體資料的查詢與處理技術方面，過去有許多重要的相關研究，我們分別就各個不同的技術做探討。音樂查詢與播放技術在音樂資料方面，[66]針對音樂查詢系統提出三個階段的架構，第一階段是主旋律擷取。由於一般複音的MIDI 格式音樂歌曲，主旋律無法直接獲得，所以此階段中，最好的主旋律擷取方法為在同時發音的音符中，取音高最高的音符作為主旋律。第二階段標準化則是希望統一各歌曲以及查詢的表示法，以絕對音高及相對音程差的效果為佳。第三階段就是決定查詢與歌曲的相似度，以 local alignment 為最好。

在音樂分段方面，[10]提出一套 rule based model，根據 Change Rule 找出連

續兩音符的改變程度，Proximity Rule 可以用來決定邊界落在 interval 較大的音符

上。

在找出音樂重複片段方面，過去有不少研究在找出完全相同的重複樣式(repeating pattern)[33][59]，但是這用在音樂資料上是不太合宜的。[57]提出一個找出近似重複樣式(approximate repeating pattern)的方法，用 sliding window 方式將音樂資料

切成許多segments，每個 segment 跟其他 segments 以 edit distance 為相似度測量

標準進行相似度比較，相似的 segments 數目若超過門檻值，便是一個近似重複

樣式。[43]延續此一架構，設計了一個 Lower-bounding distance，先使用計算複

雜度較低的距離計算方式去過濾不相似的segments，最後再真正用 edit distance

去計算相似度，用以降低計算時間。近年來有關音樂與情緒的研究主要可分為兩類：（一）利用音樂與心理方面所建立的模型進行音樂的分類。[22][42]（二）根據預先分類好的歌詞資料利用 decision tree 等方式建立歌詞分類法則。[72]（三）根據預先分類好的音樂資料利用SVM 等方式建立音樂分類法則。[39] 而這些方法主要都是在探討所謂音樂本身的情緒，然而，每個人對音樂的感覺會因為種族、成長背景等各項因素而有所不同，甚至於同一個人在不同的時間也會有不同的感受，因此，一個新的音樂情緒系統應該要能夠根據使用者不同的感受而自動找出最適當的情緒音樂，更進一步要能夠找出適合某種情境的感覺音樂。多媒體高維索引技術在索引技術方面，[53]將過去的索引方法分成兩大類。一類為座標導向 (coordinate-based)，另一類為距離導向(distance-based)。其中，座標導向的索引方

(12)

法又可以分成空間基礎(space foundation)和資料基礎(data foundation)的。下面，我們將探討各種索引結構的優缺點。座標導向索引方法的主要精神，是將空間中的點切割(separate)成數個部份。在此類別下，空間基礎和資料基礎的主要不同在於切割的觀念。空間基礎的索引方法[55]主要是將空間切割成數個大小相等或是所包含的點數相近的子空間。相對的，資料基礎的索引方法[68]主要是用矩形(rectangle)或是圓形(circle)來覆蓋具有聚集性的點，而這些矩形或是圓形通常會形成階層式的結構。但是，座標導向的索引方法在高維空間中是無效率的，主要是因為空間切割的觀念。當一個空間被切割以後，所有的切割資訊將會被保留下來。而使用者的查詢被執行時，這些空間切割資訊將會被拿來做比對，而這些比對的代價，將會隨著維度的提高而增加。接著，我們來介紹距離導向的索引方式。距離導向的索引方法[5][74]會先挑選一些參考點(reference point)，然後特徵空間中的每個點都會跟參考點計算距離並且將其記錄下來。當查詢處理被執行時，這些所記錄的資訊將會與三角不等式一起被用來刪剪(pruning)不可能的答案。而由於三角不等式的計算只需要一次減法，因此，距離導向索引方法的計算量是跟維度無關(dimensional independence) 的。但是，因為距離導向索引方法將距離的資訊過度壓縮，因此維度一高的時候，整個刪剪的效果會很差，甚至有可能無法刪剪掉任何點。多媒體可調整距離函式查詢技術度量空間中的索引結構已經被廣泛地探討過了，[32]中討論了許多有效的解決方案。這些索引結構只需要知道任兩點之間的距離，而不需要知道距離如何被計算的細節。[18]提出了 M-Tree 這個索引結構，並且提供了 M-Tree 上的範圍查詢(range query)及 k 最近鄰點查詢。這個索引結構後來被許多研究所引用。上述在度量空間的搜尋演算法，在建立索引結構時都必需先指定一個距離函式，而在查詢時必需使用相同的距離函式查詢。[17]首次探討了每次查詢時都可以使用不同距離函式的演算法，其中定義了兩種不同的距離函式。用來建立索引的距離函式，被稱為索引距離函式(index distance)。而使用者查詢時所下達的距離函式，稱為查詢距離函式(query distance)。並基於這樣的條件下發展了範圍查詢與 k 最近鄰點查詢的演算法。[9]延伸了這個方法，在索引結構中記錄了一些額外的資訊以達到加速的目的，但距離函式被線性組合(linear combination)所限制。近年來，反向最近鄰點查詢是一個相當受關注的議題。大部份的演算法是為了歐吉里德空間(Euclidean distance)上的查詢所設計的[60][62]。然而最近，度量空間上的反向最近鄰點查詢也開始受到重視。[2]提出了基於預先計算的反向最近鄰點查詢演算法。[63]整理了 M-Tree 的許多特性，定義了一個不需預先計算的反向最近鄰點查詢演算法。

(13)

多媒體資料線上分類技術過去能處理高維空間中的分類技術大致有下列幾種：類神經網路(Neural network)[48]、SVM[8][19]和 RCE-network[51][56]。其中，類神經網路是利用計算所得答案與標準答案間的誤差，形成誤差方程式。而為了使誤差能達到最小值，在訓練過程中需要對誤差方程式利用泰勒展式和微分來找出類神經網路需要如何調整。由於這個調整的步驟需要執行很多次才能使得誤差收斂到最小，因此類神經網路的訓練速度很慢。爲了解決類神經網路訓練速度慢和不一定能求出最佳值的缺點，類神經網路產生了很多變形。RCE-network[51][56]是其中之ㄧ。RCE-network 的架構類似於類神經網路，但是所用的概念卻完全不同。RCE-network 的主要觀念是利用圓圈覆蓋所有的訓練資料，並滿足下列兩個條件：(1)任何一個訓練資料一定被某個圓覆蓋。(2)任何一個圓所覆蓋的訓練資料只能屬於同一個類別。滿足第一個條件可以才能讓每個訓練資料都有被利用到。而滿足第二個條件才能順利的將測試資料做分類。如圖一所示，RCE-network 有三層：輸入層、隱藏層和輸出層。輸入層的每一點表示訓練資料的一個維度；輸出層的每一點代表一個類別，所以輸出層的點數即類別總數；隱藏層的每一點代表一個圓，與輸入層某一點連接線上的權值，即代表該圓圓心在那個維度上的值。以圖一為例，輸入層有n 個點代表 n 維的特徵空間，圓 C1的圓心座標為（w11, w21, …, wn1）。在此網路中，每個圓只屬於一個類別，因此隱藏層的每一個點只能有一條線連到輸出層，而線上的權值即為該圓半徑；如圖一的r1即為圓C1的半徑。假設需要分類的點 A 座標為（x1, x2, …, xn），則隱藏層 Ci 的公式為

∑

= − n k 1 xk wki 2 | | ，其幾何意義為點A 到圓 Ci的距離。若此距離小於半徑ri，表示點A 落在 Ci中，此時Ci連到輸出層的點會輸出1，而輸出層中其他類別所對應的點則輸出0。若輸出全為 0（沒落在任何圓中）或超過一個以上的類別為 1(落在不同類的圓中)，則該資料無法被分類。圖一：RCE-network 架構 1 C1 輸出層 n w11 wn1 Ci C 2 w21 ··· r1 ri rm ··· ··· x1 x2 xn ··· 隱藏層輸入層

(14)

另外，Cortes 等人[19]提出了 Support Vector Machines(簡稱 SVM)。給定一群訓練資料(x1,y1), (x2,y2), …,(xn,yn)，其中 yi為物件xi的類別標籤。因為SVM[8][19] 是一種二分類器，即每一個SVM 只能分辨兩類的資料，所以 yi的值只能為1 或 -1。SVM 的目標在於訓練出一個函數: f(x) = w * x + b (3.1) 並使得下列的式子成立： ⎩ ⎨ ⎧ − = − ≤ + = ≥ + 1 , 1 * 1 , 1 * i i i i y if b x w y if b x w _(3.2) 公式(3.2)的意義在於，對於所有的訓練資料都能被 f(x)分成兩邊，其中類別標籤為1 的一邊，類別標籤為-1 的一邊。明顯地，此時 f(x)為一個二分類器，同時也為這兩類訓練資料的分隔平面。但是可以分隔兩類訓練資料的分隔平面有許多條，那要怎麼選擇呢？SVM 的主要概念是在要分類的兩群訓練資料中，求出能產生最大界線(maximum margin)的分隔平面。其中，最大界線的概念如圖七所示，假設所要求的分隔平 面和右半邊點的最近距離為d+，而和左半邊點的最近距離為d-，則最大界線分隔平面定義為：該分隔平面能使 d++d-成為最大值。最後，SVM 利用 Lagrangian multipliers 來解這樣一個最大值問題。 以和弦和節奏為基礎之音樂分類技術過去的音樂分類研究可被歸納成兩種。第一種是判斷所給予的音樂物件是屬於哪一種音樂型態，我們稱之為型態間的分類(inter-style classification)。例如：在[38]中提出，切分音(syncopation)和自然音階(diatonic)常常出現在爵士樂中，但這兩者很少出現在古典樂。因此，[38]利用這種特性來分析所給予的一段音樂是屬於爵士樂還是古典樂。McKay et al. [41]則使用共同的音樂特徵來對古典樂，爵士樂和流行歌曲做分類。第二種是利用樂理上的分析，來將一種音樂型態在細分成不同的風格(genre)，我們稱之為型態內的分類(intra-style classification)。例如：J. Miguel 和 Díaz-Báñez [47]利用強度和節奏來細分佛朗明哥的舞曲。Li et al.[40]則是利用音樂的內容和歌詞，來判斷英國與美國近三十年來的樂團和藝人哪些曲風是相似的。在分類機制方面，SVM 是一個常被使用於音樂分類的分類機制。D.V. Steelant [61]利用 SVM 在音訊(audio)類型的音樂資料上來判別鼓聲。Jang et al. [12]對古典樂和pop 擷取情感上的特徵，並且有利用到 SVM 來分類。

(二) 股票交易資料的分析與預測

在股票交易的分析與預測方面，由於我們發展了許多不同的方法，因此，我們也分別討論過去與這些方法相關的研究。時序性資料走勢之分析及預測

(15)

對於時序性資料的分析，在過去相當多的文獻探討中，片段（episode）常被用以表示一事件（event）集合間的關係．給予一個時間框架（time window），序列片段（serial episode）<e1e2…en>，用以表示事件 e1，…，en 其發生的時間順序，其中，en 的發生時間減去 e1 的發生時間是小於框架尺寸（window size）。

而平行片段（parallel episode）（e1，…，em）描述在時間框架內事件 e1，…，em

都有發生，但是不管事件間的發生順序。而合成片段（composition episode）為多組序列片段和平行片段的組合，其所有描述的事件也都必須發生在時間框架尺寸內。

在本年度計劃中，我們將一股票的多種技術指標形成多維的事件序列（event sequence），我們進而參考過去文獻對頻繁片段探勘（frequent episode discovery）的探討，發展出多個能夠線上（on-line）推導片段法則（episode rules）的演算法，所推導出的法則將具有高信懶度（confidence），並且將被應用於線上的股票價格之預測．以下為相關文獻探討：在分析片段及片段法則方面，在[45]中有兩種計算片段出現次數的方式，一個是利用固定時間長度的滑動視窗，另一個則是在一個固定時間限制內，計算出現該片段的最小區間，然而其子區間沒有出現片段。[45]並且也對兩種計算方式，設計了WINEPI 和 MINEPI 兩種求取頻繁平行及序列片段的方法。由於合成片段十分複雜，[45]僅設計針對平行與序列片段的探勘。有了求出頻繁片段的方法之後，若要求出如下片段法則：AÆB，前項片段（antecedent）A 在時間框架 T 發生之後，後項片段（consequent）B 則有超過 70% 的機率會在時間框架 S 內發生。則必須對 T 與 S 兩個時間限制分別對資料集做挖掘頻繁片段的工作。上述的找尋片段法則的方式，如果想發現片段B 有較長的後項延遲時間（lag time，指前項片段開始時間與後項開始時間的時間差），這個將會造成計算量大幅度的增加。對於一片段法則，[30]將前項片段與後項片段分開，在求出頻繁片段之後，再兩兩尋找其符合信賴度的關聯法則及後項的延遲時間。值得一提的是，本篇與前篇所探討問題之不同處在於前篇只考慮一維的事件序列，而本篇則考慮在同一個時間有多個維度的事件值。傳統求取片段法則的方法如[45]，如果需要能求出後項較長的延遲，可能會使計算量與延遲長度呈指數關係。在[30]雖然將前項片段與後項片段分開，但是並無提出適合的作法。另一個相似的環境在[34]被提到，[34]將 MINEPI 的廣度搜尋改成深度搜尋成為MINEPI+，並且利用記憶體的索引結構而設計了 EMMA 方法來加速探勘頻繁片段的速度。股價關聯分析及未來走勢預測對於股價變化之關聯法則，在過去的文獻探討中，技術指標常被用來當作預測未來股價變化的工具，方法可分為兩類。

(16)

（一）利用多種技術指標[37][70]，互相組合來作為買賣策略的依據，組合的指標顯示為多頭時作買進，顯示為空頭時作賣出。（二）利用技術指標的數值變化搭配人工智慧，如類神經網路演算法[27][49]，算出最有效的數值變化當作買進與賣出的訊號，也可視為動態的技術指標組合，每日要使用的組合指標要經過人工智慧的方法來求出。考慮到股票會有群體效應，在[65]的研究中提到，股票之間會有互相影響的關聯，例如聯電上漲時，台積電與矽品都上漲的機率相當高，利用股價的同漲同跌來作為兩兩之間的關聯度分析，並且延伸到群體同漲同跌的機率關係。股票事件預測技術

在主動式資料庫管理系統（active database management systems）中，ECA-法則（Event-Condition-Action- Rules）被用來趨動及時性的回應，當相對應的法

則前項條件滿足時。一般而言，一 ECA-法則的前項是被表示成一混合事件

（composite event）。在過去的十幾年裡，有大量的研究專題，像是 Ode[25]和 SAMOS[24]已發展出其獨等的主動式資料庫管理系統。這些系統其中一個最重要的課題，就是提出具有豐富的事件運算子的代數（algebra）來支援各種類的查

詢（亦既混合事物）。另外，SAMOS 和 Ode 基於 colored petri nets 和有限自動機

（finite automata）來實作他們的系統。在基於內含訂閱系統（content-based subscription systems）中[1][20]，送出者（senders）發佈事件（像是新聞或是訊息）結合了一群預先定義的特質-值對(attribute-value pairs)給接收者，而接收者描述由特質-值-運算子（attribute-value-operator）組成的感興趣定閱（subscription），用以過慮其不感興趣的發佈事件。Aguilera et al.[1]利用一樹狀結構索引定閱，其中，從根部至一葉子的路徑對應到一集合的具有相同特質-值-運算子定閱集合。當一發佈事件到達時，我們可以判定一發佈事件是否滿足接收者的要求，如果我們可以從樹根至某些葉結點一路滿足其所對應的特質-值-運算子。Demers et al. [20] 准許使用者描述可以比對一集合發佈事件的定閱。他們基於非決定有限狀態自動機（nondeterministic finite state automata）來實作他們的索引系統。在這樣的方式之下，所發展的系統可以同時處理多個發佈事件。Wu et al. [69]對無線射頻辨視（RFID）資料串流提出一具有特質值比較的事件序列查詢系統（SASE）。在他們的工作中，他們基於非決定有限狀態自動機及一堆疊結構提出了的一查詢

方案（query plan）來從串流中檢索查詢事件（query occurrences）。在其他一些基

於無線射頻辨視的資料串流管理系中[23][67]，他們討論了其自有的查詢和系統架構，但是卻沒有詳細的實作細節。另外，近幾年在資料串流上，也有一些基於關聯運算子的事件處理系統被提出[3][4]。他們大部份著重於最佳化查詢方案（對比對查詢建構出最佳的結合（join）步驟順序）以期滿足所指定的資源限制，像是CPU 時間和記憶體空間。以上工作與我們的研究最大不同處在於我們的方法將過濾多餘的法則前項比對。亦即，在比對一法則前項的過程中，若此法則前項對應到一個已公佈的預

(17)

測，則我們可以不必繼續比對此前項，因為其所對應的後項事件已被公佈出來（亦即在某段時間某股票股價會有如何的變化已知）。因此，在我們的方法裡，並不是存在於事件串流中的每個前項都要被比對出來，我們只比對可以發佈不重覆的預測的法則前項。在過去的工作中，那些基於自動機[20][25][69]或者 petri nets [24] 的演算法無法避免比對多餘的法則前項。一些混合事件處理器[20][69]無法處理基於圖的查詢。而一些缺少序列運算子[3][4]。在[1]中考慮的查詢格式集合形式的，而我們所考慮的是圖形式。而且，他們的答案必須在一個時間單位內被比對，而我們准許在一個時間範圍內。總而言之，所有的相關工作無法被直接運用在以事件法則（episode rules）為基礎的查詢上。利用天際線查詢之股票推薦技術在天際線(skyline)查詢的研究中，一筆資料常被稱之為一個物件，而天際線查詢所要尋找的就是這些物件中較好較具代表性的那些物件。天際線查詢原本是被[36]稱之為“找出由向量所成的集合中的極大值(finding the maxima of a set of vectors)”的一個數學上的問題。而[6]是首篇提出天際線查詢的研究，利用[36]定義了物件間所謂的支配(dominate)關係。一個物件能成為“天際線物件”，代表該物件在整個空間中，不存在另一個物件能夠支配它。而“支配與否”代表了多媒體物件間在各個特徵維度上的優劣關係。一個物件甲支配另一物件乙，就表示物件甲在這個整個空間中各個維度都優於乙。為了找出天際線物件，[6]將物件依序取出，與剩下所有的物件做比較，檢驗所有的支配與被支配的關係，被支配的物件就被剃除，到最後還留著沒被移除的物件就是天際線查詢的結果。在[35]中，則是利用 NN 的方法，利用已確定的天際線物件加快將非天際線物件去除，但此方法須到用到多次的 NN 查詢。[54]改進了[35]的方法，提出 BBS (Branch-and-Bound Skyline)方法，同樣是利用 NN 來找天際線物件，但在 IO 次數可達最佳化。

在[16]中所提出的 SFS(Sort Filter Skyline)利用預先對各維度的排序，來加快去掉非天際線物件的速度。[26]改進 SFS，提出“線性淘汰排序法 LESS (Linear Elimination Sort for Skyline)”，設法在做預先排序的時候就把一些非天際線物件給去掉，算是目前不使用額外的索引結構來計算天際線查詢最快的方法。相較於上述研究都是對整個空間所進行的天際線查詢，[75]則是考慮了子空間上的天際線查詢，利用一些分享計算的策略，讓各種不同的子空間的天際線物件可以同時被找出來，形成天際線立方體(skyline cube)，達到快速回答所有可能的子空間它們各別的天際線物件。以及之後的出現的改進版本[71]，將整個天際線立方體建成摘要（summary），使得所需的儲存空間降低且讓天際線查詢的答案可以更新，能適用於資料經常變動且使用者可能會對各種子空間進行天際線查詢的環境。而[73]是首篇考慮了不確定資料上的天際線查詢的研究。它定義了不確定資

(18)

料上物件與物件間的支配關係，並利用[13]所提出的數學模型說明了一物件在資料居有不確定性的環境下使其成為天際線物件的機率值的計算方式。並提出了一些刪除(pruning)策略，加快在離散型的不確定資料上找尋天際線物件的速度。其他天際線查詢的變形還有：[11]提出的 k-dominant 的概念，設法減少在高維空間中過多的天際線物件數量。[50]針對各維度都屬於小值域的資料，提出利用晶格(Lattice)的概念進行加快天際線查詢的研究。[41]則是研究了資料串流環境下的天際線查詢。

(19)

四、研究方法

以下我們分項討論各種技術的研究方法。

(一) 多媒體資料的查詢與處理

音樂查詢與播放技術之研究這部份的工作主要又可以細分為兩大項，一是音樂索引的建立和相似樂曲的查詢，二是依情緒／情境的樂曲擷取。以下我們分別介紹。 A. 音樂索引的建立和相似樂曲的查詢主要可以分成下面的步驟：步驟一：音樂特徵擷取 1. 主旋律擷取：採取[66]的方法來作主旋律擷取。在音樂資料中，若有同時發音的音符，保留音高最高者為主旋律音符。 2. 設計樂句分割法則及演算法：大部分的樂句都會結束在終止音，而終止音有兩種，第一種終止音在休止符的前一個音符，所以我們先計算每一個音符的開始發音的時間加上它的持續時間，然後去檢查跟下一個音符開始發音的時間中間是否有空檔的時間，若有空檔時間且時間超過一個門檻值，這裡就當做有一個休止符，所以先用與有找到的休止符將音樂資料作第一步的分割。第二種終止音是音符的持續時間突然變得較長，我們用[66]的演算法套入每個音符的持續時間找出這種終止音，此為第二步分割。最後分割完成的每個段落便視為一個樂句。 3. 發展自動化擷取音樂特徵之方法：我們以一個新的方式去自動找出音樂資料當中的近似重複片段。利用[28]當中提到一個以 edit distance 為基礎的近似字串比對方法(公式一)，這個方法可以找出被比對字串(T)中，局部與查詢字串(P) 最相似的部分，假設P 是 1234，T 是 123423123143，利用公式一可以得到表格一，在最後一列(第四列，有顏色部分是產生的表格內容)的第四行可以知道在 T 中，有一片段與P 相似，其 edit distance 為 0，並且可以知道這片段結束在 T 的第四個位置(t4)。另外可以在利用公式二同時產生的表格二中，相對於表格一的位置(第四列第四行)得到一個值為 4，這代表在 T 中與 P 相似的這個片段長度為 4，又我們知道它結束在 t4，所以可推得此在 T 中與 P 相似的片段為 t1 t2 t3 t4。 P = p1 p2 ... pm，T = t1 t2 ... tn D[0, j] = 0, 0 ≦ j ≦ n D[i, 0] = i, 0 ≦ i ≦ m D[i - 1, j] + 1

D[i, j] = min D[i - 1, j - 1] + (if pi = tj then 0 else 1) D[i, j - 1] + 1

for 1 ≦ i ≦ m, 1 ≦ j ≦ n

(20)

L[0, j] = 0, 0 ≦ j ≦ n L[i, 0] = 0, 0 ≦ i ≦ m

L[i, j] = if (D[i, j] = D[i – 1, j] + 1) then L[i – 1, j]

elseif (D[i, j] = D[i - 1, j - 1] + (if pi = tj then 0else 1)) then L[i – 1, j – 1] + 1 else L[i, j – 1] + 1 for 1 ≦ i ≦ m, 1 ≦ j ≦ n 圖三：公式二我們的方法就是把音樂資料當T，然後也是用 sliding windows 的方式從音樂資料切出片段來當 P。延續前面的例子，假如音樂資料 T 為 123423123143，sliding windows 大小為 4，第一個 P 就是 1234。然後可以看表格一的第四列中，第四行的0 表示這裡有一個片段與 P 完全相似。第九到十一行的 1 表示這附近有三個重疊很大的片段與P 相似，且與 P 距離為 1。這種情形，我們先找距離最小的片段當代表，但在此例中，最小的片段有三個，就去表格二相對的位置，找出長度最長的片段當代表，所以這個在T 中與 P 距離 1 的片段代表就是 12314。表一：公式一計算結果 1 2 3 4 2 3 1 2 3 1 4 3 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 1 1 1 1 0 1 1 0 1 1 0 2 2 1 0 1 2 1 2 1 0 1 1 1 2 1 3 3 2 1 0 1 2 1 2 1 0 1 2 1 2 4 4 3 2 1 0 1 2 2 2 1 1 1 2 2 表二：公式二計算結果 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0 1 0 1 2 3 0 1 0 1 2 3 1 2 0 1 0 1 2 3 4 1 2 1 2 3 4 2 3 1 0 1 2 3 4 5 2 3 2 3 4 5 3 4 在[43][57]都可以去定義感興趣的近似重複樣式大小，也就是 sliding window 的大小，我們的方法同樣可以處理，而且不會多花太多的時間。例如前面例子，若使用者感興趣的近似重複樣式大小為2 到 4，我們直接以 4 當作 sliding window 的大小，而2 跟 3 的結果一樣可以從同一個表格的第二列跟第三列得到。 4. 原型旋律之擷取及驗證：在上一步中找到的近似重複樣式，會有數個與它近似的片段，我們以按順序且同時出現在所有片段的音符為我們的原型旋律。步驟二：索引結構設計

(21)

1. 定義適當之音樂表示法：以相對音程差(後面音符的音高減前面音符的音高)來當作音樂的表示法。 2. 主旋律索引建立：將所有音樂資料的主旋律轉成定義的音樂資料表示法，然後建在同一個suffix tree 中。 3. 樂句式（phrase -based）索引研究：將所有音樂資料的主旋律先做樂句分割，再轉成定義的音樂資料表示法，然後建在同一個suffix tree 中。步驟三：近似查詢處理 1. 相似度計算函數訂定：以edit distance 為相似度測量標準。 2. 查詢演算法之設計：自動產生所有與查詢字串的edit distance 在門檻值內

的字串，然後一一去suffix tree 中做完全比對(exact matching)。

B. 依情緒／情境的樂曲擷取以情緒／情境為基礎的音樂檢索與過去音樂檢索最大的不同在於必須建立一個新的音樂表示法，不同於過去將音樂資料建立成索引後，利用一段旋律等音樂片段來進行相似音樂搜尋的方法，在檢索情緒／情境時，我們必須要利用各種特徵來表示音樂的特性，目的在於找出什麼樣特性的音樂會有什麼樣的情緒／情境效果。主要方法可分為以下幾個步驟：步驟一：建立新的音樂表示法過去在表示一首音樂的特徵時，最常使用的方法就是平均，例如我們可以說這首音樂的平均音高是多少？平均音長是多少？平均音量是多少？藉此來表示一首音樂的特性，希望能藉此找到一些分類規則，例如音量在哪些範圍時分別代表哪些情緒／情境等，然而，平均卻也有著很多缺點： (1)容易被一些較大或較小的值影響而使得平均值的可信度降低。 (2)無法明確表示出一首音樂的特性，例如，一首音樂音量，如果以平均來看，那漸升漸降或平穩的音樂將分不出差異。 (3)藉由平均得到的音樂特性不易理解，例如，我們說一首音樂的平均音長是 1.25 秒，平均音量是75 分貝，對沒有豐富專業知識的人來說，無法理解平均音長 1.25 秒是長是短？而平均音量75 分貝又會對人的心理造成什麼樣的影響，是屬於噪音嗎？所以我們必須建立出一種新的音樂表示法，以期能更明確表現出音樂的特性，因此，我們利用統計分布情況的方法來表示音樂的特徵，例如，我們會說一首音樂有80%的音其音量都是屬於比較大聲的，這樣不但能避免被一些較大或較小的值影響，而且也能很明確地告訴我們這首音樂是屬於比較大聲的。而為了得到特徵的分布情況來釐清對於每一種特徵而言什麼樣的值算大、什麼樣的值算小，我們收集了大量的資料以求得各種特徵所有可能的出現情形（domain value），再以 K-Means（K = 3）的方式將每一種特徵分為大、中、小三類（L、M、S），如此ㄧ來便可將數值資料轉換為類別資料。因此，ㄧ首音樂我們可以用一個 vector 來表示。步驟二：自動賦予音樂特徵權重

(22)

由於單純使用平均的方式得到的vector Ma 並不能很正確的表示出使用者的喜好，因此，我們將vector Ma 加上權重，這是由於每個特徵在不同的情緒／情境中重要度不同，例如，在happy 的音樂中，聲音大小是ㄧ個很重要的判斷要素，而在 peaceful 的音樂中聲音大小的鑑別度可能就不是這麼大，相反地，peaceful 的音樂擁有節奏慢、穩、旋律輕鬆等特性，因此自動調整每個特徵的權重將可以更正確地表示出使用者的喜好情形。而調整權重的方法主要是根據音樂特徵的分布情況來決定，例如，在happy 中音量有 80%出現在類別 L，有 15%出現在類別 M，5%出現在類別 S；而音高出現在類別 L、M、S 的機率分別為 30%、35%、 35%，此時我們可以很清楚地知道對 happy 的音樂而言音量的鑑別度要比因高來得高，所以我們可以根據鑑別度高低給予不同的權重。步驟三：個人化的情緒／情境音樂檢索因每個使用者過去經驗的不同對音樂的感受也會不同，所以我們必須根據使用者的回饋來找出符合使用者需求的音樂具備有哪些特徵，因次每回合我們都會根據使用者勾選的音樂計算每個特徵的鑑別度高低。為了有效利用non-relevant 的資訊，並更加接近使用者的需求，我們多加入了一個特徵---音色。在聲音物理特性（頻率與震幅）上，影響人類生理及心理情緒因素的三個向量即為：音量（Loudness）、音高（Pitch）與音色（Timbre）[76] 。而在幼兒聽力方面發展順序為音量、音色、旋律、節奏最後方為和聲[77]。由此可見音色對使用者的喜好影響也是相當大的。步驟四：相似度計算相似度的計算使用Cosine measure，我們可以根據使用者的回饋建立音樂特性vector Ma 與樂器 vector Tf，而後與資料庫中的音樂資料作相似度的計算，因此相似度可以表示成α* Sim_M(Ma,Mn)+β* Sim_T(Tf,TI)。影像查詢技術之研究為了達到快速搜尋影像中的物件，我們有下列的步驟：步驟一：建立影像物件的表示方法由於影像中的物件，常常具有多個屬性，例如：一輛車子具有方向，速度及加速度。因此，我們使用如下的多值序列來表示一個物件的多個屬性： NS1 H H H M M L L NS NS2 P Z N Z Z N N NS3 N E E E S W S 圖四：多屬性表示法步驟二：建立查詢模型由於查詢一個物件時，使用者很難記住該物件的所有屬性，例如，在上個例子中，使用者可能只記住了NS1 和 NS3 兩個屬性。因此，我們必須允許使用者只針對部分的屬性作查詢。依據上面的例子，一個查詢如圖五所示。其中，由於第三個多值屬性與第二個多值屬性都相同，這代表物件沒有改變屬性，因此可以

(23)

被刪除掉。 NS NS1 H H H M M L L NS3 N E E E S W S 圖五：查詢表示法步驟三：建立索引結構及查詢方法為了將多值屬性建立索引，我們使用了如圖六所示的KP suffix tree。但是由於KP suffix tree 只能紀錄單一數值，因此我們將多值屬性拆成好幾條單一數值的屬性，使其能被記載於KP suffix tree 中。圖六：索引結構 --- KP suffix tree 而我們在做查詢時，可以利用KP suffix tree 來找到各個單一數值序列，在判斷其是否有可能組合成查詢所要的多值序列。如果可以，則將其組合並去資料庫進行比對。多媒體高維索引技術根據文獻探討中的分析，我們選擇以距離導向索引方法為基礎，來設計我們的索引方法，主要是因為距離導向索引方法的計算量是跟維度無關的，因此較能克服高維空間所引發的問題。我們希望設計出來的索引方法能被使用在常用的查詢方式，如：k 最近鄰點查詢或是範圍查詢等。

我們採用[5]所提出的 MRP(multiple reference points)方法。一開始，先從所有點中選擇幾個點來當成參考點，並且將每個點與這些參考點計算距離。以表三

為例，我們選擇g 和 h 兩個點當作參考點，而所有其他點都與此兩點算距離，並

將結果記錄在如圖七的 B+-tree 中，以加快存取的速度。當給定一個查詢時，我

們以最近鄰點查詢(nearest neighbor query)為例，來說明我們的索引方法。主要可以分成下列兩步驟：步驟一：找尋近似最近鄰點我們使用B+-tree 中所記錄的資訊，來快速的求取一個近似的最近鄰點。我們的主要想法是，如果兩個點很近，那麼他們對於某一個參考點的距離也應該很接近。所以我們從B+-tree 中該點的兩邊開始掃描並計算其與查詢真正的距離。以圖七為例，假設查詢是e 點，則我們從 B+-tree 中 e 兩旁的 a，b，c 和 d 四個點開始計算與e 的真正距離。透過這種方式，我們可以只計算很少的點就能找出一個近似的最近點。

(24)

以MNIST 手寫數字資料庫為例，此資料庫中有 60,000 個資料，並且每個資料會被對應到 784 維的空間中的一個點。當給定一個查詢點時，我們從每個參考點的 B+-tree 中該查詢點的位置往兩旁開始掃描，並對掃描到的點計算其與查詢點真正的距離。根據實驗，只需這樣計算一百個不同的點，我們便可以找到平均距離查詢點約第8.45 近的點。步驟二：計算距離時，採用維度刪剪透過第一步，我們可以得到一個近似的最近鄰點。然後利用此近似最近鄰點到查詢點的距離，我們可以加速距離運算。主要的想法是在計算某個點到查詢點的距離時，我們一維一維的將兩個相同維度的値相減取平方後相加。如果在過程中，這個相加的總和已經大過近似最近鄰點到查詢點距離的平方，那麼這個點就不可能為答案了。一樣以MNIST 資料庫為例，我們對每個點都求取其最近鄰點，利用步驟二，我們可以將兩點間原本需要 784 維的距離運算，降低到平均只有 91.7 維。我們的方法除了在MNIST 資料庫中能看出好的效果以外。我們亦有從理論的角度來分析我們的方法能在做距離運算時節省大量的維度運算。表三：範例資料庫

Point Coordinates Class

a (5,5) 1 b (7,8) 1 c (7,5) 1 d (7,6) 1 e (6,6) 1 f (3,7) 2 g (3,8) 2 h (11,11) 3

圖七：The B+_{-tree set of reference points}

多媒體可調整距離函式查詢 [17]是目前在度量空間中，唯一可以在查詢時處理不同距離函式的演算法，其同時能支援範圍查詢及k 最近鄰點查詢。我們基於[17]做出一些改進，設計一套索引結構，記錄不只一組的索引距離，以加快查詢的速度。另外，我們發展了可以處理不同距離函式的反向k 最近鄰點查詢，至目前為止這個問題還沒有被其 3.6 5 g f a e b d c h 7.1 8.5 h b d e c a g f

B+_{-tree of reference point g}

(25)

他論文所探討過。使用者自訂距離函數之k 最近鄰點查詢 步驟一：建立索引我們提出的索引結構(MDM-Tree)是基於 M-Tree[18]，並且進行一些改進。在建立完M-Tree 之後，我們額外使用一些不同的距離函數，計算每個節點的覆蓋範圍，以及每個節點至其父節點的距離，並將這些資訊記錄在 M 樹之中。換句話說，在 MDM-Tree 中我們記錄了不止一種的索引距離，查詢時我們可以找出最有用的一組索引距離幫助刪剪。步驟二：k 最近鄰點查詢我們的k 最近鄰點查詢演算法是基於 QIC-M-Tree[17]，並且做出一些改善。首先，我們使用了記錄額外資訊的 MDM-Tree，而非原本的 M-Tree。另外，相較於QIC-M-Tree 在走訪樹結構時計算索引距離函式，我們的演算法直接計算查詢距離函式，以達到更好的刪剪效果。由於度量空間一般是難以想像的，我們將查詢之距離函數投射至二維平面上，並舉例說明此演算法的基本精神。在圖八中，令索引距離為di，查詢距離為dq。假設p 點為 r 點在樹結構中的父節點之中心，則 di(p,r)已經被預先計算過了，而 dq(p,q) 應在上層走訪時已被計算過。我們可以從索引距離及查詢距離，計算出兩者之最大差距，而推導出r 點在查詢距離下的可能位置(即黃色環的範圍)。由此我們可以得知dq(r,q)的最小可能值，若已找到 k 個點比 r 更接近 q，則 r 可以被刪剪。圖八：K 最近鄰點查詢範例使用者自訂距離函數之反向k 最近鄰點查詢 步驟一：建立索引此部分與k 最近鄰點查詢的建立索引方式相同，一樣的索引結構可以應用在這兩種不同型態的查詢。步驟二：反向k 最近鄰點查詢目前沒有其他的演算法能夠做到在度量空間下，由使用者自訂距離函數的反向k 最近鄰點查詢。我們的反向 k 最近鄰點查詢演算法是基於[63]，並且對其六項刪剪規則做出修正，使得我們的演算法可以處理這一種查詢。我們的方法可以在度量空間中運作，但是，為了舉例的方便，我們以一般的歐吉里德空間為例，如下圖： r p q

(26)

圖九：反向K 最近鄰點查詢範例假設q 為查詢點，p 為目前試圖刪剪節點之中心。該節點在索引函數下的覆蓋半徑(即實線圓內範圍)已被記錄在索引結構中。根據索引函數及查詢函數間的關係，我們可以算出該節點在查詢函數下最大的覆蓋半徑 r(即黃色圓的範圍)。假設該節點內的資料點數大於k，該節點內所有資料點在 2r 的距離都會至少存在 k 個其他資料點。若dq(p, q)>3r，根據三角不等式，該節點中的任何資料點與 q 的距離皆大於2r(如距離 q 最近的點 t，與 q 的距離大於 2r)，且已知有其他 k 個資料點比q 更接近該資料點，故該節點可以成功地被刪剪。多媒體資料線上分類技術在數種分類機制的建構方法中，只有RCE-network 使用了較為簡單的幾何概念，因此其方便與索引結構相結合。我們選擇RCE-network 做為分類機制，並結合第二年所發展出來的多媒體高維索引技術來達到快速建立分類機制的目的。我們歸納了過去 RCE-network 後，得知一個 RCE-network 需要滿足下列兩個條件： (a) 每個訓練資料都必須被一個圓所包含。 (b) 每一個圓只能包含同一類別的訓練資料。為了快速的建構出RCE-network，我們的方法分成兩個步驟。步驟一：設計可以符合索引方式的RCE-network 建構演算法

我們提出了一個RCE-network 的建構演算法-半徑擴展(Radius Expansion，簡

稱RE)法的目標就是要快速達成上面兩個條件，其主要步驟如圖十所示。為了滿足條件(a)，步驟 1 先找出還沒被任何圓所包含的點，然後利用步驟 2～4 畫出以此點為圓心的圓。為了滿足條件(b)，在步驟 2 和步驟 3 限制了圓半徑必須小於圓心與非同類最近點的距離，如此保證該圓不會包含任何與圓心不同類別的點。步驟4 將被此圓包含的所有點都歸諸於此圓，可減少步驟 1 檢查為“否”的次數，亦即減少產生圓圈的數目。觀察上述演算法，我們發現步驟2 與步驟 3 皆為點查詢（point query），而步驟 4 為範圍查詢（range query），因而促使我們採用第二年所發展出來的多媒體高維索引技術來加速這三個步驟。其中，步驟3 和步驟 4 都是在處理同類別的資料，因此我們在設計上是同時進行這些步驟的。步驟二：將多媒體高維空間索引技術整合到我們所提出的RCE-network 建構演算法中由於多媒體資料的特徵空間維度都很高，在此情形下，當執行點查詢或是範圍查詢時，幾乎沒有任何資料可以利用索引方法來刪除，而必須執行線性掃描 p q t r >3r

(27)

(linear scan)來逐個檢查該資料是否為可能的答案。因此，在執行圖十的步驟 2 時，我們可以對於所有跟所選取的點 A 不同類別的點，直接套用多媒體高維空間索引技術中的兩個步驟： (1)找尋近似最近鄰點 (2)計算距離時，採用維度刪剪來達成。其中，(1)中只針對所有不同類別的資料做尋找，而後找到的資料，其到查詢點距離要當成(2)中的限制。而當要執行類似圖十中步驟4 的範圍查詢時。由於已經從圖十的步驟 2 中得知限制範圍為AB。因此，我們可以直接套用多媒體高維空間索引技術中維度刪剪的方法即可。輸入：訓練資料輸出：RCE 網路 1.選擇訓練資料中的一個點 A，判斷其是否已經屬於某一個圓。若是，則執行步驟 5，若否，則執行步驟 2～4。 2.計算與點 A 不同類別的所有點中，與 A 距離最近的點 B，設其距離 AB 為 p。 3.計算與點 A 同類別的所有點中，與 A 距離最遠且距離小於 p 的點 C，設其距離 AC 為 q。 4.以 A 為圓心，q 為半徑畫圓。並將此圓中所包含的點都設定為屬於此圓。 5.若訓練資料中的每個點都已經屬於某一個圓，則演算法停止。若否，則執行步驟 1。圖十：半徑擴展法我們的方法與其他 RCE-network 建構演算法主要差異在於：第一，過去的 RCE-network 建構演算法都需要給定一些參數。相較之下，我們提出的半徑擴展法法以相同類別中與圓心距離最遠的點來決定半徑，可以避免事先給定參數的困難。第二，我們的方法引入了專門針對高維空間所設計的索引方法，因此，對於特徵空間經常具有很多維度的多媒體資料而言，我們的方法在執行速度上加快許多。以和弦和節奏為基礎之音樂分類技術為了達到能正確分類音樂的目的，我們的步驟如圖十一所示，可以分為四步，以下我們分別解釋。步驟一：頻道(channel)選擇由於MIDI 型態的音樂資訊通常包含很多頻道，這些頻道記錄著不同樂器的演奏資訊，例如：吉他和鼓等等。在此部份，我們將所有的頻道分為四類：吉他、鼓、打擊樂器和其他樂器。主要是因為在樂理上，前三項對於搖滾樂都有特別意義，因此，我們將從這些特別的頻道中來做特徵選取。步驟二：特徵選取由文獻探討中得知，音樂分類在進行特徵選取的時候，很注重樂理上的分析。因此，當我們要對搖滾樂進行特徵選取時，我們將和弦和節奏來當作主要特

(28)

徵是因為這兩個特徵在樂理上對搖滾樂的影響很大。此外，由於和弦大多是由吉他來表現，而節奏則是多由鼓聲來表現。因此，我們可以根據第一步驟所選擇出來的頻道，來針對這兩種樂器來選取和弦和節奏的特徵。值得一提的是，由於選擇出來的音樂特徵其長度常常不固定，然而，我們選用的分類機制SVM 需要固定長度的特徵。因此，我們提出一個將不固定長度特徵轉換成固定長度特徵的方法。我們用下面的例子說明。圖十一：音樂分類步驟

假設我們找出來的和弦的出現順序為：{I, II, III, I, IV, V, I, I, II, III, VI, II}，由於和弦的種類是固定的，因此我們可以建立一個二維矩陣，如表四所示，其長寬都為和弦種類的數目。在此例中，有七種和弦，因此長寬皆為七。而每個值，則表示某一個和弦出現後，其後面跟著另一個和弦的條件機率。例如：I 總共出現三次，其中兩次後面都有接II。因此，其機率為 0.66，故第二行第一列的值為 0.66。表四：和弦條件機率表 I II III IV V VI VII I 0.33 0.66 0 0 0 0 0 II 0 0 0.66 0 0 0 0 III 0.5 0 0 0 0 0.5 0 IV 0 0 0 0 1 0 0 V 1 0 0 0 0 0 0 VI 0 1 0 0 0 0 0 VII 0 0 0 0 0 0 0 此種轉換方式的主要優點是，還保留了音樂特徵中相當重要的順序關係。步驟三：建立分類機制在第二步驟選擇好特徵，並將其轉換成固定長度以後，我們便可利用現有的 SVM 建構演算法來建立一個 SVM 的分類機制。步驟四：利用分類機制將測試(test)資料做分類 Channel Selection Feature Extraction: Classifier construction: Classifying Input: training songs

Output: the song with label

(29)

有了前面三個步驟所建立的分類機制以後，我們可以將需要被分類的測試資料做分類。首先，先將測試資料的特徵取出，並且轉換成固定長度。接著就可以將此特徵輸入分類機制中以便得到分類結果。

(二) 股票交易資料的分析與預測

時序性資料走勢之分析及預測在此，我們以股票作為時序性資料的例子，當然，在做一些修改之後，此技術亦可推廣到其他的應用。參照計劃書中所描述，我們將一股票股價的連續變化，考量不同的區間長度（我們只考量一股票當天的交易情形，因此，區間長度不跨過一天）及多種的技術分析法則（例如，MACD、KD 等技術分析工具），我們將可以從一股票價格的連續變化中，轉換成一多維的事件序列。透過對一股票多維事件序列的分析，我們提出了三個線上推導多維序列片段法則的方法，其中多維序列片段法則中的後項延遲時間，在此定義如同[10]，指前項片段開始時間與後項開始時間的時間差。首先介紹數個參數，之後再簡述我們所發展的方法。 (1)最小支持度 min_sup：是指在 N 個單位時間的輸入之後，片段出現次數必須要大於(N* min_sup)我們才將該視為頻繁的片段。 (2)最小信賴度 min_conf：如果我們發現了一個序列性的片段規則，如：甲Æ乙 (延遲 15 秒鐘)，在此片段規則，只有甲之開始後 15 秒出現乙的次數比上甲出現的次數大於min_conf 時，我們才輸出此片段法則。 (3)最大延遲限制 Lmax：我們所求的片段法則，其後項的延遲限制。定義了上面三種輸入參數後，我們發展了三個方法：方法一：字首樹（prefix tree）與時間標籤一棵字首樹把序列性的片段組織起來。一開始，字首樹僅有一個根結點不包含任何東西。新的項目A 進來，由最深的節點開始走訪直至根節點。如果該節點是根節點，便產生一個子節點接在根結點上，這個節點代表一個片段，僅包含一個項目A。並且在該子節點上記錄這個片段的開始與結束時間。如果該節點不是根結點，而是一個代表片段乙的節點，首先看現在時間與該片段乙最後兩次所出現的時間，如果某次的開始時間與現在相同，我們便可產生一個子節點，表示一個新片段丙是片段乙的最後一個項目會和項目甲同時出現。如圖十二及圖十三所示。若其開始時間與現在時間差小於時間限制T，表示該次片段乙的出現與現在項目甲的是一個片段丁的出現，在此片段丁是指，片段乙後面接著一個項目B。為了要減緩字首樹不停地增長，我們採取了[44]所提的失真計算（Lossy Counting）的方法，就是每當輸入了固定的資料量之後，便將計算好次數通通減一。我們設定一個誤差值ε 小於最小的出現比例，每當處理過 1/ε 個項目組時，我們開始維護這個字首樹，我們將每種片段最早的出現區間去除。如果該節點並未任何出現

(30)

記錄，我們便把該節點與子樹通通刪除。如圖十四所示。圖十二：新增單一項目之片段圖十三：新增兩種新片段圖十四：ε=0.001, 時間 1000 時所有片段的時間標籤去掉一最早的一組然而在我們的問題中，設定ε 不是那麼簡單，因為 ε 不止影響我們計算片段出現的次數，還會影響到我們計算片段規則的信賴度，經過理論推導，失真計算可能會造成在信賴度上ε/min_sup 的相對誤差，所以合理的 ε 值約為 min_sup 的十分之一。最後對任兩個片段，我們可以拿出他們出現的時間標籤，求出符合條件的片段規則。方法二：字首樹與延遲資訊在上述的方法中，每個節點必須要記錄很長的時間標籤，此方法將時間標籤改成記錄延遲資訊。在每個節點，現在只留下了最後兩組出現的時間區間，以及小於最大延遲限制的開始時間，和一個記算出現次數的計數器，計算片段的方式跟上面一樣，但是處理項目B（見圖十五）時，對於一個表示片段乙的節點，我們會先求現在時間與片段乙記錄的小於最大延遲限制的開始時間之差，這個差，便是項目 B 對於片段乙的延遲。我們產生片段丁的節點表示片段乙之後出現項目B，這些資訊記錄就是在片段丁的節點上。要輸出片段規則，我們走訪過所有結點，將延遲時間次數比上父節點所代表的片段的次數大於最小信賴度，我們便可以輸出這些規則，這些片段規則的後項是只有單一項目。我們可以將這些規則經過組合後，產生出複雜的後項。如：我

(31)

們發現 <(AB)ÆC (延遲 5)>，＜(AB)ÆD (延遲 6)＞，我們便可產生＜ (AB)Æ(C)(D) (延遲 5)＞，我們可以藉由字首樹上記錄的(C)(D)出現次數來估計片段規則：＜(AB)Æ(C)(D) (延遲 5)＞是否有夠高的信賴度。圖十五：字首樹與延遲資訊方法三：字首樹與同時發生表格最後這個方法，是在系統資源較為不足時可以採用，我們維護(Lmax+T-1) 張表格，每一張表格的欄與列是經由失真計算之後，所滿足(min_sup－ε)的項目，除此之外還包含有一個變數Lag。Lag 為 i 的表格，在列為項目 A，欄為項目 B 的位置所記錄的值我們記為Count(AÆB, i)，是指 A 出現後 i 個單位時間 B 出現的這種情形的次數。如圖十六。除了每個項目組進來我們都維護這些表格外，我們還是建了一個字首樹，該樹的誤差值是min_sup，並且不記錄時間標籤與延遲資訊。用這些表格我們可以求出任兩個項目甲乙，所產生的片段規則甲Æ乙的信賴度。圖十六：方法三所使用的表格(Lag=1, Lag=2 的例子) 因此最後我可以對任兩個字首樹上的節點，估計出在不同延遲，他們所產生的片段規則的信賴度。如圖十七所示。圖十七：方法三所使用的字首樹誤差值是min_sup，並且不記錄時間標籤 與延遲資訊

(32)

如圖十八，有項目A、B、C、D，我們想知道 <(AB)(C)Æ(D) (延遲 i)>，我們便可以由字首樹知道(AB)(C)可能發生的次數，再查表格知 Count(AÆD, i) ， Count(BÆD,i)，Count(CÆD,i-1)的出現次數，再加上下列公式的值：

∑

_Ymin{Count(A→Y),Count(Y →B)}

取這些值的最小值，便可當成<(AB)(C)Æ(D) (延遲 i)>這個規則出現次數的估計，因此我們便可估計出這些規則的信賴度。圖十八：方法三中估計片段規則<(AB)(C)Æ(D) (延遲 i)>的方法藉由以上三個方法，我們可以線上快速地處理股票事件序列，並且提供高信賴度的片段法則。股價關聯分析及未來走勢預測在文獻[65]中，是以同時間的關聯作研究，而且是以一季作預測時間單位，所以並無法達到預測的效果與買賣的動作。因此，我們考慮分別使用技術指標與股價變化來計算股票之間的關聯度，並且以隔Ｎ天的股價走勢作為研究目標，利用求出的關聯度來發展出個別股票的買進與賣出推薦值。我們透過技術指標與股價變化來分別計算股票之間的關聯度，並且考慮了時間延遲問題，分別計算延遲一天、三天和五天的關聯度。例如：A 股票顯示為多頭時，B 股票在同一天、隔一天、隔三天和隔五天也會顯示為多頭的個別關聯度, 希望藉由不同時間的延遲結果與不同類型的關聯度，可以分析出最好的買賣策略。關聯度的求法是以條件機率的方法來求得。Ａ股票對於Ｂ股票的關聯度的計算方法是：當Ａ股票在一段時間間隔裡，由技術指標顯示為多頭的總日數中，Ｂ股票也顯示為多頭的機率。除此之外，為了判斷某一股票對其他股票的影響力，我們提出了兩種推薦值的計算方法，來作為買進與賣出的依據。方法一:機率模式以條件機率的方式，考慮所有兩兩股票之間的關聯度分布，訂出高度關聯的 threshold 值。依歷史資料裡，所有對 A 股票具有高度多頭關聯性的股票總數作為條件，以每日加總已成為多頭的高關聯度股票總數，因而可以計算出 A 股票 A C D

i

B Y Y B A

(33)

的當日買進推薦值與每日賣出推薦值。例如對於Ａ股票具高度關聯的總股票數有５０檔，而當天這５０檔股票有３０檔股票顯示為多頭時，則Ａ的買進推薦值為 30/50=0.6。方法二:PageRank 模式採取了 google[7]在判斷網頁重要性的方法而應用在股票之間推薦值的計算中。如 A 股票的買進推薦值，是由其他股票(B)對於 A 具有高度相關性的買進推薦值，依比率所累加出來的，比率是依照其他股票(B)對於全部股票市場具有高度關聯股票的總數作為依據。以圖十九為例，對於Ａ股票具備高度相關的有Ｂ、Ｃ、Ｄ三檔股票，所以Ａ股票的買進推薦值是由Ｂ、Ｃ、Ｄ個別的影響值所累加出來。而Ｂ股票對Ａ股票的影響值是由Ｂ股票的買進推薦值所分配出來，分配的原則是考慮Ｂ股票總共影響了幾檔股票總數。下圖中，Ｂ的買進推薦值為80 且總共對Ａ、Ｅ、Ｆ具備高度相關，所以Ａ、Ｅ、Ｆ個別可以從Ｂ中獲取80/3 的影響值。圖十九：PageRank 示意圖股票事件預測技術我們利用事件法則來當作查詢。一個事件法則的例子可以表示成αDβ如圖二十所示。其中α被稱為前項（predicate）而β稱為後項（consequent）。前項描述一集合的事件並形成一有向非循環圖。每一個頂點表示一個事件，而每一條從頂點u 至頂點v 的邊表示事件 u 必須發生在事件 v 之前。例如，在圖二十中，台積電和聯電必須上漲在聯發科上漲之前。注意，台積電和聯電上漲的先後順序沒有規定。後項為一個單一的事件。而此法則意味著，如果前項發生之後，台肥將在不久的將來下跌。另外，對於一事件法則都會附與兩個時間界限（time bounds），分別對整個法則與他的法則前項。我們稱對應在法則前項的時間界限為前項框架（predicate window），其用以規範所有在前項的事件必須出現在一個時間片斷範圍內。而另一個時間界限用以規範所有在法則中出現的事件，我們稱此時間界限為法則框架（rule window）。例如在圖二十中，如果所有在前項中事件發生在 10 分鐘內，則台肥會有很大的機率在15 分鐘內上漲。在本研究中，我們假設系統一個時間只接收到一個事件。令W，X，Y 和 Z 代表為台積電上漲，聯電上漲，聯發科上漲及台肥下跌等事件。圖二十一為一股票交易事件例子，其呈現從時間9:00 至 9:07 分的所事件。其中，在時間區段（time interval）[9:02, 9:05]比對到圖二十中的前項。所以，我們可以回覆使用者，事件

數位家庭助理之研究與實作(III)

行政院國家科學委員會補助專題研究計畫

■ 成 果 報 告

□期中進度報告

數位家庭助理之研究與實作(3/3)

Research and Implementation of Digital Home Assistants

計畫類別：■個別型計畫 □整合型計畫

計畫編號：NSC－96－2221－E－004－003－

執行期間：94 年 08 月 01 日至 97 年 07 月 31 日

計畫主持人：陳良弼

成果報告類型(依經費核定清單規定繳交)：□精簡報告

■

完整報告

本成果報告包括以下應繳交之附件：

□赴國外出差或研習心得報告一份

□赴大陸地區出差或研習心得報告一份

□出席國際學術會議心得報告及發表之論文各一份

□國際合作研究計畫國外研究報告書一份

處理方式：除產學合作研究計畫、提升產業技術及人才培育研究計畫、列

管計畫及下列情形者外，得立即公開查詢

□涉及專利或其他智慧財產權，□一年□二年後可公開查詢

執行單位：國立政治大學資訊科學系

中 華 民 國 97 年 10 月 31 日

數位家庭助理之研究與實作

(3/3)

Research and Implementation of Digital Home Assistants

中文摘要

目錄

一、前言

6

二、研究目的

8

三、文獻探討

11

四、研究方法

19

五、成果自評

37

參考文獻

表格目錄

圖片目錄

一、 前言

(一) 多媒體資料的查詢與處理

(二) 股票交易資料的分析與預測

二、 研究目的

(一) 多媒體資料的查詢與處理

(二) 股票交易資料的分析與預測

三、 文獻探討

(一) 多媒體資料的查詢與處理

∑

(二) 股票交易資料的分析與預測

四、 研究方法

(一) 多媒體資料的查詢與處理

(二) 股票交易資料的分析與預測

∑

i

■ 成果報告

中華民國 97 年 10 月 31 日

一、前言

二、研究目的

三、文獻探討

四、研究方法