學習能力的最終表現
5.3.2 No Free Lunch 檢驗
在計算理論中, 有一個相當著名的理論叫 「無免費午餐理論」 (No Free Lunch Theorem, 以下稱作 NFL)。 這個理論是由 Wolpert and Macready (1995b) 及 Wolpert and Macready (1995a) 首先提出。 對於搜尋或最適化的問題, NFL 理 論指出在考量所有可能的問題後, 每一個用來求解的演算法的表現平均而言是相 同的。 也就是說, 沒有一個策略是可以全面性地適用於所有的問題:
“We show that all algorithms that search for an extremum of a cost function perform exactly the same, when average over all possible cost functions. In particular, if algorithm A outperforms algorithm B on some cost functions, then loosely speaking there must exist exactly as many other functions where B outperforms A.” (Wolpert and Macready, 1995b)
這是很強的一個結論,它說明了即始是隨機的策略,也可以在解決某些問題上 勝過其他的演算法。 沒有一個演算法可以在每一個可能的問題上都能做得比別的 演算法來得好, 再白話點說, 就是有一好沒兩好, 因此這個理論便被命名為 「無免 費午餐理論」。
根據這個理論, 既然所有的演算法表現平均而言皆相同, 意即不存在一個具有 普遍優勢的演算法的話, 我們花費在尋找字宙間最佳演算法的精力便會是徒勞無 功的。 那我們還需要做什麼呢? 是不是隨便選一個演算法就好? 還是既然不存在 最佳的演算法, 人們就可以根據個人喜好恣意選擇想要使用的演算法?
恰恰相反的是, NFL 理論告訴我們不存在普遍最佳演算法的原因, 是每個演 算法都會在某些問題上表現較佳, 而在解決其他問題上則不盡理想。 因此, 我們有 需要針對不同的問題來尋找適合該問題的演算法,而這樣的作法,會比仰賴一個一 般性的演算法來得好。 如圖 5.10 所示, 針對當前問題設計一個合適的求解法, 毋 需考慮該求解法在其他問題上的表現。
5.3 學習性個體 109
Performance
Type of Problems general-purpose algorithm Highly specialized algorithm
圖 5.10: NFL示意圖
雖然我們的實驗目的並不在於驗證 NFL的正確性, 不過NFL理論卻為我們 帶來了一個十分有趣的問題: 我們知道許多文獻上搜集而得的策略, 其設計目的 便是在一定範圍的市場環境中,在已知的問題框架中設法極大化交易者的獲利,因 此可以說是一種針對雙方喊價市場的客製化求解策略。 但是在我們的實驗結果中 GP 交易者的平均表現的確有可能勝過其他交易策略, 這是否代表 GP 在每一個 市場中都可以擊敗其他交易策略,代表存在著免費的無餐呢? 換句話說, 我們想知 道GP是否是一個普遍較優的交易演算法,是否不管市場形態為何, GP都能後來 居上, 拔得頭籌?
從平均財富及財富變異的觀點來看,如果真的有白吃的午餐,代表不論是何種 市場, GP 最後都能拔得頭籌, 而與市場環境無關。 在這種情況下, 如果將 GP 最 終的表現放到如同圖 5.9 的空間中, 我們應該可以看到 GP跳脫 「高利潤高變異」
的規範,進而達成 「高利潤低變異」 的創舉, 獨自落在效率前緣的左上方。
為了檢驗這個效果是否存在, 我們將所有交易者的首期及末期之平均財富與 財富變異繪於圖 5.11 中。8
8圖5.11與圖5.9的差別在於圖5.9 繪製的是從頭到尾平均的結果,而圖5.11僅將期初及期 末兩個時間點的表現繪製出來。
GP
5.3 學習性個體 111 圖中同樣形式但較小的標示為期初的表現, 較大且有陰影的標示為期末表現, 我們用箭頭將其相連以顯示出變化的方向。 由圖 5.11 可以看出以下有趣的現象: 首先, GP 並沒有突破 「高利潤高變異」 的法則, 相反地, 隨著 GP 交易者的學習 與平均財富的增長, 財富變異反而是愈來愈大的。 而且不僅GP交易者如此, 幾乎 所有的交易策略連退步時都遵循著這個法則, 而沿著右上–左下的方向變動。
圖5.11告訴我們GP交易者的表現還是與市場環境習習相關。 但表現與市場 習習相關,也不能充份說明GP交易者的表現到底是普遍地優於其他交易策略,還 是如同圖 5.10 所示的在某些市場中表現特優, 但在大多數市場中則表現普通。 如 果是前者, GP 交易者的財富變異雖大, 但大多數都比其他人好, 是一種較為理想 的情況;如果是後者的話, GP 交易者財富的高變異性就是一種十分不好的特質。
GP 交易者表現較好的可能性有: (1) GP 交易者獲勝的次數本來就多; (2) GP交易者獲勝次數有限,但可以靠著有限次數內的大量領先來拉抬整體平均。 為 了檢驗這點, 我們改採計算排名的方式, 以去除掉獲利水準值的影響。 表 5.3 列出 了各個智商水準下, GP交易者在p5L、p20L、p50L這三個實驗的期末平均排名。
數字愈低, 就代表拔得頭籌的次數愈多。 由表可知 GP 交易者的平均排名皆為第 一,代表了 GP交易者在絕大部分的情況下最後都是表現最佳的策略。