No Free Lunch 檢驗 - 學習能力的最終表現 - 計算力限制對經濟決策影響之分析

學習能力的最終表現

5.3.2 No Free Lunch 檢驗

在計算理論中^, 有一個相當著名的理論叫「無免費午餐理論」 (No Free Lunch Theorem, 以下稱作 ^NFL)。這個理論是由 Wolpert and Macready (1995b) 及 Wolpert and Macready (1995a) 首先提出。對於搜尋或最適化的問題^{, NFL} 理論指出在考量所有可能的問題後^, 每一個用來求解的演算法的表現平均而言是相同的。也就是說^, 沒有一個策略是可以全面性地適用於所有的問題^:

“We show that all algorithms that search for an extremum of a cost function perform exactly the same, when average over all possible cost functions. In particular, if algorithm A outperforms algorithm B on some cost functions, then loosely speaking there must exist exactly as many other functions where B outperforms A.” (Wolpert and Macready, 1995b)

這是很強的一個結論^,它說明了即始是隨機的策略^,也可以在解決某些問題上勝過其他的演算法。沒有一個演算法可以在每一個可能的問題上都能做得比別的演算法來得好^, 再白話點說^, 就是有一好沒兩好^, 因此這個理論便被命名為「無免費午餐理論」。

根據這個理論^, 既然所有的演算法表現平均而言皆相同^, 意即不存在一個具有普遍優勢的演算法的話^, 我們花費在尋找字宙間最佳演算法的精力便會是徒勞無功的。那我們還需要做什麼呢^? 是不是隨便選一個演算法就好^? 還是既然不存在最佳的演算法^, 人們就可以根據個人喜好恣意選擇想要使用的演算法^?

恰恰相反的是^{, NFL} 理論告訴我們不存在普遍最佳演算法的原因^, 是每個演算法都會在某些問題上表現較佳^, 而在解決其他問題上則不盡理想。因此^, 我們有需要針對不同的問題來尋找適合該問題的演算法^,而這樣的作法^,會比仰賴一個一般性的演算法來得好。如圖 ^5.10 所示^, 針對當前問題設計一個合適的求解法^, 毋需考慮該求解法在其他問題上的表現。

5.3 學習性個體 ¹⁰⁹

Performance

Type of Problems general-purpose algorithm Highly specialized algorithm

圖 ^5.10: ^NFL示意圖

雖然我們的實驗目的並不在於驗證 ^NFL的正確性^, 不過^NFL理論卻為我們帶來了一個十分有趣的問題^: 我們知道許多文獻上搜集而得的策略^, 其設計目的便是在一定範圍的市場環境中^,在已知的問題框架中設法極大化交易者的獲利^,因此可以說是一種針對雙方喊價市場的客製化求解策略。但是在我們的實驗結果中 GP 交易者的平均表現的確有可能勝過其他交易策略^, 這是否代表 ^GP 在每一個市場中都可以擊敗其他交易策略^,代表存在著免費的無餐呢^? 換句話說^, 我們想知道^GP是否是一個普遍較優的交易演算法^,是否不管市場形態為何^{, GP}都能後來居上^, 拔得頭籌^?

從平均財富及財富變異的觀點來看^,如果真的有白吃的午餐^,代表不論是何種市場^{, GP} 最後都能拔得頭籌^, 而與市場環境無關。在這種情況下^, 如果將 ^GP 最終的表現放到如同圖 ^5.9 的空間中^, 我們應該可以看到 ^GP跳脫「高利潤高變異」

的規範^,進而達成「高利潤低變異」的創舉^, 獨自落在效率前緣的左上方。

為了檢驗這個效果是否存在^, 我們將所有交易者的首期及末期之平均財富與財富變異繪於圖 ^5.11 中。⁸

8圖^5.11與圖^5.9的差別在於圖^5.9 繪製的是從頭到尾平均的結果^,而圖^5.11僅將期初及期末兩個時間點的表現繪製出來。

5.3 學習性個體 ¹¹¹ 圖中同樣形式但較小的標示為期初的表現^, 較大且有陰影的標示為期末表現^, 我們用箭頭將其相連以顯示出變化的方向。由圖 ^5.11 可以看出以下有趣的現象^: 首先^{, GP} 並沒有突破「高利潤高變異」的法則^, 相反地^, 隨著 ^GP 交易者的學習與平均財富的增長^, 財富變異反而是愈來愈大的。而且不僅^GP交易者如此^, 幾乎所有的交易策略連退步時都遵循著這個法則^, 而沿著右上^–左下的方向變動。

圖^5.11告訴我們^GP交易者的表現還是與市場環境習習相關。但表現與市場習習相關^,也不能充份說明^GP交易者的表現到底是普遍地優於其他交易策略^,還是如同圖 ^5.10 所示的在某些市場中表現特優^, 但在大多數市場中則表現普通。如果是前者^{, GP} 交易者的財富變異雖大^, 但大多數都比其他人好^, 是一種較為理想的情況^;如果是後者的話^{, GP} 交易者財富的高變異性就是一種十分不好的特質。

GP 交易者表現較好的可能性有^{: (1) GP} 交易者獲勝的次數本來就多^{; (2)} GP交易者獲勝次數有限^,但可以靠著有限次數內的大量領先來拉抬整體平均。為了檢驗這點^, 我們改採計算排名的方式^, 以去除掉獲利水準值的影響。表 ^5.3 列出了各個智商水準下^{, GP}交易者在^p5L、^p20L、^p50L這三個實驗的期末平均排名。

數字愈低^, 就代表拔得頭籌的次數愈多。由表可知 ^GP 交易者的平均排名皆為第一^,代表了 ^GP交易者在絕大部分的情況下最後都是表現最佳的策略。

在文檔中計算力限制對經濟決策影響之分析 (頁 128-131)