實驗與成果 - 電腦麻將程式ThousandWind的設計與實作

則繼續再下去的話因各牌統計的比例已經趨於穩定，故效果就差不多了，這邊也可以發現只要少量的場次統計，就可以讓捨牌期望值的計算更加準確，當然也就代表勝率能夠有效的提升。

TCGA 2013 ThousandWind MAJO LongCat GrandSlam 7 將的總分 -23000 20500 61000 -58500 12 將的總分 28000 7000 75000 -110000 8 至 12 將的分數 51000 -13500 14000 -51500

表 4-1 TCGA 2013 的比賽結果

上表是 TCGA 2013 比賽時的紀錄，其中一將代表是 16 場的比賽，當中各玩家會輪流當莊家以及首家。因當時設定上的錯誤，使得我的程式直到第八將開始才開始利用統計結果來做動態權重的調整，這邊也可以發現，程式若沒有使用這樣的機制時，也就是前七將時，權重計算不準確，因此表現不佳，但在後半段的比賽卻有了大幅的進步，不只是一下子就爬到第二名的位置，甚至若只單看後半段的分數，我的程式是遠遠超過其他所有程式的。

而往後的比賽也可以嘗試套用過往統計出來的權重分數，畢竟假如其他家的習慣與我之前所統計的成果不同，我的程式也能在比賽過程中自動做調整，以應付各種情況。

4.2 避免放槍的機制

TAAI 2012 ThousandWind MAJO LongCat GrandSlam

胡別人牌 28 23 36 11

自摸 4 2 14 3

胡+自摸 32 25 50 14

放槍 17 29 21 31

表 4-2 TAAI 2012 的比賽結果

TCGA 2013 ThousandWind MAJO LongCat GrandSlam

胡別人牌 39 29 47 20

自摸 11 15 18 5

胡+自摸 50 44 65 25

放槍 21 37 29 48

表 4-3 TCGA 2013 的比賽結果

以上表 4-2 與表 4-3 是兩次比賽中胡牌與放槍的次數統計，這邊也可以發現我的程式在兩次比賽中的放槍率都是最低的，當然若是想降低放槍率，也很有可能一同將胡牌率也一起降低，因此很難看出這個方法的實際成效，不過以自己程式自動對下的成果來看，採用這項避免放槍的作法，大約可以降低 5%至 10%左右的放槍率，而胡牌率則只會下降 1%至 2%，從總分來說是有些成長。

4.3 大牌型的模擬

為了測試大牌型模擬的效果，測試方法設定為讓程式以通常打牌來看總分，

以及完全以特定牌型為目標來看總分，最後是採用模擬結果，比較期望值後來做決策是否常是大牌型，以這三種方式來看總分會有什麼樣的趨勢。

同時為了讓實驗效果明顯，我們將玩家的起手配牌作調整，讓實驗對象起手就能擁有加起來至少十二張的萬子與字牌，也就是起手就有些接近混一色的牌型，

而實驗場次為四十萬場，其中每一家也都會輪流當起使玩家。

決策方式 總分 胡牌次數

通常打牌 2393628 308494

採用模擬結果做決策 2586890 224924

完全以混一色為目標 2293808 152701

表 4-4 採用混一色模擬決策的結果

這邊可以發現，當嘗試以混一色為目標在打牌時，必然胡牌次數會下降，因為捨牌並不是當下最佳期望值的捨牌，但是因為胡到混一色的次數上升，所以分數也有所提高，但是完全以混一色為目標時，也因為胡牌次數減少太多，因此較

使得分數反而下降，在這樣的實驗環境下，採用模擬結果來做決策的方法大約比平常打牌多上約百分之十的分數，就實驗結果來看這模擬方法是有效果的。

同樣我們可以比照混一色的模擬方式，來進行清一色的實驗，同樣遊戲會進行四十萬場，同時為了提高實驗效果，我們也是將玩家的起始手牌作調整，設定成一開始就會擁有至少十二張的萬子，也就是接近清一色的牌型，同樣進行正常的捨牌、完全以清一色為目標、以及採用模擬結果來做決策。

決策方式 總分 胡牌次數

通常打牌 2388649 308073

採用模擬結果做決策 3493625 272829

完全以清一色為目標 2751314 164233

表 4-5 採用清一色模擬決策的結果

這邊同樣可以看到是以模擬結果來做決策的效果最好，甚至比上正常打牌足足有高達百分之三十的成效，當然從完全以清一色為目標來看都有些許變好，這邊可以推論是這樣的配牌很容易導致清一色的胡牌，不過就算這樣也是可以看出以模擬的效果會來的比一味的嘗試還要好。

在文檔中電腦麻將程式ThousandWind的設計與實作 (頁 45-50)