如何實際應用模糊增強式學習

從本研究得知，模糊增強式學習確實是可以應用在坦克類型遊戲之中，但是數位遊戲有很多類型，在不同的遊戲類型可能會有不同的應用情形。

1.

第一人稱遊戲類型

例如在第一人稱射擊遊戲中就可以本研究所做的路徑搜尋功能，第一人稱射擊遊戲中的 NPCs 跟坦克對戰類型遊戲有異曲同工之妙，NPCs 都需要知道去避開危險，找到一條安全且可以擊敗的玩家的路徑，不同的是第一人稱射擊遊戲通常會更複雜，會有更多因素來影響NPCs 的決定，例如與玩家的距離、武器的不同、是否要與玩家硬碰硬等等，要將更多的因素加入路線危險程度的考慮，但是同樣的是可以讓模糊增強式學習成為NPCs 選擇路徑的一個依據，讓 NPCs 有更具人性化的行動表現。

2.

角色扮演類型

如果是以目前最熱門的線上角色扮演類型的遊戲，或許可以將模糊增強式學習技術應用在敵方NPCs 的出招模式上，在此類型的遊戲中，最吸引玩家的過程通常是集合許多玩家一起去打敗強大的敵方頭目(NPCs)來取得稀有的物品獎勵，而不同的 NPCs 可能就會有不一樣的行為模式，雖然同樣的一個 NPC 可能會有許多不同的行為，但是不同的行為通常會是隨機產生的，因此玩家在玩過幾次後通常會知道 NPC 會有哪幾種行為，該如何避開NPC 的招式，所以玩過幾次後打頭目 NPC 的過程就變成有固定的模式且不斷重複的無趣過程，遊戲公司也必須要一直出更多不同的場景與不同的NPCs 來因應玩家的需求，因此如果能讓NPCs 都具有模糊增強式學習的人工智慧，讓 NPCs 可以學習到玩家的行為，進而選擇不同的行為模式，就可以讓遊戲變得更有趣，延長遊戲的壽命。

3.

即時戰略遊戲類型

以即時戰略類型遊戲而言，模糊增強式學習可以應用在 NPC 的出兵選擇上，在此類型的遊戲中，兵種的相剋是取得勝利的一個重要因素，但是玩家常會異想天開的發展出許多不同的兵種來做搔擾戰術，如果要用規則基礎方法來做NPCs 人工智慧技術的話，可能需要很非龐大的程式碼才能達到目標，而且這類型的遊戲會不斷的更新以求平衡，如此一來各個兵種在不同的版本可能會有不一樣的功能，但NPCs 卻不會像人類玩家一樣用經驗去學習在不同版本情形下的玩法，如果有增強式學習的技術，也就可以不需要重新寫NPCs 的人工智慧程式碼，而是直接讓 NPCs 去學習玩家的玩法，並且做出相對應的兵種來剋制玩家的玩法，如此一來就可以讓遊戲更具挑戰且有趣。

4.

回合式戰略類型遊戲

在回合式戰略類型遊戲中，通常玩家會挑戰同樣的一個局面很多次，想出不同的戰略來打贏電腦，就像是下一盤棋一樣，因此，這類型遊戲的流程非常適用增強式學習技術，如果可以讓NPCs 學習到移動不同的棋子(或遊戲中電腦所控制的兵力)時，玩家會有怎樣不同的反應，並且瞭解到玩家曾出現過的怪招，就可以加強難度，並且讓玩家更具挑戰，畢竟這類型的遊戲就是要讓玩家不斷的嘗試不同的戰略去取得勝利，因此增強式學習會非常適用。

5.

其他類型

除此之外，還可以應用在許多不同種類的遊戲之中，但是最主要的應用在於當 NPCs 要選擇如何應對玩家的行為時，如以上所提到的 NPCs 要選擇不同的路徑避開玩家，或是選擇不同的招式來打敗玩家等等，這也就是玩家想要遊戲中NPCs 具有人工智慧技術的一大原因，只要NPCs 應對玩家行為可以更人性化且聰明，那就會讓玩家覺得自己並不是在跟單調的電腦玩，而是一個會思考的機器，如此一來就可以增加遊戲的耐玩性與樂趣。

雖然增強式學習技術可以應用在許多不同類型的的遊戲中，但仍然有許多不合適的類型，像是：

6.

運動遊戲類型

在運動遊戲類型中，大部份的NPCs 行為模式都非常複雜，而且常常不只有一兩個行為目標，同時運動遊戲類型的玩家常常是兩個人以上，在此種情形下，要應用增強式學習技術可能會非常的困難，除了要有更複雜的演算法之外，還不一定可以有很好的效率，如果要應用增強式學習技術的話，可能就要限制許多的條件。

7.

動作遊戲類型(如格鬥遊戲等)

增強式學習技術在動作遊戲類型中會非常的不適用，如同運動遊戲類型一樣，動作遊戲類型有太複雜的行為模式，且這類型的遊戲的NPCs 並不需要太聰明或是複雜的行為，通常只需要幾種簡單的行為，讓玩家在玩的過程中知道如何擊敗，並因此取得快感，如果NPCs 具有太強大的學習能力，會讓遊戲變得太過複雜與困難，反而失去樂趣。

4.8 本章小結

從本章對於模糊增強式學習的一個前導實驗中可以看出以下幾點：

I. 模糊增強式學習的一個實作中可以看出，增強式學習確實可以讓 NPC 坦克在一段時間內找到一條正確的路線，

II. 用模糊獎懲機制去取代固定獎懲機制可以提高增強式學習的效率，

III. 另外，模糊隸屬函數的選擇可以改變 NPCs 的學習模式，但是並無規律可尋，

在不同的遊戲環境下可能需要不同的隸屬函數來改變NPCs 的行為模式。

此外，本研究也實際的做出了一個坦克對戰的遊戲，在遊戲中的 NPC 坦克具有模糊增強式學習的能力，NPC 坦克依據不同環境(障礙物與玩家行為)下做出不同的反應，

讓玩家覺得 NPC 坦克是具有智慧的。從實驗中就可以看出模糊增強式學習確實可應用在數位遊戲之上，並且也可以有很好的效率。

第5章結論

本章將對本研究所獲得之結果進行總結與討論，從前導實驗中可以看出增強式學習的效果，以及模糊理論提高效率的成果，實驗的結果也證明了本研究的研究假設，以下各節將依序對於本研究做一個整體的結論，以及探討如何應用模糊增強式學習在不同類型的遊戲之中，最後是本研究的各種限制與未來可以發展的研究議題。

在文檔中應用模糊增強式學習技術於數位遊戲之研究 (頁 52-56)

1.

2.

3.

4.

5.

6.

7.

4.8 本章小結

第5章 結論

第5章結論