消費者購買決策與學習行為 - 考量消費者適應學習與供應商洩密行為之零售商價格競爭模式之研究

Hopkins（2007）指出已有許多經濟與行銷領域之研究分析支持即使簡單的學習適應法則能幫助解釋人類行為。本研究模型中設計每個消費者為適應性個體，

購買決策會產生學習行為。學習行為指消費者在每次的購買行動（至哪一家零售商購買）後，根據對當次購買後之價差，透過本身過去經驗或觀察他人獲得，作為評估對該零售商對進行購買之報酬，進而調整本身下一次的購買決策，以期得日後購買得到更高的報酬。

根據零售商市場特性，消費者在未進入零售商前無法獲得價格資訊為其最大特點，每次購買行動前，便觸發消費者思考其購買決策，究竟這次去哪一家零售商會買到較低價的商品。消費者面對價格不完全資訊特性下，以每次購買最低價格商品為目標，在有限理性下展現購買決策學習行為。本研究依據實務狀況將消費者區分為下列三種購買決策學習行為。

1. 在情境一中，消費者是屬於精明型，消費者能在購買前貨比三家，事前獲得即時的價格資訊，或者可視為消費者之價格資訊搜尋成本相當小，

此時消費者每次皆可購買到最低的商品價格，因此無學習行為。

2. 在情境二中，消費者是屬於忙碌型，沒有時間進行購買前的價格搜尋（可視為搜尋成本對消費者而言較大），也只願意花少許的記憶容量處理與上次購買價格比較來學習，因此只根據本身過去購買經驗判斷此次哪家零售商會提供較低價的商品，來決定此次前去的零售商，根據當次購買後報酬調整購買決策，以期下次購買得到更高的報酬，此情境下之學習行為稱為自我式學習，本研究應用強化學習演算法模式化其行為。

3. 在情境三中，消費者為忙碌型中的精明型，對於該消費者而言，價格搜

尋成本高，購買前不願花時間進行比價，購買後會透過親朋好友或網路的資訊傳播而獲得其他零售商的價格資訊，而知上一次價格最低的零售商，而進行學習進而調整本身下一次的購買決策，以期得到更高的報酬，

此情境下之學習行為稱為群體式學習，本研究應用群體演算法模式化此學習行為。

一、自我式購買決策與學習行為

自我式學習行為使用強化學習演算法表示，強化學習是指，過去產生好結果的行動將會被強化，使得未來再次採行的機率將增加，而過去產生壞結果的行動將會被弱化，未來再次採行的機率將降低。本研究中的行動即為消費者決定至哪一家零售商進行購買，而結果為購買商品後所得到價格上的「價差報酬」，由於不完全資訊下，當時價格為選擇零售商後才能獲知此資訊，且仍無法得知其它零售商價格資訊，須從過去記憶回想，當價差報酬在知覺上是正面時，則下次選擇該零售商的機率將會增加，反之亦然。這樣的學習模式完全以自己的經驗作為學習的依據，能充分詮釋出自我式適應學習的精神。因此本研究以強化學習演算法來模式化此自我式學習行為。行為模式與演算法結合與流程如圖 3-11 所示。並依此流程步驟一一說明。

圖 3-11 強化學習演算法據零售商選擇法則（Choice Rule），其次為供應商商品的選擇。零售商選擇法則為依據目前消費者對各零售商之傾向（偏好）程度，透過‘選擇行動法則’決定消

對該零售商該類產品之各品牌商品，進行選擇品牌的決策行動，此階段消費者直

其中



_s( )

t

表示對選擇到行動進行更新，



_u( )

t

為對未選擇到的行動之更新方法，1 δ 0 ≧ ≧ 為一個記憶參數（recency），符合人類思考模式為有限記憶，過去的經驗或記憶會隨著時間而模糊與遺忘，值愈大，表示較著重最近一次的記憶。

隨時間經過，持續維持高報酬的行動將擁有相對高的傾向權數值，其被選中的機率相對較高，最後消費者的行動集合趨於單純、學習趨於平穩。

二、群體式購買決策與學習行為

群體式學習行為強調是藉由與本身與他人經驗及資訊的比較，作為日後決策修正的學習方式。在本研究中指的是，消費者藉由購買決策後進行群體之間價格資訊的比較，了解此次購買行動下，各零售商的價格，進而調整對零售商之傾向，

以利於下一次購買決策得到較高的報酬。而群體演算法主要的精神在於模仿群集體搜尋食物位置的過程，每隻個體會參考本身過去體驗的經驗，以及藉由社會網絡透過觀察群體中其他個體的資訊，來修正現階段行為決策的方向與強度，進而決定下一階段覓食的位置，使本身可以處於本身最佳報酬決策的均衡狀態。因此借鏡群體演算法之運作機制模式化消費者呈現群體式學習行為。

以群體演算法之行為流程如圖3-12 所示，以下依此流程步驟一一說明。

圖 3-12 群體演算法流程步驟一、初始化

此步驟之作業與自我學習行為相同，包括針對每位消費者設定其對零售商的

初始傾向、傾向的上下限、理性程度、價格敏感度。

, t



k j ：消費者 k 現階段對各零售商 j 之傾向。

t t

g k j

p p ：消費者所知覺到的價差感受。

第二年計畫

供應商洩密（leakage）行為對於供應商及零售商的影響?零售商是否有策略可應對供應商的洩密行為?零售商透過觀察供應商的批發價格，如何影響的零售價的制定?最後，零售商如何應對供應商所透露的資訊進行訂購量的決定? 及需求預測資訊的洩密，對於資訊擁有之零售商的影響?針對以上問題，我們試圖提出一個以零售商與供應商互動架構之模擬模式。第二年我們接續第一年同樣之 ABMS 架構下（零售商與消費者），加入供應商擴展成一資訊不對稱之三階供應鏈結構，同樣以適應性個體（Adaptive Agent）代表供應商。此供應鏈中各零售商擁有其私有需求預測資訊，並與供應商進行資訊分享，供應商根據零售商所提供之資訊制定批發價格，然而供應商有動機決定洩密（leakage）決策，例如釋放高需求資訊之訊息，增加其訂單，最後零售商根據批發價格進行定價與訂購行為。

各成員在最大化本身利益下，我們以重複訊息賽局（signaling game）作為三方互動模式的基礎，模式化其動態地互動，讓供應商及零售商在每次互動後，根據決策行為之報酬修改其決策之演譯-歸納法則，可以藉此模式分析加入供應商的資訊分享與洩密行為，對零售商價格競爭的影響。最後期望提出一套整合消費者適應學習模式與供應商洩密模式之價格競爭模擬模式，以決策支援的角度提供零售商制定價格策略之參考。

在文檔中考量消費者適應學習與供應商洩密行為之零售商價格競爭模式之研究 (頁 80-87)