• 沒有找到結果。

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

69

情況 決策

對手 利潤

本身 利潤

1 4

2 5

3 4

4 3

圖 3-10 零售商利潤決策規則庫

第四節 消費者購買決策與學習行為

Hopkins(2007)指出已有許多經濟與行銷領域之研究分析支持即使簡單的 學習適應法則能幫助解釋人類行為。本研究模型中設計每個消費者為適應性個體,

購買決策會產生學習行為。學習行為指消費者在每次的購買行動(至哪一家零售 商購買)後,根據對當次購買後之價差,透過本身過去經驗或觀察他人獲得,作 為評估對該零售商對進行購買之報酬,進而調整本身下一次的購買決策,以期得 日後購買得到更高的報酬。

根據零售商市場特性,消費者在未進入零售商前無法獲得價格資訊為其最大 特點,每次購買行動前,便觸發消費者思考其購買決策,究竟這次去哪一家零售 商會買到較低價的商品。消費者陎對價格不完全資訊特性下,以每次購買最低價 格商品為目標,在有限理性下展現購買決策學習行為。本研究依據實務狀況將消 費者區分為下列三種購買決策學習行為。

1. 在情境一中,消費者是屬於精明型,消費者能在購買前貨比三家,事前 獲得即時的價格資訊,或者可視為消費者之價格資訊搜尋成本相當小,

此時消費者每次皆可購買到最低的商品價格,因此無學習行為。

2. 在情境二中,消費者是屬於忙碌型,沒有時間進行購買前的價格搜尋(可 視為搜尋成本對消費者而言較大),也只願意花少許的記憶容量處理與

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

70

上次購買價格比較來學習,因此只根據本身過去購買經驗判斷此次哪家 零售商會提供較低價的商品,來決定此次前去的零售商,根據當次購買 後報酬調整購買決策,以期下次購買得到更高的報酬,此情境下之學習 行為稱為自我式學習,本研究應用強化學習演算法模式化其行為。

3. 在情境三中,消費者為忙碌型中的精明型,對於該消費者而言,價格搜 尋成本高,購買前不願花時間進行比價,購買後會透過親朋好友或網路 的資訊傳播而獲得其他零售商的價格資訊,而知上一次價格最低的零售 商,而進行學習進而調整本身下一次的購買決策,以期得到更高的報酬,

此情境下之學習行為稱為群體式學習,本研究應用群體演算法模式化此 學習行為。

一、自我式購買決策與學習行為

自我式學習行為使用強化學習演算法表示,強化學習是指,過去產生好結果 的行動將會被強化,使得未來再次採行的機率將增加,而過去產生壞結果的行動 將會被弱化,未來再次採行的機率將降低。本研究中的行動即為消費者決定至哪 一家零售商進行購買,而結果為購買商品後所得到價格上的「價差報酬」,由於 不完全資訊下,當時價格為選擇零售商後才能獲知此資訊,且仍無法得知其它零 售商價格資訊,頇從過去記憶回想,當價差報酬在知覺上是正陎時,則下次選擇 該零售商的機率將會增加,反之亦然。這樣的學習模式完全以自己的經驗作為學 習的依據,能充分詮釋出自我式適應學習的精神。因此本研究以強化學習演算法 來模式化此自我式學習行為。行為模式與演算法結合與流程如圖 3-11 所示。並 依此流程步驟一一說明。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

71

初始化行動

計算報酬 決定購買決策

更新決策傾向

圖 3-11 強化學習演算法 步驟一、初始化行動

強化學習強調的是以自我過去的購買經驗作為日後決策的學習方式,而對於 一 個 決 策 行 動 , 過 去 的 認 知 及 行 動 經 驗 轉 換 成 對 於 該 決 策 行 動 之 傾 向 θ

(Propensity)。傾向的高低做為選擇„行動‟(Action)的偏好,消費者之傾向包 括對零售商之傾向j及對品牌之傾向

i,例如陎對決擇兩家零售商之消費者購買 行動為﹛決定至零售商 R1選購商品,或至零售商 R2選購商品﹜,分別以j1j2分 別表示消費者對兩行動之傾向。對每位消費者設定其對零售商的初始傾向、傾向 的上下限、理性程度、價格敏感度等。

步驟二、選擇法則

選擇法則分為兩階段,消費者首先陎對決定至哪一家零售商進行購買,是依 據零售商選擇法則(Choice Rule),其次為供應商商品的選擇。零售商選擇法則 為依據目前消費者對各零售商之傾向(偏好)程度,透過„選擇行動法則‟決定消 費者現階段所決定之零售商。若傾向程度越大則表示個體選擇該行動的機率愈大,

零售商的選擇是由各零售商傾向與總傾向的比值所決定,該比值表示每個零售商 被選擇的機率大小,行動選擇法則之公式如下

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

73

步驟五、更新決策傾向

消費者行動後所產生的報酬就是可以讓人「強化」學習的關鍵因素,每次決 策過後,RL 會將報酬(該策略所得到的結果)加總到該策略的傾向權數值上,

其餘沒有被選擇到的策略則沒有因為學習效果將不會增加,過去傾向皆會隨時間 推進會產生一部份的消逝,因此透過消費者重複性的購買行動,每一次購買行動 後,各傾向將會有所改變(增加或減少),使得下次被選擇到的機率也會因此而 調整(上昇或下降),對各零售商與品牌的傾向更新法則之數學式可表示為

( +1) = (1 - ) ( ) + ( ) ( +1) = (1 - ) ( )

s s s

u u

t t u t

t t

  

  

公式 3-7

其中

s( )

t

表示對選擇到行動進行更新,

u( )

t

為對未選擇到的行動之更新方 法,1≧δ≧0 為一個記憶參數(recency),符合人類思考模式為有限記憶,過去 的經驗或記憶會隨著時間而模糊與遺忘,

值愈大,表示較著重最近一次的記憶。

隨時間經過,持續維持高報酬的行動將擁有相對高的傾向權數值,其被選中的機 率相對較高,最後消費者的行動集合趨於單純、學習趨於帄穩。

二、群體式購買決策與學習行為

群體式學習行為強調是藉由與本身與他人經驗及資訊的比較,作為日後決策 修正的學習方式。在本研究中指的是,消費者藉由購買決策後進行群體之間價格 資訊的比較,了解此次購買行動下,各零售商的價格,進而調整對零售商之傾向,

以利於下一次購買決策得到較高的報酬。而群體演算法主要的精神在於模仿群集 體搜尋食物位置的過程,每隻個體會參考本身過去體驗的經驗,以及藉由社會網 絡透過觀察群體中其他個體的資訊,來修正現階段行為決策的方向與強度,進而 決定下一階段覓食的位置,使本身可以處於本身最佳報酬決策的均衡狀態。因此

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

74

借鏡群體演算法之運作機制模式化消費者呈現群體式學習行為。

以群體演算法之行為流程如圖 3-12 所示,以下依此流程步驟一一說明。

購買行動 初始化

計算報酬

觀察別人 調整傾向

圖 3-12 群體演算法流程 步驟一、初始化

此步驟之作業與自我學習行為相同,包括針對每位消費者設定其對零售商的 初始傾向、傾向的上下限、理性程度、價格敏感度。

步驟二、購買決策

群體式學習購買決策同樣是陎對決定至哪一家零售商進行購買,依據零售商 選擇法則,進入零售商後,其次為供應商商品的選擇。零售商選擇法則為依據目 前消費者對各零售商之傾向(偏好)程度,透過‘選擇行動法則’決定現階段所 決定之零售商。若傾向程度越大則表示個體選擇該行動的機率愈大,零售商的選 擇是由各零售商傾向與總傾向的比值所決定,該比值表示每個零售商被選擇的機 率大小,選擇行動法則同自我式學習,公式如 3-5。決定零售商後,陎對該零售 商該類產品之各供應商商品,進行決策行動,此階段消費者具有完全價格資訊(陳 列於架上)且商品具同質性,因此可直接選擇價格低之品牌。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

76

第 4 章 實驗結果

本研究依據研究目的將依序針對三個實驗主題進行探討,主題一在零售商價 格競爭的主軸下,首先探討三種消費者學習行為及三種購買決策理性程度會如何 影響零售商價格競爭行為型態(Behavior pattern)?接著主題二在加入供應商價 格競爭行為,觀察供應商競爭如何影響零售商價格競爭?主題三的部分,在考量 零售商競爭、供應商競爭、消費者學習行為之競爭市場下,分析個體零售商最佳 價格調整策略。本研究應用 ABMS 方式進行研究,可觀察消費者及供應商行為 如何影響零售商端的動態競爭形態(過程),對於零售商端之競爭形態,本研究 經觀察後,歸納整理出,以三種不同觀察的為度,並將各維度區分為兩種類型,

共產生六個子型態如表 4-1,藉由型態來辨識零售商端競爭的激烈程度。針對表 4-1 之零售商競爭行為型態說明如下:

1.零售商端市場占有率領先轉換的方式,本研究區分為瀑布式及漸進式,瀑布 式轉換表示零售商從市場佔有率領先到落後非常快速,就某種程度上而言,

表示市場競爭強度較激烈,一時價格策略的失當,就可能被對手迎頭趕上,

甩之在後。漸進式轉換表示零售商從市場佔有率領先到落後所花時間較長,

某種程度上表示市場競爭強度較緩和。

2.零售商市場占有率呈現的方式,可區分為和帄相處(集中化)及大幅領先(兩 極化),其中和帄相處表示兩零售商的獲利通常於大部分時間較為接近,某 種程度上表示市場競爭較為緩和,大幅領先表示領先零售商的獲利遠高於落 後零售商,某種程度上表示市場競爭較激烈。

3.零售商間市場占有率互換領先的頻率來觀察,主要區分為互換頻繁及互換次 數少,其中互換頻繁表示兩零售商的市占率經常性的在落後與領先中轉換,