混沌理論在資料探勘上的應用-以國內某藥品公司之客戶信用分析為例
100
0
0
全文
(2) 摘. 要. 企業要能夠穩健的經營,除了追求利益以創造其存在的價值之外,任 何有可能影響到企業營運的因素都為企業所不容忽視。本研究是利用一般 企業內資訊系統所能夠取得的交易歷史資料進行資料探勘(Data Mining), 以混沌理論為理論基礎研究客戶交易行為與客戶發生跳票問題間的關係, 並找出客戶發生信用問題的特徵,以避免增加企業不必要的營運成本與降 低經營風險,並藉由健全交易客戶的信用體質,達到加強企業與客戶間合 作關係的目的。 經由研究結果顯示,客戶交易行為存在著混沌現象的特性,利用李雅 普諾夫指數分析與 R/S 分析所得到的相關指數變化,歸納出正常客戶交易 行為的樣板,做為檢驗客戶異常交易行為的檢驗指標,並初步建立一套客 戶信用交易之預警機制,在具備足夠的客戶交易記錄的條件下,可有效的 篩選出發生退票行為的客戶。利用預警機制搭配一般企業所採用的信用管 理政策,可為客戶信用管理帶來一套新的思考方向。. 關鍵詞:混沌、李雅普諾夫指數、R/S 分析、Hurst 指數、樣版、客戶交易 行為、客戶信用、應收帳款。. i.
(3) Abstract This study applies the data mining technology and Chaos theory to examine the relation between the behavior of customer transactions and the customer credit. Methodologically, this study focuses on the analyses of the sales data of a pharmaceuticals sales company with the use of Lyapunov exponent and Hurst exponent as indicators to the measurement of chaos. Furthermore, by the observations of the change of these two exponents, this study generalizes the pattern of the behavior of normal customer transaction and use this pattern to separate abnormal clients from normals. Under the analysis of Lyapunov exponent, the result shows that the curve of normal clients rises steadily, while abnormal one falls. Similarly, under the analysis of R/S, the result shows that the curve of normal clients converges toward a stable value, while abnormal one shocks. From these results, this study develops forecasting rules that provide a new way to help making decisions in customer credit management.. Keywords: Chaos, Lyapunov Exponent Analysis, R/S Analysis, Hurst Exponent, Pattern, Behavior of Customer Transactions, Customer Credit, Account Receivable.. ii.
(4) 致. 謝. 本論文承蒙指導教授毛治國博士之細心指導與教誨,始得以順利完 成。在研究過程中,雖然屢屢遇到瓶頸,但毛老師常常勉勵我們要「Think like a winner, don't think like a loser.」,要我們退一步去想問題, 把整件事看清楚,要做到見樹又見林,對於許多問題的思考方式,也由毛 老師的潛移默化改變學生的思考邏輯,毛老師指導學生以及上課時的專注 與認真,亦帶給我們為學做事上的啟發與廣闊的研究思考空間,為我們未 來人生態度的效法模範。同時感謝口試委員本所許和鈞教授、銘傳大學資 訊管理系鄭毅萍教授以及碩網科技邱仁鈿博士,對於本研究提供諸多的寶 貴意見和建議,使得本論文之內容更臻於完善,在此表達由衷的謝意。 從職場中途重新回到學生生涯,進入交通大學經營管理所研究所,接 受研究所階段的訓練,在這過程中不但豐富了我的知識涵養,並也影響了 我未來的人生態度。論文的完成,不僅代表學業階段的成果,亦代表新的 階段的開始,在此為交大經管所獻上本人最高的謝忱與敬意。 此外在研究所就讀期間,首先感謝最親愛的家人們,能夠使我無憂的 專心從事課程學習與論文研究。而在最後半年的研究過程,感謝同學黃鴻 順、蔡素珍的支持與鼓勵,學妹王怡珺的協助與建議,以及碩一學弟妹駱 彥汝、陳怡文、邱玉宜、湯玉萱、連世和、袁明俊等人伴我走過這一段研 究所求學的時光,使我留下畢生永難忘懷的回憶。 最後,謹將本論文呈獻給我的父親徐渭忠先生、母親謝千玉女士和關 懷我的親友們,你們的支援與鼓勵是本篇論文完成的原動力,願與你們分 享這份榮耀。. 徐元良 2005 年 7 月. iii.
(5) 目. 錄 頁次. 中文摘要 …………………………………………………………… 英文摘要 …………………………………………………………… 致謝 …………………………………………………………… 目錄 …………………………………………………………… 表目錄 …………………………………………………………… 圖目錄 …………………………………………………………… 第ㄧ章 緒論……………………………………………………… 1.1 研究背景與研究動機…………………………………… 1.2 研究目的………………………………………………… 1.3 論文組織架構…………………………………………… 1.4 研究範圍對象及資料…………………………………… 1.4.1 研究範圍………………………………………………… 1.4.2 研究對象………………………………………………… 1.4.3 研究資料………………………………………………… 1.5 研究步驟………………………………………………… 第二章 文獻探討………………………………………………… 2.1 企業應收帳款之信用風險管理………………………… 2.1.1 應收帳款及應收票據之定義…………………………… 2.1.2 應收帳款之信用風險管理……………………………… 2.1.3 信用政策(Credit Policy)的制定……………………… 2.2 資料開採(Data Mining)的理論技術與相關應用……… 2.2.1 資料開採的定義與程序………………………………… 2.2.2 資料開採的功能應用與限制…………………………… 2.3 複雜理論的發展與運用………………………………… 2.3.1 複雜理論介紹…………………………………………… 2.3.2 碎形理論與特性………………………………………… 2.3.3 混沌現象的鑑別方法…………………………………… 2.3.4 複雜理論之應用………………………………………… 第三章 研究方法………………………………………………… 3.1 問題描述………………………………………………… 3.2 研究方法架構…………………………………………… 3.3 鑑定方法………………………………………………… 3.3.1 李雅普諾夫指數分析法………………………………… 3.3.2 R/S 分析法……………………………………………… 3.4 客戶交易行為模式樣版定義…………………………… iv. i ii iii iv vi vii. 1 1 3 4 6 6 6 6 7 9 9 9 9 12 12 13 16 19 19 26 28 30 31 31 33 34 35 39 41.
(6) 3.5 交易異常警示訊號的定義……………………………… 第四章 研究結果………………………………………………… 4.1 李雅普諾夫指數分析…………………………………… 4.1.1 客戶交易行為李雅普諾夫指數分析…………………… 4.1.2 客戶交易行為李雅普諾夫指數變化分析……………… 4.2 R/S 分析………………………………………………… 4.2.1 客戶交易行為 R/S 分析………………………………… 4.2.2 R/S 指數變化分析……………………………………… 4.3 客戶交易預警機制……………………………………… 4.4 研究結果總結…………………………………………… 第五章 結論與建議……………………………………………… 5.1 研究貢獻與結論………………………………………… 5.2 後續研究發展建議……………………………………… 參考文獻 …………………………………………………………… 附錄 A 本研究所使用之資料表及資料表關聯圖……………… 附錄 B 本研究所使用之相關資料庫預儲程序………………… 附錄 C 分析過程與步驟…………………………………………. v. 42 44 44 45 46 49 49 50 53 57 58 58 60 62 64 76 88.
(7) 表目錄. 表 表 表 表 表 表 表 表 表 表 表 表 表 表 表 表 表. 2-1 4-1 4-2 4-3 4-4 4-5 4-6 4-7 4-8 4-9 4-10 A-1 A-2 A-3 A-4 A-5 A-6. 頁次 鑑別混沌現象的方法……………………………………………… 29 客戶交易金額李雅普諾夫指數匯總表…………………………… 45 客戶交易金額李雅普諾夫指數迴歸分析匯總表………………… 49 客戶交易金額 Hurst 指數匯總表………………………………… 50 客戶交易金額 Hurst 指數變化統計表…………………………… 52 李雅普諾夫指數與 R/S 指數綜合分析(退票發生時)…………… 53 李雅普諾夫指數與 R/S 指數綜合分析(退票前 5 次)…………… 54 李雅普諾夫指數與 R/S 指數綜合分析(退票前 10 次)………… 54 李雅普諾夫指數與 R/S 指數綜合分析(退票發生時,交易>50)… 55 李雅普諾夫指數與 R/S 指數綜合分析(退票前 5 次,交易>50)… 55 李雅普諾夫指數與 R/S 指數綜合分析(退票前 10 次,交易>50)… 55 客戶基本資料資料表……………………………………………… 64 退票客戶行為分析資料表………………………………………… 65 客戶交易統計資料表……………………………………………… 67 客戶交易明細資料表……………………………………………… 72 客戶應收票據明細資料表………………………………………… 73 客戶交易混沌特性指數變化資料表……………………………… 74. vi.
(8) 圖目錄 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖 圖. 1-1 1-2 2-1 2-2 2-3 2-4 2-5 2-6 2-7 2-8 2-9 2-10 2-11 2-12 2-13 3-1 3-2 3-3 3-4 3-5 3-6 4-1 4-2 4-3 4-4 4-5 4-6 4-7 4-8 A-1. 本研究之論文組織架構………………………………………… 本研究之研究步驟……………………………………………… 資料探勘(Data Mining)所運用的技術整合………………… 蝴蝶效應-對初始值的敏感度………………………………… 奇異吸子………………………………………………………… 羅吉斯方程式模型(0<r<1)…………………………………… 羅吉斯方程式模型(1<r<3)…………………………………… 羅吉斯方程式模型(1<r<3)…………………………………… 羅吉斯方程式模型(r>3)……………………………………… 羅吉斯方程式模型(r=3.56)…………………………………… 羅吉斯方程式模型(r=3.725),混沌發生……………………… 平衡解與成長參數 r 之關係圖………………………………… 科赫雪片………………………………………………………… 康托集合………………………………………………………… 西爾平斯基襯墊………………………………………………… 研究方法架構…………………………………………………… 李雅普諾夫指數示意圖………………………………………… 李雅普諾夫指數λ<0 收斂至單點……………………………… 李雅普諾夫指數λ<0 收歛至單一軌道………………………… 李雅普諾夫指數λ=0 軌道運動呈穩定………………………… 李雅普諾夫指數λ=0 兩相鄰軌跡最終發散…………………… 客戶交易金額李雅普諾夫指數分布圖………………………… 正常客戶(ㄧ)交易金額李雅普諾夫指數折線圖……………… 退票客戶(ㄧ)交易金額李雅普諾夫指數折線圖……………… 正常客戶(二)交易金額李雅普諾夫指數折線圖……………… 退票客戶(二)交易金額李雅普諾夫指數折線圖……………… 客戶交易金額 Hurst 指數分布圖……………………………… 正常客戶交易金額 Hurst 指數折線圖………………………… 退票客戶交易金額 Hurst 指數分布圖………………………… 本研究所使用之資料表關聯……………………………………. vii. 頁次 5 8 15 20 20 22 22 23 23 24 24 25 27 27 27 34 35 36 36 36 36 45 47 47 48 48 50 51 51 75.
(9) 第一章. 緒論. 1.1 研究背景與研究動機 近年來隨著全球化市場的趨勢之下,不但使得交易活動日益頻繁,也 伴隨著市場競爭日益激烈,為了提昇整體的競爭優勢,促進與客戶達成交 易的可行性,企業普遍地提供客戶在資金上的彈性運用,因此企業(公司) 間的交易往來大多以信用交易(Trade Credit)為主,也就是以應收帳款 (Accounts Receivable)支付交易費用,取代傳統的現金交易。而應收帳款 亦屬於企業資產中重要的項目。由於應收帳款是屬於「未實現的經濟利 益」,當應收帳款之信用期間到期時,客戶的應收帳款才會轉換成現金, 若屆期客戶未能支付貨款,則可能發生問題帳甚至變成壞帳(Bad Debt)問 題。在問題帳不能獲得充分控制之下,儘管企業之營業收入很高,但若是 無法將營業收入轉換成實際的現金時,則直接會影響到公司的營運獲利, 嚴重時甚至導致企業無法繼續經營而倒閉。 永續經營是每個企業的共同目標,追求利益也是企業普遍存在的價 值,任何有可能影響到企業營運的因素都為企業所不容忽視,因此,除了 積極擴大企業的經營版圖之外,企業應收帳款的信用風險管理,也是企業 決策者重視的議題。傳統上許多企業僅能依賴經驗法則及運氣,作為客戶 信用管理的決策依據,但是隨著時代的變動,傳統的做法已經不能有效掌 握客戶信用的控管,因此企業需要其他的方式進行客戶信用管理。拜科技 之賜,使得資料庫技術提升及網際網路的發達,改變了企業內的作業模式, 除了大幅的以電腦文書處理取代了紙上作業,各企業也陸續導入進銷存財 務會計系統或是 ERP 系統,將企業在財務上的營運活動進行資料彙整與處 理,不但改善了原本的工作效率,資料也得以充分的保存,在經過整理與 分析之後,資料成為對企業非常有幫助的資訊,許多企業利用這些資訊作 為生產流程、存貨成本控制、內部管理、銷售、服務等管理決策的指標, 應收帳款管理也屬於其中的範疇。. -1-.
(10) 雖然花費了龐大的金額建置資訊系統,並累積了大量的資料,但企業 所能運用的仍屬有限,大部分侷限在機械式的查詢與資料彙整報表的呈現 上,而在這些龐大資料的背後,是否隱藏著具有重大意義的資訊。在近幾 年來在結合了許多學者的研究以及企業的投入發展之下,開啟了企業資訊 應用另一塊新的領域-「資料探勘(Data Mining)」。資料探勘的過程即在龐 大的資料庫中尋找出有價值的隱藏事件,藉由統計及人工智慧的科學技 術,將資料做深入分析,找出其中的知識,並根據企業的問題建立不同的 模型,以提供企業進行決策時的依據。例如目前許多銀行業者,可藉由資 料探勘的技術將其龐大的顧客資料做篩選、分析、推演及預測,找出哪些 是最有貢獻的顧客,哪些是高流失率族群,或是預測一個新的產品或促銷 活動可能帶來的回應率,能夠在適當的時間提供適合的產品及服務。也就 是說,透過資料探勘的程序企業得以了解他們的顧客,掌握他們的喜好, 滿足他們的需要。 在另一方面,過去學者或是在商業應用上要解決預期問題的答案,基 本上都是以"完全理性的假設"作為前提,例如古典經濟學是建構在完全理性 的理論基礎上。也就是說科學家完全知道未來將會面對的各種選擇的所有 可能狀況,而且以完美無暇的推理,預見行動可能的涵義因此可以在任何 情況下,依據所獲得的資訊,採取最有利的行動。並且在預測的模式上, 多採用以線性的理論基礎,探討整個系統發展的可能性,但是在真實的世 界中,人類的思考模式大多為非理性,大多數的真實系統都是非線性系統, 大多數的情形看起來也似乎是雜亂無序。尤有甚者,系統中某些行為的改 變,可能也不只是在一個簡單方程式的條件上的做改變就可以解決問題, 因此過去的研究就有著修正的必要。 在一九八十年代中期,混沌理論的發展終於開啟了非線性研究的大 門。混沌理論,被稱為非線性的決定性(Determinant)過程,藉由混沌理論 中對過去行為的回饋情形,去解釋整個過程中非線性的現象,並由其中找 出無序中的有序,以做為未來發展更為有效之時間序列預測模型的基礎, 也能解決在過去無法真實模擬非線性的缺憾。. -2-.
(11) 因此,此份研究主要是應用企業所能掌握的資訊,透過對於客戶基本 資料、交易歷史記錄(訂單資料)與客戶應收帳款所產生信用相關記錄的觀察 與整理,希望能夠以混沌理論為基礎,從中解讀出問題帳發生相關的症候, 經過假設與實證之後,作為區分正常客戶以及會發生退票行為的問題客戶 之檢驗模型,對於之後客戶日常發生的交易行為能夠加以分析與判斷,事 先察覺出問題帳發生的徵兆,在問題帳發生前,向帳款管理人員提出警訊, 使其注意客戶發生退票行為的可能性,讓帳款管理人員能夠及早採取因應 之道,以減少企業應收帳款發生問題帳的機率並降低問題帳發生對企業營 運的衝擊為此文之研究動機所在。. 1.2 研究目的 研究目的根據上述研究背景與動機,茲將本研究之問題與目的,具體 說明如下: 1. 探討過去企業界對於客戶交易行為與應收帳款的相關研究與管理,包括 客戶交易行為以及客戶的信用狀況分析,以及企業在客戶信用管理的相關 應用。 2. 探討資料探勘(Data Mining)的理論基礎、發展技術以及實務上的應用。 3. 探討混沌理論的發展過程、理論基礎以及國內外文獻關於混沌理論的相 關研究,並規劃可行的研究方向。 4. 以混沌理論為基礎,分析客戶交易行為與客戶發生跳票問題之間的關 係。 5. 依據上述的分析結果,選擇適當的篩選標準,找出跳票客戶其交易行為 與發生跳票情形間的關係,以提供決策者具有參考價值的判斷模式,讓企 業能夠及早防範客戶跳票行為及降低企業營運損失。. -3-.
(12) 1.3 論文組織架構 本文在組織架構上共分五個章節: 第一段落為導論,說明研究動機、目的、本研究組織架構與思考邏輯、研 究範圍對象及資料以及研究步驟。 第二段落為文獻探討,文獻探討分為三大部分,(1)企業界對客戶應收帳款 的信用風險管理之探討(2) 資料探勘(Data Mining) 的理論基礎以及相關研 究與應用(3)混沌理論的發展與其應用。 第三段落為研究方法,先將本研究的問題加以詳細描述,之後分別探討李 雅普諾夫指數分析法與 R/S 分析法,以及兩種分析法在本研究中如何應用。 第四段落為實證結果,分別利用李雅普諾夫指數分析法與 R/S 分析法,說 明客戶交易行為與混沌現象間的關係,之後並就李雅普諾夫指數與 R/S 分 析所產生的 Hurst 指數的變化,歸納出正常客戶交易行為的樣版,及定義客 戶信用預警機制的警示訊號。 第五段落則為本文之討論與結論,說明發現結果與管理意涵,並提出本研 究的相關限制與建議後續的研究方向。. -4-.
(13) 圖 1-1 本研究之論文組織架構 -5-.
(14) 1.4 研究範圍對象及資料 1.4.1 研究範圍: 應收帳款(Accounts Receivable)為國內外各企業普遍使用的信用交易 方式,但由於我國企業國情特殊,民間企業均有使用票據作為交易工具的 習慣,為增加本研究於本土企業的可用性,因此本研究將應收票據納入廣 義應收帳款之研究範疇內。本研究主要以本國企業使用之應收帳款與應收 票據作為整體應收帳款的研究範圍。 1.4.2 研究對象: 本研究主要以本國企業為主要研究對象,但基於時間、人力及資料取 得的考量,研究對象以作者所服務之醫藥行銷流通公司為研究主體,其服 務對象涵蓋台灣全島以及離島地區約一萬三千多家之醫院、診所以及藥局 等通路客戶。. 1.4.3 研究資料: 本研究主要之研究對象為兩年內有發生交易之客戶,客戶家數為一萬 三千多家包括醫院、診所以及藥局等通路客戶,研究資料分為兩部分,一 部分為客戶交易歷史資料,在觀察期間兩年內訂單交易共五十萬餘筆;另 一部分為收款歷史資料,在觀察期間內收款資料約為六萬八千多筆,此外, 觀察期間兩年內的客戶交易中共發生一百零五家客戶,一百八十筆退票記 錄, 退票總金額兩千四百餘萬元 (排除負責人死亡、大小寫金額不符或塗 改等非信用相關因素)。以此期間所發生與客戶信用有關的退票事件為判定 客戶發生信用問題指標進行相關研究分析,關於客戶資料、訂單資料以及 應收帳款/票據資料之資料表結構另標示於附錄中。. -6-.
(15) 1.5 研究步驟 本研究採取下列研究步驟: 1.界定研究問題與目的 首先研究步驟,就是界定本研究的問題與目的,以作為進行研究的準 則與目標。 2.理論與相關文獻整理 依據研究的問題與目的,進行搜集與研究相關理論及文獻,並且整理 相關研究的方法與結果,據此以提出研究之觀念性架構。 3.建立研究模式 藉由觀念性的架構,參考現有原理、原則、理論、經驗法則或研究應 用,建立適當的研究模式以供實證研究。 4. 研究樣本資料蒐集與整理 對於客戶所表現出的行為,大部分企業所能掌握的資訊,不外乎是客 戶基本資料、客戶訂單交易記錄以及應收帳款等客戶信用記錄,因此 將以上資料進行蒐集與彙整,以便後續研究的運算與分析。 5. 進行研究實證 針對假設做出檢定驗證假設是否成立。 6.建立客戶信用預警機制 根據以上實證結果,建立客戶交易行為樣版,並以此樣版定義客戶交 易異常警示訊號。 -7-.
(16) 7.研究結論 依據結論,針對企業針對應收帳款的風險管理之需求,作成具體之建 議,以供企業應收帳款風險管理的應用參考,並提出後續之研究方向。 本研究的研究步驟,圖示如圖1-2:. 圖 1-2 本研究之研究步驟 -8-.
(17) 第二章. 文獻探討. 本研究主要目的為針對過去與目前企業在客戶信用管理上較為欠缺 的檢驗方法,利用混沌理論探討客戶交易行為與客戶信用之間的關係,並 希望從大量的客戶交易資料與應收帳款資料中找出客戶交易行為的正常樣 版,利用此樣版定義一套可預測客戶發生信用問題新的預警機制,提供企 業對應收帳款客戶信用管理的另一種方法。因此在文獻探討的部份,本章 共計分為三個方向進行討論:第一、目前企業應收帳款之信用風險管理機 制;第二、資料探勘(Data Mining)的理論技術與相關應用;第三、混沌理 論的應用以及相關研究。. 2.1 企業應收帳款之信用風險管理 2.1.1 應收帳款及應收票據之定義 應收帳款(Account Receivable)是指企業提供貨物銷售或是勞務服務 後應該向客戶收取的報酬,但是為了降低交易成本,並且達到企業營運週 轉的彈性,因此產生的尚未實際收取到現金的過度性信用交易項目,在企 業營運活動上,有一部分的應收帳款經由客戶開立企業本票或是支票,作 為取得客戶信用的票據,稱之為應收票據(Note Receivable),雖然在企業 的會計帳上,此筆銷貨收入已由應收帳款科目轉為應收票據科目,但仍屬 於未實現的銷售利益,因此亦屬於過度性項目,在本研究中所探討的,涵 蓋應收帳款與應收票據的部分。 2.1.2 應收帳款之信用風險管理 在應收帳款管理中,企業首先要決定是否要將交易信用授權給客戶, 且也必須評估企業有多少在外流通的應收帳款,其總額視以下兩個因素而 定: 1. 信用銷售的數量。 2. 從銷售發生到將應收帳款收現所需的平均時間。 -9-.
(18) 企業的營運要能進入穩定的狀態,則應收帳款總額為「每日信用銷售 額」乘以「平均收現期間」 ,因此應收帳款總額必須視銷售水準與收現期間 而定,且企業的融資需求也會隨著應收帳款的增加而增加。企業的應收帳 款餘額太高可能會伴隨呆帳的風險增加而產生鉅額的呆帳損失,同時也會 積壓資金,使企業週轉不靈。若是企業大幅降低對客戶的信用交易,雖然 應收帳款餘額會大幅降低,發生呆帳的風險及資金的需求均會降低,但是 也會對企業的營業績效產生很大的影響,使公司的獲利能力大為減弱。所 以一般企業均設定信用政策,進行信用管理,使應收帳款維持在最適當的 水準。 企業依目前的經濟環境,市場競爭情形以及企業本身資金的狀況定出 寬鬆的信用政策或嚴格的信用政策,在景氣低迷,或企業需要資金週轉時, 公司可能採取嚴格的信用政策,信用政策趨向: (1)縮短信用期間,對使用信用交易的客戶要求較短的票期或鼓勵以現 金交易。 (2)緊縮信用標準,只對信用水準較高的客戶給予較高的信用額度。 (3)加速過期未付款之帳款催收。 反之,在景氣復甦,市場競爭激烈,或企業有足夠資金擴充信用時, 企業可能採用較寬鬆的信用政策,信用政策趨向: (1)對風險較大的客戶仍給予信用交易的優惠。 (2)延長付款週期並減少對過期尚未付款的客戶之收款壓力。 依照行業別以及營運屬性的不同,某些企業針對交易金額較大、以及 風險較高的客戶會採用徵信的方式做為客戶信用管理的機制,但是一般而 言,基於成本與時效性的考量,目前各企業採用的信用評比工具多以報表 方式為主,主要為應收帳款明細表、帳齡分析表、客戶別營業額統計表及 客戶別收款率分析表,以下就這四項報表做說明: - 10 -.
(19) 應收帳款明細表:應收帳款明細表顯示客戶應收未收的交易明細、交易時 間以及款項金額,決策者可透過此表初步判斷看出該客戶的交易情形是否 異常,並可以據此表向客戶追討未收的部分。 帳齡分析表:帳齡分析表為將客戶的應收帳款分別依照應收帳款週期做分 類,主要顯示出應收帳款已流通在外多久的表,它可使信用管理人員很快 瞭解下列事項: 1. 到底有多少客戶在折扣期間內付款? 2. 到底有多少客戶在信用期間內付款? 3. 到底有多少客戶在信用期間過後才付款? 4. 到底有多少應收帳款會由於拖太久的緣故而成為壞帳? 信管人員透過帳齡分析表以及公司的平均收現期間,可掌握應收帳款 帳齡與金額分布的趨勢,用來評估公司的信用部門相對於其他公司信用部 門的績效。如果平均收現期間有開始延長的跡象,或已有越來越多的客戶 未能如期付款,則公司就可能必須採取緊縮信用的措施。 客戶別營業額統計表:此表主要是將客戶與企業的交易明細,依照週期(每 月)加總顯示該客戶每個週期與公司的交易金額,進而判斷客戶的營運狀 況,假設客戶與公司的營業額逐漸遞增的趨勢,且付款狀況正常,則該客 戶的信用水準較高。反之若客戶與公司的營業額突然大幅下降,同時貨款 均未能按時付清,則此客戶的信用水準有待驗證。 客戶別收款率分析表:此表為公司對客戶各月份的銷售與收款分別加總, 顯示收款率統計,透過此表能夠完全比較出客戶的銷售與應收帳款之間的 關係,防止客戶銷售金額突然暴增,但卻收不到款的情況發生。 透過以上四個表的資料,可以協助企業作客戶信用管理的依據。 - 11 -.
(20) 2.1.3 信用政策(Credit Policy)的制定 企業擬定信用政策一般係由下列四個要素所構成: 1. 信用期間(Credit Period):信用期間是指企業給予客戶的付款期間, 企業通常會根據客戶的正常存貨特有期間或是產品銷售週期來決 定信用期間的長短。 2. 信用標準(Credit Standard):為了獲得企業給予信用交易的使用,客 戶所需具備的最低財務力量。在決定信用標準時,企業的主要考慮 因素是,客戶延遲付款或賴帳不還的可能性。 3. 收款政策(Collection Policy):企業為了催收已過期的應收帳款所遵 循的程序。收款政策的改變會影響到銷售額、收現期間、壞帳損失 百分比,以及願意享受購貨折扣客戶的百分比。 4. 現金折扣(Cash Discount):企業為了鼓勵客戶提前付款所給予的購 貨折扣。 一般而言,信用政策的放鬆會導致銷售額的增加,但基於下列原因,公司 的成本也會跟著提高: 1. 為了生產更多的貨物,必須投入更多的人工與原料。 2. 應收帳款會隨著銷售額的增加而增加,故公司必須負擔較前為多的應 收帳款持有成本。 3. 壞帳損失以及現金折扣費用也會隨著銷售額的增加而增加。 因此,在信用政策的制定上,除了客戶的交易信用屬性以及整體環境的景 氣外,必須配合企業本身的生產能力、財務能力以及風險承擔能力做全盤的考 量,才能掌握最佳的財務平衡狀況。. 2.2 資料探勘(Data Mining)的理論技術與相關應用 在知識爆炸的時代中,現代的企業體常常需要面對許多有關客戶、供 應商、競爭對手以及工業趨勢等資訊;如大量的性別、年齡、職業、住址、 - 12 -.
(21) 購買習慣、供應商售價表、市場銷售數量與競爭對手價格策略,以及賣場 上上千個商品的售價與分類;而他們往往只知道努力的擷取資訊,但卻均 無法有效地使用它們。近幾年,企業也體認到他們所收集到資料只有少部 份是有效的被使用到。因此,在此需求的情況下,出現了一系列結合各種 資料探勘技術(Data Mining Techniques)的新型產品以及服務,使得一般企 業所蒐集的資訊可以經由此技術而發揮最大的效用,在本節中,就對資料 探勘的理論與技術做相關介紹。. 2.2.1 資料探勘的定義與程序 在人類決策的過程中,會經過一定的步驟。經濟學者 H. A. Simon 在 1960 年代提出一般人解決問題的四個階段,分別為情報、設計、選擇及實 施,成為較為大家所熟知且引用的模式。此外,毛治國教授認為「決策」 可拆解成「見、識、謀、斷、行」等五個步驟。對企業來說, 「見識」是一 種「如何權衡環境、審時度勢,為企業診斷問題、發掘機會」的工作。它 的原則是「了解全局、洞察趨勢、把握重點」 ;它的重點在「為企業定義正 確的問題」 。因此,企業在決策的制定過程中,如何蒐集充分的資訊,並從 其中過濾出有價值的資訊情報,以找出真正問題的核心,對未來企業所制 定決策的品質具有重大的影響,而資料探勘的工作,就是有效的從龐大的 資料中取得較不為人知,具有參考價值的資訊。曾任職於 IBM 北美決策支 援策劃部的 Evangelos Simoudis 為資料探勘做出以下定義 -「資料探勘是 從一個龐大的資料庫中將正確、以前未發覺卻非常重要的資訊加以抽離出 來,並利用這些資訊來做出重要決策的過程。」。 過去在資料庫應用上,經常使用資料庫查詢的功能,透過簡單的程序 與排列之後,顯示出較為表面、淺層的資訊,但若是想知道更深入的資訊, 在面對龐大的資料,卻都束手無策。資料探勘不僅僅只對資料庫提出一個 查詢的要求,事實上,它是一個更加複雜的程序;利用它,使用者可以從 排列方式雜亂無序、未結構化的資料中找出並規劃出有用的資訊。有別於 傳統的資料庫查詢,資料探勘是自行找出隱含於資料庫中的相關性,並且 以一種可令人理解的方式呈現出來;舉例來說,它可能會偵測出有相似特 性的客戶群,並決定其中哪些群組的人最可能對新產品或活動會有所回 - 13 -.
(22) 應。因此可以得知的是資料探勘技術會找出兩種有用的資料;一種是傳統 中大家認為有用的資料;另一種是因為其所顯示出的訊息有別於以往較為 突出且對於企業而言較為有用的資料。 由於資料探勘的任務主要是由龐大的資料中找出有意義的資料,因此 通常依照下列五個步驟進行: 1.. 決定企業探勘資料的目的:企業在決定進行資料探勘前,必須清楚的 定義出其所面臨的問題以及所欲達成的目標,再衡量需要採用何種技 術完成任務。這是非常直覺,卻也是關係到未來進行資料探勘任務成 敗的關鍵,因此決定最終目標之後,才能進一步規劃利用適當的資料 以及技術以達成目標。. 2.. 資料收集與整合:目標明確之後,就必須掌握進行資料探勘所需要的 資料。資料的來源不外乎存在於企業內部或是外部,最好的狀況是這 些資料都是立即可使用的,然而往往實際所遇到的狀況是企業必須面 對龐大、雜亂無章、格式不統一且與資料庫系統不相容的資料,若不 經過適當的資料格式整理與篩選,可能會導致之後的資料探勘工作無 法順利進行下去,或造成最後產生的結果出現偏差的情形,因此在此 一步驟,必須決定需要哪些資料,收集資料以及依照資料庫支援的格 式與所用到資料欄位屬性訂定資料格式,最後進行資料整理。. 3.. 選擇適當的資料探勘功能:不同的應用領域,不同的問題型態,以及 需要應用到的技術,必須選擇對應的資料探勘功能來解決。例如零售 賣場想要訂定產品的搭配銷售策略,則必須採用關聯分析的功能了解 消費者的採購偏好。關於資料探勘的功能,會在下一節作詳加介紹。. 4.. 結果分析:在上一步驟得到探勘的結果,但是不是所產生的結果立即 可以使用,有時候也會產生偏差或是完全錯誤的結果,因此必須將結 果加以分析,並進行專業評估與解讀,探討分析結果的正確性以及造 成結果背後潛在的意義。. 5.. 知識應用:經過分析的可用結果,便可應用在實際問題的解決上或是 策略規劃上。由以上步驟探索出的知識,有些是顯而易見的,也有些 是隱晦不明,必須讓專家做進一步的判斷或是對結果進行合理的解 - 14 -.
(23) 釋,才能成為實務上能夠直接的應用,有時候專家解讀出的結果會另 一個新的資料探勘任務的開始。. 圖 2-1 資料探勘(Data Mining)所運用的技術整合. 關於資料探勘所牽涉到的技術領域,如圖 2-1 所示,為了要達到所需 的功能,資料探勘整合包括以下的技術: 1. 資料庫技術(Database Technology):藉由資料庫技術,龐大的資料得以 儲存以及做適當的排列與運算,以方便快速的存取,增加資料探勘的效率。 2. 機器學習(Machine Learning):利用人工智慧中的機器能夠長期觀察與 學習的特性,從大量的資料中,分析過去的行為模式並模擬未來可能發展 的趨勢。 3. 專家系統(Expert System):專家系統的特色在於蒐集人類過去的知識與 經驗,建構一套知識庫(Knowledge Base),藉由經驗法則與邏輯的推理, 大量又快速的搜尋出最佳的解決方案。 4. 統計技巧(Statistics):資料探勘的技術是建構於在統計基礎上,大量的 資料經過統計後的結果後可顯示較有意義的資訊。 5. 形象化(Visualization):龐大且雜亂無章的資料,透過圖形化或是形象化 的處理方式,將更能夠由其中看出有意義的行為趨勢或是資料的分布狀況。 - 15 -.
(24) 6. 其他的規則(Other Disciplines):某些資料透過基本的統計處理無法產生 有意義的結果,資料必須依靠其他的規則整理後將能顯示出其背後潛在的 意義。. 2.2.2 資料探勘的功能應用與限制 資料探勘具有提供相當重要資訊的技術,近年來也廣為學術界或是企 業所注重,但是在實際上該如何應用。根據資料探勘所提供的四項主要功 能,依照功能需求與執行程序,研究學者更進一步將資料探勘的運作分為 四種主要類型: 1. 關聯性運作(Association):關聯性運作的靈感來自於為了解決零售 企業的問題,主要功能是去發掘哪些事物總是同時發生,也稱為購物 籃分析;美國一個應用資料探勘技術做關聯分析的有名實例是零售連 鎖商 Walmart 發現的「星期四、尿布和啤酒」 。也就是在審視各銷售點 之終端機所獲得的記錄後發現在禮拜四晚上,消費者通常會同時購買 尿布和啤酒。這樣的發現提供了 Walmart 更多可與此結合的行銷點子。 事實上,購物籃分析就是達成交叉銷售的方法。藉由這些資料,零售 商們可以調整貨架的擺設位置,進而設計推銷活動,以期能更有效地 將商品賣出。除了實體的零售量販店之外,目前許多新興的網站,也 大量應用關聯性技術,透過搜集網友對於網頁瀏覽的偏好、廣告的點 閱以及經常搜尋的關鍵字等的間接資料,或是直接在該網站上消費過 的商品資訊,推測出網友對於何種商品具有潛在的消費動機,以主動 提供相關商品的消費資訊以刺激其購買意願。而對於非商業相關的領 域,澳洲健康保險委員會曾使用資料探勘技術來找尋其資料的關聯 性;他們的資料探勘工作主要是針對一些不必要的醫療檢驗,而尋找 的目標則是利用通常會同時進行檢驗的代碼,找出其間的關聯性。一 些專家認為有些檢驗工作是多餘的,根本不需要做的;而且利用這個 技術同時發現了許多的實例,足以替委員會節省大量的金錢。 - 16 -.
(25) 2. 序列特徵(Series Characteristic):預測是根據對象屬性之過去行為 觀察值來推估該屬性未來之值。例如由過去行銷活動所產生的反應來 預測未來新活動的回應率,或是由顧客的職業、年齡、收入等人口屬 性特質及其消費行為來預測可能的流失率等。使用的資料探勘技術包 括時間序列(Time Series Analysis)、類神經網路(Neural Network)、決 策樹(Decision Tree)、迴歸分析(Regression Analysis)等。銀行業、保 險業、信用卡公司等行業近年來對於詐欺行為的偵測(Fraud Detection) 非常關心,因為每年這些行業因詐欺行為而造成的損失都非常可觀。 資料探勘可以從一些信用不良的客戶資料中找出相似特徵並預測可能 發生的詐欺行為,以達到減少損失的目的。此外,金融市場也是廣泛 地將資料探勘的技術用於預測上,例如期貨市場分析過去期貨商品的 價格變動,以預測近期商品價格的走勢。 3. 分類(Classification):分類就是分析資料的所有特質,依據已知類別 建立模型,再將其指派至一個現有的群集中,以解釋該類別之特性。 例如,金融機構常客戶的將信用狀況區分為高風險、中度風險及低風 險,或是將客戶區分為高貢獻度族群、高忠誠度族群等。藉由分類可 以對不同族群給予不同的產品及服務。它使用的 Data Mining 技術有決 策樹(Decision Tree),記憶基礎理解(Memory-Based Reasoning)等。 信用卡公司除了利用預測的技術,掌控客戶可能發生的詐欺行為之 外,在發行信用卡業務上,也應用其擁有過去客戶之信用歷史以及繳 款特性等的大量相關資訊,將信用良好的客戶與發生信用問題的客戶 的基本資料做分類並建立一些模型,調整新申請者的信用可靠度。此 外,在市場行銷上,也透過過去購買該產品的客戶、地點、時間等做 基本資料統計與分類,以歸納出該產品的市場消費族群並擬訂配套的 行銷策略。 4. 群集化(Clustering):群集化就是將一群異質的群體區隔為同質性較 高的群體或是子群。它與分類不同的是,群集化沒有依靠事先明確定 義的類別來進行分類,資料是根據自身的相近性來群集在一起的,因 此,群集化可說是分類的前置作業,它也是進行市場區隔的第一步。 - 17 -.
(26) 雖然在統計上,群集早就被使用了。而在資料探勘上,其新鮮之處在 於它處理的一些非數字屬性的物件。使用的技術為 K 平均法。許多廠 商在新產品上市前或剛上市後,利用問卷調查的方式,除了從消費者 基本資料上做消費族群的分類,並也透過消費習性的問題中,將結果 群集化處理,找出消費者的潛在特性,以作為行銷策略或是改善產品 的參考。 然而,企業界實際發展資料探勘技術的模式時,效能常不如預期,有 許多因素影響,包括資料的不完整性、無時效性會影響 Model 建立的準確 度,以及分析的結果需要企業內部其他相關部門配合來執行,才能將資料 探勘的效能真正發揮。. - 18 -.
(27) 2.3 混沌理論的發展與運用 在本節中,主要是介紹混沌理論的發展、混沌現象的探討以及混沌理 論的相關研究應用。. 2.3.1 混沌理論介紹 混沌(Chaos)是一種非線性確定過程(Nonlinear Deterministic Process),其看似隨機且非常複雜的變化行為,其實背後卻可由非常簡單 的動態過程所產生。混沌理論起源於數學與物理學,是 20 世紀中最重要的 創新研究之一。由於真正的隨機過程,是不能夠被精確預測的,因此在過 去科學家往往將一些生活中無法解釋,且無規則的非線性行為歸納為隨機 過程而予以忽略,隨著混沌理論的發現,許多研究學者開始回頭,試圖從 複雜且無規則的現象,探討其背後是否隱藏著其確定性的結構模式 (Pattern),因此混沌理論的研究,也擴展到其他各領域。 提到混沌理論,不得不提到在混沌理論領域具有重大貢獻的氣象學者 勞倫玆(Edward Lorenz, 1963),其利用十二條數學方程式,試圖模擬大 氣的系統變化,從天氣預測的電腦中發現到兩個獨特的現象:一為『蝴蝶 效應(Lorenz Butterfly)』 (如圖 2-2 所示,對初始條件的敏感依賴,初始條 件微小的差異,會造成日後系統狀態截然不同),發現氣象的變化—差之毫 釐,失之千里;另一為『奇異吸子(Strange Attractor)』(如圖 2-3 所示,在 奇異吸子會在相空間上對漫無秩序的軌跡進行約束,顯示出亂中有序的現 象),引發了此後科學家對於混沌現象的研究。. - 19 -.
(28) 圖 2-2 蝴蝶效應-對初始值的敏感度. 圖 2-3 奇異吸子. 關於混沌現象的發現,可以引用介紹混沌理論中常被提到的羅吉斯方 程式(Logistic Equation)。在傳統族群生物學中認為,在不受限於食物供給 與道德束縛的前提下,生物存活率可由每年增加固定百分率之函數,即為 一線性函數:X t +1 = rX t 表示,這就是人口成長的古典馬爾薩斯構想(Classical Malthusian Scheme)。但在 1845 年由菲耳胡斯特(P.E.Verhulst)所提出, 用來描述封閉環境中生物發展的概念,之後生物學家根據此概念從事研 究,在一座孤島上所做的野兔生態學觀察,在觀察中發現當地野兔的存活 率會受到前幾季存活率的影響,若是前幾季存活率過高,野兔數量過多, 則會因為封閉環境內的成長空間達到瓶頸,沒有足夠的糧食,造成彼此互 - 20 -.
(29) 相競爭,影響到當季的存活率,因此在實際的世界裡,生物的成長是有所 限制的,當生物數量很小時,其數量會急速成長,到了中間值成長速度開 始遲緩,當數量龐大時會崩潰下降。在經過一連串的時間觀察與統計之後, 生物學家歸納出以下的數學關係式: X t +1 = rX t (1 - X t ) ……………………(2.1) 0 < X t <1, 0 < r < 4. 式(2.1)中 X t 代表當季野兔的存活率, X t +1 代表下一季的野兔存活率, r 代 表成長參數,此方程式表示下一季的野兔存活率會受到前一季的野兔存活 率以及成長參數 r 所影響。其中 (1 - X t ) 項使得成長限定在某一範圍內,當 X t 增加,則 (1 - X t ) 會相對減少,顯示存活率會受到前期存活率的負反饋作用, 由於生態環境的改變,成長參數 r 也會隨之改變。 羅吉斯方程式之所以會被廣泛的解釋混沌現象,是後續生態學者將物 種的遷移能力以其棲息區所能支援物種最大數量的觀念納入,衍生出新的 方程式: Pt +1 = r × Pt. (K - Pt ) ……………………(2.2) K. 其中 Pt 表示某一物種數目,K 代表棲息地所能容納該物種的最大數量。 以下列例子來做解釋,假設某棲息地所能容納野兔的數量 K=1000,如圖 2-4 所示,假設野兔數量初始值 P0 為 500,並在 0 到 1 之間取成長參數 r 分 別為 r=0.25,0.6,0.95,則在數期之後,野兔數量將逐漸為 0,亦即野兔 滅亡。. - 21 -.
(30) 圖 2-4 羅吉斯方程式(logistic equation )模型(0<r<1). 但是將 r 取在 1 到 3 之間,如圖 2-2 所示,分別取 r=1.25, P0 =600; r=2.0, P0 =750:r=2.75, P0 =900,由於一開始數量太多,野兔數量會突 然下降,數量越大的下降幅度越大,但是到最後終究維持在一平穩值,這 表示系統已達到平衡。另外參考圖 2-5,初始值 P0 = 0.01 ,在 r 介於 1 至 3 之間時,數量會穩定的增加,由圖 2-4 與圖 2-5 所示,系統隱含有自我平衡 的功能。由圖 2-4、2-5 與 2-6 所示,當 r 介於 0 到 3 之間,數量終究收斂 至一穩定值,儘管圖 2-4 中數量變為 0,但仍為收斂。. 圖 2-5 羅吉斯方程式(logistic equation )模型(1<r<3). - 22 -.
(31) 圖 2-6 羅吉斯方程式(logistic equation )模型(1<r<3). 但是當 r>=3,如圖 2-7,分別取 P0 = 0.01 ,r=3.0 與 r=3.45,則可以觀 察出,當 r=3 時,系統最後會出現在兩個穩定值中來回震盪,當 r=3.45 時, 系統會出現在四個穩定值中來回震盪。當更進一步取 r=3.56,如圖 2-8 所 示,此時系統出現八個穩定值,路徑在此八個穩定值中震盪。當 r 值持續增 加,函數的不穩定平衡點將更多,由四點的循環,變為八點,再增加為十 六點以上的循環,直到呈現 2 n 點的循環(n=1,2,3,4… )此週期不斷增加 的過程稱為分歧(May,1976)。. 圖 2-7 羅吉斯方程式(logistic equation )模型(r>3). - 23 -.
(32) 圖 2-8 羅吉斯方程式(logistic equation )模型(r=3.56). 但是當 r 到達 3.7,取 r=3.725 時,如圖 2-9 所示,奇妙的現象發生了, 此時圖形出現看似隨機且不可預期的震盪,亦即不會產生重複的穩定值, 這也是所謂的混沌現象發生。而這種複雜的行為,是由簡單的羅吉斯方程 式所產生的。圖 2-10 為系統穩定值與成長參數 r 的關係圖。. 圖 2-9 羅吉斯方程式(logistic equation )模型(r=3.725),混沌現象發生. - 24 -.
(33) 圖 2-10 平衡解與成長參數 r 之關係圖. 由以上的說明,可以得到一個重要的觀念,序列關係(The Sequence), 此觀念在混沌理論中稱為運行軌跡(Orbit) ,序列可經由一個遞迴的系統產 生,設定初始參數值,經由一定的演算過程即可不斷產生往後的序列數值。 綜合以上的探討,可以歸納混沌特性如下: 1. 混沌過程必為非線性動態過程:傳統的決定性系統的行為是明確、規 律,可以藉由因果性來加以掌握,混沌雖然來自決定性系統,但是它的 內在的非線性過程使其展示無規律的行為。此外,雖然混沌現象必然出 現在非線性的動態系統中,但反者並不恆成立,如上述的羅吉斯方程式 為例,雖為非線性動態方程式,但當 r 小於 3 時,並不會產生混沌的現 象,序列最後會達到一個穩定的均衡。 2. 混沌現象對初始值的高度敏感:在許多研究中常常會談到的例子—蝴蝶 效應:一隻蝴蝶振翅所拍打出來的風,會造成未來地球上氣候的巨變。 混沌系統對於初值極為敏感,系統的演化過程中,一個微小的誤差或干 擾,很可能造成演化方向極端的差異,即所謂的「差之毫厘,失之千里」 , 這種對於初始值的敏感性使得嘗試對複雜系統所做預測的結果極不可 靠。但是複雜系統是否僅能描述其行為,無法發掘出背後產生的機制 呢?因此,找出混沌中的秩序,是各界學者努力挑戰的目標。 3. 無週期的時間路徑:以羅吉斯方程式為例,當 r 從 r=3 開始增加時,會 先出現循環時間加倍的特性,而當混沌現象形成後,由於無週期的擺盪 - 25 -.
(34) 行為,則永遠不可能產生相同的輸出值或有極多的穩定平衡點。因為假 設當相同的值一旦再出現,序列就會出現週期循環的現象,軌跡即便可 以完整預測,就不會是讓人困擾的混亂現象。 4. 存在有奇異吸子的現象:混沌現象外觀看似隨機發生,但是內在其實是 由一確定性非線性模式不斷的演算所產生,以一混沌系統不斷的進行某 種轉換,並將產生的數值在平面記錄下來,觀察軌跡的情形,當軌跡呈 現出有秩序的圖形,即表示背後存在有吸子(Attractor),混沌軌跡所產 生的吸子會在相空間上對漫無秩序的軌跡進行約束,產生安定的碎形集 合,即使在改變初始參數的情況下,仍會出現相同的圖形,一般研究稱 這種吸子為奇異吸子(Strange Attractor),奇異吸子會產生一個吸收的區 域稱為盆地(Basin),將軌跡收斂在此範圍內,不致於遠離發散。. 2.3.2 碎形理論與特性 碎形(Fractal)一詞是 Mandelbrot (1974)為複雜形狀與無規則現象創造 的一個新詞,意指有些破碎部份不規則集合在一起的狀態,可是到目前為 止,碎形仍無一個嚴格的定義。碎形的特徵是描述一個集合(set),當此集 合對於本身在不同程度的放大後,而所看到的形態總是相同的。一般要對 於碎形有一個較明確的概念,皆從碎形幾何的角度開始,學術上的範例為 由許多數學家創造出的規則碎形,如科赫雪片(Koch Snowflake)、康托集合 (Cantor Set)、西爾平斯基襯墊(Sierpinski Gasket)等,如圖 2-11 至圖 2-13 所示。簡而言之,碎形本身具有兩個重要的特性:自我相似性(Self-Similarity) 及碎形維度(Fractional Dimension)。. - 26 -.
(35) 圖 2-11 科赫雪片. 圖 2-12 康托集合. 圖 2-13 西爾平斯基襯墊. 1.. 自我相似性(Self-Similarity):指不論採用什麼樣大小的標度(Scale)對 碎形本體進行測量,其形態皆不變,以一條曲線為例,觀察取出曲線 的一小部份,加以適當放大以後,仍與曲線整體的形狀是一樣的,曲 線的任何一小部分都是整體的縮形。實際的現象並不如想像中及實驗 創造出的現象那般規律,但從統計上的意義來看,仍然是具有自我相 似性的,即統計的自我相似性(Self-Similarity)。所謂的統計意義,就 是在研究中收集許多類似的形狀,把其中之一的一小部份加以放大 後,其形狀與收集中的另一個形狀是相搭配的。就時間序列而言,將 資料的一小段放大,所呈現的特徵和原先尺度所呈現的特徵相似。以 系統而言,常見的自回饋系統是個很好的例子,在此類系統中,系統 的輸入值即為前階段的輸出值,在此程式下產生的時間序列即存在自 我相似性。. 2.. 碎形維度(Fractional Dimension):碎型維度的值不是整數而是分數, - 27 -.
(36) 在歐氏幾何中,所研究的形狀維度都是整數,分數維度在歐氏幾何中 視不可思議的,但是碎形這種怪異性質在自然界卻普遍存在,在此引 用依據碎形理論大師 Mandelbrot﹝1982﹞所說的: 『雲朵不是球體, 山峰不是圓錐體,海岸線不是圓弧,樹皮不是光滑的,甚至閃電走的 路徑也不是直線』,反映出歐幾里德幾何學的應用是有限制的,對於 解釋自然界的複雜物體方面是如何的無能為力,遂產生了『碎形幾何 學』 。 以紙球為例,當一張紙張攤平時,假設不考慮其厚度,其歐氏幾何維 度為二維平面,接著將紙張撕成碎片,擠壓成一個紙球,此時紙球的維度 將不再是二維平面,但它的維度也不是三維。因為紙球表面有裂縫空隙存 在,其維度將小於三維,但若擠壓的愈緊,則維度愈接近三維。對於這種 現象,是傳統的歐氏幾何無法以其純粹、平滑的方式能描述的,唯有實心 的固體才是維數上真正三維的物體,故只有碎形維度的衡量方能適切的表 示物體或時間序列。複雜系統的背後必隱藏有特殊碎形結構的奇異吸子, 鑑別時間序列是否具混沌現象,可藉由碎形維度的衡量作判斷,並由碎形 維度的大小得知系統的複雜程度。 當一系統(或時間序列)呈現混沌的特性的話,則它即具有混沌現象,由 基本的非線性動態過程推演出的序列,通常能符合以上特性,如數學家們 提出的方程式;但是由實際資料證明是否符合以上特性的研究是各工程領 域所期望的,遂發展出許多鑑定混沌現象的方法。本研究將在下一節作說 明。. 2.3.3 混沌現象的鑑別方法 如果將由簡單的數學方程式和改變少量的參數與初始資料就可以描繪 出複雜形狀的方法稱為『問題』的話,那麼由複雜的形狀反求具有原方程 式的方法就稱為『反問題(Inverse Problem)』 。由上節所述羅吉斯方程式的 例子,鑑別時間序列是否具有混沌現象為反問題的求解方式,這也是各工 程領域研究中,試圖以混沌現象解釋複雜行為的重點,基於這個需求,研 究學者發展出許多鑑別時間序列的方法。 - 28 -.
(37) 在時間序列實證上,通常由檢視一系統是否具有奇異吸子,來判別系 統是否屬於隨機、混沌抑或其他特性的系統。由幾何的角度觀示,混沌現 象是屬於一種具有特別維度的碎形,可將軌跡顯示於座標為( X t , X t +1 )的平面 上,由於奇異吸子的存在,軌跡不會將平面填滿,所以軌跡圖不具有整數 的維度,而是具有非整數的維度(碎形維度)。計算時間序列的碎形維度成為 判斷是否具有混沌現象的依據,碎形維度的大小則為系統複雜度的依據。 如何鑑別一個系統是否具有混沌現象,已有許多學者提出圖形或數量化的 方法,茲整理如表 2-1:. 方法. 方法概念說明. 鑑別方式 ﹝具混沌現象﹞. 以軌跡追蹤的方式計算特定的關係 李雅普諾夫指數>0 李雅普諾夫指數 式,直到包含所有資料,計算最大的 表示軌跡運行並不收斂 李雅普諾夫指數 計算 Hurst 冪數(H),作為判斷系統 0.5 < H < 1 是否具有持續性的指標,具此參數 H 序列具有持續正相關 R/S 分析法 未來路徑受過去行為影 推估碎形維度 響 以相關積分的概念,衡量資料組間之 維度值 D 相關維度分析法 距離小於某一特定值的程度 ﹝D 值不為整數﹞ 以幾何空間角度觀察維度,當維度值 維度值 D 容積維度 為非整數時具有混沌現象 ﹝D 值不為整數﹞ 與容積維度相同,只是以機率的型態 維度值 D 資訊維度 表現 ﹝D 值不為整數﹞ 以圖形方式觀察混沌的動態行為,將 n 維的動態系統減為 n-1 維的間斷 圖形呈現特殊的結構 龐加萊圖 系統,觀察其行為 研究奇異吸子的結構,設定差異值, 圖形呈現規則的散佈 計算所有資料點彼此的差異,以二分 Close Returns 結構 法繪製點圖,觀察圖形行為 資料來源:陳信維﹝2000﹞ 表2-1鑑別混沌現象的方法. - 29 -.
(38) 2.3.4 混沌理論之應用 混沌觀點的探討,除了在自然科學上的研究上廣泛被應用之外,近年 來在經濟管理領域,也受到很大的注意。由於在研究上許多時間序列的研 究,其研究樣本中的時間序列普遍存在非線性相關的現象,例如股票指數、 匯率變動、期貨指數等,是經濟學家所關切的時間序列資料,他們期望此 方面的研究,可以協助他們預測未來的走勢。此外,在生產管理的領域, 市場需求的預測及掌握是分析第一步,但限於研究條件的限制,因此常逕 自將其假設為某項機率分配,這樣的假設在新理論未發展前是可以被接受 的,但畢竟與真實情況相異,因此混沌理論的出現,正是解決此研究問題 的契機。 混沌及碎形理論中的分析方法,其實也可算是時間序列分析的方法, 只因為初始的應用目的不相同,一直未關聯在一起,直到新科學掀起一陣 研究的風潮,才廣泛的出現在各個工程領域中。由於傳統方法的不適性, 近期的研究大都引用新分析方法,國內韓宜芬、李世欽、葉時魁、沈添吉、 陳信維等在其論文研究中皆討論經濟方面的時間序列資料是否具混沌現 象,對於股價指數、匯率、金融資產價格變動率、民生物品價格等時間序 列,分別以不同之鑑別混沌現象的方法進行分析,雖然研究所得的結果皆 無法提出明顯證據證明該時間序列具有混沌的現象,但是根據之前學者的 相關研究,發現生活中處處充滿混沌的系統,如人體的經脈系統、道瓊股 價指數的波動、資料傳輸時的雜訊等等。雖然有些研究無法證實研究對象(時 間序列)具有混沌特性,但對於此類的研究仍有其貢獻性。. - 30 -.
(39) 第三章. 研究方法. 本研究方法主要係依照資料探勘(Data Mining)的步驟進行研究,一開 始對本研究所探討的客戶交易行為與客戶信用做一詳細的問題描述,以提 出本篇論文的研究方法架構,接下來對本研究所採用以混沌理論觀察客戶 交易行為之鑑別方式做演算法的流程做具體說明,之後歸納出正常客戶的 交易行為模式樣版(Pattern),最後由客戶交易行為樣版定義出一套客戶應收 帳款的預警機制,以作為最後的研究結果。. 3.1 問題描述 自企業開始採用信用交易作為主要的交易機制以來,雖然提供了企業 與客戶間交易的便利性,並間接提高了企業的交易成功率,但也因信用交 易所伴隨的風險,造成客戶應收帳款無法成為實質營業收入,產生客戶壞 帳的問題,不但提高了企業營運成本,其所造成的企業資金衝擊,直接影 響到企業的獲利,甚至危及企業的營運,因此對於客戶應收帳款的控管, 是目前所有企業所重視的議題。 「事出必有因」 ,客戶應收帳款會出現問題,其發生原因必定與客戶本 身有關,因此本研究觀察的目標為客戶行為。客戶在永續經營的前提之下, 其必須妥善掌握銷售、存貨與資金的控制,以維持正常的營運。換言之, 也就是在管理上講求降低庫存與增加銷貨,以維持營運成本最小化與營業 收入最大化的目的。客戶若是營運狀況不佳,而導致其資金週轉不足,此 時不但無法支付先前的應付帳款以發生退票現象,並且無多餘的資金進行 採購,使得其失去營運的能力;也有可能為銷售業績衰退或是受到市場的 影響,造成本身存貨無法有效的銷售出去,此時也會減緩採購的頻率或採 購金額。因此,客戶的採購交易行為會間接反映出客戶的營運狀況。 目前企業在客戶應收帳款的管理上,多採用客戶帳齡分析表作為管理 工具,透過帳齡分析表,可觀察出客戶目前有多少未兌現的應收帳款,以 - 31 -.
(40) 及其帳齡金額/天數分布情形,雖然可以從中掌握客戶應收帳款的狀況,避 免客戶的信用額度無限擴張,但是當客戶營運發生問題,無法支付帳款時, 還是無法有效的避免客戶跳票而造成企業的營業損失,因此本研究希望透 過客戶交易行為的觀察與分析,建立一套有效的預警機制,一方面可防範 客戶退票的行為發生,另外也可以在客戶營運出現狀況之前,給予客戶適 當的支援(例如增加其銷售能力、或是協助客戶辦理退貨以減少其資金壓 力),以達到關懷客戶的效果。 分析客戶交易行為的方法可分為定性分析與定量分析,定性分析一般 是透過業務人員對客戶的交易行為利用其經驗或是對該客戶的熟悉度進行 判斷,由於定性分析較為主觀,且較無法提出有效的數據證明其分析結果, 因此定性分析較無法成為客戶管理的主要程序。反之隨科技的進步與工商 業的發展,分析技術逐漸趨向較為客觀的定量分析。對於企業而言,其所 能夠掌握客戶行為的主要資料來源為客戶的歷史交易資料,歷史交易資料 是一組有時間先後順序的統計資料,而時間序列分析(Time Series Analysis) 廣泛的應用在歷史資料分析上。時間序列分析的主要目的有二: 1. 描述及解釋時間序列的行為 2. 協助決策及預測未來發展 此兩項目的存有先後關係,當過去的行為能夠被充分解釋,在掌握其 特性之後,對於未來的發展才能夠有效的做決策與預測,其目的符合本研 究的目標,因此時間序列分析是本研究所使用主要的分析方法。 雖然時間序列在不同範疇已被廣泛的應用,但是大部分的時間序列分 析,均有其限制條件,如穩定性、線性與隨機,而在現實生活中,時間序 列資料普遍地存在非線性(Nonlinearity),並隱含有決定性(Deterministic)問 題,本研究中所探討的客戶交易行為,亦是種非線性動態過程。以往許多 研究以線性試圖模擬非線性過程,但是長期而言,其終究無法掌握系統狀 態,因此呈現出傳統方法的不適用性,而非線性動態過程為混沌的特性, 因此以混沌理論或碎形來解釋客戶交易行為是否更為貼切? - 32 -.
(41) 因此本研究提出的研究方法將分為三大部分進行: 1. 對於客戶歷史交易資料以混沌之鑑別方法分析,判斷客戶交易行為是 否存有混沌現象的特性。 2. 根據鑑別方法所產生的結果,建立正常客戶與退票客戶之交易行為模 版(Pattern)。 3. 根據正常客戶與退票客戶之交易行為模版,找出其行為差異,並訂出 警示參數。. 3.2 研究方法架構 本研究的研究方法架構如圖 3-1 所示,主要是針對本研究所要探討的 議題 - 「由客戶交易資料找出客戶發生退票行為的徵兆」 ,充分運用資料探 勘(Data Mining)所提供的各項功能,分別進行以下處理步驟: 1. 群集:資料概念化的步驟。將原本雜亂無章的客戶交易時間序列資料, 分別計算其李雅普諾夫指數與 Hurst 指數,以判別其是否具有混沌現象 的特性。 2. 序列特徵:藉由兩種指數的變化,產生新的序列,並利用客戶應收帳款/ 信用記錄中是否曾經發生退票的記錄,將客戶分為正常客戶與退票客 戶,由其序列觀察出正常客戶交易行為樣版(Pattern)。 3. 分類:將異常客戶其交易行為序列與正常客戶由步驟 2 所找出的行為樣 版做比較,以觀察出其行為差異。 4. 關聯性:觀察客戶發生退票行為前,其交易時間序列是否產生變化,以 觀察出的現象做為制定客戶信用交易之預警訊號。 最後將研究結果如何應用在客戶信用管理作相關探討,至於本研究分析過 程,將於附錄 C 做詳細說明。 - 33 -.
(42) 圖 3-1 研究方法架構. 3.3 鑑定方法 本研究是以混沌理論為基礎,觀察客戶交易行為與探討交易行為與發 生退票情況之間的關係,因此主要是以分析客戶交易資料為主,客戶交易 行為是種非線性動態過程,而非線性動態過程為混沌的特性之一,因此本 研究嘗試以混沌理論或碎形來解釋客戶交易行為。混沌與碎形理論是否能 使用在解釋客戶交易行為上,首先必須對其交易行為之時間序列資料加以 鑑定使否有混沌現象的發生。 隨著近幾年混沌及碎形理論的風行,藉其對於複雜系統的解釋能力, - 34 -.
(43) 混沌理論已漸漸廣泛應用在許多領域,因此以混沌理論鑑別時間序列是否 具有混沌現象,以發展出許多數量化的方法。本研究採用較受到廣泛應用 的鑑別方法 – 李雅普諾夫指數分析法與 R/S 分析法來鑑定客戶歷史交易 資料,並利用其鑑定結果(李雅普諾夫指數與 Hurst 指數)之變化過程,歸納 出正常客戶與發生退票行為客戶之行為模式。本研究並提供其鑑別的演算 過程,期望能供後續研究者加以應用與改良。. 3.3.1 李雅普諾夫指數分析法(Lyapunov Exponent Analysis) 李雅普諾夫指數分析法(Lyapunov Exponent Analysis)是在混沌理論領 域中,常被用來鑑別時間序列是否具有混沌現象的分析方法。. 圖 3-2 李雅普諾夫指數示意圖. 以圖 3-2 為例,假設在空間上有兩點 X 0 與 X 0 + ΔX 0,其中 X 0 為參考點, X 0 + ΔX 0 為鄰近 X 0 的測試點,此兩點 X 0 與 X 0 + ΔX 0 移動會形成兩條軌跡,兩. 條移動軌跡可看做是兩個時間函數方程式,因此這兩軌道間的距離也為一 時間函數。考慮到複雜系統中,對於初始值的敏感依賴,因此兩軌跡間的 距離函數可寫成 Δx(X 0 , t) 。若在系統中存在一固定吸引子(Attracting Point) 或是吸引週期軌道,則 Δx(X 0 , t) 會隨時間逐漸縮小。若系統為不穩定狀態, 例如系統中具有混沌現象,則兩軌道間的距離會成指數般的發散 (Diverge),但終究還是發散至一極值。因此可以利用下式所求得的指數 λ 來 判斷兩軌跡間的距離關係是否呈指數般的發散。 1 t →∞ t Δx →0. λ = lim ln 0. | Δx(X 0 , t) | ……………………(3.1) | Δx 0 |. - 35 -.
(44) 其中 λ 就是一般所稱的李雅普諾夫指數(Lyapunov Exponent)。李雅普諾夫 指數的判別條件為: 1. λ < 0 ,如圖 3-3 與圖 3-4 所示,軌道運動收斂至定點或是收斂至單一軌 道。. 圖 3-3 李雅普諾夫指數λ<0 收斂至單點. 圖 3-4 李雅普諾夫指數λ<0 收歛至單一軌道. 2. λ = 0 ,如圖 3-5 所示,軌道運動呈穩定。. 圖 3-5 李雅普諾夫指數λ=0 軌道運動呈穩定. 3. λ > 0 ,如圖 3-6 所示,兩相鄰軌跡最終發散,軌道運動具有混沌現象的 特徵。. 圖 3-6 李雅普諾夫指數λ=0 兩相鄰軌跡最終發散. 換言之,以本研究為例,當李雅普諾夫指數檢定得到 λ>0,表示兩相鄰 點其運行軌跡最終發散,隱含混沌現象中對初始值的敏感性且無週期的路 徑;反之若 λ<0 或 λ=0 則無混沌現象的特徵。 但是在真實世界裡,本研究只能取得有限的樣本資料,並且在理論上, - 36 -.
數據
+7
相關文件
請開啟 CSD03.csproj 專案的 Program.cs
瞭解客 戶的 要求 並採
七、提醒貴公司依「多國多中心藥品臨床詴 驗計畫審查程序」 ,如計畫內容變更,應檢
對外商品貿易指數的資料是源於進出口貨物准照及申報單的資料,而有關指數主要包括:價值指
a 顧客使用信用卡在線上付款時,只要輸入其卡號及有效期
1.大專以上學歷(不限特定科系) 2.行政文書處理與文字表達能力 3.外語能力(國際書信往來與客戶接待) 4.資訊應用能力(excel、ppt 等軟體操作)
駭客集團「Gameover Zeus」被指自 2006 年起就散播病毒,入侵企業及個人 電腦,並利用儲存於電腦內的使用者密 碼與私人資料 登入銀行戶頭盜取資 金 ;此外,Gameover
¾ Used to declare code, data areas, select memory model declare procedures etc memory model, declare procedures, etc.. ¾ not