• 沒有找到結果。

第二章 文獻探討

第二節  Benford’s Law 之研究

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

7

第二節 Benford’s Law 之研究

一、 Benford's law

Benford's law 也稱為第一位數法(first-digit law),Benford's law 指出現實生活 中許多數據來源都會呈現特定的數字頻率分佈。在這種分佈中會發現,數字 1 約有 30%的情況為第一個數字,而其他數字在該位置出現的情況較少,像 9 作 為第一個數字的機率就小於5%,廣義來說,越大的數,以它為首幾位的數出現 的機率就越低。故Benford's law 可用於檢查各種數據是否有造假情況。圖 2- 2 Benford's law 第一位數之頻率分佈情形,此數字頻率分佈現象是由美國數學家、

天文學家Simon Newcomb 於 1881 年首次發現,但ㄧ開始 Simon Newcomb 的研 究並未受到重視(Formann,2010)。在 1938 年,美國物理學家 Benford 又發現了 這種現象,且得到和Simon Newcomb 相同的結論。2009 年,西班牙數學家在質 數中發現了一種新模式,並且驚訝於為何現在才為人發現。雖然質數一般被認為 是隨機分布的,但西班牙數學家發現質數數列中每個質數的首位數字有明顯的分 布規律,它可以被描述了質數的Benford's law。這項新發現除了提供對質數屬性 的新洞見之外,還能應用於欺騙檢測和股票市場分析等領域。

Benford's law 定律亦可套用在各種進位制中,其公式如下,b 進位制中,以 數n 起頭的數出現的機率為:

Bolton & Hand (2002)主張偵測詐欺大致上可分為監督式及非監督式二種方 法。監督式方法為利用一個已知的數據庫(合法或詐欺),建構一個模型來分析新 的案例是否為詐欺的可能性。非監督式的方法則是使用時,事先沒有區分合法和 欺詐的屬性,其技術通常是檔案分析(profiling)和離界值(outlier)檢測方法的組合。

其中一個最佳的例子為應用Benford's law 的數字分析(digital analysis)(Hill 1995;

Nigrini 1996; Nigrini & Mittermaier 1997; Drake & Nigrini 2000)。

Benford's law 指出了數字 0~9 在自然狀態下,不同位數出現機率的規律。人 為的詐欺活動將會破壞此規律,使其出現異常,而且此種異常是詐欺者所無法控 制的。所以,比較實際數據的數字分配與Benford's law 數字分配,如果存在異常 現象,這異常就有可能是因為人為詐欺所造成的。再利用此異常發現的基礎上,

運用審計人員的實務經驗和專業判斷進一步調查,就可能會發現詐欺行為。

Benford's law 被提出並證實有偵測數據的能力後,就出現了許多不同領域的 學者利用Benford's law 為基礎來檢查資料數據之合理性。現今已有許多領域應用 Benford's law 來檢查數據之合理性,像是會計、審計及財務等領域,例如:檢查財 務交易金額第n 位數出現的頻率是否符合 Benford's law 所驗證出來的頻率,據此 來檢查其是否有偽造之情況發生。

Hal Varian(1972)提出這個定律來用作檢查支持某些公共計劃的經濟數據有 否欺瞞之處。1992 年,Mark J. Nigrini 便在其研究中利用 Benford's law 提來檢查 所得稅是否有逃稅情況發生。而Drake & Nigrini 於 2000 年開始將 Benford’s law 應用於會計審核上。

Carslaw(1988)首次將 Benford's law 定律運用於會計資料的數據上,針對紐西 蘭1981 年至 1985 年共 220 家上市公司中的會計資料進行研究,Thomas(1989) 則延續Carslaw 的研究,針對美國 1986 年上市上櫃公司中,虧損及盈餘企業之 每季及年度 EPS 的企業資料進行研究。Christopher 等學者(2004)也針對了 1974 年至 1997 年東京股票市場 1,871 家上市公司,共計 37,900 筆年度盈餘資料作

Busta & Weinberg(1998)利用 Benford's law 定律產生指標用以作為類神經網 路模型的輸入變數,Lu & Boritz (2005)及 Lu et al. (2006)應用 Benford's law 於醫 療保險索賠的詐欺檢測上。廣而言之,Benford's law 能用於在會計、金融或是大 量出現的數據,但若所用的數據有指定數值範圍;或不是以機率分布出現的數據,

如常態分佈的數據;這個定律則不準確。

Benford's law 提出了現實生活中首位數字出現的頻率,會符合某一特定分佈,

故我們可以藉由 Benford's law 所提出的特性,來對數據資料進行初步的驗證。

Busta & Weinberg (1998)與 Bhattacharya et al. (2011)提出 Benford's law 指標變數一 共有:第一位數(1~9)的頻率共 9 個變數、第二位數(0~9)的頻率共 10 個變數、第

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

11

查費、痰液溶解劑費、一般生化學檢查費等輸入變數。其研究結果顯示該模式之 分類正確率良好,可藉此進一步偵測健保醫療費用中異常申報之行為。

相關文件