依據資料庫的迴歸分析 vs. 二十年資歷的護士看一眼就 能判斷一個小孩是否不太對勁「棋王之爭」 -超級電腦深藍 vs. 人類西洋棋王-卡斯 帕洛夫
IBM的深藍不是聰明,而是有七十萬種棋賽的資料庫做 為決策依據
數據分析的結果有時也印證了專家智慧,畢竟專家的經 驗有一定的可信度,但輔以數據可做出更好的選擇「路捷失竊車輛尋回系統」(LoJack)
路捷是小小無線電發收器,可藏在汽車中,幫助警察找回 失竊車輛,如果車子裝了方向盤鎖,竊賊會偷其他車,但路 捷是隱藏的,是否可降低整體失竊率
分析56座城市14年間的汽車失竊資料,投資$500裝路捷, 可使未裝路捷的車減少5000美元損失(正向外部效應)
連缺乏保護的車子也因路捷減少了保險理賠,保險公司 應該提供給路捷使用者更多折扣誰在 思考
人生是一連串做決定的過程
可靠的建議可以讓生活輕鬆很多
想知道那部電影好看,可能會問朋友或參考影評 <紐約時報>會列出最多人郵寄的文章
<iTunes>會列出下載歌曲排行
<Del.icio.us>會列出當紅網路書籤 推薦軟體
<亞馬遜書店>會告訴你買達文西密碼的人也買了聖 血與聖杯
透過網路進行合作過濾,互相推薦
<Netflix>有2/3的影片出租是推薦的,評價也因此更高
5萬種影片中,90%可每月都能租出去一次
量身訂做可針對人們偏好產生長尾效應誰在 思考
預測顧客行為
<哈樂賭場> (Harrah’s Casinos)
預測顧客能忍受輸掉多少錢仍一再回來消費
最高獎勵級(Total Rewards)顧客使用電子卡,紀錄輸 贏金額、顧客年齡、居住地區的平均所得
計算’痛苦臨界點’
假設雪莉喜歡玩吃角子老虎,系統預測她賭一晚的 痛苦臨界點是輸900美元,因此當資料庫偵測雪莉快 輸到900美元時,便會有幸運大使出現,引導她離開, 去品嘗賭場提供的食物
於是顧客不再痛苦,反而離開時更心滿意足
提升顧客的滿意度與忠誠度也就是讓適當的顧客獲 得獎勵
企業會開始提供優惠給讓他們更賺錢的顧客,而不 一定是常客誰在 思考
消費者反擊
<旅遊網站票價預測網> (Farecast.com)
華盛頓大學資訊系教授艾茲歐尼的反擊
2002年,他搭飛機時發現鄰座乘客買的票便宜很多, 只因他們較晚買
向ITA軟體公司購買5百億筆價格
創立網站供人搜尋最低票價,並可預測票價走向
利用115種變數,考慮燃料價格、天氣、美國職棒冠 軍是誰
為消費者爭取資訊上的平等<塵網> (Dust Network)
分析50萬商用車輛的速度以預測塞車情形
以全球衛星定位系統紀錄位置與速度
結合交通流量、天氣、事故、學校上下學
提供甲地到乙地最快捷的路徑, Ex: 計程車或送貨車
回歸分析的預測以機率表示,並會顯示個別因素的影嚮 程度,若資料不夠或難以預測,分析本身也會告訴你隨機 試驗
隨機試驗
一昧仰賴歷史資料要理出因果關係恐怕很困難
1925年,現代統計學之父-費雪提出運用’隨機研究’
假設想知道化療是否優於放射線治療
控制所有條件,包括患者是否抽菸、環境因素等因素
大型隨機研究不需要這些控制,因為樣本夠大時,兩種治療 組別裡抽菸的比例相當
兩組的統計基礎一樣,會有不同結果自然是處理方式不同 所致
樣本夠大時,變數值會是常態分佈
<信用保障公司>南非最大貸款業者之一
寄出5萬份廣告給客戶,隨機提供3.5~11.75%的利率
在信角附上微笑女人的照片可提高男性回覆率,效果相當 於調降利率4.5%
請行銷公司在一周前電訪顧客未來是否有大筆支出,暗示 的力量效果更好
網路的低成本讓試驗種類可以無限多樣
在文檔中
全球資訊網
(頁 43-48)