數學與工業
陳宜良
台大應用數學科學所
交大數學建模與科學計算中心 台灣工業與應用數學會
2014.6.6
Outline
• Part 1: 工業界需要數學嗎?
• Part 2: 工業界如何用數學
• Part 3: 如何做好準備
Part 1: 工業界需要數學家嗎 ?
• Are mathema8cians needed in Industry?
• SIAM report on Math in Industry
CareerCast.com是美國的一個人力資源網站
CareerCast 的一份報告 Best Jobs in 2014
轉載2014.4.18科技新報
CareerCast
• CareerCast 對 200 種行業排序是依據:
– 收入
– 工作環境
– 工作壓力
– 體能要求 – 事業前景
• 使⽤用勞⼯工部與⼈人⼝口調查局的資料,並根據研究 者的專業經驗。
• 註
:
收入最高的行業仍是醫生與律師,但壓力與風險都較高。
其他相關報導
• US News 2014
– Best business jobs: Market research analyst, opera8ons research analyst
– Best technology jobs: SoNware developer, computer systems analyst, web developer
• Business Insider
– SoNware developer, computer system analyst -‐> data scien8st
• Wall Street Journal 2014, 2013, …, 2009…
• search best jobs in 2014, you will find more…
•
Mathema8cians are needed in industry!
• 為什麼數學專業逐漸被重視 ?
Who Hires Math Majors
• Math majors develop
– analy8cal proficiencies,
– knowledge of math theory and prac8cal applica8ons,
– problem-‐solving skills
• that are highly valued by public and private companies in every industry, including
– finance, computer and data science, and
biotechnology.
Who Hires Math Majors
• State Farm Insurance: 60,000 people
• Qualcomm: a wireless technology company: 150 offices
• Boeing: 170,000 people
• Google: 70 offices
• U.S. Government
• Intel
• Edward Jones: investment firm with 11,000 offices
• McKinsey & Company: leading employer of business analysts
• Boston Consul8ng Group
• Genentech: discovery and manufacturing of medicines.
SIAM
• 美國的工業與應用數學會 Society for
Industrial and Applied Mathema8cs (SIAM) 於 1950
創立.
• 宗 旨 : 應用數學與計算科學是解決實際問題 的關鍵學科。我們的任務是透過出版丶研
究與活動,建立數學與科技的合作橋樑。
SIAM Report on Mathema8cs In Industry
MII 1996, MII 2012
• 檢視數學在學界外的角色
• 檢視數學家在非學界的工作環境
• 了解在業界數學家及其上司對其工作領域 所需技能及背景知識的看法
• 提昇數學系研究生到業界工作機會的策略
MII 2012: 一些新的挑戰
• 人類基因解碼與分子動力模擬開始用到藥 物工業,需要懂得統計丶資料探勘丶模擬 的人才。
• 金融界仍持續需要深入了解數學與金融的 專家。
• 美國工業有許多由製造業轉到服務業,需 要數學家提供各種諮詢服務
SIAM Report on Mathema8cs in
Industry (MII 2012)
The role of mathema8cal sciences in Industry Trends and Case Studies
8種趨勢,18個範例
1. Business Analy8cs商務分析
• 數據引導的決策軟體 (Data driven decision making)
可以幫助許多公司在大量數據中找到有意義的規 律。這就是所謂智慧型商務(Business intelligence)
或商務分析(Business Analy8cs).
• 軟體工業賭上:
數據引導的決策軟體將會是未來商 業發展的走勢
• 主要的軟體高科技公司—IBM, Oracle(甲骨文),
SAP(歐洲最大的軟體公司), MicrosoN微軟—已投資
$250 億美元在此領域. [Lohr, 2011-‐a]
Business Analy8cs 商務分析的內容
• 傳統部份: opera8ons research (作業研究) 與
management science(管理科學).
• 新的元素: 巨量數據的應用
作業研究
與管理科學
• 自1950年起,即已發展出以數學方法處理
物流丶倉儲丶設施位址等優化問題
• 這些優化的技術,如線性規劃,對今日的 工業仍十分重要。
Data analysis for business
(商務數據分析)
• 新的機會在發展 算法與技術,能以低價快
速處理大量的數據。
• 公司可用智慧型商務與商務數據分析於市
場行銷 , 人力資源管理, 財務, 供應鏈管理, 設
施位址 , 風險管理, 產品與製造設計等
。Business Insider Intelligence
• Business Insider 是美國商務與高科技新聞網站
– 全球的網路用戶平均每天花費
2.5
個小時瀏覽社群網站,現在正是社群網站當道的時代,然而大家最 關心的則是該如何有效運用這些網站背後的大數據,
掌握社會趨勢並創造商機。
– BI Intelligence的最新報告指出,只要觀察各大社群
網站上的資訊與用戶行為就可以整理出有規律的數 據,而如果能有效的掌握社群網站背後的大數據,
則可以針對不同網站擬定策略,達到跨社群媒體行 銷的第一步。
(來源:Business Next數位時代譯自BI Intellengence)
商務分析背後的人工智慧
• 《危險邊緣》(Jeopardy)是由梅夫·∙格里芬在1964年創建的
美國的電視智力競賽節目。就像同一類的其它節目,節目 涵蓋了歷史、語言、文學、藝術、科技、流行文化、體育、
地理、文字遊戲等多方面內容。
• 2011年2月14日的《危險邊緣》節目中,IBM華生超級電腦 擊敗人腦。
• IBM華生超級電腦有強大的自然語言的翻譯解釋能力丶能 處理無結構的資料丶並作深度分析(deep analysis)。這些成 果已可用在許多科學丶健保丶金融服務丶及許多工業上的 的問題 [Groenfeldt, 2011] 。
• 人工智慧涉及許多優化丶統計丶計算方面的問題。
商務分析背後的
高性能計算,雲端計算
• 許多行業有興趣於高性能計算來解決其工 業問題
• 工業界需要數學建模丶程式設計丶數學軟
體,並能在平行的計算平台進行模擬。
• 許多公司並非自己擁有平行電腦,而是使 用雲端計算。
2. 跨學科設計優化 與 電腦輔助設計
Mul8disciplinary Design Op8miza8on(MDO) and Computer Aided Design (CAD)
MDO and CAD
• 2011年10月Boeing 787 夢想航空號首航由東
京飛到香港。
• 波音787使用光纖強化塑料,比鋁材料有更
佳的強度-‐重量比,可省20%燃油。
• 波音787窗戶較大,卻可承受較高的氣壓差。
MDO and CAD
• 787 完全在電腦上設計.
• 787飛行時機翼彎曲可達3公尺,電腦要整合流 體力學與結構力學作最佳化設計。
• 787內部設計可以應客戶需求,直接設計並直 接連上生產線。
• 設計所需數學工具包括
computa8onal linear algebra, differen8al equa8ons, opera8on
research, computa8onal geometry, op8miza8on,
op8mal control, data management, and a variety
of sta8s8cal techniques。
其他優化設計的例子 1
• 光罩設計:用於半導體製成
• 光罩設計要解複雜的反問題
其他優化設計的例子 2
• 新穎材料的設計 : 要解Maxwell方程的 反問題
負折射係數,做隱形材料。• 光子晶體的設計要解反問題
– 濾波材料
3. 快速成長的 IT 領域
• Computer vision (電腦視覺)
• Image processing (影像處理)
• Imaging(造影)
• natural language processing( 自然語言處理)
• informa8on retrieval (信息重獲)
• machine learning (機器學習)
也需要大量的數學
比如 : Image Analysis and Data Mining
• Science Applica8ons Interna8onal Corpora8on (SAIC) 是一家承包美國國防部計畫的公司
• SAIC 發展了一套軍事用的智慧型偵查監測系統(ISR) 稱作 AIMES
• AIMES分析無人駕駛飛機所錄之龐大的動態影像資
料,可區別靜態背景與動態物件,可針對動態物件 放大。 AIMS為可攜式,可直接在戰場上部署。
• AIMES也可用於民用的防災或犯罪偵防,以及機械
運轉偵測。
• AIMES裡的
影像分析用到大量的數學,是當前熱門的研究課題。
Part 2 工業界怎麼用數學
How math is used in Industry?
• How google works
• How Amazon recommends books
• How to reduce imaging 8me in MRI
• How to denoise a corrupted picture
• How to inpaint a corrupted pain8ng
• Some other info on ``math in industry.’’
How google works
• 爬挖資料 (Crawling)
• 建立索引 (Indexing) 60 trillion pages
• 排序(Search algorithm and page ranking)
How google works
1. Lars Elden, Matrix Methods in Data Mining and Patern Recogni8on, SIAM 2. PageRank, Wiki
3. GoogleGuide, how google works
Query Processor-‐-‐PageRank
PageRank: A link analysis
Mathema8cal Theory
A random walk interpreta8on
Two problems
• We may get stuck at some page
• The random walk may not converge
Perron-‐Frobenius Theorem
Perturba8on
Challenges
• 60 Trillions of individual pages
• Size of stochas8c matrix can be hundreds of thousands
• Fast algorithm
Part 2 工業界怎麼用數學
How math is used in Industry?
• How google works
• How Amazon recommends books
• How to reduce imaging 8me in MRI
• How to denoise a corrupted picture
• How to inpaint a corrupted pain8ng
• Some other info on ``math in industry.’’
How Amazon recommends books
• 亞馬遜網上書店 Amazon.com 是美國最大的一家 網路電子商務公司,是網路上最早開始經營電子 商務的公司之一,亞馬遜書店成立於1995年,一 開始只經營網路的書籍銷售業務,現在則擴及了 範圍相當廣的其他產品,包括了DVD、音樂光碟、
電腦、軟體、電視遊戲、電子產品、衣服、傢具 等等。
• 亞馬遜會根據你購買或評比過的書籍,推薦你相 關的書籍
Recommender Systems
The next few slides are copied from ``Recommender System, An Introduc8on,’’
Recommender systems
• Collabora8ve filtering
• Content-‐based filtering
• Knowledge-‐based recommenda8ons
• Hybrid recommender systems
Collabora8ve Filtering
Ra8ng by correla8on-‐weights
Reproduce from Powerpoint-‐Slides for Recommender Systems -‐ An Introduc8on
Nevlix Problem
• Nevlix是一家美國公司,提供北美地區綫上
播放DVD的出租業務。
• 2011年4月,Nevlix宣布在美有2360萬用戶,
而全世界則超過2600萬,可提供10萬種DVD
選擇。
• Nevlix會根據用戶訂閱過或評比過的資料提 供推薦影片。
Nevlix 獎
• Nevlix為追求最佳collabora8ve filtering算法
的獎,獎金一百萬美金,由Nevlix公司提供。
• 比賽方式是所提供的方法要比該公司用戶 的方法(Cinematch)好10%. 度量方法是RMSE (root-‐mean-‐square-‐error).
Nevlix 問題
• Data format: <user, movie, date of grade, grade>
• Training data: Training set (99,072,112 ra8ngs not
including the probe set, 100,480,507 including the probe set)
• Quiz set (1,408,342 ra8ngs), used to calculate leaderboard scores
• Test set (1,408,342 ra8ngs), used to calculate compe88on scores
• On September 18, 2009, Nevlix announced team
"BellKor's Pragma8c Chaos" as the prize winner (a Test RMSE of 0.8567)
A Matrix Comple8on Approach
• Given less than 1% of movie ra8ngs
• Goal: predict missing ra8ngs
Matrix Comple8on
Matrix Comple8on
• It can be used for recommender systems
• It can also be used for classifica8on
Part 2 工業界怎麼用數學
How math is used in Industry?
• How google works
• How Amazon recommends books
• How to reduce imaging 8me in MRI
• How to denoise a corrupted picture
• How to inpaint a corrupted pain8ng
• Some other info on ``math in industry.’’
How to reduce imaging 8me for MRI
• Mo8va8on from medical imaging
– Low dose
– Fast imaging – High resolu8on
• A breakthrough: Compressed Sensing
Magnetic Resonance Imaging
(MRI)
MRI images
Typical resolution: 256 x 256 or 512 x 512
MRI history
Basic Principles of Nuclear Magnetic Resonance
• Atoms with odd number of protons and/or neutrons possess nuclear spin angular momentum S
• Associated with S is a magnetic dipole moment
• Magnetic dipole moment rotates under external magnetic field, exhibit magnetic resonance phenomena
• The variation of rotation of spins generate magnetic fluxes and can be recorded
• Hydrogen H+ atoms are abundant in biological specimens
MRI:
use magnetic fields to perform
• Relaxation: Main field B0
• Excitation: Radio Frequency (RF) field B1
• Fourier transform: Gradient field G
Magnetic fields in MRI
Principle of MRI
MRI is a Fourier integrator
Compressive sensing
E. Candes, J. Romberg, T. Tao 2006 David Donoho 2006
Compressive sensing
Candes,Romberg,Tao 2006
Compressive sensing in Fourier space
Part 2 工業界怎麼用數學
How math is used in Industry?
• How google works
• How Amazon recommends books
• How to reduce imaging 8me in MRI
• How to denoise a corrupted picture
• How to inpaint a corrupted pain8ng
• Some other info on ``math in industry.’’
71
70% Salt-and-Pepper Noise
Chan, Ho, Nikolova L1
Denoising
impulse denoise
73
Chan, Ho, Nikolova
70% Salt-and-Pepper Noise
Denoising
Image Inpainting
“Image Inpain+ng : An Overview”,
Guillermo Sapiro
“Fast Digital
Image Inpain+ng”, Manuel M. Oliveira, Brian Bowen,
Richard McKenna and Yu-‐Sung Chang
Chiu-‐Yen Kao
Image Inpainting
Some Applied Mathema8cians in Image Processing
Compressive Sensing (2004)
• Dv
David Donoho
Emmanual Candes Justin Romberg Terence Chi-Shen Tao
Candes, Romberg, Tao, Robust uncertainty principles: Exact signal reconstruction from highly incomplete frequency information, IEEE TRANSACTIONS ON INFORMATION THEORY, VOL. 52, NO. 2, FEBRUARY 2006 cited 4894
DL Donoho, Compressed sensing, Information Theory, IEEE Transactions on, 2006 , cited 6716
關於工業中數學的一些資料
•
85 Things Mathema8cians Have Been Hired to Do In Industry (American Math Society)
• European Consor8um for Mathema8cs in Industry (ECMI) :
Progress in Industrial Mathema8cs ECMI2006-‐2014
•
Journal of Mathema8cs in Industry
Part 3 How to prepare 如何做好準備
• 學會寫程式
• 傳統數學在新時代要有新思維 (建模與應用)
• 多接觸應用課題,從實作當中學習
歐巴馬鼓勵年輕人要會程式
• 2013年12月8日歐巴馬在計算機科學周演講,鼓勵 美國年輕人要會寫程式 :
– “If we want America to stay on the cu|ng edge, we need young Americans like you to master the tools and
technology that will change the way we do just about everything.”
– ‘’Don’t just buy a new video game, make one.’’
– ‘’Don’t just download the latest app, help design it.’’
– “Don’t just play on your phone, program it.”
• 編寫程式是未來社會的基本技能,別成了程式文盲。
新時代 新思維 新數學
• 傳統數學在新時代要有新思維
• 新的應用課題賦予傳統數學新的生命
– 線性代數中的Singular Value Decomposi8on在數據分析
丶影像處理十分重要
– 各種大尺度數值算法十分重要
– 優化丶數學規劃等都有新的應用
– 圖論在社群網路研究有新的應用
– 微分方程丶偏微分方程丶變分學丶反問題等仍是連續
世界建模的基本工具
– 機率丶統計丶不確定性的量化分析等也是建模的工具
做中學
• 多接觸應用問題
• 從實作中學
• 從簡單的東西做起
• 學習將複雜的東西化成簡單的東西
一個小故事
• 一個數學系畢業生組織的讀書會
– Taiwan R User group and Data Mining – htp://www.meetup.com/Taiwan-‐R/
– Python, Git
• R 是目前最紅的 Open Source 統計語言,而且,不只是對於傳統 的統計檢定來說,或是,對於新世代的 Machine Learning 和
Data Mining 的許多技術而言,R 都有很完整的套件支援。因此,
可以很快速的在R上面運用各種 Machine Learning 的技術來分析 資料。
• 他們開了一家Data Mining 公司。
• 大量數據分析:
htp://www.revolu8onanaly8cs.com/