不同視角看數據 ~ 一窺資料科學的世界
中山大學 劉正山
@ YS 青年職涯發展中心
2019.9.22
手機安裝 APP: ZUVIO 校園
加入與老師及同學的即時互動
或是使用免帳號登入:
HTTP://ZUV.IO/39055
322
https://ips.nsysu.edu.tw/research/page/5/127
https://ips.nsysu.edu.tw/news/page/2/319
關於職場需求這件事
不限科系都有機會,但你得要有作品、有想法。
https://www.google.com/search?client=firefox-b-d&q=%E6%B1%82%E8%81%B7+%E8%B3%87%E6%96%99%E7%A7%91%E5%AD%B8%E5%AE
%B6&ibp=htl;jobs&sa=X&ved=2ahUKEwjt5pS08eHkAhVtKqYKHb_bD80QiYsCKAB6BAgJEAM#fpstate=tldetail&htidocid=AZe06kCAkrezckJOAAAAAA%3D%3D&htilrad=-1.0&htivrt=jobs
為什麼要用 R
自由、誠實、免費、視覺化、連結全世界
資料科學 用眼看?
漂亮圖表的背後 想知道 / 傳達什麼才是關鍵
https://www.tableau.com/
黑盒子?
透明,才有科學!自己看得到過程、別人也要能看到過程。
今日工作坊的目標
體驗資料科學家的工作環境及思考方式
HTTPS://PSMETHO
DS.POSTACH.IO/
專案‧資料處理
製表.製圖.解讀
請確定 R + RSTUDIO
安裝好了
HTTPS://BIT.LY/2KVJ6HN
請下載本次實做要用的全部資料
本講主要使用的 教材
◦ 劉正山 . (2018). 民意調查資料分析的 R 實戰手冊 . 台北 : 五南 .
https://github.com/frankcsliu/R4su rveyresearch
◦ 本講資料下載 https://bit.ly/2kVJ6Hn
啟動:開設專案
認識 RStudio 工作環境
看看 R 的製圖簡介
demo(graphics) 秀給你看 11 張圖片
資料讀入與編碼
做「黑手」是日常
會不會溝通 高下立判
直接使用 Rmarkdown 讓你的文件「活」過來
資料描述與尋找關聯
科學家的使命
資料的視覺化 繼續談談
請記得,它是(可誤人的)手段,不是目的
https://www.visualisingdata.com/resources/
https://www.coursera.org/learn/datavisualization?recoOrder=1&utm_medium=email&utm_source=recommendations&utm_campaign=NNYEEL04EempyReieZALEQ
https://www.coursera.org/learn/datavisualization?recoOrder=1&utm_medium=email&utm_source=recommendations&utm_campaign=NNYEEL04EempyReieZALEQ
https://www.coursera.org/courses?query=data%20science&
Wickham, H., & Grolemund, G. (2017). R for Data Science: Import, Tidy,
Transform, Visualize, and Model Data (1 edition). Sebastopol, CA: O’Reilly
Media.
Microsoft Machine Learning & Data Science Summit 2016 Keynote Session
Dr. Edward Tufte: “The Future of Data Analysis”
Prof. Tufte 的重點
◦ Analytical thinking 視覺化的目的是幫助讀者透過他們的認知能力看見證據 (11:00)
◦ 本身追求美的極致,才能為眾人創造出好的資料視覺化作品 (24:33)
◦ 要忠於良知,誠實、誠實、誠實!
◦ 資料分析界的未來:大膽探索,誠實確證( Exploratory detective analysis vs.
confirmatory unhacked analysis ) (38:00)
https://github.com/Quartz/bad-data-guide#data-are-in-a-pdf
劉老師推薦的資料視 覺化的進階(新)書
◦ Healy, K. (2018). Data Visualization: A Practical Introduction (1 edition). Princeton, NJ: Princeton University Press.
https://kieranhealy.org/publications/dataviz/
◦ Wilke, C. O. (2019). Fundamentals of Data Visualization: A Primer on Making Informative and Compelling Figures (1 edition). Retrieved from
https://serialmentor.com/dataviz/index.html
◦ 張杰 . (2019). R 語言數據可視化之美:專業團表繪製指南 . 北京 : 電子
工業出版社 .
結語
投入一萬小時可以成匠,但 Data Science 不能只用技術來定義。還要勇敢與誠實。
能自己分析資料的人 出路 = 無限
政策研究人員、教授、策略家、市場分析專家、資料記者(data journalist)…
https://www.facebook.com/imDataMan/posts/24679073634882 15
勉勵新一代資料科學家
對被研究對象全方位理解、對技術的變化長時關注、勤於手做、大量閱讀與思考 & ’ 要誠實
Source: https://www.youtube.com/watch?v=rHUDJ8RyseQ
Source: https://www.youtube.com/watch?v=rHUDJ8RyseQ
Source: https://www.youtube.com/watch?v=rHUDJ8RyseQ
歡迎聯絡劉老師
歡迎來中山政研走走 或加入我們
csliu@mail.nsysu.edu.tw