教材
•
R 語言資料分析:從機器學習、資料探勘、文
字探勘到巨量資料分析 [第二版]
• 作者:李仁鐘、李秋緣
• 出版社:博碩文化股份有限公司
• 書號:MP31714
• 出版日期:2017 年 6 月 2 日
•
範例檔案下載
工作目錄
• 設定工作目錄:setwd("目錄位置") 函數
• 取得工作目錄:getwd( ) 函數
文字檔格式 (.csv)
1. 第一列可以是表頭 (head),也就是各行資料的
變數名稱。表頭可省略。
資料讀取 (1)
• 在資料框架中操作,讀取文字檔(.csv 檔案):
read.table( ) 、read.csv( ) 與 scan( ) 函數。
– 範例:
> setwd("~/R/examples")
> X <− read.table("X.csv", header = T, sep = ",") # TRUE 可寫成 T
> Y <− read.csv("X.csv")
# 省略 header,預設值為 TRUE > Z <− scan("X1.txt")
資料讀取 (2)
• 從網路上直接讀取資料
– 範例:
> ad <− read.csv("http://www-bcf.usc.edu/~gareth/ISL/Advertising.csv") > head(ad) # 顯示前 6 筆資料 > X <− read.csv("http://www.k12ea.gov.tw/files/common_ unit/8b44a0ce-6793-4284-8fcf-ed22c3b216c9/doc/學生體重平均值(6歲-15歲).csv", header=T, encoding="UTF-8", quote="") (註:資料讀取有問題,原因待查。)
資料讀取 (3)
• 從鍵盤輸入數值資料:scan( ) 函數。
– 範例:
> X <− scan("") # 或寫成 X <− scan() 1: 12 # 輸入數值後按「Enter」鍵 2: 10 3: 5 4: 6.3 5: # 直接按「Enter」鍵結束 Read 4 items > X [1] 12.0 10.0 5.0 6.3資料讀取 (4)
• 從鍵盤輸入指定資料型態的資料:scan( ) 函數。
– 範例:
> X <− scan(file = "", what = list(name = "",
pay = 0, sex = "")) # file 參數可省略 1: Peter 50000 M 2: Lisa 40000 F 3: Johnson 65000 M 4: 王大頭 95000 M 5: Read 4 records > mode(X) [1] "list"
資料輸出至外部檔案
• 使用 write.table( ) 函數。
– 範例:
> write.table(X, "test.csv", row.names = F,
資料集 (data sets)
1. R 內建的資料集,使用 data( ) 函數列出已建立
的資料集。
> data()
2. 使用內建資料集,data("資料集名稱")
> data(iris)
> iris
3. 取得資料集的資料結構,str(資料集名稱)
> str(iris)
4. 取得資料集的分佈資訊,summary(資料集名稱)
> summary(iris)
RData 格式資料
• 二進制格式。
• 儲存:使用 save( ) 函數
– 範例:
> data(iris)
> save(iris, file = "iris.Rdata")