• 沒有找到結果。

02資料的讀取與寫入.pdf

N/A
N/A
Protected

Academic year: 2021

Share "02資料的讀取與寫入.pdf"

Copied!
12
0
0

加載中.... (立即查看全文)

全文

(1)

02 資料的讀取與寫入

王元俊

Wang Yuan-Jiun

[email protected]

(2)

教材

R 語言資料分析:從機器學習、資料探勘、文

字探勘到巨量資料分析 [第二版]

• 作者:李仁鐘、李秋緣

• 出版社:博碩文化股份有限公司

• 書號:MP31714

• 出版日期:2017 年 6 月 2 日

範例檔案下載

(3)

工作目錄

• 設定工作目錄:setwd("目錄位置") 函數

• 取得工作目錄:getwd( ) 函數

(4)

文字檔格式 (.csv)

1. 第一列可以是表頭 (head),也就是各行資料的

變數名稱。表頭可省略。

(5)

資料讀取 (1)

• 在資料框架中操作,讀取文字檔(.csv 檔案):

read.table( ) 、read.csv( ) 與 scan( ) 函數。

– 範例:

> setwd("~/R/examples")

> X <− read.table("X.csv", header = T, sep = ",") # TRUE 可寫成 T

> Y <− read.csv("X.csv")

# 省略 header,預設值為 TRUE > Z <− scan("X1.txt")

(6)

資料讀取 (2)

• 從網路上直接讀取資料

– 範例:

> ad <− read.csv("http://www-bcf.usc.edu/~gareth/ISL/Advertising.csv") > head(ad) # 顯示前 6 筆資料 > X <− read.csv("http://www.k12ea.gov.tw/files/common_ unit/8b44a0ce-6793-4284-8fcf-ed22c3b216c9/doc/學生體重平均值(6歲-15

歲).csv", header=T, encoding="UTF-8", quote="") (註:資料讀取有問題,原因待查。)

(7)

資料讀取 (3)

• 從鍵盤輸入數值資料:scan( ) 函數。

– 範例:

> X <− scan("") # 或寫成 X <− scan() 1: 12 # 輸入數值後按「Enter」鍵 2: 10 3: 5 4: 6.3 5: # 直接按「Enter」鍵結束 Read 4 items > X [1] 12.0 10.0 5.0 6.3

(8)

資料讀取 (4)

• 從鍵盤輸入指定資料型態的資料:scan( ) 函數。

– 範例:

> X <− scan(file = "", what = list(name = "",

pay = 0, sex = "")) # file 參數可省略 1: Peter 50000 M 2: Lisa 40000 F 3: Johnson 65000 M 4: 王大頭 95000 M 5: Read 4 records > mode(X) [1] "list"

(9)

資料輸出至外部檔案

• 使用 write.table( ) 函數。

– 範例:

> write.table(X, "test.csv", row.names = F,

(10)

資料集 (data sets)

1. R 內建的資料集,使用 data( ) 函數列出已建立

的資料集。

> data()

2. 使用內建資料集,data("資料集名稱")

> data(iris)

> iris

3. 取得資料集的資料結構,str(資料集名稱)

> str(iris)

4. 取得資料集的分佈資訊,summary(資料集名稱)

> summary(iris)

(11)

RData 格式資料

• 二進制格式。

• 儲存:使用 save( ) 函數

– 範例:

> data(iris)

> save(iris, file = "iris.Rdata")

• 讀取:使用 load( ) 函數

– 範例:

> load("iris.Rdata", .GlobalEnv) # .GlobalEnv 可省略

註:.GlobalEnv 表示使用者正在使用的工作空

間 (Workspace)。

(12)

讀取 SQL Server 資料庫資料

• 安裝 RODBC 套件

> install.packages("RODBC")

• 使用 RODBC 套件

> library("RODBC")

• 連結資料庫

> db

<− odbcConnect(dsn="test", uid="test",

pwd= "test")

> sqlTable(db)

> df

<− sqlQuery(db, "select * from iris")

> head(df)

參考文獻

相關文件

假設我們的觀察資料是美國自 1790 至 1990 年(以 10 年為一單位)的 總人口,此資料可由載入檔案 census.mat 得到,如下:. &gt;&gt; load census.mat

另外我們還可以觀察到,在 1930 年以後的一段時間,人口

動態時間扭曲:又稱為 DTW(Dynamic Time Wraping, DTW) ,主要是用來比

下列哪一種記憶體屬於非揮發性記憶體, 不會因電源關閉而使其中的資料消 失, 但是可以透過電壓的方式重複抹除資料, 可用於基本輸入/ 輸出系統 (Basic Input / Output System,BIOS)

sort 函式可將一組資料排序成遞增 (ascending order) 或 遞減順序 (descending order)。. 如果這組資料是一個行或列向量,整組資料會進行排序。

●報名資料填寫完畢後,於首頁可點選欲列印之報名表,即可進入列印檢視頁面,請利用瀏覽器列

所以 10 個數字 個數字 個數字 個數字 pattern 就產生 就產生 就產生 就產生 10 列資料 列資料 列資料 列資料 ( 每一橫 每一橫 每一橫

[r]