1
SAS 初探
台中榮總研究部
生統小組R319 徐倩儀#4047 1020426
課程大綱
SAS視窗環境介紹
資料編碼
SAS命名原則
SAS two step
DATA
PROC
資料檔建立&存檔
資料檔合併
SET
MERGE
常用語法
DATA step
PROC step
3
SAS視窗環境介紹
Libraries:
書櫃中各資料夾,也可建立新書櫃Log:記錄所有執行過程
NOTE:藍色字體,表示執行無誤且記錄過程
WARNING:綠色字體,表示程式中有些部分要注意 ERROR:紅色字體,表示程式有誤
黑色字體,表示執行的程式碼
Editor:程式檔視窗
藍色字體,SAS系統用字 紅色字體,表示指令有誤
黑色字體,自訂字,程式更換時須修改之部分
Output:SAS內建結果檔視窗
Results:
所有分析結果,依分類顯示在此視窗資料編碼
Observations(觀測體)
Variables(變項)
SAS命名原則
Variable Value(變項值)
文字型(Character)
數值型(Numeric)
5
資料編碼-SAS命名原則-1
名稱長度
檔案名稱、變項名稱
• 32個字元內
書櫃名稱
• 8個字元內
書櫃名稱、檔案名稱、變項名稱命名原則
英文字母不分大小寫
必須以『A~Z』或『底線(_)』開頭
資料編碼-SAS命名原則-2
範例
合乎規則
• age、a1_1、__2、spmsq_1z等等
不合乎規則
• 1.age、*6、+az等等
7
SAS two step -1
兩大區塊(two step, 有前後區分)
DATA
• data management-建立、管理或修改資料之步驟
PROC
• data procedure-分析資料之步驟
語法不分大小寫
課程範例
• 大寫-SAS系統用字
• 小寫-自訂字
SAS two step -2
語法注意事項
英文不分大小寫
每句語法,以『
;
』為結尾整段語法,以『
RUN
』為結尾,再按 (或F3 或F8)執行註解符號『 * 』-執行程式時不會執行
9
資料檔建立&存檔-1
LIBNAME指令
讀入SAS型式資料檔
資料檔存檔
資料檔建立&存檔-2
LIBNAME指令
讀入SAS型式資料檔
資料檔存檔
• 暫存檔
• 永久檔
11
資料檔合併-SET
SET
複製資料
垂直合併資料
SET
資料檔合併-MERGE
MERGE
水平合併資料
SET
垂直合併資料
複製資料
MERGE
13
資料檔合併-MERGE
SORT & BY 指令
資料檔合併-MERGE
SORT & BY 指令
15
常用語法-DATA step-1
指派指令
常用語法-DATA step-2
四則運算及常用函數
y=MAX(var) or 、 | 最大值
或
擷取字串
文字函數
y=var**(次方數) y=ABS(var) y=SUM(var) y=STD(var) y=MEAN(var) y=MIN(var)
SAS語法
開根號 加
<= 次方項 小於等於
^= 、~=、ne 總和 不等於
>= 絕對值 大於等於
= 標準差 等於
not 、 ^ 平均值 非、不是
y=SUBSTR(var, 自第幾 位起, 取幾位數) and 、 & 最小值
和
SAS語法 SAS語法 數值函數
運算種類
17
常用語法-DATA step-3
當變項有遺漏值
四則運算及數值函數差異
常用語法-DATA step-4
四則運算
計算時間
計算年齡
19
常用語法-DATA step-5
四則運算
計算時間
計算年齡
常用語法-DATA step-6
保留
KEEP指令
KEEP=
刪除
DROP指令
DROP=
21
常用語法-DATA step-7
保留
KEEP指令
KEEP=
刪除
DROP指令
DROP=
常用語法-DATA step-8
保留
KEEP指令
KEEP=
刪除
DROP指令
DROP=
23
常用語法-DATA step-9
條件限制
IF…; (只分析某類個案)
• IF…THEN…; (選擇或刪除某些個案)
• IF…THEN…; ELSE…; (進行併組、分類)
• IF…THEN…; ELSE IF…; (每個條件均有排他性)
• IF…THEN DO; …; END; (同時進行兩個以上之步驟)
常用語法-DATA step-10
IF…; (只分析某類個案)
25
常用語法-DATA step-11
IF…THEN…; ELSE…; (進行併組、分類)
常用語法-DATA step-12
IF…THEN…; ELSE IF…; (每個條件均有排他性)
27
常用語法-DATA step-13
IF…THEN DO; …; END; (同時進行兩個以上 之步驟)
常用語法-DATA step-14
設Dummy variable (虛擬變項、啞變項)
IF…THEN DO; …; END;
29
常用語法-PROC step-1
PROC SORT data=a; BY id; RUN;
刪除重覆資料
• NODUPKEY
• NODUP
常用語法-PROC step-2
31
常用語法-PROC step-3
常用語法-PROC step-4
單變項分析
等距變項
• PROC UNIVARIATE data=a; VAR age s1-s5; RUN;
類別、序位變項
• PROC FREQ data=a; TABLES sex b1-b5; RUN;
33
常用語法-PROC step-5
常用語法-PROC step-6
35
常用語法-PROC step-7
雙變項分析
獨立樣本
• 等距
PROC TTEST data=a; CLASS sex; VAR age s1-s5; RUN;
PROC ANOVA data=a; CLASS 類別變項;
MODEL 等距變項=類別變項; RUN;
• 類別
PROC FREQ data=a; TABLES sex*dis/CHISQ; RUN;
相依樣本(前後測)
• 等距
PROC TTEST data=a; PAIRED a*b; RUN;
常用語法-PROC step-8
37
常用語法-PROC step-9
常用語法-PROC step-10
39
常用語法-PROC step-11