Table of Contents
[SAS] One-way ANOVA 單因子變異數分析
開站來第一篇文章就是講到 t-test : [SAS][R]常用的三種t-test
t-test 可以檢定兩組資料的平均數是否有顯著差異,如果資料多於兩組我們該怎麼檢定呢? 當然我們可以使用多次的t-test 兩兩檢定,但是這不僅花時間,更會增加型一誤差的機率。
今天要介紹變異數分析 ANalysis Of VAriance 簡稱ANOVA
變異數分析 ANOVA
為甚麼叫做變異數分析呢? 因為在變異數分析中,我們利用樣本資料間的變異來推斷各組樣本的母體平均數是否具有顯著差異
在執行變異數分析前需要符合下列假設 :
1.常態性:母體需要符合常態分佈
2.同質性:母體變異數必須具有同質性
3.獨立性:樣本之間必須獨立
要怎麼執行變異數分析呢?
事實上變異數分析是一種假設檢定,虛無假設為各組樣本的母體平均沒有差異,對立假設為至少有一組樣本的母體平均數與其他有差異
H0: μ1= μ2= μ3= … = μk
H1: μi ≠μj , i , j = 1 …. k
變異數分析執行的概念以及方法 :
1.組間變異=SSR
2.組內變異=SSE
3.總變異=SST
公式如下圖:
其中,SST=SSR+SSE , ni 為每一組樣本數, μi為每一組平均數 ,y bar 為全部樣本的平均
ANOVA table
上面三個公式讓你昏了嗎? 別急!
下面的ANOVA table 讓你輕鬆算出統計檢定量F
其中n是全部的樣本數,k是組別數
統計檢定量F=MSR/MSE ~ F(n-1,n-k)
如果F>Fα(k-1,n-k) ,就拒絕虛無假設
EXAMPLE
現在就直接套入資料來算吧!
假設我們想要知道大華國小 A\B\C 班的數學成績是否有差別
A班同學的成績: 64\85\82\74\92
B班同學的成績: 94\76\67\85\85
C班同學的成績: 70\55\49\60\61
A\B\C 班的平均為: 79.4\81.4\59 ,全部人的平均為:73.2667
SSE= (64–79.4)²+(85–79.4)²+(82–79.4)²+(74–79.4)²+(92–79.4)²+(94–81.4)²+ … + (85–81.4)²+(70–59)²+(61–59)² = 1126.4
SSR= 5*(79.4-73.2667)²+ 5*(81.4–73.2667)²+ 5*(59–73.2667)² = 1536.533
SST=SSE+SSR=2662.933
n=15,k=3,所以從上到下的自由度分別為 2 / 12 / 14
MSR=SSR/(k-1)=SSR/2=768.2667
MSE=SSE/(n-k)=SSE/12 =93.8667
F=MSR/MSE=8.184659
當 α=0.05 時,F(k-1,n-k)=F(2,12)=3.89
F = 8.184659 > 3.89 ,拒絕虛無假設,表示三個班級間的成績有顯著差異
Example for SAS
接下來就使用SAS來示範拉~~~
同樣使用上面的資料,輸入的資料如下:
data score;
input group $ math @@ ;
datalines;
A 64 A 85 A 82 A 74 A 92 B 94 B 76 B 67 B 85 B 85 C 70 C 55 C 49 C 60 C 61
;
ANOVA 的SAS code 如下:
proc anova data=score;
class group;
model math= group;
run;
class 組別 ;
model 變數=組別
在output的第一個表格就是ANOVA table
SSR=1536.5333
SSE=1126.4000
SST=2662.9333
MSR=768.2667
MSE=93.86667
F=8.18 ,使用SAS 就不用查表了, p-value=0.0057 ,表示拒絕虛無假設,三個班的成績有顯著差異
跑SAS時也會附上盒鬚圖,可以發現C班的成績比其他班低
One-Way ANOVA 就介紹到這裡了,希望之後還有機會介紹其他的變異數分析