變異數分析(Analysis of variance, ANOVA)

為資料分析中常見的統計模型,主要為探討連續型(Continuous)資料型態之因變數(Dependent variable)與類別型資料型態之自變數(Independent variable)的關係,當自變項的因子中包含等於或超過三個類別情況下,檢定其各類別間平均數是否相等的統計模式,廣義上可將T檢定中變異數相等(Equality of variance)的合併T檢定(Pooled T-test)視為是變異數分析的一種,基於T檢定為分析兩組平均數是否相等,並且採用相同的計算概念,而實際上當變異數分析套用在合併T檢定的分析上時,產生的F值則會等於T檢定的平方項。
在統計學中,變異數分析 (ANOVA)是一系列統計模型及其相關的過程總稱,其中某一變數的方差可以分解為歸屬於不同變數來源的部分。其中最簡單的方式中,變異數分析的統計測試能夠說明幾組數據的平均值是否相等,因此得到兩組的t測試。在做多組雙變數t測試的時候,錯誤的幾率會越來越大,特別是 I型錯誤。因此,變異數分析只在二到四組平均值的時候比較有效。
一、ANOVA的模式型態
變異數分析分為三種型態:
1.固定效應模式(Fixed-effects models)
用於變異數分析模型中所考慮的因子為固定的情況,換言之,其所感興趣的因子是來自於特定的範圍,例如要比較五種不同的汽車銷售量的差異,感興趣的因子為五種不同的汽車,反應變數為銷售量,該命題即限定了特定範圍,因此模型的推論結果也將全部著眼在五種汽車的銷售差異上,故此種狀況下的因子便稱為固定效應。
2.隨機效應模式(Random-effects models)
不同於固定效應模式中的因子特定性,在隨機效應中所考量的因子是來自於所有可能得母群體中的一組樣本,因子變異數分析所推論的並非著眼在所選定的因子上,而是推論到因子背後的母群體,例如,藉由一間擁有全部車廠種類的二手車公司,從所有車廠中隨機挑選5種車廠品牌,用於比較其銷售量的差異,最後推論到這間二手公司的銷售狀況。因此在隨機效應模型下,研究者所關心的並非侷限在所選定的因子上,而是希望藉由這些因子推論背後的母群體特徵。
3.混合效應模式(Mixed-effects models)
此種混合效應絕對不會出現在單因子變異數分析中,當雙因子或多因子變異數分析同時存在固定效應與隨機效應時,此種模型便是典型的混合型模式。
資料來源:維基百科

▼生物統計學(Biostatistics) 顯示/隱藏(show/hide)

0 意見:

張貼留言

 
TOP