You are on page 1of 36

本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.

tw
或來電(02)2705-5066
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
自 序
SPSS 是社會科學有名的統計軟體,迄今亦在生物醫學大流行。特別是最近
幾年,各大學研究生人數逐年大增,基於學位學術撰寫的需要,多變量統計更是
不可或缺。
一般研究者從事研究時,常有的難題包括:
(1) 應該採用哪一種統計方法來檢定研究假定 (assumptions) 及假設 (hypoth-
esis)?
(2) 如何使用電腦統計程序,以正確且快速的分析研究資料?
(3) 統計程式所輸出的數據所代表的意義為何?又該如何解釋?
筆者在從事研究與教學之際,乃針對此問題,將各種類型的統計方法,以學
習者與使用者的觀點歸納整理,並以範例呈現,期使讀者在了解統計方法之後能
快速學會使用 SPSS,做最有效率的統計分析。
高等統計分析主要應用在:社會科學、生物學 (Biology)、經濟學 (Econom-
ics)、工程學 (Engineering)、遺傳學 (Genetics)、市場行銷 (Marketing)、醫學 (Medi-
cine)、精神病學 (Psychiatry)、教育學、心理學、人管、生產管理;系所包含:經
濟系、風險管理系、航運管理、財務金融、會計、公共衛生、工業工程、土木
等。
有鑑於國內統計使用者眾多,可是目前較缺「理論、統計及方法論」系統性
的書,加上 SPSS v25 市面上鮮少有教科書來介紹新統計功能,於是開始著手撰
寫 SPSS 統計分析,一系列的書。並附上範例之資料檔供讀者實作:
一、《高等統計:應用 SPSS 分析》一書,該書內容包括:描述性統計、樣
本數的評估、變異數分析、相關、迴歸建模及診斷、重複測量……。
二、《多變量統計之線性代數基礎:應用 SPSS 分析》,該書內容包括:平
均數之假設檢定、MANOVA)、典型相關分析 (canonical correlation analysis)、判
別分析 (discriminant analysis)、主成分分析、因素分析 (factor analysis)、集群分
析、多向度量尺/多維標度法。
三、《邏輯斯迴歸分析及離散選擇模型:應用 SPSS》一書,該書內容包括:
邏輯斯迴歸、Probit 迴歸、多項式邏輯斯迴歸、Ordinal 迴歸、Poisson 迴歸、負

I
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
二項迴歸……。
四、《多層次模型 (HLM) 及重複測量:使用 SPSS 分析》一書,該書內容包
括:線性多層次模型、panel-data 迴歸……。
五、《存活分析及 ROC:應用 SPSS》一書,該書內容包括:類別資料分析
( 無母數統計 )、logistic 迴歸、存活分析、流行病學、配對與非配對病例對照研
究資料、勝出比(Odds Ratio)的計算、篩檢工具與 ROC 曲線……Cox 比例危險
模型、Kaplan-Meier 存活模型、參數存活分析有六種模型……。
此外,研究者如何選擇正確的統計方法,包括適當的估計與檢定方法、與統
計概念等,都是實證研究中很重要的內涵,這也是本書撰寫的目的之一。本書內
文盡量結合「理論、方法、統計」,期望研究者能在其領域中得到良好的研究成
果。

張紹勳 林秀娟 敬上

II
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
自 序

Chapter
01 統計學回顧 1

1-1 統計學回顧 .....................................................................................................21


1-1-1  單變量 vs. 多變量統計......................................................................21
1-1-2  統計分析法 ........................................................................................23
1-1-3  統計公式之重點整理 ........................................................................31
1-1-4  檢定與信賴區間之關係 ...................................................................46
1-2 常態曲線 (normal curve) ................................................................................48
1-3 樣本大小的決定 (sample size) .......................................................................49
1-4 Type I 誤差 α 及 Type II 誤差 β:ROC 圖切斷點的由來 ............................53

Chapter
02 假定 (assumption) 的偵測及補救法 59

2-1 自定 SPSS 介面 ( 自己習慣的介面 ) .............................................................62


2-2 資料分析前之檢查 (examining data) .............................................................65
2-2-1  散布圖 (ggraph 指令 ):最小平迴歸法錯用的 4 情況? ...............68
2-2-2  直方圖 (ggraph 指令 ) .......................................................................74
2-2-3  莖葉圖 (EXAMINE /plot stemleaf 指令 ) .........................................77
2-2-4  二個次序變數 (vocab、educ) 之散布圖 ..........................................80
2-3 假定 (assumption) 的偵測及補求法:變數變換 (transforming data) ..........84

I
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
2-3-1  用線形圖檢視連續變數是否符合常態性的假定 (assumption) ......91
2-3-2  曲線關係就違反直線性假定:改用加權 (weighted)OLS 迴歸 .....99
2-3-3  變數變換 ( 迴歸分析 ):違反誤差常態性的假定就做 log(x) 變換
...........................................................................................................113
2-3-4 ANOVA:盒形圖發現變異數異質性:改用 Welch 法.................120

Chapter
03 勝算比 (odds ratio)、卡方檢定、Logistic
迴歸 131

3-1 適用條件 .......................................................................................................132


3-2 卡方檢定:關聯性分析 ...............................................................................134
3-2-1  卡方檢定之介紹 ..............................................................................136
3-2-2  卡方檢定之實作 ( 獨立性檢定、百分同質性 ).............................138
3-3 卡方檢定包含於 logistic 迴歸:勝算比......................................................143
3-3-1 odds ratio 之意義 ..............................................................................146
3-3-2  列聯表 (contingency table)、相對風險、勝算比 (odds ratio) 及
卡方檢定 (crosstabs、logistic regression 指令 ) ..............................150
3-3-3  卡方 logistic 迴歸:同意人類可實驗貓大腦注入藥物嗎 (logistic
regression、crosstabs 指令 ) ............................................................157

Chapter
04 兩組平均數之比較:t 檢定值≒ Meta 的
效果量 181

4-1 t 檢定之簡介 .................................................................................................182


4-2 t 檢定之解說:comparing group means.......................................................184

II
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Contents

4-2-1  單變量:Student’s t-distribution .....................................................185


4-2-2 t 檢定的條件:假定 (assumption) ...................................................187
4-2-3  單變量:Student’s t 檢定 (t-test) ...................................................189
4-2-4  獨立樣本 t 檢定 vs. 單因子變異數分析.........................................191
4-2-5 t 檢定、ANOVA,使用 STaTa、SAS 和 SPSS 之差別 ................191
4-2-6 t 檢定資料檔的編碼安排.................................................................192
4-3 t 檢定 (t 考驗 ):三種型 t-test 實作 ............................................................193
4-4 t 檢定、ANOVA、判別分析、迴歸的關係 (t-test、oneway、regression、
discriminant 指令 ) ........................................................................................202

Chapter
05 獨立樣本 ANOVA、重複測量 ANOVA 225

5-1 變異數分析 (ANOVA) 之簡介 .....................................................................229


5-1-1 ANOVA【基本概念】........................................................................229
5-1-2 ANOVA【重點整理】........................................................................234
5-2 one way ANOVA 分析 (oneway、oneway /contrast、oneway /posthoc、
unianova /print = etasq、oneway /polynomial 指令 ) ..................................242
5-2-1 one way ANOVA:四種教學法的教學效果比較 (oneway 指令 )
...........................................................................................................242
5-2-2  單因子 ANOVA:A 因子 ( 四組 ) 在連續變數 Y 的平均數比較
(oneway、oneway /contrast、oneway /posthoc、unianova /print =
etasq、oneway /polynomial 指令 ) ..................................................261
5-3 two way ANOVA 分析 ..................................................................................275
5-3-1 two way ANOVA:教室氣氛 (a) 和教學方法 (b) 對學習成就 (y):
交互作用項 (MANOVA 指令 )........................................................276

III
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
5-4 單層次:重複測量的混合效果模型 (mixed effect model for repeated
measure) .........................................................................................................288
5-4-1  重複量測 (repeated measurement)ANOVA 的重點整理 ................289
5-4-2  重複測量 ANOVA 之 F 檢定公式 ..................................................295
5-4-3  重複測量 ANOVA 之主要效果 / 交互效果檢定 ( 雙層 MIXED
vs. 單層 GLM 指令 ) ........................................................................298
5-5 雙層次 (MIXED 指令 ):重複測量的混合效果模型.................................301
5-5-1  雙層次 vs. 二因子混合設計 ANOVA:wide 格式 ( 雙層 MIXED
vs. 單層 GLM 指令 ) ........................................................................302
5-5-2  雙層次 vs. 二因子混合設計 ANOVA:long 格式 (MIXED 指令 )
...........................................................................................................323

Chapter
06 共變數分析 (ANCOVA) 339

6-1 單變量:ANCOVA( 共變數分析 ) ..............................................................340


6-1-1  單因子 ANCOVA 之原理................................................................345
6-1-2  單因子 MANCOVA 之重點整理 ....................................................351
6-1-3  單因子 ANCOVA vs. 調整用途的共變數 ( 連續變數 ) 分割為類別
變數,再進行 ANOVA ....................................................................356
6-2 為何要 MANCOVA 取代 MANOVA 呢?ANCOVA ≠ ANOVA
(UNIANOVA、GLM 指令 ) .........................................................................371
6-2-1  單因子 MANCOVA:3 個檢定 (GLM 指令 ) ...............................371
6-2-2  二因子 MANOVA 與 MANCOVA 平均數及效果比較 ( 交互作用顯
著 )(UNIANOVA、GLM 指令 ) ......................................................372

IV
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Contents

Chapter
07 線性迴歸的診斷 401

7-1 自變數與依變數是直線關係 (linearity),此假定若違反,則取 log()、開根


號 ...................................................................................................................409
7-2 檢定變異數的非線性及同質性 (tests on nonlinearity and homogeneity of
variance) ........................................................................................................411
7-2-1  殘差非線性 (nonlinearity):迴歸式「預測值 vs. 殘差」散布圖
...........................................................................................................411
7-2-2  殘差異質性 (homoscedasticity):迴歸式「預測值 vs. 殘差」散布
圖 .......................................................................................................419
7-3 殘差的常態性:P-P 圖、Q-Q 圖、Shapiro-Wilk W 常態檢定 .................421
7-4 模型界定:如何篩選足夠的預測變數們? ...............................................429
7-5 誤差的獨立性 (independence):(EXAMINE VARIABLES=×× BY ×× /
PLOT=BOXPLOT 指令 ) .............................................................................436
7-6 共線性 (multicollinearity) 診斷 ....................................................................440
7-7 偵測不尋常且有影響力的觀察值 (graph /scatterplot(bivar)=×× with ××
by 指令 ) ........................................................................................................448

Chapter
08 線性迴歸 457

8-1 t 檢定、ANOVA、判別分析、迴歸的隸屬關係 (t-test、oneway、


regression、discriminant 指令 )....................................................................459
8-2 簡單線性迴歸 (simple linear gression).........................................................464
8-3 多元線性迴歸 (regression 指令 ) .................................................................470

V
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
8-4 如何挑選預測變數的最佳組合:用 Mallow’s Cp 值及 Adjusted R2 來比較
模型 ...............................................................................................................479

Chapter
09 內生的共變:工具變數及兩階段最小
平方法 (2SLS) 501

9-1 工具變數及兩階段最小平方法 (2sls 指令 ) ...............................................502


9-1-1  進行 OLS 統計分析時應注意之事項.............................................504
9-1-2  工具變數 (IV) 之重點整理 .............................................................513
9-1-3  隨機解釋變數 X(random regressor) 與工具變數 Z(instrumental
variable) ............................................................................................519
9-1-5  為何需要多個工具變數? ..............................................................548
9-1-6  工具變數 (instrumental variables) 在教育應用 ..............................554
9-2 兩階段最小平方法 (2SLS) 分析七步驟 (2sls y with x /instruments z 指令 )
.......................................................................................................................559
9-2-1  兩階段最小平方法 (2SLS) 迴歸:消費者行為 (2sls y with x /
instruments z 指令 ) ..........................................................................559
9-2-2  練習題:兩階段迴歸 vs. 最小平方法迴歸....................................582

參考文獻 585

VI
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
t e r
p

01
Cha

統計學回顧

本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
2

資料型態是連結分布或
離散分布

離散變數 連續變數

可估計結果的機率嗎 資料分布是對稱或非對稱

對稱分布 非對稱分布
可 不可
高等統計:應用SPSS分析

數據是否群集在一個中心值附 離群值 (outliers) 在哪裡?


資料分布是對稱或非對稱 近?
估計機率分布


對稱分布 非對稱分布

數據是否群集在一個 離群值 (outliers) 正值 離群值的可能性有多


否 多數是負值
還是負值? 只有正值 多數是正值
中心值附近? 大?
多個 多個
是 否 僅正值 無離群值 非常低 低
正值 負值
對數常態
二項式 均勻 幾何 負二項式 Hyoergeo 均勻或多種 邏輯斯 指數 最小端
三角分布 常態分布 Gamma 分布
分布 分布 分布 分布 matric 模型 Cauchy (exponential) 值
韋伯分布

或來電(02)2705-5066
binomial discrete geometric binomial hyoergeometric unifrom trigular normal logistic exponential lognormal Min Extreme
uniform

圖 1-1 z 分配

本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
統計學回顧
Chapter
01 3

均勻分布 伯努利分布

超幾何分布 二項式分布 幾何分布

負二項式分布

卜瓦松分布 指數分布

韋伯分布

常態分布 卡方分布
高斯分布
t分布

Gamma分布

Beta分布

圖 1-2  分布的類型

1. 均勻分布:一個均勻分布在區間 (a 到 b 之間 ) 上的連續型隨機變數。一隨機
的連續變數 X ,其值介於最小值 a 到最大值 b 之間。假設每一點出現的機率
都是均等,那麼就稱這個變數 X 的機率分布是連續均勻分布。例如:生物學
上如族群密度中所提及。竹林或針葉樹林的分布因陽光、空間關係,故維持
一定的均勻分布情形亦稱之;人造林與水稻田的分布亦屬之。

本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
4 高等統計:應用SPSS分析

f(x)

1
b-a

0 a b X

圖 1-3  均勻分布之 pdf

2. 伯努利分布 (Bernoulli distribution ,又名兩點分布或者 0-1 分布,是一個離散


型概率分布,為紀念瑞士科學家雅各布.伯努利而命名。) 若伯努利試驗成功,
則伯努利隨機變數取值為 1 。若伯努利試驗失敗,則伯努利隨機變數取值為 0 。
記其成功概率為 p (0 ≤ p ≤ 1) ,失敗機率為 q = 1 - p 。

本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
統計學回顧 01 5

隨機變數

機率密度函數

定義域
平均數
眾數

變異數

偏態

峰度

圖 1-4 Bernoulli 分布之 pdf

3. 超幾何分布 (Hypergeometric probability distribution) 指在伯努力試驗中,若每


次成功的機率不一樣,則次試驗後,所得成功次數就不是二項分布了。試驗
中抽樣歸還時,使用二項分配計算機率。不歸還時,使用超幾何分配計算機率。

本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
6 高等統計:應用SPSS分析

因此民意調查及品質管制的研究裡常出現此分布。生物學例子如:標記再捕捉
法。計算河川中魚的數量時,可將依定數量的魚做標記動作,而後假設捉出
十隻中有六隻標記即可回推河川中總共的魚數,即為該分布情形。

超幾何分布之

超幾何分布之

機率質量函數

平均數

眾數

變異數

偏態

圖 1-5  超幾何分布之 pdf


本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
統計學回顧 01 7

4. 二項式分布 (Binomial distribution) 指 n 個獨立的「是/非」試驗中,成功次數


的離散分布機率。用二項式分布來計算機率的前提是,每次抽出樣品後再放回
去,並且只能有兩種試驗結果,例如:丟銅板正面跟反面。

機率質量函數

平均數
中位數

變異數
偏態

圖 1-6  二項式分布之 pdf

本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
8 高等統計:應用SPSS分析

機率質量函數
如果隨機變數 X 服從參數為 n 和 p 的二項分布,我們記 X~b(n, p) 或 X~B(n, p)。
n 次試驗中正好得到 k 次成功的機率由機率質量函數給出:

對於 k = 0, 1, 2, …, n ,其中

是二項式係數 ( 這就是二項分布的名稱的由來 ) ,又記為 C ( n , k ) , nC k ,或


n k
Ck 。該公式可以用以下方法理解:我們希望有 k 次成功 (p ) 和 n - k 次失敗 (1
n- k
- p) 。然而,k 次成功可以在 n 次試驗的任何地方出現,而把 k 次成功分布
在 n 次試驗中共有 C(n, k) 個不同的方法。
在製造二項分布機率的參考表格時,通常表格中只填上 n/2 個值,這是因為 k
> n/2 時的機率可以從它的補集計算出:
f(k; n, p) = f(n - k; n, 1 - p).
因此,我們要看另外一個 k 和另外一個 p( 二項分布一般不是對稱的 ) 。然而,
它的表現不是任意的,總存在一個整數 M ,滿足
(n + 1)p - 1 < M ≤ (n + 1)p.
作為 k 的函數,表達式 f(x; n, p) 當 k < M 時單調遞增,k > M 時單調遞減,只
有當 (n + 1)p 是整數時例外。在這時,有兩個值使 f 達到最大:(n + 1)p 和 (n + 1)
p - 1 。M 是伯努利試驗的最可能的結果,稱為眾數。注意它發生的機率可以
很小。
5. 幾何分布指的是以下兩種離散型機率分布中的一種:(1) 在伯努利試驗中,得
到一次成功所需要的試驗次數 X ,X 的值域是 {1, 2, 3 ……};(2) 在得到第一
次成功之前所經歷的失敗次數 Y = X - 1 。

本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
統計學回顧 01 9

參數 成功機率 ( 實 ) 成功機率 ( 實 )
支撐集
機率質
量函數

累積分
布函數

期望值

中位數 ( 如果 ( 如果

是整數, 是整數,則
則中位數不唯一 ) 中位數不唯一 )

圖 1-7  幾何分布之 pdf

6. 負二項分布:是統計學上一種離散概率分布。常見離散隨變數的分布如下表五
種:

X~B(n, p)
二項分配 E(X) = np V(X) = npq

X~NB(k, p)
負二項分配

X~G(p)
幾何分配

本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
10 高等統計:應用SPSS分析

X~HG(n, K, N)
p = K/N
超幾何分配
E(X) = np

X~Poi(λ), λ = np V(X) = λ
卜瓦松分配 E(X) = λ (1) n > 20 & p <= 0.05
(2) n > 50 & p < 0.1

「負二項分布」與「二項分布」的區別在於:「二項分布」是固定試驗總次數 N
的獨立試驗中,成功次數 k 的分布;而「負二項分布」是所有到成功 r 次時即
終止的獨立試驗中,失敗次數 k 的分布。舉例說:若我們擲骰子,擲到一即視
為成功。則每次擲骰的成功率是 1/6 。要擲出三次一,所需的擲骰次數屬於集
合 {3, 4, 5, 6 ……} 。擲到三次一的擲骰次數是負二項分布的隨機變數,要在
第三次擲骰時,擲到第三次一,則之前兩次都要擲到一。
注意擲骰是伯努利試驗,之前的結果不影響隨後的結果。
.二項分布:丟出現正面機率為 p 的銅板 n 次,出現 k 次正面的機率為

.負二項分布:丟出現正面機率為 p 的銅板,在失敗 r 次後,出現 k 次正面的


機率為下式:(n = r + k)

.例如:成功機率 0.6,5 次內有 3 次成功的機率為

.在失敗 2 次前已經 3 次成功的機率為

本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
統計學回顧 01 11

概率質量函數

虛線 代表平均值,在每個圖中等於 10;綠線表示標準偏差。

符號
參數 直到實驗停止 ( 失敗次數整數,但
定義可以還可以擴展到實數 )
在每個實驗中的成功概率
( 真實 )
支持 一些成功
涉及
二項式

係數
在正則完全 beta 函數

圖 1-8  負二項分布之 pdf

7. 卜瓦松 (Poisson) 分布指適合於描述單位時間內隨機事件發生的次數的機率分


布。例如:7-11 便利商店每個小時的來客數,因為以時段區分,所以有間隔
屬於離散。

本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
12 高等統計:應用SPSS分析

又如:某一服務設施在一定時間內受到的服務請求次數、電話交換機接到呼
叫的次數、汽車站台的候客人數、機器出現的故障數、自然災害發生的次數、
DNA 序列的變異數、放射性原子核的衰變數、雷射的光子數分布等。

Poisson 的機率質量函數為:

機率質量函數

平均數

眾數
變異數
偏態

圖 1-9 Poisson 分布之 pdf

本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
統計學回顧 01 13

8. 指數分布 (Exponential distribution) 是一種連續機率分布。指數分布可以用來表


示獨立隨機事件發生的時間間隔。
例如:旅客進入機場的時間間隔、打進客服中心電話的時間間隔、中文維基百
科新條目出現的時間間隔等。此指數關係,常見於邏輯斯迴歸或存活分析的
分布圖。

指數分布之存活函數 (Survival Function)

隨機變數 x

參數

機率密度函數

平均數

中位數

眾數

變異數
偏態

圖 1-10 Exponential 分布之 pdf

9. 韋伯分布(Weibull distribution)是可靠性分析和壽命檢驗的理論基礎,其中 x
是隨機變數,λ > 0 是比例參數(Scale parameter),k > 0 是形狀參數(Shape
parameter)。顯然,它的累積分布函數是擴展的指數分布函數,而且 Weibull
distribution 與很多分布都有關係。如:當 k = 1,它是指數分布;k = 2 時,是

本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
14 高等統計:應用SPSS分析

Rayleigh distribution(瑞利分布)。

韋伯 pdf(gamma=0.5) 韋伯 pdf(gamma=1)

隨機變數 X 隨機變數 X

機率密度函數

平均數

眾數

變異數

偏態

圖 1-11  韋伯分布之 pdf


本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
統計學回顧 01 15

10. t 分布 (Student’s t-distribution) 是用於根據小樣本來估計呈常態分布且變異數


未知總體的均值。如果總體變異數已知 ( 例如:在樣本數量足夠多時 ) ,則應
該用常態分布來估計總體均值。它是對兩個樣本均值差異進行顯著性測試的
學生 t 檢定的基礎。此圖形呈現較常態分布瘦長。
t 分布可用來描述 n 個常態分布樣本平均值的分布,與常態分配密切相關,且
是對「常態分配 – 中央極限定理/樣本平均數分配 – 統計顯著性考驗」程序
的一種特殊情形處理。如果要比較的數據有三組以上時,因為誤差無法被壓
低,此時可以用變異數分析(ANOVA)代替 t 檢定。

機率密度函數

平均數

眾數
變異數

偏態

圖 1-12 t 分布之 pdf


本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
16 高等統計:應用SPSS分析

11. 常態分布(高斯分布,Gaussian distribution)是一種理論模式,其分部曲線最


重要的特性是其形狀為左右對稱如同鐘形的曲線。此曲線眾數,並與中位數、
平均數三者合一。曲線兩尾項兩端無限延伸。
於生物學上常見的常態分布為多基因遺傳中,如:人身高、膚色、果實重量等。

機率密度函數

平均數
中位數

變異數
偏態

圖 1-13  常態分布之 pdf

12. 卡方分布 (Chi-square distribution, χ²-distribution) 是概率論與統計學中常用的一


種概率分布。 k 個獨立的標準常態分布變數的平方和服從自由度為 k 的卡方
分布。卡方分布是一種特殊的伽瑪分布,是統計推斷中應用最為廣泛的概率
分布之一,例如:假設檢驗和置信區間的計算。

本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
統計學回顧 01 17

機率密度函數

平均數
中位數

變異數
偏態

圖 1-14  卡方分布之 pdf

13. Gamma 分布是統計學的一種連續機率函數。


Gamma 分配家族包括:t 分配、卡方分配、F 分配、Beta 分配、Poisson 分配
(類同以上分配,當計量對象為類別資料時)。伽瑪分布可用來計算等候時間。
在波氏歷程裡,單位時間成功次數為 λ ,那麼等候第一個成功事件出現的時
間,平均就需要 b = 1/λ 。若要等候至第 n 個成功事件,那麼 µ = n ,這個等

本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
18 高等統計:應用SPSS分析

候的時間就是伽瑪分布。
指數分布和伽瑪分布可用來計算等候時間、產品可靠度、排隊問題等。

Gamma 之存活函數

機率密度函數

平均數

中位數

變異數

偏態

圖 1-15 gamma 分配之機率密度函數

本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
統計學回顧 01 19

14. Beta 分布指觀察一系列的二項分布,但是每一個二項分布的 n, p 都是未知的


情況下,成功率 p 的分布。其中 α 與成功事件數相關,β 與失敗事件數相關。
例如:在一個收費站,收費站一段時間 ( 假設每隔 1h) 會經過一些車 (n 輛 ) 。
假設經過的車只分兩種,大車和小車。你希望通過觀察收費站一長段時間 ( 假
設 10h) 的車輛經過情況,估計小車占所有車的比例 (p) 。這時候就可以使用
beta 分布,記每小時的小車數為 α ,大車數為 β ,則小車的比例為 frac{α}\{α
+ β} 。而這個比例就服從 beta(α, β) 。也就是說,計算每小時觀測到的小車比
例,可以認為他們服從 beta 分布。

機率密度函數

平均數

圖 1-16 gamma 分配之機率密度函數
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
20 高等統計:應用SPSS分析

15. 對數常態分布是指一個隨機變數的對數服從常態分布,則該隨機變數服從對
數常態分布。對數常態分布從短期來看,與常態分布非常接近。但長期來看,
對數常態分布向上分布的數值更多一些。此分布結果如生物學上的演化上因
環境極端異同,而使得物種分布呈現對數常態分布。

對數常態之存活函數

機率密度函數

平均數

中位數

變異數
偏態

圖 1-17 gamma 分配之機率密度函數
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
統計學回顧 01 21

1-1 統計學回顧

1-1-1 單變量 vs. 多變量統計

1. 單變量分布 (Univariate):若我們只關心母體的某項特性,如產品之抗拉強
度、個人滿意度……,則此母體分布稱為單變量分布。
2. 雙變量分布 (Bivariate):若我們關心母體的兩項特性,如產品的抗拉強度與
重量的關係、個人滿意度與離職意願的因果關係……,則此母體分布稱為雙
變量分布。
3. 多變量分布 (Multivariate):若我們關心母體兩項以上的特性,如:「產品的
抗拉強度、重量與抗壓強度」、
「個人滿意度、組識承諾與離職意願的因果關
係」,則此母體分布稱為多變量分布。

一、醫學統計經常混淆的名詞
在應用統計分析作學術研究的各個領域中,醫學領域可說是其中的非常大
宗,據統計目前全世界約有 3 萬種的醫學期刊,約占了科技期刊的四分之一之多。
而在這塊這麼大的市場中,我觀察到在醫學領域所使用的統計名詞,經常與統計
教科書有相當多的出入,本篇文章擬將這些常見的混淆之處作個釐清。
1. 單變量或多變數迴歸分析
假使我們現在要進行依變數 (dependent variable) 的預測,如果我們的自變
數 (independent variable) 只有一個,那麼這種迴歸模式稱之為簡單迴歸 (Simple
regression) ,不過在醫學期刊常見以單變量迴歸 (Univariate regression) 來表達;
倘若我們的自變數是 2 個以上,那麼我們稱之為多元迴歸 (Multiple regression) ,
但在醫學期刊則部分稱之為多變數迴歸 (Multivariable regression) 或多變量迴歸
(Multivariate regression) 。
特別值得說明的是,「多變量」(Multivariate) 在一般統計教科書是專門指同
時有 2 個以上的依變數的統計方法,例如主成分分析、因素分析、集群分析、結
構方程模式、典型相關等;但在醫學領域中,不管依變數有多少個,只要自變數

本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
22 高等統計:應用SPSS分析

2 個以上,就會稱之為多變量分析 ( 比較正確來說應該是多變數分析 ) ,這是蠻


特別的一點。
2. 自變數、依變數或控制變數
統計教科書皆把依變數定義為 dependent variable ,不過實際醫學期刊比較
常見以結果變數 (outcome) 來稱呼之;如果我們的模式有許多個 (2 個以上 ) 自
變數,而所關注的是其中一個變數,那麼此時其他變數便稱作控制變數 (Control
variable) ,但在醫學期刊的習慣來說,並非主要研究變數的控制變數都叫做共變
量 (Covariate) 。
3. 迴歸分析的細節
在多變數迴歸 (2 個以上的自變數 ) 中,每一個自變數的迴歸係數皆是已經
考慮其他變數的效果,一般我們會說控制或考慮其他變數效果之下 (Controlling
or considering other variables) ,不過醫學期刊特別偏好使用「調整」(Adjust) 這個
字。「Adjusted」,例如 adjusted OR 或 adjusted HR 以標明此為多變數分析之下的
結果;相較之下,如果是單變數的模式 ( 只有一個自變數 ) ,醫學期刊也偶爾會
看到用 naïve 或 crude 這兩個字來表示這是一個單變數分析,例如 crude OR 或
naïve analysis 。
以上介紹了一些常見的醫學統計容易造成混淆的名詞,並且以與迴歸分析相
關的名詞為主,以下表格為將以上內容作個整理,希望幫助大家未來在閱讀醫學
期刊時有所幫助。

名詞或情境 醫學領域 其他領域


單變量的迴歸分析 Univariate regression Simple regression
多變量的迴歸分析 Multivariate regression or Multiple regression
multivariable regression
控制變數 ( 共變量 ) Covariate Control variable
依變數 ( 結果變數 ) Outcome (variable) Dependent variable
考 慮 其 他 變 數 之 下 的 效 果 Adjusting for other covariates Controlling or considering
( 通常是迴歸分析 ) other variables
迴歸係數 ( 多變量的迴歸分 “Adjusted” coefficient (e.g. Regression coefficient
析之下 ) adjusted OR or HR)

本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
統計學回顧 01 23

1-1-2 統計分析法

常見的資料分析統計方法,包括:t 檢定、變異數 F 檢定、相關/迴歸 r 等


統計量,可歸納成表 1-1 。

表 1-1 資料分析方法之參考表

自變數 單因子 兩因子關係 兩因子線性 多因子關係 多因子


關係 ( 有依變數 ) 關係
依變數 ( 無依變數 )
連續變數 1. Z-test(e.g. 常態 ANOVA 、 相關分析、 迴歸分析、時間 多 變 量 分
( 平均數 分配之偏態 / ANCOVA 線性模型、 序列 ( 自身相關、 析 : 如 因
為比較基 峰度檢定 ) 時間序列 向量自我迴歸、 素 分 析 、
準) 2. t-test (ARIMA) VECM) 、複迴歸 集群分析、
3. ANOVA 之交互項 MDS……
4. 無母數統計
( Wi l c o x o n
rank test 等 )
類別變數 1. z-test 類 別 資 料 分 廣 義 估 計 對數線性 (loglinear)
( % 為 比 2. 卡 方 檢 定 析:卡方檢定 (GEE) 分析法 模 型 、 區 別 分
較基準 ) ( e . g . 樣 本 ( 獨 立 性 、 % 進行重複性資 析、Probit 模型、
代表性或隨 同 質 性 、 對 料的比較 survival 模型、
機性檢定、 稱性檢定 ) 、 Multinomial Logit
樣 本 n o n - Conjoint 分析 等。
responded 等 Multilevelmixed-
bias 、適合 effects 迴歸
度檢定 )
3. 勝出比 odds
ratio(logistic
迴歸 )
4. risk ratio
5. Tetrachoric
相關
註:若分析資料,結合橫斷面及縱貫面,則採 panel data 迴歸或 Multilevel and Longitudinal 模型、Treatment
Effects 模型 ( 虛擬變數 ) 。
  1. 因子:類別自變數。例如:性別、教學法、實驗處理效果 vs. 對照組。
  2. 單因子:一個類別自變數;二因子:二個類別自變數。
  3. 實驗處理或實驗水準:因子的類別或水準。
   例如:實驗組 vs. 控制組;或高 vs. 中 vs. 低分組。
  4. 獨立樣本:每一組受試者僅接受一種實驗處理。
  5. 相依樣本:受試者需接受所有的實驗處理,例如教學法。
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
24 高等統計:應用SPSS分析

表 1-2 常見之統計模型

自變數 Independent Variables


全是類別變數 至少有一個整數或連續變數
二分 2×c×… 行列表分析;機率 機率單元模型、
Binary 單元 (probit) 模型、勝算對數 成長曲線 (logistic) 迴歸
(logit) 模型
依變數 無次序 r×c×… 行列表分析; 多項之機率單元模型、勝算對
Dependent Nominal 多項 (multinomial) 之機率單元 數模型 ( 成長曲線迴歸 )
Variable 模型、勝算對數模型
有次序 r×c×… 行列表分析; 有序多分類之機率單元模型、
Ordinal 有序多分類之機率單元模型、 依序之勝算對數模型
依序之勝算對數模型
整數 * 對數線型 (loglinear) 模型; 卜瓦松迴歸及其延伸
Integer 卜瓦松 (Poisson) 迴歸及其延伸
連續 變異數分析 (ANOVA); 共變數分析 (ANCOVA);
Continuous 線型或非線型迴歸 線型或非線型迴歸
* 註:嚴格說來,對數線型模型並不區分自變數與依變數,而是以行列表細格內之聯合次數分布為解釋對象,
並以組成行列表的所有變數及其互動作為解釋變數。

一、推論統計主要工作
推論統計指用概率形式來決斷數據之間是否存在某種關係,及用樣本統計
值來推測總體特徵的一種重要的統計方法。推論統計包括總體參數估計和假設檢
定,最常用的方法有 Z 檢定、t 檢定、卡方檢定等。推論統計主要工作如下:
1. 估計 (estimation):利用一組由母體所取之隨機樣本資料的資訊,來推估母體
之未知參數。常見有 (1)「點估計量」:由樣本資料計算的統計量,使用來估計
母體參數。(2)「區間估計」
:某區間會涵蓋母體參數的可能性。(3)「信賴區間」
(confidence interval):在特定機率下,估計母體參數可能落在的數值範圍。此
特定的機率值可以稱為信賴水準。
2. 假設檢定 (testing of hypothesis):研究者對現象 ( 參數 ) 提出主觀的研究假設,
再利用樣本特徵的資訊 ( 抽樣數據 ) 來對研究假設進行檢定,以做管理的正確
決策。
通盤來說,假設檢定都可分解成下列五個步驟:

本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
高等統計:應用SPSS分析/張紹勳,林秀

娟.--初版.--臺北市:五南, 2018.09

 面; 公分

ISBN 978-957-11-9888-0 (平裝附光碟片)

1.統計套裝軟體 2.統計分析

512.4 107013718

1H1G

高等統計:應用SPSS分析
作  者 ─ 張紹勳 林秀娟

發 行 人 ─ 楊榮川

總 經 理 ─ 楊士清

主  編 ─ 侯家嵐

責任編輯 ─ 黃梓雯

文字校對 ─ 黃志誠 劉祐融

封面設計 ─ 盧盈良

出 版 者 ─ 五南圖書出版股份有限公司

地  址:106台 北 市 大 安 區 和 平 東 路 二 段 3 3 9 號 4 樓

電  話:(02)2705-5066  傳  真:(02)2706-6100

網  址:http://www.wunan.com.tw

電子郵件:wunan@wunan.com.tw

劃撥帳號:0 1 0 6 8 9 5 3

戶  名:五南圖書出版股份有限公司

法律顧問 林勝安律師事務所 林勝安律師

出版日期 2 0 1 8 年 9 月 初 版 一 刷

定  價 新 臺 幣 6 8 0 元

※版權所有.欲利用本書內容,必須徵求本公司同意※

本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066