Professional Documents
Culture Documents
tw
或來電(02)2705-5066
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
自 序
純粹概念性的理論顯然在實際問題的解釋與應用上是有限的。而缺乏理論基
礎的統計分析則無法提供一個「因果關係」的說明。同樣,其說服力也是有限
的,或甚至可能是錯誤的。加上組織與管理研究的資料多涉及階層特性,因此
多層次模型是當代組織與管理領域的重要研究典範之一。因而興起多層次模型
(HLM)來彌補單層次迴歸的不足。迄今,多層次與層級線性模型廣泛應用到管
理、教育、人管、醫藥健康等領域。
人並非孤立的個體,而是整個社會中的一員,例如,學生層次的資料巢套於
高一層的分析單位(如班級或學校)之內,在同一個高階分析單位下的個體會因
為相似的特質,抑或受到共享的環境脈絡所影響,造成個人層次資料間具有相依
的性質,亦即存在著組內觀察資料不獨立的現象。由此可知,個體的行為或反
應不僅會受到自身特性的影響,也會受到其所處的環境脈絡所影響。因此巢狀
(nested)資料分析之多層次模型就此流行起來。
科學是一門累積的學習課程,統計又 是科學之實證基礎,加上電腦統計計
算能力日新月益。進而像 STaTa 這種龐大功能之統計軟體的誕生,STaTa 功能及
便利性都遠超越 R、MLWin、Mplus、SPSS、SAS、AMOS 及 Eviews 等軟體。
STaTa 優秀統計功能是地表最強的軟體。STaTa 已可處理:(1) 橫斷面研究設計、
縱貫面研究設計、縱橫面 (pandel-data) 研究設計。(2) 單一迴歸方程式、迴歸聯
立方程式。(3) 網站提供龐大線上求助、外掛指令(*.ado)來滿足各行各業的個
別需求。(4) 單變量、多變量時間序列亦可處理。(5) 多層次 vs. 單層次迴歸之統
計分析……等都有最新處理方法,光是多層次線性混合模型就有 15 種以上類型
可供選擇。
STaTa 同時提供眾多(內建 vs. 外掛)指令,幾乎坊間教科書能看到的統計
分析,都可解決。此外,STaTa 為了減低電腦使用者對程式設計的憂慮,它亦提
供 Menu 表單之對應視窗,讓像 SPSS、SAS、HLM 那樣能輕鬆操作 Menu,來進
行統計分析。況且,STaTa 有能力處理像 big-data 這類巨大資料庫。
有鑑於 STaTa 分析功能龐大,故作者將撰寫一系列 STaTa 書籍,包括:
多層次模型(共 15 種多層次模型之類型可選擇)、社會科學、生物醫學、
I
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
財金等領域,其統計係採用統計學、運籌學、經濟、數學等領域之定量方法。社
會科學及自然科學二大領域中各個學科,它們有許多共通之研究設計及統計分析
法,都與作者在五南出版 STaTa 一系列書名有關,包括:
一、《STaTa 與高等統計分析的應用》一書,該書內容包括:描述性統計、
樣本數的評估、變異數分析、相關、迴歸建模及診斷、重複測量……。
二、《STaTa 在結構方程模型及試題反應理論的應用》一書,該書內容包括:
路徑分析、結構方程模型、測量工具的信效度分析、因素分析……。
三、《STaTa 在生物醫學統計分析》一書,該書內容包括:類別資料分析 ( 無
母數統計 )、logistic 迴歸、存活分析、流行病學、配對與非配對病例對照研究資
料、盛行率、發生率、相對危險率比、勝出比(Odds Ratio)的計算、篩檢工具
與 ROC 曲線、工具變數(2SLS)……Cox 比例危險模型、Kaplan-Meier 存活模
型、脆弱性之 Cox 模型、參數存活分析有六種模型、加速失敗時間模型、panel-
data 存活模型、多層次存活模型……。
六、《總體經濟與財務金融:STaTa 時間序列分析》一書,該書內容包括:
誤差異質性、動態模型、序列相關、時間序列分析、VAR、共整合……等。
七、《多層次模型(HLM)及重複測量:使用 STaTa》一書,該書內容包括:
線性多層次模型、vs. 離散型多層次模型、計數型多層次模型、存活分析之多層
次模型、非線性多層次模型……。
八、《模糊多準則評估法及統計》一書,該書內容包括:AHP、ANP、TOP-
SIS、Fuzzy 理論、Fuzzy AHP……等理論與實作。
II
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
九、《邏輯斯迴歸及離散選擇模型:應用 STaTa 統計》一書,該書內容包
括:邏輯斯迴歸、vs. 多元邏輯斯迴歸、配對資料的條件 Logistic 迴歸分析、Mul-
tinomial Logistic Regression、特定方案 Rank-ordered logistic 迴歸、零膨脹 ordered
probit regression 迴歸、配對資料的條件邏輯斯迴歸、特定方案 conditional logit
model、離散選擇模型、多層次邏輯斯迴歸……。
本書目標在提供對多層次分析有興趣的學生、學者、教師與研究人員的指導
工具書。本書亦提供範例資料檔與統計程式操作方式。這些基礎理論與範例有助
於我們瞭解多層次分析。要深入瞭解這本書必須要有基本的多元迴歸方程式的知
識。本書提供 STaTa 範例,針對多層次迴歸分析主要模型的操作程序,並強調這
些統計軟體所產生的報表解釋,諸如結果變數為連續變數或者類別變數的兩層與
三層模型、輔助性統計 ( 如迴歸係數信賴區間、組內相關係數等 )、檢視模型假
設等。
此外,研究者如何選擇正確的統計方法,包括適當的估計與檢定方法、與統
計概念等,都是實證研究中很重要的內涵,這也是本書撰寫的目的之一。為了讓
研究者能正確且精準使用 panel 迴歸,本書結合「理論、方法、統計」,期望對
產學界有拋磚引玉的效果。
最後,特感謝全傑科技公司(http://www.softhome.com.tw),提供 STaTa 軟
體,晚學才有機會撰寫 STaTa 一系列書,以嘉惠學習者。
張紹勳 敬上
III
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
自 序
Chapter
01 STaTa 是地表最強統計,適合各產官學研
1
Chapter
02 多層次分析法:HLM 91
II
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Contents
III
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
2-8-5 多層次中介效果:STaTa 實作 (ml_mediation、xtmixed 指令 )
.................................................................................................. 244
2-8-5a 多層次中介效果:STaTa 方法一 (ml_mediation 指令 ) ..... 244
2-8-5b 雙層次中介效果:STaTa 方法二 (xtmixed、mixed 指令 ) 251
2-8-6 Sobel-Goodman 中介檢定法 ( 先 sgmediation 再 ml_mediation
指令 ) ........................................................................................ 261
Chapter
03 單層 vs. 雙層次模型:無交互作用項就無
須中心化 269
IV
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Contents
Chapter
04 多層次模型之方程式解說:有 (Z×X) 交
互作用項就須中心化 431
4-1 多層次模型之方程式解說:影響住宅房價之個體層及群組層
............................................................................................................... 433
4-1-1 Step 1 設定 ( 模型 1):零模型 (null model) ........................... 440
4-1-2 Step 2 設定 ( 模型 2):平均數為結果的迴歸模型 (means-as-
outcomes regression) ................................................................ 445
4-1-3 Step 3 設定 ( 模型 3):Level-1 具固定效果之隨機截距模型
.................................................................................................. 447
4-1-4 Step 4 設定 ( 模型 4): 隨機係數 (random coefficients) 迴歸模型
.................................................................................................. 454
4-1-5 Step 5 設定 ( 模型 5): 截距與斜率為結果的迴歸 ( 交互作用 )
.................................................................................................. 458
V
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
05 多層次模型之 STaTa 實作及解說 ( 新版
mixed, 舊版 xtmixed 指令 ) 467
VI
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Contents
Chapter
06 單層次 vs. 多層次:離散型依變數之
Poisson 迴歸 533
Chapter
07 單層次 vs. 雙層次:二元依變數之 Logistic
迴歸 587
VII
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
7-2-1 Logit 模型之解說 ..................................................................... 603
7-2-2 單層次:二元依變數之模型:Logistic 迴歸之實例 ............ 621
7-3 範例:三層次 :Logistic 迴歸 (melogit 或 xtmelogit 指令 )................ 643
7-4 練習題:雙層次 Logistic 迴歸 (melogit 指令 ) .................................. 653
Chapter
08 範例:雙層次 vs. 三層次:線性多層次模
型 665
VIII
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Contents
Chapter
09 單層 vs. 雙層:Cox 存活分析:臨床最重
要統計法 729
IX
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
9-6-1 脆弱性 (frailty) 模型 ............................................................... 835
9-6-2 加速失敗時間 (accelerated failure time) 模型 ........................ 842
9-7 雙層次:panel-data 參數存活模型 [xtstreg, shared(panel 變數 ) 指令 ]
............................................................................................................... 851
9-7-1 追蹤資料 (panel-data).............................................................. 852
9-7-2 追蹤資料 (panel-data) 存活分析 [xtstreg, shared(panel 變數 ) 指
令 ] ............................................................................................ 859
9-8 多層次:參數存活模型 (mestreg、「sttocc clogit」指令 ) .............. 870
9-8-1 multilevel 存活模型 ................................................................. 870
9-8-2 多層次參數存活模型 (mestreg… || 分層變數 ) ..................... 872
9-9 巢狀型病例—對照研究法 (nested case-control) ( 先 sttocc 再 clogit 指令 )
............................................................................................................... 886
9-10 練習題:三層次之對數常態存活模型 (mestreg 指令 ) ..................... 895
Chapter
10 非線性:多層次混合效果模型 (menl 指令 )
901
X
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Contents
Chapter
11 誤差變異 σ2ε 具異質性 (xtgls 指令為主流 )
961
參考文獻 1013
XI
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
t e r
p
01
a
Ch
STaTa 是地表最強統計,
適合各產官學研
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
多層次模型 (HLM) 及重複測量:使用 STaTa
1-1 統計分析
統計學是在資料分析的基礎上,研究如何測定、蒐集、整理、歸納和分析
反映資料,以便給出正確訊息的科學。這一門學科自 17 世紀中葉產生並逐步發
展起來,它廣泛地應用在各門學科,從自然科學、社會科學到人文學科,甚至
被用於工商業及政府的情報決策。隨著巨量資料 (Big data) 時代來臨,統計的面
貌也逐漸改變,與資訊、計算等領域密切結合,是資料科學 (Data science) 中的
重要主軸之一。
由於 STaTa 可讀入的資料庫己達無限大,非常適合聚合後 Big data 之統計
分析。此外,普羅大眾所有關聯式資料庫 (Oracle, MySQL, Microsoft SQL Server,
PostgreSQL and IBM DB2)、分析軟體 (R、SPSS、SAS、其他 Relationsl Data-
Base),亦可順利將其格式轉成 STaTa 資料檔來精準分析。
譬如自一組資料中,可以摘要並且描述這份資料的集中和離散情形,這個
用法稱為描述統計學。另外,觀察者以資料的形態,建立出一個用以解釋其隨
機性和不確定性的數學模型,以之來推論研究中的步驟及母體,這種用法被稱
為推論統計學。這兩種用法都可以被稱為應用統計學。數理統計學則是討論背
後的理論基礎的學科。
統計學的數學基礎建立在 17 世紀 Blaise-Pascal 和 Pierre-de-Fermat 發展的機
率論上。機率論從研究機率得來。最小平方法由 Johann-Karl-Friedrich-Gauß 於
1794 年第一次得出。現代電腦可以進行更大尺度的統計運算,生成了許多無法
用人工計算的新公式。
統計學是在面對不確定的情況下,提供人們能做出聰明決策的科學方法。
其過程包括資料的蒐集、整理、呈現結果、解釋與分析。透過此一過程,並可
進而根據分析的結果加以推論,從而可以獲得合理的研判與有效的結論。
1-1-1 認識統計
統計是數學的一個分支,它處理、蒐集、分析、解釋、展示和組織數據。
將統計數據應用於科學、生物醫學、財金、工業或社會問題等。統計源始於人
口統計或統計模型之建模過程。統計處理數據來自多方面,包括在調查法、分
析法和實驗法、觀察法的數據蒐集及規劃 ( 研究設計 )。
2
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
STaTa 是地表最強統計,適合各產官學研 01
一、統計學的觀念
為了將統計學應用於科學、生物醫學、財金、工業或社會問題上,我們由
研究母群體開始。這可能是一個國家的人民,石頭中的水晶,或者是某家特定
工廠所生產的商品。一個母群體甚至可能由許多次同樣的觀察程序所組成。由
這種資料蒐集所組成的母群體,長期的我們稱它叫時間序列;短期的叫重複測
量 ( 第 2 章 )。
為了實際的理由,我們選擇研究母群體的子集代替研究母群體的每一筆資
料,這個子集稱做樣本。以某種經驗設計實驗所蒐集的樣本叫做資料。資料是
統計分析的對象,並且被用做兩種相關的用途:描述統計和推論統計。
1. 描述統計 (descriptive statistics)
資料的蒐集、整理、呈現、解釋與分析等步驟,以數值、表格、圖形來描
述資料概況的方法。在現實生活中,常會遇到一堆數據資料,要如何運用簡單
易懂的方式描述出來,以便大家瞭解,這就是描述性統計。
2. 推論統計 (inferential statistics)
旨在檢定研究假設。利用樣本資料分析的結果對母體資料的某些特性,做
合理的估計與推測。
推論統計指用概率形式來決斷數據之間是否存在某種關係及用樣本統計值
來推測總體特徵的一種重要的統計方法。推論統計包括總體參數估計和假設檢
定,最常用的方法有 Z 檢定 ( 非常態迴歸係數之顯著性檢定 )、t 檢定 (OLS 迴歸
係數之顯著性檢定 )、卡方檢定 ( 類別資料列聯表 ) 等。推論統計主要工作如下:
1. 估計 (estimation):利用一組由母體所取之隨機樣本資料的資訊,來推估母體
之未知參數。常見有 (1)「點估計量」:由樣本資料計算的統計量,使用來估
計母體參數。(2)「區間估計」:某區間會涵蓋母體參數的可能性。(3)「信賴
區間 (confidence interval)」:在特定機率下,估計母體參數可能落在的數值範
圍。此特定的機率值可以稱為信賴水準。
2. 假設檢定 (testing of hypothesis):研究者對現象 ( 參數 ) 提出主觀的研究假設,
再利用樣本特徵的資訊 ( 抽樣數據 ) 來對研究假設進行檢定,以做管理的正確
決策。
通盤來說,假設檢定都可分解成下列五個步驟:
(1) 設定 H 0:針對母體設定之基本假設。對立假設 H 1:針對題意欲測試之方
向設定之假設。
3
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
多層次模型 (HLM) 及重複測量:使用 STaTa
f(z)
0.4
0.3
0.2
0.1
α
z
-3 -2 -1 0 1 zα 2 3
圖 1-1 z 分布
4
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
STaTa 是地表最強統計,適合各產官學研
Chapter
01
σ=1
.95
-1.96 0 1.96 x
5
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
多層次模型 (HLM) 及重複測量:使用 STaTa
比起富人平均來說傾向擁有較短的生命。這兩個變數被稱做相關的。但是實際
上,我們不能直接推論這兩個變數中有因果關係 ( 邏輯謬誤 )。此外,多元 ( 線
性 vs. 非線性、單層 vs. 多層 ) 迴歸,自變數們之多元共線性診斷,也要借用
Pearson 相關分析 (r 值 ) 的觀念。
任何統計方法是有效的,只有當這個系統或是所討論的母群體滿足方法論
的基本假定 (assumption)。誤用統計學可能會導致描述面或是推論面嚴重的錯
誤,這個錯誤可能會影響社會政策,醫療實踐以及橋樑或是核能發電計畫結構
的可靠性。
即使統計學被正確的應用,結果對於不是專家的人來說可能會難以陳述。
一些統計科學的結果對於大眾而言相當費解。舉例來說,統計資料中顯著的改
變可能是由樣本的隨機變量所導致,但是這個顯著性對大眾而言可能難以理
解。另外,某些統計學分析 ( 尤其當涉及機率論時 ) 得出的結論可能非常違悖一
般人的直覺,如 Monty-Hall 問題。人們 ( 甚至包括一些科學家 ) 往往需要統計
的技巧 ( 或懷疑 ) 才能理解其正確性。
二、統計延伸出來的學科
有些科學廣泛的應用統計的方法使得他們擁有各自的統計術語,這些學科
包括:
1. 農業科學:狹義上專指農藝學 (Agronomy) 是研究與農作物生產相關領域的科
學,包括作物生長發育規律及其與外界環境條件的關係、病蟲害防治、土壤
與營養、種植制度、遺傳育種等領域。廣義的農學則涵蓋農業相關的各類科
學領域。
狹義農學主要研究兩大類作物的生產:直接為人類提供糧食的作物和為飼養
牲畜用的飼料作物。但一些分支學科也研究水果和經濟作物的生產。
2. 生物醫學統計,請見作者的著作。
3. 環境與生態統計學:自然資源統計學、環境統計學、生態平衡統計學。
4. 商務統計。
5. 資料採礦 ( 應用統計學以及圖形,從資料中獲取知識 )。
6. 經濟統計學:總體經濟統計學、個體經濟統計學、管理統計學。
7. 電機統計。
8. 統計物理學。
6
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
STaTa 是地表最強統計,適合各產官學研 01
9. 人口統計。
10. 心理統計學:心理統計學是統計學方法在心理學以及教育學測量領域的應用
統計學分支。它的目的是測量人的能力、知識、態度、性格特徵等,並且發
展相應的工具。
心理統計學是心理學研究的有效工具之一。心理學發展的歷史證明,科學心
理學離不開科學實驗或調查,而心理實驗或調查又必然要面臨處理數字資料
的問題。例如:怎樣蒐集資料才能使數字最有意義、最能反映所研究的課
題;採用什麼方法整理和分析所得數據,才能最大限度地顯現這些數據所反
映的信息,從而對實驗或調查結果作出科學的解釋;怎樣才能從所得局部結
果推論到總體,作出一般規律性的科學結論等等。要解決這些問題就必須依
靠科學的統計方法。
心理統計學與教育統計學、生物統計學、醫學統計學等相似,都是數理統計
學在某一學科的具體應用。數理統計學提供了許多處理數字資料的一般方
法,心理統計學則針對心理學的特點,研究如何應用這些方法去解決心理實
驗法、觀察法或調查法中的數據問題,兩者既有密切聯繫又不等同。隨著心
理學的發展,必然會有更多的數理統計方法被引進心理統計學中,這樣也會
促進心理統計學的發展。
11. 教育統計學。
12. 社會統計:文化與體育統計學、衛生統計學、司法統計學、社會福利與社會
保障統計學。
13. 生活質量統計學。
14. 文獻統計分析。
15. 化學與程序分析 ( 所有有關化學的資料分析與化工科學 )。
16. 運動統計學,特別是棒球以及曲棍球。
17. 國際統計學:國際標準分類統計學、國際核算體系與方法論體系、國際比較
統計學。
統計對於商業以及工業是一個基本的關鍵。他被用來瞭解與測量系統變異
性,程序控制,對資料作出結論,並且完成資料取向的決策。在這些領域統計
扮演了一個重要的角色。
7
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
多層次模型 (HLM) 及重複測量:使用 STaTa
1-1-2 統計與「實驗法、觀察法」之對應關係
可觀察
(random variables)
實驗法
研究假設
檢定結果 抽樣結果
(p-value) 統計 (data)
圖 1-4 統計之概念圖
一、統計與實驗設計功能之對應關係
統計分析是指蒐集、整理、表現、分析及解釋資料,並藉科學的方法,進
而由分析的結果,加以推論,而獲得合理且有效的結論,並做出適切決策的一
門學科。
8
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
Chapter
STaTa 是地表最強統計,適合各產官學研 01
要解決何種問題
研究構思 實驗資料之圖表繪製
轉換
研究問題 實驗資料之統計分析/意義解讀
解決
問題
研究目的 實驗內容及流程
求證
方法
實驗設計 實驗對象選擇(抽樣法)及分組
圖 1-5 實驗設計的功能與統計的對應關係
常見,一般人對各類實驗型式與統計如何連結的困擾,包括:
1. 所操作的實驗型式與實驗設計是否相配?
2. 操作的實驗設計與統計方法分析是否相配?
3. 統計分析結果與結論是否相配?
二、實驗法與觀察性研究
統計研究中的共同目標是分析因果關係,具體來講就是從預估數據變化中
得出結論,或是研究自變量與因變量之間的關係。因果統計研究主要有兩種:
實驗研究和觀察研究。在兩種研究中,自變量改變對因變量所造成的影響可以
被觀測到。兩種實驗間的不同在於實驗時如何進行的。兩種實驗都很厲害。實
驗研究包括將系統尺度進行研究、操縱系統、使用更多的尺度進行同樣的實驗
來確定操作是否改變了尺度的值。與之相對的是觀察研究,觀察研究不包括實
驗性操作。在此,數據被收集,預估數據與回覆數據間的相關係數被研究。
( 一 ) 實驗法
實驗法統計的基本步驟如下:
1. 設立研究計畫,包括找到代表研究項目的數據,使用如下信息:根據處理效
應進行初步預估,備用假說,預估實驗變率。對實驗目標的選擇和道德上的
考慮也是必不可少的。統計學家推薦實驗 ( 至少 ) 應與另一個相同標準、不同
9
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
多層次模型 (HLM) 及重複測量:使用 STaTa
項目的參照組進行對比,以減少偏差。
2. 試驗設計,使用區組變量來減少干擾變量的影響,將對象進行隨機處理,消
除估算處理效用與實驗誤差中的偏差。在此階段,實驗參與者和統計學家填
寫實驗草案,並依此指導實驗進程,對實驗數據的原始分析進行細化。
3. 根據實驗草案進行實驗、ANOVA 分析。
4. 在第二次分析中進一步解析數據,為進一步研究提出新假設 (hypothesis)。
5. 匯報研究結果並將其存檔。
對人類行為的實驗研究應該多加謹慎。像著名的霍桑效應在西方電器公
司 (Western Electric) 位於伊利諾伊州的霍桑工廠 (Hawthorne Works) 進行心理學
實驗,研究工作環境改變對生產率的影響。研究人員嘗試增強照明,觀察它是
否有助於提高流水線工人的生產率。研究人員首先檢測了工廠的生產率,爾後
改變車間的照明強度,觀察結果。結果是生產率在實驗環境下的確提升了。然
而,該實驗因其流程誤差在今天飽受批評,特別是實驗缺乏參照組和雙盲。霍
桑效應指僅從觀測來得出結論。該實驗中生產率的提升不是因為照明強度的改
變,而是因為工人們發覺他們被圍觀了。
( 二 ) 觀察性研究法
觀察研究的具體例子是研究吸煙與肺癌之間的相關係數。這種研究常用調
查來收集所需信息的觀測結果,並對其進行統計分析。例如,研究人員會收集
吸煙 (case) 和不吸煙者 (control) 的觀察數據,進行病例—對照 (case-control) 研
究,然後觀察每組中肺癌患者的數量。
10
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
STaTa 是地表最強統計,適合各產官學研
Chapter
01
不斷更新和擴充,內容日趨完善,Menu 操作視窗非常容易使用。迄今 STaTa 已
在美國各大學廣為流傳,也是地表最強統計套裝軟體。
11
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
多層次模型 (HLM) 及重複測量:使用 STaTa
screenshot 快速、精確且容易使用利用點選式介面,加上直覺式語法與線上支
援,使得 STaTa 相形於其他統計軟體更為容易上手。且您可以在 STaTa 出版的
英文書中找到所有的分析功能。
STaTa 各統計功能簡易說明:
延伸迴歸模型 Extended regression models (ERMs),There are four new commands that fit
■ linear models
■ linear models with interval-censored outcomes, including tobit models
■ probit models
■ ordered probit models
潛在類別分析 Latent class analysis (LCA)
. gsem (alcohol truant weapon theft vandalism <-), logit lclass(C 3)
Bayesian regression models using the bayes prefix
. bayes: regress y x1 x2
Convert dynamic Markdown documents to HTML with dyndoc
Linearized DSGEs
. dsge (x = E(F.x) - (r - E(F.p) - z), unobserved)
(p = {beta}*E(F.p) + {kappa}*x)
(r = 1/{beta}*p + u)
(F.z = {rhoz}*z, state)
(F.u = {rhou}*u, state)
12
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
STaTa 是地表最強統計,適合各產官學研
Chapter
01
Bayesian 多層次模型 (Bayesian multilevel models)
門檻迴歸 (Threshold regression)
Panel-data tobit models with random coefficients and intercepts
Easy import of Federal Reserve Economic Data:如
You need GDP for Venezuela, Colombia, and Peru. You launch STaTa. You choose File > Import
> Federal Reserve Economic Data (FRED). You type "Venezuela Gross Domestic Product" and
click on Search.
Multilevel mixed-effects interval regression:
. meintreg exerlo exerup age work kids walk || cid:
作者《STaTa 與高等統計分析的應用》一書,該書內容包括:描述性統計、
13
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
多層次模型 (HLM) 及重複測量:使用 STaTa
樣本數的評估、變異數分析、相關、迴歸建模及診斷、重複測量……。
STaTa 單層次:連續 vs. 類別依變數之迴歸分析法,如下表。
STaTa 指令 說明
areg an easier way to fit regressions with many dummy variables
arch regression models with ARCH errors
14
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
STaTa 是地表最強統計,適合各產官學研
Chapter
01
STaTa 指令 說明
arima ARIMA models
boxcox Box-Cox regression models
cnsreg constrained linear regression
eivreg errors-in-variables regression
etregress linear regression with endogenous treatment effects
frontier stochastic frontier models
gmm generalized method of moments estimation
heckman Heckman selection model
intreg interval regression
ivregress single-equation instrumental-variables regression
ivtobit tobit regression with endogenous variables
newey regression with Newey-West standard errors
nl nonlinear least-squares estimation
nlsur estimation of nonlinear systems of equations
qreg quantile (including median) regression
reg3 three-stage least-squares (3SLS) regression
rreg a type of robust regression
gsem generalized structural equation models
sem linear structural equation models
sureg seemingly unrelated regression
tobit tobit regression
truncreg truncated regression
xtabond Arellano-Bond linear dynamic panel-data estimation
xtdpd linear dynamic panel-data estimation
xtfrontier panel-data stochastic frontier model
xtgls panel-data GLS models
xthtaylor Hausman-Taylor estimator for error-components models
xtintreg panel-data interval regression models
xtivreg panel-data instrumental-variables (2SLS) regression
xtpcse linear regression with panel-corrected standard errors
15
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
多層次模型 (HLM) 及重複測量:使用 STaTa
STaTa 指令 說明
xtreg fixed- and random-effects linear models
xtregar fixed- and random-effects linear models with an AR(1) disturbance
xttobit panel-data tobit models
STaTa「regress」之後指令 (postestimation):
STaTa 指令 說明
estat archlm test for ARCH effects in the residuals
estat bgodfrey Breusch-Godfrey test for higher-order serial correlation
estat durbinalt Durbin's alternative test for serial correlation
estat dwatson Durbin-Watson d statistic to test for first-order serial correlation
dfbeta DFBETA influence statistics
estat hettest tests for heteroskedasticity
estat imtest information matrix test
estat ovtest Ramsey regression specification-error test for omitted variables
estat szroeter Szroeter's rank test for heteroskedasticity
estat vif variance inflation factors for the independent variables
estat esize eta-squared and omega-squared effect sizes
迴歸參數的檢定 (Tests of parameters)
test Wald test of linear hypotheses
testnl Wald test of nonlinear hypotheses
lrtest likelihood-ratio tests
hausman Hausman specification test
suest generalization of the Hausman test
一、迴歸分析之專有名詞
迴歸分析係以數學和統計方法來確認一組變數中的系統性部分,並依此解
釋過去的現象和預測未來,它將研究的變數區分為依變數與自變數,建立依變
數為自變數之函數模型,其主要目的是用來解釋資料過去的現象及自由變數來
預測依變數未來可能產生之數值。
16
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
STaTa 是地表最強統計,適合各產官學研
Chapter
01
1. 自變數 (independent variable):由數學方程式預測的變數。
2. 依變數 (dependent variable):又稱反應變數,據以預測依變數的值之變數。
3. 簡單線性迴歸 (simple linear regression):僅有一自變數與一依變數,且其關係
大致上可用一直線表示。
Y = α + βX + U
其中:
α,β 為未知參數 ( 迴歸係數 ),需要我們去估計。
U 代表不能由 α + βX 所描述的 Y 行為,亦即 Y 與線性模型之間的誤差。
4. 複迴歸 (multiple regression):兩個以上自變數的迴歸。
5. 多變數迴歸 (multi-variable regression):又稱向量迴歸 ( 如 VAR,VECM),用多
個自變數預測數個依變數,建立之聯立迴歸方程式。例如,STaTa 的 multiple
equation 迴歸。
二、單層次:各類型迴歸之適用情境
STaTa 光是「單層次:線性模型」就有 26 種迴歸,還有二元迴歸、次序迴
歸、類別迴歸、計數迴歸等大類別迴歸,每個大類別迴歸又細分好幾種不同的
迴歸方法。STaTa 已是地表最強的統計軟體。
「單層次:線性模型」可參考作者《STaTa 與高等統計分析》一書的介紹。
17
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
多層次模型 (HLM) 及重複測量:使用 STaTa
圖 1-7 單層次:各類型迴歸
18
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
STaTa 是地表最強統計,適合各產官學研
Chapter
01
自變數
(predictor)
連續變數 類別變數 連續 + 類別變數
依變數
(outcome)
連續變數 線性迴歸 線性迴歸 線性迴歸
censored 迴歸 censored 迴歸 censored 迴歸
truncated 迴歸 truncated 迴歸 truncated 迴歸
Robust 迴歸 Robust 迴歸 Robust 迴歸
Quantile 迴歸 Quantile 迴歸 Quantile 迴歸
Constrained 迴歸 Constrained 迴歸 Constrained 迴歸
Errors-in-variables 迴 Errors-in-variables 迴 Errors-in-variables 迴
歸 歸 歸
bianry 變數 線性迴歸≈ 線性迴歸≈ 線性迴歸≈
Logistic 迴歸≈ Logistic 迴歸≈ Logistic 迴歸≈
probit 迴歸 probit 迴歸 probit 迴歸
Conditional logistic 迴 Conditional logistic 迴 Conditional logistic 迴
歸 歸 歸
Ordinal 變數 Ordered Logit and Ordered Logit and Ordered Logit and
Ordered Probit Analysis Ordered Probit Analysis Ordered Probit Analysis
Nominal 類別變數 Multinomial Logit 及 Multinomial Logit 及 Multinomial Logit 及
相關模型 相關模型 相關模型
Count 變數: 1. Poisson 迴歸 1. Poisson 迴歸 1. Poisson 迴歸
Count 迴歸 2. Zero-inflated Poisson 2. Zero-inflated Poisson 2. Zero-inflated Poisson
迴歸 迴歸 迴歸
3. negative binomial 迴 3. negative binomial 迴 3. negative binomial 迴
歸 歸 歸
4. Z e r o - i n f l a t e d 4. Z e r o - i n f l a t e d 4. Z e r o - i n f l a t e d
negative binomial 迴 negative binomial 迴 negative binomial 迴
歸 歸 歸
5. Truncated negative 5. Truncated negative 5. Truncated negative
binomial 迴歸 binomial 迴歸 binomial 迴歸
6. Truncated Poisson 迴 6. Truncated Poisson 迴 6. Truncated Poisson 迴
歸 歸 歸
7. Z e r o - t r u n c a t e d 7. Z e r o - t r u n c a t e d 7. Z e r o - t r u n c a t e d
Poisson 迴歸 Poisson 迴歸 Poisson 迴歸
8. M i x e d - e f f e c t s 8. M i x e d - e f f e c t s 8. M i x e d - e f f e c t s
Poisson 迴歸 Poisson 迴歸 Poisson 迴歸
19
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
多層次模型 (HLM) 及重複測量:使用 STaTa
自變數
(predictor)
連續變數 類別變數 連續 + 類別變數
依變數
(outcome)
多個依變數 Multiple Equation 迴歸 Multiple Equation 迴歸 Multiple Equation 迴歸
seemingly unrelated 迴 seemingly unrelated 迴 seemingly unrelated 迴
歸 ( 同一組自變數 ) 歸 ( 同一組自變數 ) 歸 ( 同一組自變數 )
20
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
STaTa 是地表最強統計,適合各產官學研
Chapter
01
2. 最大概似估計法在小樣本中它的性質是未知的;但是我們可以證明在大樣本
裡 ( 有學者主張樣本數 500 以上 ),最大概似估計式是常態分配的、一致的,
而且是最佳的。
3. 我們必須將以上的迴歸函數解釋為機率的預測。
定義:混合效果
混合效果 = 固定效果 + 隨機效果
固定效果 (fixed effect) 是所有組中效果都相同 (which are the same in all
groups)。
隨機效果 (fixed effect) 是各組之間的隨機呈現效果 ( 都不同 )(which vary across
groups)。
在混合模型中,每個 levels 都很明確存在隨機和系統 ( 固定 ) 效果。
21
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
多層次模型 (HLM) 及重複測量:使用 STaTa
多層次混合模型之指令為:
指令 說明
xtmixed、mixed 多層次混合效果 linear regression
xtmelogit、melogit 多層次混合效果 logistic regression
xtmepoisson、mepoisson 多層次混合效果 Poisson regression
menl Nonlinear mixed-effects regression
meprobit 多層次混合效果 probit regression
22
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
STaTa 是地表最強統計,適合各產官學研
Chapter
01
指令 說明
mecloglog 多層次混合效果 complementary log-log regression
meologit 多層次混合效果 ordered logistic regression
meoprobit 多層次混合效果 ordered probit regression
menbreg 多層次混合效果 negative binomial regression
metobit 多層次混合效果 tobit regression
meintreg 多層次混合效果 interval regression
meglm 多層次混合效果 generalized linear model
meqrlogit 多層次混合效果 logistic regression (QR decomposition)
meqrpoisson 多層次混合效果 Poisson regression (QR decomposition)
mestreg 多層次參數存活模型
bayes: 開頭 12 指令 bayes: mecloglog、bayes: meglm、bayes: meintreg、bayes:
melogit、bayes: menbreg、bayes: meologit、bayes: meoprobit、
bayes: mepoisson、bayes: meprobit、bayes: mestreg、bayes:
metobit、bayes: mixed
1. 有網底斜體字 的迴歸,才納入本書的範例。
2. 混合效果 = 固定效果 + 隨機效果
3. 隨機截距 / 隨機斜率屬隨機效果
4. 指令 xtmixed、mixed 專門處理多層次 mixed regression ( 具常態分布、連續型結果變數 )。它特別受到歡迎。
23
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066
多層次模型 (HLM) 及重複測量:使用 STaTa
1H0P
多層次模型(HLM)及重複測量:
使用STaTa
作 者 ─ 張紹勳
發 行 人 ─ 楊榮川
總 經 理 ─ 楊士清
主 編 ─ 侯家嵐
責任編輯 ─ 黃梓雯
文字校對 ─ 鐘秀雲
封面設計 ─ 盧盈良
出 版 者 ─ 五南圖書出版股份有限公司
地 址:106台 北 市 大 安 區 和 平 東 路 二 段 3 3 9 號 4 樓
電 話:(02)2705-5066 傳 真:(02)2706-6100
網 址:http://www.wunan.com.tw
電子郵件:wunan@wunan.com.tw
劃撥帳號:0 1 0 6 8 9 5 3
戶 名:五南圖書出版股份有限公司
法律顧問 林勝安律師事務所 林勝安律師
出版日期 2 0 1 8 年 1 月 初 版 一 刷
定 價 新 臺 幣 1 0 5 0 元
※版權所有.欲利用本書內容,必須徵求本公司同意※
本試閱檔為五南所有。如欲購買此書,請至五南網站 www.wunan.com.tw
或來電(02)2705-5066