You are on page 1of 94

圖表及描述統計

第一節 次數分配表

 在彙整次數分配表時,首先計算變數中各個數值
的次數。
 其次會計算各次數的百分比,而常用的百分有兩
種:
 一、全體的百分比,公式為:
次數
百分比 = × 100%
所有觀察體

 二是有效的百分比,公式為:
次數
有效百分比 = × 100%
有效的觀察體
第一節 次數分配表

 因為有效的觀察體會小於或等於所有觀察體,因
此有效的百分比會大於或等於全體的百分比。
 在研究中,多數使用有效的百分比。
 如果變數是次序變數或量的變數 ( 含等距及比率
變數 ) ,也可以將有效的百分比累加,此稱為累
積百分比。
第一節 次數分配表

 在 SPSS 軟體中,首先在《分析》中之《敘述統
計》選擇《次數分配表》。
第一節 次數分配表

 其次,選擇所需之《變數》,並點選《確定》進
行分析。
第一節 次數分配表

 最後,在《圖表選項》下,選擇《無》 ( 不繪製
任何圖形 ) 。
第一節 次數分配表

 分析後得到以下的報表。
第一節 次數分配表

 在本表中共有 5 欄:
 第 1 欄是五種教育等級,也就是次序變數的類別
 第 2 欄是次數,總共有 1992 個樣本,因為有 3 個
遺漏值,所以有效樣本為 1989 人
 第 3 欄為百分比,由各等級的人數除以總人數後
再乘以 100 而得
 第 4 欄為有效百分比,由各等級的人數除以有效
總人數 ( 即不含遺漏值 ) 後再乘以 100 而得
 第 5 欄為累積百分比,是第 4 欄的有效百分比由
上往下累加而得。
第一節 次數分配表

 由次數分配表可得知:
 在有效樣本中,有 38.91% 的受訪者接受中學的教
育,為最多
 其次是接受大專教育者,為 27.10%
 研究所以上最少,僅有 2.71%
 70.19% 的受訪者學歷在高中以下 ( 也就是有
70.19% 的受訪者未接受大專以上之教育 )
第二節 統計圖

一、長條圖 (bar chart)


 長條圖是以其高度 ( 將類別放在 X 軸時 ) 或長
度 ( 將類別放在 Y 軸時 ) 來代表數量的大小
 適用於名義變數或次序變數,由於是間斷變數,
因此條形間應有適當的間距
 在繪製時應只改變高度或長度,而不能同時改變
高度及長度,否則會造成視覺上的錯誤。
一、長條圖 (bar chart)
 以下圖左邊為例,甲校的升學率是 30% ,乙校為
60% ,因此乙校是甲校的 2 倍。當長度固定,而高度
變為 2 倍時,面積也變為 2 倍。
 但是如果像右圖,高度與長度同時倍增,則面積會變
為 4 倍,就會誤導閱讀者。
60% 60%
升 升
學 學
率 率
30% 30%

甲 乙 甲 乙
校 校 校 校
一、長條圖 (bar chart)
 在繪製長條圖時,應避免以圓形表示,因為人的視覺會留
意物體的面積,而不是其高度或是寬度 ( 在圓形中則為直
徑)。
 圓形的面積為 π r 2
,當直徑變為 2 倍時,面積已變為 4
4 3
倍。 πr
3
 如果再以立體之球形表示時,因為球形體積是 ,則
體積會變為 9 倍。
60%
60%

升 學
學 率
率 30%

30%

甲 乙
校 校
甲 乙
校 校
一、長條圖 (bar chart)
 如果以象形圖 (pictogram) 表示,也容易誤導讀者。
 下圖左邊為了維持圖形的美觀,高度與寬度維持同比例增
加,也會造成面積變成 4 倍的錯誤。
 即使像下圖右邊不改變寬度,但是因為物體是立體的,因
此寬度 ( 或圖形中的深度 ) ,仍難以固定不變。

60% 60%

升 升
學 學
率 率
30% 30%

甲 乙 甲 乙
校 校 校 校
一、長條圖 (bar chart)

 要繪製簡單長條圖,須在《統計圖》之《條形
圖》選擇《簡單》,圖表中資料為觀察值組別之
摘要。    
一、長條圖 (bar chart)

 接著點選《定義》進入以下畫面,將變數選至
《類別軸》即可完成。
一、長條圖 (bar chart)

 下圖是受訪者受教等級之長條圖

數 800

 由圖中可看出:
 多數受訪者具有中學學歷 600

( 含國中、高中、高職 )
 雖然研究所以上人數並不多 400

,但是有大專學歷者已經超
過國小以下 ( 含自修 ) 者。 200

0
無 小學以下 中學 大專 研究所以上
受訪者教育等級
第二節 統計圖

二、集群長條圖
 集群長條圖的繪製方法與長條圖相似,也是將數據用
長條代表。
 不過,在 X 軸上則另外依照主要類別加以分群。

 右表為甲乙兩生
於暑假中每天自
行複習各科課業
的時間。
二、集群長條圖
 繪製時分別五種顏色的長條代表五個學科的複習時間

 以甲乙兩生當主要集 6
國文
英文

群,將各自的長條放 5
數學
自然
社會

在一起。 4

 由圖中可看出甲乙兩 3

生都花最多的時間在 2

國文科上,社會科所 1

花的時間最少。 0
甲生 乙生

 整體而言,兩人在各
科所花時間的大小順
序是相同的。
二、集群長條圖

 要繪製集群化長條
圖,須在統計圖條
形圖選擇《集群
化》,《圖表中資
料為》《觀察值組
別之摘要》。
二、集群長條圖

 接著點選《定義》
進入以下畫面,將
主要的分類變數選
至《類別軸》,要
集群化的變數選至
《定義集群依據》
即可完成。
二、集群長條圖

 以下為兩性在五種教育等級的長條圖。
 由圖可看出:
個 受訪者教育等級
 兩性都以接受中學教育者最 數 500 無
小學以下
中學
大專

多,但是在男性中,接受大 400
研究所以上

專教育者比接受小學教育者 300

多;在女性中,大專及小學
者則相差不多。
200

 女性未接受教育者較男性多 100

,男性具有研究所以上學歷 0
男 女
性別

者則較女性為多。
二、集群長條圖

 如果將上述兩個變數互相交換,如以下的操作畫
面。
二、集群長條圖
 由圖可看出:
 在接受中學以上教育的受訪者中,都是男性較女性為多
 但是接受小學教育及未接受教育者中,則是女性多於男
性。 性別

數 500 男

400

300

200

100

0
無 小學以下 中學 大專 研究所以上
受訪者教育等級
第二節 統計圖

三、堆疊長條圖
 堆疊長條圖的繪製 16
社會
自然

方法與集群長條圖
14 數學
英文
12 國文

類似,它也是以不 10

同顏色的長條代表 6

不同的數據,只是 2

最後在 X 軸上是以
甲生 乙生

主要分類為主,然
後將所有長條堆疊
在一起。
三、堆疊長條圖

 要繪製堆疊長條圖,
須在《統計圖》之
《條形圖》選擇《堆
疊》,《圖表中資料
為》《觀察值組別之
摘要》。
三、堆疊長條圖

 接著點選《定義》進入
以下畫面,將主要的分
類變數選至《類別軸》
,要堆疊的變數選至
《定義堆疊依據》即可
完成。
三、堆疊長條圖

 這種長條圖與簡單長條圖相似,只是在每個大類
中又有五種的教育等級。
個 受訪者教育等級
數 1,200 無
小學以下
中學
大專
1,000 研究所以上

800

600

400

200

0
男 女
性別
第二節 統計圖

四、圓餅圖 (pie chart)


 圓餅圖是以在圓形中所佔扇形面積的百分比來代表其
數量,因此比較適合用來比較相對的比例。
 甲生於暑假中每天
自行複習課業的時
間如右表,其中
國文為 3 小時,佔
總時數中之
3 1
= = 0.333 = 33.33%
15 3
四、圓餅圖 (pie chart)

科目
國文
6.67% 英文
數學
自然
13.33% 社會

33.33%

26.67%

20.00%
四、圓餅圖 (pie chart)

 圓餅圖的缺點,就是不能顯示全體的量數。
 以上表為例,甲乙兩生讀書的比例雖然相等,但
是總時數並不相同,如果使用圓餅圖來表示兩人
的讀書情形,會得到相同的結果,容易誤導閱讀
者。
 此時,改用集群化長條圖或是堆疊長條圖會比較
恰當。
 圓餅圖較適用於名義變數,此類變數在分類時應
留意互斥及完整兩個原則。
四、圓餅圖 (pie chart)
 互斥:是同一個觀察體不可以既是甲類又是乙類,如:
把學歷分自修、小學以下,中學、大學以上,這樣就是
不恰當的,因為會有受訪者是自修取得中學學歷。
 完整:即是類別要涵蓋所有可能性,如把學歷分成小學
,中學、大學、研究所,即少了未接受教育的分類。如
果不確定是否涵蓋所有可能性,最好加上「其他」一項

 此外,如果類別太多,加上某些類別所佔比例又太少,
最好也不要使用圓餅圖,以避免顯示不清的問題。
四、圓餅圖 (pie chart)

 要繪製圓形圖,須在《統計圖》下《圓餅圖》選
擇《觀察值組別之摘要》。
   
四、圓餅圖 (pie chart)

 接著點選《定義》
進入以下畫面,再
將變數選至《定義
圖塊依據》即可完
成。
四、圓餅圖 (pie chart)

在圓形比例圖中,五種
受訪者教育等級
 54
研究所以上 171

無 小學以下
2.71%
8.6% 中學

受教等級之比例分別為
大專
研究所以上
539
大專

8.6% 、 22.67% 、 38.9 27.1%


451
小學以下
22.67%

1% 、 27.10 及
2.71% 。以中學程度者
所佔比例最多,研究所
最少。
774
中學
38.91%
第二節 統計圖

五、直方圖 (histogram)
 直方圖與長條圖相似,也是以條形的高度 ( 或長
度 ) 來表示數據的大小
 其差別在於長條圖比較適用於質的變數,而直方
圖則適用於量的變數。
 因為直方圖是由量的變數加以分組而來,因此在
繪製時條形之間應相連接。
五、直方圖 (histogram)

 由直方圖可以看出至少三種訊息:
 整體型態
 偏態
 是否有離異值。
五、直方圖 (histogram)
 下圖左為 29,614 名大學生實際填答的身高直方圖 ( 右圖為另加
上折線 )
 由圖可看出身高在 160.0~162.5 公分者最多,其次是
170.0~172.5 公分者,緊接著為 165.0~167.5 公分。
 因此大略呈現雙眾數的型態。會有這樣的現象,主要是因為未
將男女分開繪製。
次 4 ,5 0 0 次 4 ,5 0 0
數 數
4 ,0 0 0 4 ,0 0 0

3 ,5 0 0 3 ,5 0 0

3 ,0 0 0 3 ,0 0 0

2 ,5 0 0 2 ,5 0 0

2 ,0 0 0 2 ,0 0 0

1 ,5 0 0 1 ,5 0 0

1 ,0 0 0 1 ,0 0 0

500 500

0 0
140 150 160 170 180 190 200 140 1 50 160 170 180 190 200

身高 身高
五、直方圖 (histogram)
 如果將男女分開,則可以發現多數女性的身高集中於
160.0~162.5 公分之間,其次為 155.0~157.5 公分及 157.5~160.0
公分之間,大略呈右偏態 ( 正偏 ) 。
 多數男性身高在 170.0~172.5 公分之間,其次為 175.0~177.5 公
分之間,介於 172.5~175.0 公分者反而較少,依常理判斷應不至
於有此分配型態,最好再進一步研究。

性別: 女 性別: 男
次 4,000 次 3,500
數 數
3,500
3,000

3,000
2,500

2,500
2,000

2,000

1,500
1,500

1,000
1,000

500
500

0 0
140 150 160 170 180 150 160 170 180 190 200

身高 身高
五、直方圖 (histogram)

 事實上,在原始資料中,有一些不尋常的數據。
 以女性的身高為例,如果 Y 軸只取 0~50 人,而
X 軸取 0~200 公分,就可以發現有 3 個人身高介
於 0~2.5 公分這一組 ( 原填答資料均為 1 公
分 ) , 50 公分上下也各有部分填答者。
 依一般情形判斷,出生之嬰兒身高即約為 50 公
分。
五、直方圖 (histogram)

 因此身高在 100 公分以下的填答者可視為異常之


數據,應更留意其是否據實作答。
 也由於有這些離異值,使得女性身高的分配呈現
左偏態 ( 負偏態 ) 。
性別: 女 性別: 女
次 50
數 次 4 ,0 0 0

40

3 ,0 0 0

30

2 ,0 0 0

20

1 ,0 0 0
10

0 0
0 50 100 150 200 0 50 100 150 200
身高 身高
五、直方圖 (histogram)
 要繪製直方圖,須  接著點選所要的《變
在《統計圖》下選 數》即可完成。
擇《直方圖》。
五、直方圖 (histogram)
 右圖為國中時父母支持之
直方圖

數 300

 由圖可看出受訪者在國中
時父母支持問卷的得分
( 共 11 題,每題最低 0 分
200

,最高 3 分,總分 33
分 ) ,平均數為 8.67 ,標 100

準差為 6.63 。 Mean =8.67


Std. Dev. =6.63
N =1,297

 分配形態呈右偏 ( 正偏 0
0 10 20
國中時 父母的支持
30

態 ) ,另外進行描述統計
,偏態值為 0.659 。
五、直方圖 (histogram)

 直方圖與長條圖不同之處
在於:
 直方圖是由量的資料分組後 次
數 1,000

畫成,因此組與組之間的長 800

條應連在一起。
600

 直方圖分組愈少,浪費的資
400

料就愈多。
200

 例如:如果分為低、中、高 Mean =8.67


Std. Dev. =6.63
N =1,297

三組,其浪費的訊息就比分 0
0 10 20
國中時 父母的支持
30

成 11 組來得多。
第二節 統計圖

六、折線圖
 折線圖是以線段在 Y 軸上的高度來代表數據的大小。
 如果 X 軸上是不同的時間點,就是時間數列圖。

 假設,某大學圖書館統
計上星期每天使用閱覽
室的人數。
六、折線圖
 繪製時 X 軸為日期, Y 軸上則為人數。
 由圖可看出星期六、日使用閱覽室的人數較少。
180

160

140

120

100

80

60

40

20

0
星期一 星期二 星期三 星期四 星期五 星期六 星期日
六、折線圖

 以教育部公布各學年度國小學生人數所繪製之時
間數列圖可看出:
 自 39 學年度開始,國小學生人數呈現逐年遞增的
趨勢,一直到 63 學年度達到最多 ( 學生數為
2,406,531 人 ) 。
 其後,可能是實施家庭計畫的結果,國小學生人
數逐年下降,到 70 學年度為 2,213,179 人
 自 71 學年度開始,由於龍年出生學生入學,使得
人數再度增加,至 77 學年度達到 2,407,166 人
六、折線圖
 78 學年度開始,學生數再度減少
 至 84 學年度已少於 200 萬人 ( 與 50 學年度相近 ) ,
 88 學年度雖然微幅增加
 89 學年度之後又再度下降。

 使用時間數列,可以進行未來數據之推估,其中最
常被使用者為自我迴歸整合移動平均模式
六、折線圖
3000000

2500000

2000000

1500000

1000000

500000

0
39 41 43 45 47 49 51 53 55 57 59 61 63 65 67 69 71 73 75 77 79 81 83 85 87 89 91 93
六、折線圖

 要繪製時間數列線形圖,須在《統計圖》下選擇
《序列圖》,接著以時間變數為《時間軸標記》
,要繪製的數值為《變數》。
   
六、折線圖

 要繪製線形圖,須在《統計圖》下《線形圖》選
擇《簡單》,並在《圖表中資料設定為》《觀察
  
值組別之摘要》。
六、折線圖
 在 1903 個有效的受訪者中對自己教育的評分,最多
者為 5 分 (469 人,由另外的次數表得知 ) ,其次為
1 分,自評 9 分或 10 分者分別為 23 及 22 人。

400

200

1分(最 2分 3分 4分 5分 6分 7分 8分 9分 10分(最
低) 高)
自評教育分數
六、折線圖

 如果要繪製兩個以
上的線形圖,可以
選擇《複線圖》。
六、折線圖

 由圖觀之,兩性對自己教 個
數 250
性別

育評分在 5 分以上之趨勢 200

相似 150

 不過在 4 分之前,女性自 100

評為 1 分者比男性高, 2
50

分者相差無幾, 3 、 4 分
0

者女性人數較少。 1分
(最
2分 3分 4分 5分 6分 7分 8分 9分 10分
(最
低) 高)
自評教育分數
第二節 統計圖

七、盒形圖 (boxplot)
 盒形圖可以用來了解變數的分配情形及是否有離
異值,它包含盒子及鬍鬚兩部分。
 在盒子部分共有三條橫線:
 中間部分為中位數 ( 也等於第二個四分位數 Q2)
 下面為第一個四分位數 Q1
 上面為第三個四分位數 Q3
七、盒形圖 (boxplot)
 Q3–Q1=IQR (interquartile range) ,中間 50% 的數值
會在盒子中。
 Q3+1.5× IQR 及 Q1–1.5× IQR 稱為上下內圍 (inner
fence) ,
 Q3+3.0× IQR 及 Q1–3.0× IQR 稱為上下外圍 (outer
fence) 。
 鬚最上端的橫線是非離異值的最大值 ( 也就是上內
圍),
 鬚最下端的橫線則是非離異值的最小值 ( 也就是
下內圍 ) 。
七、盒形圖 (boxplot)
 在上內圍及上外圍間,或是在下內圍及下外圍間的觀
察體稱為離異值 (outlier) ,報表中會用圓圈代表
 超過上下外圍的觀察體稱為極端值 (extreme) ,報表
中會用星號代表。
 以 92 學年大一女學生身高資料為例 ( 已刪除不到 100
公分之受訪者 )
 中位數為 160 公分, Q1 及 Q3 分別為 157 及 164 公分
( 另行計算 ) ,因此 IQR ( 也就是盒子的高度 ) 為 7
公分 (164–157) 。
七、盒形圖 (boxplot)

 157 − 1.5 × 7 = 146.5


上內圍為 164 + 1.5 × 7 = 174.5 ,下內圍為

,這也是圖中兩短橫線部分。
164 + 3 × 7 = 185 157 − 3 × 7 = 136
 上外圍為 ,下內圍為
 如果介於 136~146.5 公分,及 174.5~185 公分之間者
,為離異值 ( 在 SPSS 的圖中以圓圈表示 )
 低於 136 ,或高於 185 者,即為極端值 ( 在 SPSS 的
圖中以星號表示 ) 。
七、盒形圖 (boxplot)

性別: 女
205 14,646
200 8,071

195 14,811 14,232

190 4,849
12,160
185 13,317 8,075
2,722
9,75312,175
180 9,677 15,158 12,201
175 14,862 15,108 13,041
15,441 15,645
170
165
160
155
150
12,062 13,881
145
15,610
140 11,611 4,497
14,133
135 10,426 7,943
130
125 7,941

120
115
110
105
13,040 15,633
100
2,562
95

身高
七、盒形圖 (boxplot)

 要繪製盒形圖,須在《統計圖》下選擇《盒形
圖》。並在《簡單》的圖後,選擇《各個變數之
摘要》。
  
七、盒形圖 (boxplot)

 接著點選所要的變數至《盒形圖表示》中即可完
成。
七、盒形圖 (boxplot)

 在以下的圖中可看出,所有受訪者受教年數的中
位數為 12 年, Q3 及 Q1 分別為 14 年及 6 年,因
此四分位距為 8 年。
 上內圍應為 24 年12( + 1.5 × 8 = 24 ) ,但是最大值為
20 年 ( 博士 ) ,因此只畫到 20 年為止
 下外圍本來應為– 6 年6(− 1.5 × 8 = −6 ) ,不過最小
值為 0 ,所以也只畫到 0 。
 因為沒有受訪者的受教年數會高於 20 ,或是低
於 0 ,所以就沒有離異值及極端值。
七、盒形圖 (boxplot)

 如果要繪製分組的盒形圖,則須在《簡單》的圖
後,選擇《觀察值組別之摘要》。
七、盒形圖 (boxplot)

 接著點選所要的變數至《變數》中,分組變數則
點選至《類別軸》中。
七、盒形圖 (boxplot)

 以圖中男性為例,其中數是 12 , Q1 及 Q3 分別約
是 9 及 14 ,因此=IQR
14 − 9 = 5 。
 其上內圍理論應為 14 + 1.5 × 5 = 21.5 ,不過男性受
教年數的最大值是 20 年,所以實際畫的上內圍
僅到達 20 。
 其下內圍應為 9 − 1.5 × 5 = 1.5 ,不過因為扣除低
於 1.5 年的受訪者之後,最低的受教年數為 3 年
( 原始資料中學歷為自修者轉碼為 3 年 ) ,因此
下內圍實際為 3 年。
七、盒形圖 (boxplot)
 下外圍為 9 − 3.0 × 5 = −6 ( 事實上受教年數最低
為 0 年,不可能低到– 6) 。

如果受教年數低於 3 年

 訪

20


者,稱為離異值 年

15

 由圖中可看出男性編號 10

914 、 929 、 935 ,及


960 等 4 人為離異值, 5

均未接受教育。 0
960
935

914
929

男 女
性別
第三節 描述統計

一、集中量數
 名義變數的集中量數一般使用眾數 (mode) ,其
定義是最多的類別。
 例如,某大學學生來自北、中、南、東的學生人
數各為 200 、 500 、 2400 、 100 人,則該校學
生居住地的眾數為「南部」 ( 非 2400) 。
一、集中量數

 眾數的使用有其限制:
 如,某班學生考試的分數分別為 65 、 70 、 80 、
85 ,及 95 分,則這個班考試的分數就沒有眾數。
 又如,另一班學生的成績分別
60 、 60 、 70 、 90 、 90 分,則該班的分數就有
兩個眾數 (60 分及 90 分 ) ,
 在 SPSS 軟體中,會以較小的數值 (60 分 ) 做為
眾數,並註明有多個眾數。
一、集中量數

 次序變數的集中量數一般使用中位數
(median) ,
 中位數是將觀察體依大小排列後最中間那個觀察
n +1
體的數值
2
 中位數的所在位置 n +1 ( 稱為深 )(depth) 為 亦
d (median) =
即 2
一、集中量數

 中位數等於第 2 個四分位數 Q2 ,百分等級


(percentile rank, PR) 等於 50 之百分位數
(percentile) 。
 例如,某次考試,甲班學生的得分分別為
10 、 30 、 100 、 60 、 80 ,依大小排序後為
10 、 30 、 5 +1
=3
2
60 、 80 、 100 ,其中位數的位置為
 第 3 個學生的得分為 60 分,因此中位數為 60 。
一、集中量數

 等距及比率變數的集中量數一般使用算術平均數
(mean)
ΣX
 母群體 (population) 的平均數µ = N
ΣX
 樣本的平均數 X =
n

 由於比率變數也是等距、次序及名義變數,因此
也可以使用眾數、中位數來當集中量數。
一、集中量數

 如果沒有極端值,等距及比率變數的集中量數還
是使用算術平均數較佳,因為它考量每個樣本的
數值,所以比較有代表性。
 反之,如果有極端值出現,則算術平均數就可能
不足代表大多數觀察體性質,此時最好改用中位
數。
第三節 描述統計

二、變異量數
 名義變數的變異量數可以使用全距 (range) 或是
變異比率 (variation ratio) 表示。
N − f mo
 全距為最大值減最小值,變異比率 v=
N
代表非眾數與總人數的比率,其中 fmo 為眾數的次
數, N 為總人數。
 此外,也有適合名義變數的全距係數
X m ax − X m in R
=
RC = X m ax + X m in X m ax + X m in
二、變異量數

 次序變數的變異量數則使用四分位距
(interquartile range, IQR) 或是四分差 (semi-
interquartile range) 表示。
 四分位距 IQR = Q3 − Q1
 第 1 個四分位數 Q1 ( 百分等級為 25 之百分位數 )
的 n +1 n
= j+g
4 4
深, SPSS 為 ; SAS 為
二、變異量數

 其中 n 為數據個數 ( 或為總人數 ) , j 是商的整


數部分, g 是商的小數部分。
 g 如果等於 0 ,則 Q1 的位置介於第 j 及 j+1 個數
據中 ( X j + X j +1 )
d (Q1 ) =
2
間,亦即
d (Q1 ) = X j +1
 如果 g>0 ,則 Q1 的位置為第 j+1 個數據,亦即

二、變異量數

 第 3 個四分位數 Q3( 百分等級為 75 之百分位數 ) 的

n +1 n
深, SPSS 為 3 ×   ; SAS 為 3 ×  = j+g
 4  4

判斷方法與 Q1 相同

 IQR 代表涵蓋 50% 觀察體的一段距離,這段距離愈大


,表示分散的程度愈高。
二、變異量數

 由四分位數也可以判斷變數的分配是否對稱。因
為 Q1 到 Q2 ,或 Q2 到 Q3 都包含 25% 的觀察體,
 如果 Q2 − Q1 > Q3 − Q2,則呈負偏態分配,表示 Q2 到
Q3 之間的觀察體比較集中
Q2 − Q1 < Q3 − Q2
 反之,如果 ,則呈正偏態。
二、變異量數

Q3 − Q1
 四分差 = ,一般統計軟體並未提供此量數
2

 此外還有適合次序變數的四分位距係數
Q3 − Q1
2 Q3 − Q1
QC = =
Q3 + Q1 Q3 + Q1
2
二、變異量數

 等距及比率變數的變異量數使用變異數 (variance) 或
是標準差 (standard deviation) 來表示。

 母群體的變異數 Σ ( X − µ ) 2
σ2 =
N
 母群體的標準差 Σ( X − µ ) 2
σ= σ = 2

N
 樣本的變異數 Σ( X − X ) 2
S =
2

n
 樣本的標準差 Σ( X − X ) 2
S= S = 2

n
二、變異量數

Σ ( X − X ) 2
 應用在推論統計時,通常以 s2 = 來估計母
n −1
Σ( X − X ) 2
群的變異數 σ 2 ,而以s = n −1 來估計母群
σ
標準差
 由於標準差會受到測量單位的影響,如果要比較相對
的變異,可用變異係數 (coefficient of variation, CV)

S σ
表示,CV =
X
× 100 或=
CV
µ
× 100
二、變異量數

 在《分析》中之《敘述統計》中選擇《描述性統
計量》。
二、變異量數

 點選所欲分析的《變數》。
二、變異量數

 在《選項》下勾選所欲分析的各種統計量數。
二、變異量數

 有效的受訪者有 1903 名,最小


值為 0 年 ( 未接受教育 ) ,最大
值為 20 年 ( 博士 ) ,因此全距為
20 年。
 平均受教年數為 10.28 年,標準
差為 4.758 年 (4.758 的平方即為
變異數 22.641) 。
二、變異量數

 在《分析》中之《敘述統計》中選擇《預檢資
料》。
二、變異量數

 點選所欲分析的變數到《依變數清單》中。
 因為研究者僅想得到統計量,所以在《顯示》當
中只選取《統計量》。
二、變異量數

 在《統計量》下使用內定的《描述性統計量》。
二、變異量數
 以下的報表比上一個報表多了中位數 (12 年 ) 及四
分位全距 (8 年 ) ,四分差則為 8/2=4 年。
二、變異量數

 在《分析》中之《敘述統計》選擇《次數分配
表》。
二、變異量數

 選擇《變數》,並取消《顯示次數分配表》。
二、變異量數

 在《統計量》下勾選所需統計量。
 其選項可分為四部分:
 一、集中量數,含平均數、中位數,及眾數
 二、變異量數:含最小值、最大值、全距 (SPSS
中文版譯為範圍 ) 、標準差,及變異數
 三、相對地位量數,含四分位數 ( 也是變異量
數 ) 、百分位數
 四、分配量數,含偏態及峰度
二、變異量數
二、變異量數
 如果要計算百分位數,可以自行新增百分等級。
 如果是分組之後的資料,可以勾選觀察值為組別中點
,不過此時應配合觀察值加權 ( 以分組之後的次數
當加權之依據 ) 。
二、變異量數

 在 1903 個有效的受訪者中,教育年數的集中量
部分,算術平均數為 10.28 年,中位數及眾數為
12 年 ( 高中 ) 。
 變異量數部分,全距為 20 ( 等於最大值 20 減最
小值 0)
 三個四分位數 ( 百分等級為 25 、 50 、 75 之百
分位數 ) 分別為 6 、 12 、 14 ,因此四分位全距
為 8 年 (14–6) ,四分差即為 4 年。
二、變異量數
 變異數為 22.641 ,標
準差為 4.758 。自行
計算變異

係數為 4.758
= 0.463
10.28
 分配量數部分,偏態
值為– 0.591 ,為負偏
態 ( 左偏 ) ,峰度值為
– 0.372 ,為低闊峰。

You might also like