You are on page 1of 46

การใชโปรแกรม SPSS version 11.

5 เบื้องตน เพื่อการวิเคราะหขอมูล

สารบัญ
ชัยเทพ พูลเขตต
ภาควิชาสัตวแพทยสาธารณสุขศาสตรและการบริการวินิจฉัย
คณะสัตวแพทยศาสตร
มหาวิทยาลัยเกษตรศาสตร

สารบัญ ..................................................................................................................................................1
1. ขอมูลและตัวแปร.........................................................................................................................2
2. การติดตั้งโปรแกรม .....................................................................................................................4
3. เมนูและคําสั่งที่สําคัญ ..................................................................................................................9
4. การจัดการขอมูลเบื้องตน ...........................................................................................................13
5. การตรวจสอบการแจกแจงของขอมูลเชิงปริมาณ.........................................................................16
6. การวิเคราะหขอมูลดวยสถิติเชิงพรรณา......................................................................................24
7. การวิเคราะหขอมูลเชิงปริมาณแบบ Independent-Sample T Test และ One-way ANOVA........30
8. การวิเคราะหขอมูลความสัมพันธของตัวแปรเชิงปริมาณ 2 ตัวแปรดวย correlation .....................38
9. การวิเคราะหขอมูลแบบ non-parametric statistics ที่สําคัญ .......................................................41
1. ขอมูลและตัวแปร
ขอมูล (Data)
a. ขอเท็จจริงที่เกิดขึ้น
b. ขอความหรือตัวเลข
c. อาจเกี่ยวของกับคน พืช สัตว สิ่งของ
d. จํานวนสุกรทั้งหมดของประเทศไทยในเดือนมกราคม พ.ศ. 2550 เปนขอมูลเชิงตัวเลข
e. ระดับความชอบของนิสิตป 5 ตอวิชาชีวสถิติ
ตัวแปร (Variable)
ขอมูลที่ไดจากการสังเกต วัด นับ สอบถาม
หนวยที่ศึกษาอาจเปนคน สัตว พืช และสิ่งของ
หนวยศึกษาที่แตกตางกันทําใหไดขอมูลที่แตกตางกัน จึงเรียกขอมูลนั้นวา “ตัวแปร”
จํานวนโคนมในเขตอําเภอกําแพงแสน
หนวยศึกษา = โคนมในเขตอําเภอกําแพงแสน
ตัวแปร = จํานวนโคนม
คาของตัวแปรคือขอมูล
สาเหตุที่ทําใหคาของตัวแปรหรือขอมูลมีคาแตกตางกัน
คุณลักษณะที่แตกตางกัน
เชน อายุโคที่แตกตางกัน น้ําหนักโค ปริมาณน้ํานมที่ได ฯลฯ หรืออาจกลาวไดวาหนวยที่ศึกษา
มีลักษณะที่แตกตางกัน
เวลาที่แตกตางกัน
เชน ปริมาณน้ํานมของแตละชวงเวลา (day in milk)
สถานที่แตกตางกัน
ฟารมที่เลี้ยง
ประเภทของขอมูล
แบงตามแหลงที่มาของขอมูล
Primary data
เปนขอมูลที่ผูใชเก็บเอง
มีความละเอียดสูง
สัมภาษณ ทดลอง สังเกตการณ
Raw data (ยังไมมีการวิเคราะห)
เสียเวลาในการเก็บ คาใชจายสูง
Secondary data
ผูใชไมไดเก็บรวบรวมเอง แตมีหนวยงานหรือผูอื่นเก็บรวบรวมไวแลว
ประหยัดเวลาและคาใชจายกวาการเก็บ Primary data

2
ขอมูลบางสวนอาจไมตรงกับความตองการของผูใชหรือรายละเอียดไมเพียงพอ
มีการวิเคราะหเบื้องตนมาบางแลว (Information) ผูใชสามารถนําไปใชไดเลย แตอาจ
มีความผิดพลาดได
แบงตาม Scale ของการวัด
Nominal Scale
Color
Ordinal Scale
Ranking topics
Interval Scale
Temperature
Ratio Scale
Salary
แบงตามลักษณะของขอมูล
Quantitative Data
Ratio and Interval Scale
Discrete Data and Continuous Data
Qualitative Data (Categorical Data)
Nominal and Ordinal Scale
Quantitative Data <--> Qualitative Data

การวิเคราะหขอมูลประเภทตางๆ
Quantitative Data >> สามารถใชเทคนิคการวิเคราะหไดทุกเทคนิค
Qualitative Data >> ใชเทคนิคการวิเคราะหไดบางเทคนิค ไมสามารถหาคาเฉลี่ย คาเบี่ยงเบน
มาตรฐานได

Data Calculation Methods


Nominal Scale Frequency, percentage, mode, crosstab, chi-square test, binomial test
Ordinal Scale Median, mode, percentile, rank-order correlation, sign test, crosstab, chi-square test,
nonmetric multidimensional scaling
Interval Scale Mean, standard deviation, average, correlation analysis, discriminant analysis,
regression analysis, ANOVA, metric multidimensional scaling
Ratio Scale All of mean, standard deviation, coefficient of variance, correlation analysis, regression
analysis, ANOVA, average, discriminant analysis, factor analysis, cluster analysis,
metric multidimensional scaling

3
2. การติดตั้งโปรแกรม
2.1. การติดตั้งโปรแกรม SPSS version 11.5 สามารถทําไดดังนี้
a. นําแผนซีดีของโปรแกรม SPSS for windows version 11.5 ใสในซีดีรอม
b. คอมพิวเตอรจะตรวจสอบไดรฟอัตโนมัติ (Autorun) จากนั้นใหทําการติดตั้งตามขั้นตอน d เปนตน
ไป แตถาคอมพิวเตอรไมสามารถตรวจสอบไดรฟอัตโนมัติใหติดตั้งโปรแกรมตั้งแตขั้นตอนที่ c
c. ดับเบิลคลิกที่ My Computer
d. ดับเบิลคลิกที่โฟลเดอร SPSS version 11.5
e. ดับเบิลคลิกที่ไอคอน setup (ดูภาพขางลางประกอบ)

f. คลิกปุม Next และ Yes (ดูภาพขางลางประกอบ)

4
g. คลิกปุม Next เพื่อติดตั้งโปรแกรม (ดูภาพขางลางประกอบ)

h. ใส Serial number เปนหมายเลข xxxxx และคลิก Next (ดูภาพขางลางประกอบ)

i. คลิกเลือกการติดงตั้งแบบ Personal installation (ดูภาพขางลางประกอบ)

5
j. ใส License code หมายเลข xxxxxxxxxxx แลวคลิก Update จากนั่นใหใส Update code
หมายเลข xxxxxxxxxxx ในชองเดิมและคลิก Update อีกครั้ง เมื่อเสร็จแลวใหคลิก Next 2 ครั้ง
และรอจนกระทั่งการติดตั้งในขั้นตอนแรกแลวเสร็จ (ดูภาพขางลางประกอบ)

6
k. คลิก Next 2 ครั้ง และรอโปรแกรมติดตั้งใหแลวเสร็จ (ดูภาพขางลางประกอบ)

l. เมื่อโปรแกรมติดตั้งใหเสร็จแลว จะปรากฏหนาจอเพื่อถามการลงทะเบียนผูใช ใหเลือก


Register later แลวคลิก Next (ดูภาพขางลางประกอบ)

7
m. เมื่อโปรแกรม SPSS version 11.5 แลวเสร็จสมบูรณแลวจะปรากฏหนาจอเหมือนภาพดานลาง
ใหทําการคลิกเลือก Finish เปนอันสิ้นสุดขบวนการติดตั้งโปรแกรม ทั้งนี้หากผูใชคลิกเลือก
Launch tutorial now? และ/หรือ Display the ReadMe file now โปรแกรม SPSS จะแนะนํา
การใชโปรแกรมและขอควรทราบเกี่ยวกับการใชโปรแกรม SPSS version 11.5 (ดูภาพขางลาง
ประกอบ)

2.2 การเรียกใชโปรแกรม SPSS version 11.5


a. คลิก Start > All programs > SPSS for Windows > SPSS 11.5 for Windows

8
3. เมนูและคําสั่งที่สําคัญ
ผูใชโปรแกรม SPSS จําเปนตองทราบถึงเมนูและคําสั่งพื้นฐานเพื่อการใชโปรแกรมที่ถูกตอง ซึ่งจําเปนอาศัย
ความคุนเคยกับตัวโปรแกรม เพื่อใหไดประสิทธิภาพในการใชประโยชนจากโปรแกรม SPSS สูงสุด ผูใชจําเปน
ตองมีการฝกปฏิบัติเปนประจําและสม่ําเสมอในการใชโปรแกรม
a. สวนประกอบของหนาจอ เมื่อเปดโปรแกรม SPSS version 11.5 จะปรากฏหนาจอคลายภาพดาน
ลาง

Run the tutorial หมายถึง การเปดบทเรียนการใช SPSS ในโปรแกรม


Type in data หมายถึง การเริ่มตนใชโปรแกรมโดยการปอนตัวแปรและคาของตัวแปร
Run an existing query หมายถึง การทํางาน SPSS รวมกับระบบฐานขอมูล
Create new query using Database Wizard หมายถึง การสรางสวนทํางานรวมกับระบบ
ฐานขอมูล
Open an existing data source หมายถึง การนําเปดขอมูลจากโปรแกรม SPSS มาทํา
การแกไข เชน เพิ่มตัวแปร ใหคาตัวแปรและวิเคราะหผล เปนตน
Open another type of file หมายถึง การนําขอมูลโปรแกรมอื่นๆ มาทํางานรวมกับ
โปรแกรม SPSS

9
b. สวนประกอบของหนาจอหลักที่สําคัญ
Menu bar

พื้นที่สําหรับการกําหนดคาตัวแปร Variables

Data View

Variable View

Data View เปนสวนที่กําหนดคาของตัวแปรในแตละชุด หรือเปนสวน Data entry ใน


ลักษณะ spreadsheet คลายกับการทํางานของ Microsoft Excel (ดูภาพดานลาง
ประกอบ)

10
Variable View เปนสวนกําหนดคุณสมบัติของตัวแปร (ดูภาพดานลางประกอบ)

Name หมายถึง กําหนดชื่อตัวแปรซึ่งตองมีความยาวไมเกิน 8 ตัวอักษร


Type หมายถึง ชนิดของตัวแปร เมื่อคลิกที่เซลลนี้จะปรากฏชนิดของตัวแปรทั้งหมด 8
ชนิด ซึ่งตัวแปรหนึ่งๆ จะตองเปนชนิดใดชนิดหนึ่งเทานั่น โดยทั่วไปแลวมักจะเลือกใหเปน
Numeric (ตัวเลข) หรือ String (ตัวอักษร)

Width หมายถึง จํานวนความกวางของคาตัวแปรหรือจํานวนของคาตัวแปร


Decimals หมายถึง จํานวนหลักหลังจุดทศนิยม
Label หมายถึง ความหมายของตัวแปร
Value หมายถึง กําหนดความหมายของคาของตัวแปร เชน 1 หมายถึง male

11
Missing หมายถึง การกําหนดเมื่อไมพบคาตัวแปร มี 3 ทางเลือกคือ
No missing values กรณีที่ไมมีการพิมพขอมูล โปรแกรมจะใหคาเปนจุด (.)
Discrete missing values ผูใชเปนผูกําหนดรหัสของ missing value เอง
Range plus one optimal discrete missing value เปนการกําหนดรหัสของขมูลที่
ตองขามไปอีกรหัสหนึ่ง มักใชในกรณีที่ผูวิจัยออกแบบสอบถามแลวผูตอบไมจําเปน
ตองตอบในขอนี้ และใหถามไปตอบขอถัดไป

Align หมายถึง การจัดคาของชุดตัวแปรใหชิดซาย กลางหรือขวา


Measure หมายถึง Scale ของการวัด มี 3 ชนิดคือ
Scale หมายถึง Interval หรือ Ration Scale
Ordinal หมายถึง Ordinal Scale
Nominal หมายถึง Nominal Scale

12
4. การจัดการขอมูลเบื้องตน
4.1 การ Import ขอมูลจาก Microsoft Excel
a. คลิกเลือกเพื่อเปดโฟลเดอรใหม

b. คลิกเลือกไฟลเปาหมายและเลือก Files of type ใหเปนสกุล Excel

c. คลิก Open และเลือก Worksheet จากนั่นคลิก OK

13
4.2 การเปลี่ยนแปลงขอมูลดวยคําสั่ง Transform ในบางครั้งการเก็บขอมูลไมสามารถทําใหเกิดการ
กระจายตัวขอมูลแบบปกติได จึงจําเปนตองมีการเปลี่ยนแปลงขอมูลโดยอาจทําการ take log หรือยกกําลังสอง
เปนตน ตัวอยางของขอมูลที่จําเปนตองมีการ Transform เชน คา Titer, คา Somatic cell count ฯลฯ
a. เปดไฟลหรือปอนคาของตัวแปร

b. คลิกเลือกที่ Transform คลิกเลือก Compute

c. คลิกเลือก Function, Variable รวมทั้งตั้งชื่อ Variable ที่ทําการ Transform เสร็จแลว

14
d. คลิก OK

15
5. การตรวจสอบการแจกแจงของขอมูลเชิงปริมาณ
เปนการตรวจสอบวาขอมูลที่ไดมีการแจกแจงเปนแบบ Normal Distribution หรือไม จะทําในตัวแปรเชิง
ปริมาณ โดยการตรวจสอบสามารถทําได 2 วิธีคือ
การตรวจสอบดวยกราฟ เชน Histogram, Boxplot, Stem and Leaf และ Normal Probability Plot
เปนตน
การตรวจสอบโดยการใชสถิติทดสอบ เชน Kolmogorov-Smirnov, Shapiro-Wilk และ Lilliefor’s
test หรือแมกระทั่งการทดสอบความแปรปรวนของประชากรในแตละกลุมดวยวิธี Levene’s test ก็
สามารถทําได
โปรแกรม SPSS มีคําสั่งที่สามารถตรวจสอบการแจกแจงดวยกราฟ โดยเขาไปที่ Menu > Descriptive
Statistics > Frequency แตในที่นี้จะใชคําสั่งที่สามารถแสดงผลออกมาทั้งคาทางสถิติและกราฟเพื่อดูการกระจาย
ตัวของขอมูล
5.1 การตรวจสอบการกระจายตัวของขอมูล
a. โดยปกติแลวหากมีการติดตั้งโปรแกรม SPSS ทั้งหมดและสมบูรณ ในโฟลเดอรของ
SPSS ใน Drive: C > Program Files > SPSS จะมีขอมูลที่มาพรอมกับโปรแกรม ซึ่ง
ในที่นี้จะนําขอมูลดังกลาวมาเพื่อมาใชในการเรียนรู ใหนิสิตทําการเปดโฟลเดอรดัง
กลาวและเลือกไฟล 1991 U.S. General Social Survey แลวคลิก Open

b. จะพบขอมูลตามภาพดานลาง

16
c. เลือก Analyze > Descriptive Statistics > Explore

d. เลือก column ที่ตองการทดสอบการกระจายตัวของขอมูลตัวแปรตาม ซึ่งในที่นี้เลือก


Age of Respondent (age) ซึ่งเปนตัวแปรเชิงปริมาณใสในชอง Dependent List
สวนชอง Factor List เปนตัวแปรที่ใชในการแบงกลุมของขอมูล ไมจําเปนตองใส (ยก
เวนในกรณีที่ตองการแบงกลุม) และชอง Label Cases by เปนชองที่ใชเพื่อระบุ
Outlier ของ Boxplot ในที่นี้ก็ไมใสเชนกัน

e. ตรวจสอบลักษณะการแสดงของ output ในชอง Display ใหเปน Both เพื่อใหผลการ


วิเคราะหแสดงทั้งกราฟและคาสถิติ

17
f. คลิกเลือก Statistics เพื่อตรวจสอบสิ่งที่ตองการแสดงใน Output

g. คลิกเลือก Descriptives เพื่อแสดงคาสถิติเชิงพรรณา เชน คาเฉลี่ย คามัธยฐาน คา


เบี่ยงเบนมาตรฐาน ความโดงของกราฟ ความเบของกราฟ เปนตน สวนคา M-
estimators เปนคา Robust maximum-likelihood estimator ซึ่งในที่นี้จะไมเลือก แลว
คลิกเลือก Outlier และ Percentiles เพื่อแสดงคาที่หลุดออกจากขอมูลรวมทั้งคา
Percentiles ที่ 5, 10, 25, 50, 75, 90 และ 95 โดยตั้งคา Confidence Interval for
Mean ใหเปน 95% แลวคลิกเลือก Continue

h. ตรวจสอบลักษณะของ Plot โดยคลิกเลือก Plot แลวคลิกเลือก Factor levels together หมาย


ถึงการสั่งใหโปรแกรมแสดงคาแยกตามตัวแปรใน Dependent แตละตัว (ซึ่งตองมีการระบุใน
factor variable แตถาไมระบุโปรแกรมจะแสดงเปนภาพรวม) สวน Stem-and-Leaf และ
Histogram เปนกราฟที่แสดงที่สามารถดูการกระจายตัวได และ Normality plots with tests จะ
แสดงกราฟและคาทางสถิติของ Shapiro-Wilks และ Komogorov-Smirnov เพื่อทดสอบวาขอ
มูลมีการแจกแจงเปยแบบปกติหรือไม ในกรณีที่ตัวอยางมากกวา 50 โปรแกรมจะไมคํานวณ
Shapiro-Wilks’s statistic ให จากนั้นคลิก Continue สําหรับ Spread vs. Level with Levene
Test เปนการตรวจสอบการกระจายของขอมูลโดยใช Levene Test โดยคาของสถิติ Levene

18
จะคํานวณจากคาจริง หรือคาของขอมูลที่มีการเปลี่ยนแปลงรูปแบบ (Transformed data) ก็ได
ผูวิเคราะหจะตองเลือกทางเลือกใดทางเลือกหนึ่งดังนี้
None เมื่อไมตองการคํานวณคา Levene Test
Power estimation สําหรับแตละกลุม จะพล็อตคา log ของมัธยฐานกับ log ของ
พิสัยควอไทล (IQR) จะใชเมื่อตองการหาการเปลี่ยแปลงรูปแบบที่เหมาะสมของขอ
มูล
Transformed ผูวิเคราะหสามารถเลือกรูปแบบของขอมูล ถาเลือกทางเลือกนี้แล
วจะทําใหคําวา Power มีสีเขม จากนั้นคลิกเลือกทางเลือกที่ตองการหลังคําวา
Power
Untransformed ใชเมื่อตองการใชคาของขอมูลจริง โดยไมมีการเปลี่ยนแปลงขอมูล

i. คลิกเลือก Options เพื่อจัดการ Missing values ในที่นี้ใหเลือก Exclude cases


listwise ซึ่งจะทําใหโปรแกรมคํานวณโดยตัด Case ที่มี Missing value แลงคลิก
Continue

19
j. คลิกเลือก OK ได output ตามภาพดานลาง

k. การแปลผลขอมูลในตารางแรกจะเปนนับจํานวนขอมูลหรือ Cases ทั้งหมด พบวามี


จํานวนขอมูลทั้งหมด 1517 ขอมูล โดยมี 3 ขอมูลเปน missing cases

Case Processing Summary

Cases
Valid Missing Total
N Percent N Percent N Percent
Age of
1514 99.8% 3 .2% 1517 100.0%
Respondent

20
l. ตารางถัดเปนเปนตารางที่แสดงถึงคาของ Descriptive statistics ซึ่งสามารถดู
ลักษณะการกระจายตัวของขอมูลไดแบบคราวๆ โดยเปรียบเทียบจากคา Mean กับ
Median ในกรณีที่เปนการกระจายตัวแบบ Normal distribution คาทั้งสองควรมีคา
ใกลเคียงกันมากที่สุดหรือเทากัน นอกจากนี้สิ่งที่จําเปนตองพิจารณาคือคา
Skewness โดยขอมูลใดที่มีคาใกลเคียงศูนยแสดงวาขอมูลนั้นมีแนวโนมเปน Normal
distribution ทั้งนี้หากคาที่ไดมากกวาศูนยแสดงวาขอมูลมีลักษณะเบขวา และขอมูล
ใดมีคา Skewness ติดลบแสดงวาขอมูลเบซาย และคา Kurtosis ปกติแลวในขอมูลที่
มีลักษณะ Normal distribution แบบมาตรฐานจะมีคาประมาณ 3

Descriptives

Statistic Std. Error


Age of Respondent Mean 45.63 .458
95% Confidence Lower Bound 44.73
Interval for Mean Upper Bound
46.52
5% Trimmed Mean 44.97
Median 41.00
Variance 317.140
Std. Deviation 17.808
Minimum 18
Maximum 89
Range 71
Interquartile Range 28.00
Skewness .524 .063
Kurtosis -.786 .126

m. ตารางถัดไปเปนคาแสดง Percentiles ตางๆ


Percentiles

Percentiles
5 10 25 50 75 90 95
Weighted Age of
Average Respondent 22.00 24.00 32.00 41.00 60.00 73.00 78.00
(Definition 1)
Tukey's Age of
32.00 41.00 60.00
Hinges Respondent

21
n. ตารางถัดไปเปนการแสดงคาที่สูงสุดและต่ําสุด (Extreme value) จํานวน 5 คา และ
ในแตละคาอยูในชุดขอมูล (cases) ลําดับที่เทาไร

Extreme Values

Case Number Value


Age of Highest 1 295 89
Respondent 2 312 89
3 346 89
4 569 89
5 620 89(a)
Lowest 1 1120 18
2 679 18
3 188 18
4 1053 19
5 1029 19(b)
a Only a partial list of cases with the value 89 are shown in the table of upper extremes.
b Only a partial list of cases with the value 19 are shown in the table of lower extremes.

o. ตารางถัดไปเปนการแสดงคาวาชุดของขอมูลมีการกระจายตัวแบบใด โดยในที่นี้การ
ทดสอบลักษณะการกระจายตัวจะมีสมมติฐานในการทดสอบกลาวคือ
Ho: ขอมูลมีการกระจายตัวแบบปกติ
Ha: ขอมูลมีการกระจายตัวแบบไมปกติ
การพิจารณาวาจะใชสถิติตัวใดใหพิจารณาจากจํานวนขอมูลหรือขนาดของตัวอยาง
โดยที่ Shapiro-Wilk จะใชเมื่อตัวอยางมีขาดไมเกิน 50 ตัวอยางเทานั้น ซึ่งปกติแลว
เราจะพิจารณาจาก Kolmogorov-Smirnov ในที่นี้พบวา p-value เปน .000 ซึ่งมีคา
นอยกวา 0.01 ที่ระดับความเชื่อมั่น 99% แสดงวาปฏิเสธ Null hypothesis ดังนั้นขอ
มูลชุดนี้จึงมีการแจกแจงแบบไมปกติ และหากพิจารณาจากกราฟดานลางทั้งหมด
จะพบวากราฟมีลักษณะเบขวาเล็กนอย ดังนั้นการวิเคราะหสถิติสําหรับขอมูลชุดนี้
ควรเลือกแบบ Non-parametric statistics

Tests of Normality

Kolmogorov-Smirnov(a) Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Age of
.105 1514 .000 .944 1514 .000
Respondent
a Lilliefors Significance Correction

22
Age of Respondent Stem-and-Leaf Plot
Histogram
300 Frequency Stem & Leaf

12.00 1. 899
143.00 2. 000011111111222222233333344444
200 150.00 2. 5555556666666777777888888899999
187.00 3. 00000001111111222222222333333334444444
195.00 3. 555555555556666666777777788888889999999
167.00 4. 0000000111111112222223333333444444
100 113.00 4. 5555667777778888889999
87.00 5. 000011122223334444
Frequency

Std. Dev = 17.81 78.00 5. 555667778888999


Mean = 45.6 87.00 6. 00011112223333444
0 N = 1514.00 84.00 6. 555566677778888999
95.00 7. 0001111222233333444
20
25.0
30.0
35.0
40.0
45.0
50.0
55.0
60.0
65.0
70.0
75.0
80.0
85.0
90.0
53.00 7. 5566677889

.0
43.00 8. 001122234
Age of Respondent
20.00 8. 5799&

Stem width: 10
Each leaf: 5 case(s) & denotes fractional leaves

Normal Q-Q Plot of Age of Respondent Detrended Normal Q-Q Plot of Age of Re
3 1.5

1 1.0

0
Expected Normal

-1 .5
Dev from Normal

-2

0.0
-3

-4
-20 0 20 40 60 80 100 -.5
0 20 40 60 80 100
Observed Value
Observed Value

100

80

60

40

20

0
N= 1514
Age of Respondent

23
6. การวิเคราะหขอมูลดวยสถิติเชิงพรรณา
สถิติเชิงพรรณาเปนการคํานวณคาสถิติพื้นฐาน เชน การวัดคากลาง การวัดการกระจายตัวของขอมูล และ
การนําเสนอขอมูลในรูปกราฟหรือตาราง ความถี่ รอยละ เปนตน เพื่ออธิบายลักษณะของขอมูล ทั้งในเชิงปริมาณ
และเชิงคุณภาพ
6.1 การหาจํานวนหรือความถี่ดวยการสรางตารางแจกแจงความถี่ (Frequencies)
ใชคําสั่ง Analyze > Descriptive Statistics > Frequencies เพื่อแสดงความถี่ เปอรเซ็นต
คาสถิติเชิงพรรณาตางๆ กราฟ และอื่นๆ ขึ้นอยูกับการเลือกของผูวิเคราะห โดยสามารถ
วิเคราะหไดทั้งขอมูลเชิงคุณภาพและเชิงปริมาณ โดยการเลือกวาจะวิเคราะหขอมูลแบบใด
นิสิตตองเลือกชนิดของตัวแปรและ Output ใหสอดคลองกัน ซึ่งในที่นี้ใหเปดไฟท 1991
U.S. General Social Survey เพื่อทําการวิเคราะหขอมูลเชิงปริมาณโดยการเลือกตัวแปรที่
เกี่ยวของกับอายุ จากนั้นทําการเลือกในชอง Statistics, Charts และ Format ใหเหมาะสม
แลวคลิกเลือก OK

24
จะได Output ออกมาดังตารางและภาพดานลาง โดยที่การแปลผลจะคลายกับที่ไดกลาวมา
แลวในหัวขอที่ 5
Statistics

Age of Respondent
N Valid 1514
Missing 3
Mean 45.63
Std. Error of Mean .458
Median 41.44(a)
Mode 35
Std. Deviation 17.808
Variance 317.140
Skewness .524
Std. Error of Skewness .063
Kurtosis -.786
Std. Error of Kurtosis .126
Range 71
Minimum 18
Maximum 89
Sum 69078
Percentiles 10 24.32(b)
20 29.36
25 31.53
30 33.44
40 37.20
50 41.44
60 47.22
70 54.87
75 59.71
80 63.98
90 72.70
a Calculated from grouped data.
b Percentiles are calculated from grouped data.

25
Age of Respondent

Cumulative
Frequency Percent Valid Percent Percent
Valid 18 3 .2 .2 .2
19 9 .6 .6 .8
20 18 1.2 1.2 2.0
21 38 2.5 2.5 4.5
22 35 2.3 2.3 6.8
23 28 1.8 1.8 8.7
24 24 1.6 1.6 10.2
25 28 1.8 1.8 12.1
26 33 2.2 2.2 14.3
27 29 1.9 1.9 16.2
28 33 2.2 2.2 18.4
29 27 1.8 1.8 20.1
30 35 2.3 2.3 22.5
31 35 2.3 2.3 24.8
32 44 2.9 2.9 27.7
33 38 2.5 2.5 30.2
34 35 2.3 2.3 32.5
35 55 3.6 3.6 36.1
36 35 2.3 2.3 38.4
37 33 2.2 2.2 40.6
38 37 2.4 2.4 43.1
39 35 2.3 2.3 45.4
40 36 2.4 2.4 47.8
41 38 2.5 2.5 50.3
42 30 2.0 2.0 52.2
43 33 2.2 2.2 54.4
44 30 2.0 2.0 56.4
45 22 1.5 1.5 57.9
46 12 .8 .8 58.7
47 28 1.8 1.8 60.5
48 29 1.9 1.9 62.4
49 22 1.5 1.5 63.9
50 20 1.3 1.3 65.2
51 15 1.0 1.0 66.2
52 20 1.3 1.3 67.5
53 14 .9 .9 68.4
54 18 1.2 1.2 69.6
55 16 1.1 1.1 70.7
56 12 .8 .8 71.5
57 17 1.1 1.1 72.6
58 18 1.2 1.2 73.8
59 15 1.0 1.0 74.8
60 16 1.1 1.1 75.8

26
61 20 1.3 1.3 77.1
62 17 1.1 1.1 78.3
63 19 1.3 1.3 79.5
64 15 1.0 1.0 80.5
65 18 1.2 1.2 81.7
66 13 .9 .9 82.6
67 18 1.2 1.2 83.8
68 18 1.2 1.2 84.9
69 17 1.1 1.1 86.1
70 15 1.0 1.0 87.1
71 20 1.3 1.3 88.4
72 19 1.3 1.3 89.6
73 24 1.6 1.6 91.2
74 17 1.1 1.1 92.3
75 10 .7 .7 93.0
76 13 .9 .9 93.9
77 12 .8 .8 94.6
78 11 .7 .7 95.4
79 7 .5 .5 95.8
80 11 .7 .7 96.6
81 9 .6 .6 97.2
82 13 .9 .9 98.0
83 5 .3 .3 98.3
84 5 .3 .3 98.7
85 6 .4 .4 99.1
87 4 .3 .3 99.3
88 2 .1 .1 99.5
89 8 .5 .5 100.0
Total 1514 99.8 100.0
Missing NA 3 .2
Total 1517 100.0

Age of Respondent
300

200

100
Frequency

Std. Dev = 17.81


Mean = 45.6
0 N = 1514.00
20
25.0
30.0
35.0
40.0
45.0
50.0
55.0
60.0
65.0
70.0
75.0
80.0
85.0
90.0
.0

Age of Respondent

27
6.2 การสรางตารางแจกแจงความถี่แบบ 2 ทาง (Crosstabs)
ในโปรแกรม SPSS สามารถสรางตารางแจกแจงตั้งแต 2 ทางขึ้นไปได แตในที่นี้จะขอกลาว
เฉพาะการสรางตารางแจกแจง 2 ทาง (ตัวแปรที่ใสในตารางอาจมีมากกวา 2 ตัวแปร) ซึ่งจะ
ใชคําสั่ง Analyze > Descriptive Statistics > Crosstabs โดยขอมูลที่ใสในตารางแจกแจง
ควรเปนขอมูลที่ไดจากการนับหรือขอมูลเชิงคุณภาพ ในที่นี้เลือกตัวแปร Respondent’s
sex ลงใน Row(s) และเลือกตัวแปร Region of the United States ลงใน Column(s) (การ
ตั้งคาใน Statistics นั้นโดยมากเปนคํานวณคาทางสถิติ เชน Chi-square ซึ่งจะไดกลาวถึง
ในบทถัดไป) แลวคลิก OK (หากตองการแสดงผลเปน Percentage ใหคลิกเลือก Cell แลว
กําหนดโดยเลือก Percentage)

28
ไดลักษณะของขอมูลตามตารางดานลาง
Case Processing Summary

Cases
Valid Missing Total
N Percent N Percent N Percent
Respondent's Sex *
Region of the United
States * R's Federal 932 61.4% 585 38.6% 1517 100.0%
Income Tax

Respondent's Sex * Region of the United States * R's Federal Income Tax Crosstabulation

Count
R's Federal
Income Tax Region of the United States
North East South East West Total
Too High Respondent's Male
99 66 68 233
Sex
Female 140 76 92 308
Total 239 142 160 541
About Right Respondent's Male 84 45 48 177
Sex Female 92 54 57 203
Total 176 99 105 380
Too Low Respondent's Male 3 1 2 6
Sex Female 1 2 2 5
Total 4 3 4 11

ในหนาจอของ Crosstabs คําสั่ง Display clustered bar chart เมื่อเลือกจะแสดง clustered


bar chart ซึ่งชวยในการสรุปขอมูลได สวน Suppress tables จะใชเมื่อไมตองการแสดงตา
ราง Crosstabs ที่แสดงความถี่ของขอมูล แตตองการแสดงเฉพาะคาทางสถิตินั้น

29
7. การวิเคราะหขอมูลเชิงปริมาณแบบ Independent-Sample T Test และ One-way
ANOVA
7.1 การวิเคราะหขอมูลเชิงปริมาณแบบ Independent-Sample T Test เปนการวิเคราะหขอมูลเชิง
ปริมาณที่เปนอิสระตอกันจํานวน 2 กลุม วามีความแตกตางกันหรือไม โดยเลือกคําสั่ง Analyze
> Compare Means > Independent-Sample T Test โดยสมมติวาขอมูลที่จะวิเคราะหมีการ
กระจายตัวแบบปกติ

เมื่อปรากฏหนาจอตามรูปดานบนแลวใหใสตัวแปรตามเชิงปริมาณที่ตองการวิเคราะห
ในชอง Test Variable(s) แลวตัวแปรตนในชอง Grouping Variable เมื่อใสตัวแปรตน
ในชองนี้แลว Define Group จะ active ใหทําการคลิกเพื่อกําหนดคาของตัวแปรตาม
คุณลักษณะของตัวแปรนั้นๆ ในกรณีที่นิสิตลืมคุณลักษณะของตัวแปรสามารถดูได
จาก Utilities > File Info ตามรูปดานลาง

30
คลิกเลือก Options แลวกําหนดระดับความเชื่อมั่นไวที่ 95% สําหรับคา Missing
Values ใหเลือก Exclude cases analysis by analysis ซึ่งหมายถึงไมรวมเอาขอมูล
ของ Case ที่มี missing values ในการวิเคราะห จากนั้นคลิกเลือก Continue แลว
ตามดวย OK

ไดผลการทดสอบออกมาตามตารางดานลาง โดยตารางแรกจะแสดงลักษณะขอมูล
แบบสถิติเชิงพรรณา โดยแบงตาม
Group Statistics

Std. Error
Respondent's Sex N Mean Std. Deviation Mean
Age of Respondent Male 636 44.18 17.033 .675
Female 878 46.67 18.288 .617

31
Independent Samples Test

Levene's Test for


Equality of Variances t-test for Equality of Means
95% Confidence Interval
of the Difference
Mean Std. Error
F Sig. t df Sig. (2-tailed) Difference Difference Lower Upper
Age of Respondent Equal variances
9.697 .002 -2.693 1512 .007 -2.49 .925 -4.307 -.677
assumed
Equal variances not
assumed -2.724 1420.931 .007 -2.49 .915 -4.287 -.698

การวิเคราะหขอมูลจําเปนตองตรวจสอบความแปรปรวนของประชากรที่นํามาทดสอบกอนวาเทากันหรือไม โดยพิจารณาจาก
Levene’s Test for Equality of Variances ซึ่งในกรณีนี้จะมีสมมติฐานเพื่อการวิเคราะหความแปรปรวนโดย
o Ho: ความแปรปรวนของขอมูลทั้ง 2 ชุดเทากัน
o Ha: ความแปรปรวนของขอมูลทั้ง 2 ชุดไมเทากัน
ในกรณีนี้พบวาคา Probability Value (p-value) ของ Levene’s Test เทากับ 0.002 ซึ่งนอยกวา 0.05 ดังนั้นจึงปฏิเสธ Null
hypothesis แลวสรุปวาความแปรปรวนของขอมุลทั้ง 2 ชุดไมเทากัน ดังนั้นการทดสอบ Independent Samples Test จึงพิจารณา
จากคา Equal variance not assumed ไดคา P-value เปน 0.007 ซึ่งนอยกวา 0.05 แสดงวาขอมูลทั้ง 2 ชุด แตกตางกันอยางมีนัย
สําคัญทางสถิติ (p<0.05) สําหรับในกรณีที่ขอมูลมีความแปรปรวนเทากันใหพิจารณาคา p-value ของ Independent Samples Test
จาก Equal variances assumed
7.2 การวิเคราะหขอมูลเชิงปริมาณแบบ One-Way ANOVA เปนการวิเคราะหขอมูลเชิงปริมาณตัว
แปรเดียวที่เปนอิสระตอกันจํานวน 3 กลุม (ขึ้นไป) วามีความแตกตางกันหรือไม โดยเลือกคํา
สั่ง Analyze > Compare Means > One-Way ANOVA ในที่นี้สมมติตัวแปรโดยเลือกจากไฟท
1991 U.S. General Social Survey โดย assumed ขอมูลมีการกระจายตัวแบบปกติ

จากนั้นคลิกเลือกตัวแปรตามเชิงปริมาณในชอง Dependent List และตัวแปรตนใน


Factor จากนั้นสิ่งจําเปนที่ตองพิจารณาคือ Post Hoc Multiple Comparison Test ซึ่ง
เปนการใชสถิติเพื่อทดสอบวาถาคาสถิติแบบ One-way ANOVA ใหผลมีนัยสําคัญ
ทางสถิติแลวคูใดที่มีความแตกตางกันโดยสมมติฐานของ One-way ANOVA โดยทั่ว
ไปคือ
• Ho: คา mean ของทุกกลุมไมแตกตางกัน
• Ha: คา mean ของกลุมที่ทดสอบอยางนอยหนึ่งคูที่แตกตางกัน
โดย Post Hoc จะบอกไดวาคูใดที่ตางกันในกรณีที่ปฏิเสธ Null hypothesis ในที่นี้
คลิกเลือก LSD, Bonferroni, Tukey, Duncan, Tamhane’s T2 และ Dunnett’s T3
แลตั้ง Significant level ไวที่ .05 (โดยปกติแลว Post Hoc จะมี 2 กลุมคือกลุม Equal
Variances Assumed และ Equal Variances Not Assumed ซึ่งควรจะเลือกทั้ง 2
กลุม) แลวคลิก Continue
คลิก Options เพื่อเลือก Descriptive, Homogeneity-of-Variance (เพื่อทดสอบความ
แปรปรวน), Brown-Forsythe หรือ Welch (เพื่อทดสอบความแตกตางของคาเฉลี่ย
กลุมตางๆ เมื่อคาความแปรปรวนในแตละกลุมไมเทากัน จากนั้นเลือก Continue แลว
OK

ไดผลการวิเคราะหตามตารางดานลาง

34
Descriptives
Age of Respondent
95% Confidence Interval for
Mean

N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum
White 1262 46.20 18.032 .508 45.20 47.20 18 89
Black 203 43.27 16.794 1.179 40.95 45.60 19 88
Other 49 40.59 14.467 2.067 36.44 44.75 19 77
Total 1514 45.63 17.808 .458 44.73 46.52 18 89

สิ่งที่ตองพิจารณานอกจากสถิติเชิงพรรณาคือคาความแปรปรวนวาเปนอยางไร จากตารางพบวา Levene Statistic มีคา p-value<


0.05 แสดงวาคาความแปรปรวนของขอมูลแตละชุดตางกัน ดังนั้นสถิติของ One-way ANOVA ที่ตองพิจารณาคือ Brown-Forsythe
หรือ Welch แตในกรณีที่ความแปรปรวนเทากัน (p>0.05) ใหพิจารณาคาสถิติแบบ F Test ในตาราง ANOVA แทน
Test of Homogeneity of Variances
Age of Respondent
Levene
Statistic df1 df2 Sig.
5.478 2 1511 .004

ANOVA
Age of Respondent
Sum of
Squares df Mean Square F Sig.
Between Groups 2784.189 2 1392.095 4.409 .012
Within Groups 477048.21
1511 315.717
5
Total 479832.40
1513
4
Robust Tests of Equality of Means

Age of Respondent
Statistic(a) df1 df2 Sig.
Welch 5.529 2 118.615 .005
Brown-Forsythe 5.559 2 217.762 .004
a Asymptotically F distributed.

ในกรณีนี้พิจารณาจากคา Welch พบวาคา p=0.005 ซึ่งนอยกวา 0.05 แสดงวาพบนัยสําคัญทางสถิติกลาวคือมีอยางนอยหนึ่งคูที่มี


คา mean แตกตางกันอยางมีนัยสําคัญทางสถิติ ซึ่งคูใดบางเราจะพิจารณาจาก Post Hoc Multiple Comparison Test ตอไป
Multiple Comparisons

Dependent Variable: Age of Respondent

Mean 95% Confidence Interval


(I) Race of (J) Race of Difference (I-
Respondent Respondent J) Std. Error Sig. Lower Bound Upper Bound
Tukey HSD White Black 2.93 1.344 .075 -.22 6.08
Other 5.61 2.587 .077 -.46 11.68
Black White -2.93 1.344 .075 -6.08 .22
Other 2.68 2.828 .610 -3.96 9.31
Other White -5.61 2.587 .077 -11.68 .46
Black -2.68 2.828 .610 -9.31 3.96
LSD White Black 2.93(*) 1.344 .029 .29 5.57
Other 5.61(*) 2.587 .030 .53 10.68
Black White -2.93(*) 1.344 .029 -5.57 -.29
Other 2.68 2.828 .344 -2.87 8.23
Other White -5.61(*) 2.587 .030 -10.68 -.53
Black -2.68 2.828 .344 -8.23 2.87
Bonferroni White Black 2.93 1.344 .088 -.29 6.15
Other 5.61 2.587 .091 -.59 11.81
Black White -2.93 1.344 .088 -6.15 .29

36
Other 2.68 2.828 1.000 -4.10 9.46
Other White -5.61 2.587 .091 -11.81 .59
Black -2.68 2.828 1.000 -9.46 4.10
Tamhane White Black 2.93 1.283 .068 -.15 6.01
Other 5.61(*) 2.128 .032 .36 10.85
Black White -2.93 1.283 .068 -6.01 .15
Other 2.68 2.379 .600 -3.12 8.48
Other White -5.61(*) 2.128 .032 -10.85 -.36
Black -2.68 2.379 .600 -8.48 3.12
Dunnett T3 White Black 2.93 1.283 .068 -.15 6.01
Other 5.61(*) 2.128 .032 .37 10.85
Black White -2.93 1.283 .068 -6.01 .15
Other 2.68 2.379 .597 -3.12 8.47
Other White -5.61(*) 2.128 .032 -10.85 -.37
Black -2.68 2.379 .597 -8.47 3.12
* The mean difference is significant at the .05 level.

ในกรณีนี้พบวาความแปรปรวนไมเทากันดังนั้น Post Hoc จึงพิจารณาจาก Tamhane’s Ts หรือ Dunnett’s T3 ที่ไดเลือกไวพบวา


Tamhane ใหคา p<0.05 คู White กับ Other สวนคูอื่นๆ ใหคามากกวา 0.05 แสดงวาคูนี้มีคา mean แตกตางกันอยางมีนัยสําคัญ
ทางสถิติที่ p<0.05

37
8. การวิเคราะหขอมูลความสัมพันธของตัวแปรเชิงปริมาณ 2 ตัวแปรดวย correlation
8.1 การวิเคราะหสัมประสิทธิ์สหสัมพันธ (Correlation Coefficient) เปนการวิเคราะหหาความ
สัมพันธของตัวแปร X และ Y เชิงปริมาณ วามีความสัมพันธในเชิงเสนหรือไม โดยที่ไมทราบวา
ตัวแปรใดเปนตัวแปรตนหรือตัวแปรตาม ในที่นี้สมมติเลือกตัวแปร age กับ educ วามีความ
สัมพันธกันหรือไม ซึ่งสามารถใชคําสั่ง Analyze > Correlate > Bivariate แลวเลือกตัวแปรที่
ตองการหาความสัมพันธลงในชอง Variables จากนั้นคลิกเลือก Pearson ในกรณีที่ขอมูลชุดนี้
มีการกระจายตัวแบบปกติ และเลือก Kendall’s tau-n หรือ Spearman กรณีที่การกระจายไม
เปนปกติ และควรคลิกเลือกการทดสอบแบบ Two-tailed สําหรับ Flag significant correlations
เปนกําหนดใหโปรแกรมทําเครื่องหมาย * และ ** เพื่อดูระดับนัยสําคัญที่ 0.05 และ 0.01 ที่ขอ
มูล นอกจากนี้ตรวจสอบ Options โดยคลิกเลือก Mean and standard deviations (เปนการหา
จํานวน case คาเฉลี่ยและ คาเบี่ยงเบนมาตรฐานของขอมูลแตละตัว จะใชเมื่อคลิกเลือกการ
ทดสอบแบบ Pearson correlation สวน Cross-product deviation and covariance จะไม
กลาวถึง) และ Exclude cases pairwise (เปนการคํานวณคา r เปนคูๆ ในกรณีที่ตัวแปรมาก
กวา 2 ตัวขึ้นไป และถามีคา missing โปรแกรมจะตัดออกเฉพาะเปนคูๆ ไป แตถาเลือก
Exclude cases listwise โปรแกรมจะตัด missing ออกในทุกๆ ตัวแปรเพื่อใหเหลือคูที่เทากัน
ทุกตัวแปร)
ไดผลการคํานวณออกมาตามตารางดานลาง
Descriptive Statistics

Mean Std. Deviation N


Age of Respondent 45.63 17.808 1514
Highest Year of
School Completed 12.88 2.984 1510

ตารางลางดานลางนี้พิจารณาคา p-value ของแตละคูในกรณีที่ขอมูลมีการกระจายตัว


แบบปกติ จากตารางแสดงวา Age of Respondent มีความสัมพันธเชิงเสนแบบตรง
กันขาม โดยมีคา r = -.254 อยางมีนัยสําคัญทางสถิติที่ p<0.01 จากตัวอยางทั้งหมด
1508 ตัวอยาง สําหรับในกรณีที่การกระจายตัวของขอมูลเปนแบบไมปกติใหใชตาราง
Nonparametric correlation โดยอาจเลือกใชไดทั้งสถิติแบบ Kendall’s หรือ
Spearman’s และการแปลผลก็คลายๆ กัน
Correlations

Highest Year
Age of of School
Respondent Completed
Age of Respondent Pearson Correlation 1 -.254(**)
Sig. (2-tailed) . .000
N 1514 1508
Highest Year of Pearson Correlation -.254(**) 1
School Completed Sig. (2-tailed) .000 .
N 1508 1510
** Correlation is significant at the 0.01 level (2-tailed).

39
Nonparametric Correlations

Highest Year
Age of of School
Respondent Completed
Kendall's tau_b Age of Respondent Correlation
1.000 -.146(**)
Coefficient
Sig. (2-tailed) . .000
N 1514 1508
Highest Year of Correlation
-.146(**) 1.000
School Completed Coefficient
Sig. (2-tailed) .000 .
N 1508 1510
Spearman's rho Age of Respondent Correlation
1.000 -.209(**)
Coefficient
Sig. (2-tailed) . .000
N 1514 1508
Highest Year of Correlation
-.209(**) 1.000
School Completed Coefficient
Sig. (2-tailed) .000 .
N 1508 1510
** Correlation is significant at the 0.01 level (2-tailed).

40
9. การวิเคราะหขอมูลแบบ non-parametric statistics ที่สําคัญ
10.1 การวิเคราะหสถิติแบบ Chi-square ในประชากร 2 กลุมขึ้นไป เปนการทดสอบลักษณะตางๆ
ของสัดสวนในประชากร 2 กลุมวามีความสัมพันธกันหรือไม โดยใชคําสั่ง Analyze >
Descriptive Statistics > Crosstabs เหมือนขอที่ 6.2 แตกตางกันคือนิสิตตองใสคาทางสถิติใน
ตัวเลือก Statistics เพื่อสั่งใหโปรแกรมคํานวณคา Chi-square ดวย ขณะที่ตัวเลือก Cell ให
คลิกเลือกทั้ง Observed และ Expected โดยเลือกตัวอยางจากไฟท AML survival

ในการเลือกตัวแปรใหอยูในแนว Row(s) หรือ Column(s) ตามที่ตองการ แลวคลิก


เลือก Display clustered bar charts เพื่อให output แสดงกราฟแทงเปรียบเทียบ
นอกจากนี้ในสวนของ Statistics ใหเลือก Chi-square และใน Cells ใหเลือกทั้ง
Observed และ Expected เพื่อให output แสดงคาทั้งคู

41
ไดขอมูลตามตารางดานลาง

Case Processing Summary

Cases
Valid Missing Total
N Percent N Percent N Percent
Chemotherapy * Status 23 100.0% 0 .0% 23 100.0%

ตารางดานลางเปนการแสดงคา Observed หรือ Count กับ Expected Value ในแต


ละ cell
Chemotherapy * Status Crosstabulation

Status
Censored Relapsed Total
Chemotherap No Count 1 11 12
y Expected
2.6 9.4 12.0
Count
Yes Count 4 7 11
Expected
2.4 8.6 11.0
Count
Total Count 5 18 23
Expected
5.0 18.0 23.0
Count

42
ตารางดานลางเปนการแสดงคา Chi-square พบวา p=.104 ซึ่งมากกวา 0.05 แสดง
วาไมสามารถปฏิเสธ Null hypothesis ได ดังนั้นปจจัยทั้ง 2 ตัวไมมีความสัมพันธกัน
หรือปจจัยทั้งคูที่นํามาทดสอบเปนอิสระตอกัน
Chi-Square Tests

Asymp. Sig. Exact Sig. Exact Sig.


Value df (2-sided) (2-sided) (1-sided)
Pearson Chi-Square 2.650(b) 1 .104
Continuity
1.259 1 .262
Correction(a)
Likelihood Ratio 2.780 1 .095
Fisher's Exact Test .155 .131
Linear-by-Linear
Association 2.535 1 .111

N of Valid Cases 23
a Computed only for a 2x2 table
b 2 cells (50.0%) have expected count less than 5. The minimum expected count is 2.39.

12

10

4
Status
2
Censored
Count

0 Relapsed
No Yes

Chemotherapy

43
10.2 การเปรียบเทียบขอมูล 2 ชุดที่เปนอิสระตอกัน จะใชเมื่อขอมูลมีการแจกแจงไมเปนปกติ เปน
การทดสอบวาขอมูล 2 ชุดมีคากลางอยูที่ตําแหนงเดียวกันหรือไม ตางกันอยางไร ซึ่งในกรณีนี้
จะทดสอบเฉพาะ Mann-Whitney U Test โดยใชคําสั่ง Analyze > Nonparametric Test > 2
Independent Sample และเลือกใชตัวอยางจากไฟท 1991 U.S. General Social Survey โดย
สมมติใหขอมูลที่จะใชมีการแจกแจงแบบไมปกติ (การใชโปรแกรมจะคลายกับกรณีของ
Parametric แตตางกันที่นิสิตตองคลิกเลือกสถิติแบบ Mann-Whitney U Test ซึ่งการวิเคราะห
จะคลายๆ กับ T-test

Descriptive Statistics

Percentiles
N Mean Std. Deviation Minimum Maximum 25th 50th (Median) 75th
Age of Respondent 1514 45.63 17.808 18 89 32.00 41.00 60.00
Respondent's Sex 1517 1.58 .494 1 2 1.00 2.00 2.00

Mann-Whitney Test
Ranks

Respondent's Sex N Mean Rank Sum of Ranks


Age of Respondent Male 636 726.92 462319.50
Female 878 779.65 684535.50
Total 1514

44
Test Statistics(a)

Age of
Respondent
Mann-Whitney U 259753.500
Wilcoxon W 462319.500
Z -2.317
Asymp. Sig. (2-tailed) .021
a Grouping Variable: Respondent's Sex

จากตารางดานบนพบวาสถิติของ Mann-Whitney U ไดคา p=0.021 แสดงวาปฏิเสธ


Null hypothesis เนื่องจากคา p<0.05 ดังนั้นจึงสรุปไดวาคากลางของขอมูลสองชุดที่
นํามาวิเคราะหมีความแตกตางกันอยางมีนัยสําคัญทางสถิติ (p<0.05)

10.3 การเปรียบเทียบขอมูลมากกวา 2 ชุดที่เปนอิสระตอกัน เปนกรณีเดียวกับการทดสอบแบบ


One-Way ANOVA แตกตางกันเพียงในหัวขอนี้ขอมูลจะสมมติใหมีการกระจายตัวไมเปนปกติ
และสถิติที่จะกลาวถึงคือ Kruskal-Wallis H ที่ขยายมาจาก Mann-Whitney U Test แตจะมี
จํานวนกลุมของตัวแปรตนมากกวา 2 กลุม คําสั่งที่เลือกใชคือ Analyze > Nonparametric
Tests > K Independent Sample ซึ่งการวิเคราะหจะคลายๆ กับ One-way ANOVA

45
Descriptive Statistics

Percentiles
N Mean Std. Deviation Minimum Maximum 25th 50th (Median) 75th
Age of Respondent 1514 45.63 17.808 18 89 32.00 41.00 60.00
Race of Respondent 1517 1.20 .473 1 3 1.00 1.00 1.00

Kruskal-Wallis Test
Ranks

Race of Respondent N Mean Rank


Age of Respondent White 1262 770.78
Black 203 700.81
Other 49 650.27
Total 1514

Test Statistics(a,b)

Age of
Respondent
Chi-Square 7.529
df 2
Asymp. Sig. .023
a Kruskal Wallis Test
b Grouping Variable: Race of Respondent

จากตารางดานบนพบวาสถิติของ Kruskal Waliis ไดคา p=0.023 แสดงวาปฏิเสธ


Null hypothesis เนื่องจากคา p<0.05 ซึ่งในกรณีนี้สมมติฐานคือ
• Ho: median ของขอมูลทั้งสามชุดไมแตกตางกัน
• Ha: median ของขอมูลอยางนอยหนึ่งคูที่แตกตางกัน
ในกรณีนี้พบวา median อยางนอยหนึ่งคูที่แตกตางกันอยางมีนัยสําคัญทางสถิติ โดย
หากตองการทราบวาคูใดที่แตกตางกันตองไปวิเคราะหหา Post Hoc Multiple
Comparison Test โดยควรที่จะตองพิจารณาวิธีที่ใช median ในการคํานวณ

******************************************************************************************************

46

You might also like