Professional Documents
Culture Documents
5 เบื้องตน เพื่อการวิเคราะหขอมูล
สารบัญ
ชัยเทพ พูลเขตต
ภาควิชาสัตวแพทยสาธารณสุขศาสตรและการบริการวินิจฉัย
คณะสัตวแพทยศาสตร
มหาวิทยาลัยเกษตรศาสตร
สารบัญ ..................................................................................................................................................1
1. ขอมูลและตัวแปร.........................................................................................................................2
2. การติดตั้งโปรแกรม .....................................................................................................................4
3. เมนูและคําสั่งที่สําคัญ ..................................................................................................................9
4. การจัดการขอมูลเบื้องตน ...........................................................................................................13
5. การตรวจสอบการแจกแจงของขอมูลเชิงปริมาณ.........................................................................16
6. การวิเคราะหขอมูลดวยสถิติเชิงพรรณา......................................................................................24
7. การวิเคราะหขอมูลเชิงปริมาณแบบ Independent-Sample T Test และ One-way ANOVA........30
8. การวิเคราะหขอมูลความสัมพันธของตัวแปรเชิงปริมาณ 2 ตัวแปรดวย correlation .....................38
9. การวิเคราะหขอมูลแบบ non-parametric statistics ที่สําคัญ .......................................................41
1. ขอมูลและตัวแปร
ขอมูล (Data)
a. ขอเท็จจริงที่เกิดขึ้น
b. ขอความหรือตัวเลข
c. อาจเกี่ยวของกับคน พืช สัตว สิ่งของ
d. จํานวนสุกรทั้งหมดของประเทศไทยในเดือนมกราคม พ.ศ. 2550 เปนขอมูลเชิงตัวเลข
e. ระดับความชอบของนิสิตป 5 ตอวิชาชีวสถิติ
ตัวแปร (Variable)
ขอมูลที่ไดจากการสังเกต วัด นับ สอบถาม
หนวยที่ศึกษาอาจเปนคน สัตว พืช และสิ่งของ
หนวยศึกษาที่แตกตางกันทําใหไดขอมูลที่แตกตางกัน จึงเรียกขอมูลนั้นวา “ตัวแปร”
จํานวนโคนมในเขตอําเภอกําแพงแสน
หนวยศึกษา = โคนมในเขตอําเภอกําแพงแสน
ตัวแปร = จํานวนโคนม
คาของตัวแปรคือขอมูล
สาเหตุที่ทําใหคาของตัวแปรหรือขอมูลมีคาแตกตางกัน
คุณลักษณะที่แตกตางกัน
เชน อายุโคที่แตกตางกัน น้ําหนักโค ปริมาณน้ํานมที่ได ฯลฯ หรืออาจกลาวไดวาหนวยที่ศึกษา
มีลักษณะที่แตกตางกัน
เวลาที่แตกตางกัน
เชน ปริมาณน้ํานมของแตละชวงเวลา (day in milk)
สถานที่แตกตางกัน
ฟารมที่เลี้ยง
ประเภทของขอมูล
แบงตามแหลงที่มาของขอมูล
Primary data
เปนขอมูลที่ผูใชเก็บเอง
มีความละเอียดสูง
สัมภาษณ ทดลอง สังเกตการณ
Raw data (ยังไมมีการวิเคราะห)
เสียเวลาในการเก็บ คาใชจายสูง
Secondary data
ผูใชไมไดเก็บรวบรวมเอง แตมีหนวยงานหรือผูอื่นเก็บรวบรวมไวแลว
ประหยัดเวลาและคาใชจายกวาการเก็บ Primary data
2
ขอมูลบางสวนอาจไมตรงกับความตองการของผูใชหรือรายละเอียดไมเพียงพอ
มีการวิเคราะหเบื้องตนมาบางแลว (Information) ผูใชสามารถนําไปใชไดเลย แตอาจ
มีความผิดพลาดได
แบงตาม Scale ของการวัด
Nominal Scale
Color
Ordinal Scale
Ranking topics
Interval Scale
Temperature
Ratio Scale
Salary
แบงตามลักษณะของขอมูล
Quantitative Data
Ratio and Interval Scale
Discrete Data and Continuous Data
Qualitative Data (Categorical Data)
Nominal and Ordinal Scale
Quantitative Data <--> Qualitative Data
การวิเคราะหขอมูลประเภทตางๆ
Quantitative Data >> สามารถใชเทคนิคการวิเคราะหไดทุกเทคนิค
Qualitative Data >> ใชเทคนิคการวิเคราะหไดบางเทคนิค ไมสามารถหาคาเฉลี่ย คาเบี่ยงเบน
มาตรฐานได
3
2. การติดตั้งโปรแกรม
2.1. การติดตั้งโปรแกรม SPSS version 11.5 สามารถทําไดดังนี้
a. นําแผนซีดีของโปรแกรม SPSS for windows version 11.5 ใสในซีดีรอม
b. คอมพิวเตอรจะตรวจสอบไดรฟอัตโนมัติ (Autorun) จากนั้นใหทําการติดตั้งตามขั้นตอน d เปนตน
ไป แตถาคอมพิวเตอรไมสามารถตรวจสอบไดรฟอัตโนมัติใหติดตั้งโปรแกรมตั้งแตขั้นตอนที่ c
c. ดับเบิลคลิกที่ My Computer
d. ดับเบิลคลิกที่โฟลเดอร SPSS version 11.5
e. ดับเบิลคลิกที่ไอคอน setup (ดูภาพขางลางประกอบ)
4
g. คลิกปุม Next เพื่อติดตั้งโปรแกรม (ดูภาพขางลางประกอบ)
5
j. ใส License code หมายเลข xxxxxxxxxxx แลวคลิก Update จากนั่นใหใส Update code
หมายเลข xxxxxxxxxxx ในชองเดิมและคลิก Update อีกครั้ง เมื่อเสร็จแลวใหคลิก Next 2 ครั้ง
และรอจนกระทั่งการติดตั้งในขั้นตอนแรกแลวเสร็จ (ดูภาพขางลางประกอบ)
6
k. คลิก Next 2 ครั้ง และรอโปรแกรมติดตั้งใหแลวเสร็จ (ดูภาพขางลางประกอบ)
7
m. เมื่อโปรแกรม SPSS version 11.5 แลวเสร็จสมบูรณแลวจะปรากฏหนาจอเหมือนภาพดานลาง
ใหทําการคลิกเลือก Finish เปนอันสิ้นสุดขบวนการติดตั้งโปรแกรม ทั้งนี้หากผูใชคลิกเลือก
Launch tutorial now? และ/หรือ Display the ReadMe file now โปรแกรม SPSS จะแนะนํา
การใชโปรแกรมและขอควรทราบเกี่ยวกับการใชโปรแกรม SPSS version 11.5 (ดูภาพขางลาง
ประกอบ)
8
3. เมนูและคําสั่งที่สําคัญ
ผูใชโปรแกรม SPSS จําเปนตองทราบถึงเมนูและคําสั่งพื้นฐานเพื่อการใชโปรแกรมที่ถูกตอง ซึ่งจําเปนอาศัย
ความคุนเคยกับตัวโปรแกรม เพื่อใหไดประสิทธิภาพในการใชประโยชนจากโปรแกรม SPSS สูงสุด ผูใชจําเปน
ตองมีการฝกปฏิบัติเปนประจําและสม่ําเสมอในการใชโปรแกรม
a. สวนประกอบของหนาจอ เมื่อเปดโปรแกรม SPSS version 11.5 จะปรากฏหนาจอคลายภาพดาน
ลาง
9
b. สวนประกอบของหนาจอหลักที่สําคัญ
Menu bar
พื้นที่สําหรับการกําหนดคาตัวแปร Variables
Data View
Variable View
10
Variable View เปนสวนกําหนดคุณสมบัติของตัวแปร (ดูภาพดานลางประกอบ)
11
Missing หมายถึง การกําหนดเมื่อไมพบคาตัวแปร มี 3 ทางเลือกคือ
No missing values กรณีที่ไมมีการพิมพขอมูล โปรแกรมจะใหคาเปนจุด (.)
Discrete missing values ผูใชเปนผูกําหนดรหัสของ missing value เอง
Range plus one optimal discrete missing value เปนการกําหนดรหัสของขมูลที่
ตองขามไปอีกรหัสหนึ่ง มักใชในกรณีที่ผูวิจัยออกแบบสอบถามแลวผูตอบไมจําเปน
ตองตอบในขอนี้ และใหถามไปตอบขอถัดไป
12
4. การจัดการขอมูลเบื้องตน
4.1 การ Import ขอมูลจาก Microsoft Excel
a. คลิกเลือกเพื่อเปดโฟลเดอรใหม
13
4.2 การเปลี่ยนแปลงขอมูลดวยคําสั่ง Transform ในบางครั้งการเก็บขอมูลไมสามารถทําใหเกิดการ
กระจายตัวขอมูลแบบปกติได จึงจําเปนตองมีการเปลี่ยนแปลงขอมูลโดยอาจทําการ take log หรือยกกําลังสอง
เปนตน ตัวอยางของขอมูลที่จําเปนตองมีการ Transform เชน คา Titer, คา Somatic cell count ฯลฯ
a. เปดไฟลหรือปอนคาของตัวแปร
14
d. คลิก OK
15
5. การตรวจสอบการแจกแจงของขอมูลเชิงปริมาณ
เปนการตรวจสอบวาขอมูลที่ไดมีการแจกแจงเปนแบบ Normal Distribution หรือไม จะทําในตัวแปรเชิง
ปริมาณ โดยการตรวจสอบสามารถทําได 2 วิธีคือ
การตรวจสอบดวยกราฟ เชน Histogram, Boxplot, Stem and Leaf และ Normal Probability Plot
เปนตน
การตรวจสอบโดยการใชสถิติทดสอบ เชน Kolmogorov-Smirnov, Shapiro-Wilk และ Lilliefor’s
test หรือแมกระทั่งการทดสอบความแปรปรวนของประชากรในแตละกลุมดวยวิธี Levene’s test ก็
สามารถทําได
โปรแกรม SPSS มีคําสั่งที่สามารถตรวจสอบการแจกแจงดวยกราฟ โดยเขาไปที่ Menu > Descriptive
Statistics > Frequency แตในที่นี้จะใชคําสั่งที่สามารถแสดงผลออกมาทั้งคาทางสถิติและกราฟเพื่อดูการกระจาย
ตัวของขอมูล
5.1 การตรวจสอบการกระจายตัวของขอมูล
a. โดยปกติแลวหากมีการติดตั้งโปรแกรม SPSS ทั้งหมดและสมบูรณ ในโฟลเดอรของ
SPSS ใน Drive: C > Program Files > SPSS จะมีขอมูลที่มาพรอมกับโปรแกรม ซึ่ง
ในที่นี้จะนําขอมูลดังกลาวมาเพื่อมาใชในการเรียนรู ใหนิสิตทําการเปดโฟลเดอรดัง
กลาวและเลือกไฟล 1991 U.S. General Social Survey แลวคลิก Open
b. จะพบขอมูลตามภาพดานลาง
16
c. เลือก Analyze > Descriptive Statistics > Explore
17
f. คลิกเลือก Statistics เพื่อตรวจสอบสิ่งที่ตองการแสดงใน Output
18
จะคํานวณจากคาจริง หรือคาของขอมูลที่มีการเปลี่ยนแปลงรูปแบบ (Transformed data) ก็ได
ผูวิเคราะหจะตองเลือกทางเลือกใดทางเลือกหนึ่งดังนี้
None เมื่อไมตองการคํานวณคา Levene Test
Power estimation สําหรับแตละกลุม จะพล็อตคา log ของมัธยฐานกับ log ของ
พิสัยควอไทล (IQR) จะใชเมื่อตองการหาการเปลี่ยแปลงรูปแบบที่เหมาะสมของขอ
มูล
Transformed ผูวิเคราะหสามารถเลือกรูปแบบของขอมูล ถาเลือกทางเลือกนี้แล
วจะทําใหคําวา Power มีสีเขม จากนั้นคลิกเลือกทางเลือกที่ตองการหลังคําวา
Power
Untransformed ใชเมื่อตองการใชคาของขอมูลจริง โดยไมมีการเปลี่ยนแปลงขอมูล
19
j. คลิกเลือก OK ได output ตามภาพดานลาง
Cases
Valid Missing Total
N Percent N Percent N Percent
Age of
1514 99.8% 3 .2% 1517 100.0%
Respondent
20
l. ตารางถัดเปนเปนตารางที่แสดงถึงคาของ Descriptive statistics ซึ่งสามารถดู
ลักษณะการกระจายตัวของขอมูลไดแบบคราวๆ โดยเปรียบเทียบจากคา Mean กับ
Median ในกรณีที่เปนการกระจายตัวแบบ Normal distribution คาทั้งสองควรมีคา
ใกลเคียงกันมากที่สุดหรือเทากัน นอกจากนี้สิ่งที่จําเปนตองพิจารณาคือคา
Skewness โดยขอมูลใดที่มีคาใกลเคียงศูนยแสดงวาขอมูลนั้นมีแนวโนมเปน Normal
distribution ทั้งนี้หากคาที่ไดมากกวาศูนยแสดงวาขอมูลมีลักษณะเบขวา และขอมูล
ใดมีคา Skewness ติดลบแสดงวาขอมูลเบซาย และคา Kurtosis ปกติแลวในขอมูลที่
มีลักษณะ Normal distribution แบบมาตรฐานจะมีคาประมาณ 3
Descriptives
Percentiles
5 10 25 50 75 90 95
Weighted Age of
Average Respondent 22.00 24.00 32.00 41.00 60.00 73.00 78.00
(Definition 1)
Tukey's Age of
32.00 41.00 60.00
Hinges Respondent
21
n. ตารางถัดไปเปนการแสดงคาที่สูงสุดและต่ําสุด (Extreme value) จํานวน 5 คา และ
ในแตละคาอยูในชุดขอมูล (cases) ลําดับที่เทาไร
Extreme Values
o. ตารางถัดไปเปนการแสดงคาวาชุดของขอมูลมีการกระจายตัวแบบใด โดยในที่นี้การ
ทดสอบลักษณะการกระจายตัวจะมีสมมติฐานในการทดสอบกลาวคือ
Ho: ขอมูลมีการกระจายตัวแบบปกติ
Ha: ขอมูลมีการกระจายตัวแบบไมปกติ
การพิจารณาวาจะใชสถิติตัวใดใหพิจารณาจากจํานวนขอมูลหรือขนาดของตัวอยาง
โดยที่ Shapiro-Wilk จะใชเมื่อตัวอยางมีขาดไมเกิน 50 ตัวอยางเทานั้น ซึ่งปกติแลว
เราจะพิจารณาจาก Kolmogorov-Smirnov ในที่นี้พบวา p-value เปน .000 ซึ่งมีคา
นอยกวา 0.01 ที่ระดับความเชื่อมั่น 99% แสดงวาปฏิเสธ Null hypothesis ดังนั้นขอ
มูลชุดนี้จึงมีการแจกแจงแบบไมปกติ และหากพิจารณาจากกราฟดานลางทั้งหมด
จะพบวากราฟมีลักษณะเบขวาเล็กนอย ดังนั้นการวิเคราะหสถิติสําหรับขอมูลชุดนี้
ควรเลือกแบบ Non-parametric statistics
Tests of Normality
Kolmogorov-Smirnov(a) Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Age of
.105 1514 .000 .944 1514 .000
Respondent
a Lilliefors Significance Correction
22
Age of Respondent Stem-and-Leaf Plot
Histogram
300 Frequency Stem & Leaf
12.00 1. 899
143.00 2. 000011111111222222233333344444
200 150.00 2. 5555556666666777777888888899999
187.00 3. 00000001111111222222222333333334444444
195.00 3. 555555555556666666777777788888889999999
167.00 4. 0000000111111112222223333333444444
100 113.00 4. 5555667777778888889999
87.00 5. 000011122223334444
Frequency
.0
43.00 8. 001122234
Age of Respondent
20.00 8. 5799&
Stem width: 10
Each leaf: 5 case(s) & denotes fractional leaves
Normal Q-Q Plot of Age of Respondent Detrended Normal Q-Q Plot of Age of Re
3 1.5
1 1.0
0
Expected Normal
-1 .5
Dev from Normal
-2
0.0
-3
-4
-20 0 20 40 60 80 100 -.5
0 20 40 60 80 100
Observed Value
Observed Value
100
80
60
40
20
0
N= 1514
Age of Respondent
23
6. การวิเคราะหขอมูลดวยสถิติเชิงพรรณา
สถิติเชิงพรรณาเปนการคํานวณคาสถิติพื้นฐาน เชน การวัดคากลาง การวัดการกระจายตัวของขอมูล และ
การนําเสนอขอมูลในรูปกราฟหรือตาราง ความถี่ รอยละ เปนตน เพื่ออธิบายลักษณะของขอมูล ทั้งในเชิงปริมาณ
และเชิงคุณภาพ
6.1 การหาจํานวนหรือความถี่ดวยการสรางตารางแจกแจงความถี่ (Frequencies)
ใชคําสั่ง Analyze > Descriptive Statistics > Frequencies เพื่อแสดงความถี่ เปอรเซ็นต
คาสถิติเชิงพรรณาตางๆ กราฟ และอื่นๆ ขึ้นอยูกับการเลือกของผูวิเคราะห โดยสามารถ
วิเคราะหไดทั้งขอมูลเชิงคุณภาพและเชิงปริมาณ โดยการเลือกวาจะวิเคราะหขอมูลแบบใด
นิสิตตองเลือกชนิดของตัวแปรและ Output ใหสอดคลองกัน ซึ่งในที่นี้ใหเปดไฟท 1991
U.S. General Social Survey เพื่อทําการวิเคราะหขอมูลเชิงปริมาณโดยการเลือกตัวแปรที่
เกี่ยวของกับอายุ จากนั้นทําการเลือกในชอง Statistics, Charts และ Format ใหเหมาะสม
แลวคลิกเลือก OK
24
จะได Output ออกมาดังตารางและภาพดานลาง โดยที่การแปลผลจะคลายกับที่ไดกลาวมา
แลวในหัวขอที่ 5
Statistics
Age of Respondent
N Valid 1514
Missing 3
Mean 45.63
Std. Error of Mean .458
Median 41.44(a)
Mode 35
Std. Deviation 17.808
Variance 317.140
Skewness .524
Std. Error of Skewness .063
Kurtosis -.786
Std. Error of Kurtosis .126
Range 71
Minimum 18
Maximum 89
Sum 69078
Percentiles 10 24.32(b)
20 29.36
25 31.53
30 33.44
40 37.20
50 41.44
60 47.22
70 54.87
75 59.71
80 63.98
90 72.70
a Calculated from grouped data.
b Percentiles are calculated from grouped data.
25
Age of Respondent
Cumulative
Frequency Percent Valid Percent Percent
Valid 18 3 .2 .2 .2
19 9 .6 .6 .8
20 18 1.2 1.2 2.0
21 38 2.5 2.5 4.5
22 35 2.3 2.3 6.8
23 28 1.8 1.8 8.7
24 24 1.6 1.6 10.2
25 28 1.8 1.8 12.1
26 33 2.2 2.2 14.3
27 29 1.9 1.9 16.2
28 33 2.2 2.2 18.4
29 27 1.8 1.8 20.1
30 35 2.3 2.3 22.5
31 35 2.3 2.3 24.8
32 44 2.9 2.9 27.7
33 38 2.5 2.5 30.2
34 35 2.3 2.3 32.5
35 55 3.6 3.6 36.1
36 35 2.3 2.3 38.4
37 33 2.2 2.2 40.6
38 37 2.4 2.4 43.1
39 35 2.3 2.3 45.4
40 36 2.4 2.4 47.8
41 38 2.5 2.5 50.3
42 30 2.0 2.0 52.2
43 33 2.2 2.2 54.4
44 30 2.0 2.0 56.4
45 22 1.5 1.5 57.9
46 12 .8 .8 58.7
47 28 1.8 1.8 60.5
48 29 1.9 1.9 62.4
49 22 1.5 1.5 63.9
50 20 1.3 1.3 65.2
51 15 1.0 1.0 66.2
52 20 1.3 1.3 67.5
53 14 .9 .9 68.4
54 18 1.2 1.2 69.6
55 16 1.1 1.1 70.7
56 12 .8 .8 71.5
57 17 1.1 1.1 72.6
58 18 1.2 1.2 73.8
59 15 1.0 1.0 74.8
60 16 1.1 1.1 75.8
26
61 20 1.3 1.3 77.1
62 17 1.1 1.1 78.3
63 19 1.3 1.3 79.5
64 15 1.0 1.0 80.5
65 18 1.2 1.2 81.7
66 13 .9 .9 82.6
67 18 1.2 1.2 83.8
68 18 1.2 1.2 84.9
69 17 1.1 1.1 86.1
70 15 1.0 1.0 87.1
71 20 1.3 1.3 88.4
72 19 1.3 1.3 89.6
73 24 1.6 1.6 91.2
74 17 1.1 1.1 92.3
75 10 .7 .7 93.0
76 13 .9 .9 93.9
77 12 .8 .8 94.6
78 11 .7 .7 95.4
79 7 .5 .5 95.8
80 11 .7 .7 96.6
81 9 .6 .6 97.2
82 13 .9 .9 98.0
83 5 .3 .3 98.3
84 5 .3 .3 98.7
85 6 .4 .4 99.1
87 4 .3 .3 99.3
88 2 .1 .1 99.5
89 8 .5 .5 100.0
Total 1514 99.8 100.0
Missing NA 3 .2
Total 1517 100.0
Age of Respondent
300
200
100
Frequency
Age of Respondent
27
6.2 การสรางตารางแจกแจงความถี่แบบ 2 ทาง (Crosstabs)
ในโปรแกรม SPSS สามารถสรางตารางแจกแจงตั้งแต 2 ทางขึ้นไปได แตในที่นี้จะขอกลาว
เฉพาะการสรางตารางแจกแจง 2 ทาง (ตัวแปรที่ใสในตารางอาจมีมากกวา 2 ตัวแปร) ซึ่งจะ
ใชคําสั่ง Analyze > Descriptive Statistics > Crosstabs โดยขอมูลที่ใสในตารางแจกแจง
ควรเปนขอมูลที่ไดจากการนับหรือขอมูลเชิงคุณภาพ ในที่นี้เลือกตัวแปร Respondent’s
sex ลงใน Row(s) และเลือกตัวแปร Region of the United States ลงใน Column(s) (การ
ตั้งคาใน Statistics นั้นโดยมากเปนคํานวณคาทางสถิติ เชน Chi-square ซึ่งจะไดกลาวถึง
ในบทถัดไป) แลวคลิก OK (หากตองการแสดงผลเปน Percentage ใหคลิกเลือก Cell แลว
กําหนดโดยเลือก Percentage)
28
ไดลักษณะของขอมูลตามตารางดานลาง
Case Processing Summary
Cases
Valid Missing Total
N Percent N Percent N Percent
Respondent's Sex *
Region of the United
States * R's Federal 932 61.4% 585 38.6% 1517 100.0%
Income Tax
Respondent's Sex * Region of the United States * R's Federal Income Tax Crosstabulation
Count
R's Federal
Income Tax Region of the United States
North East South East West Total
Too High Respondent's Male
99 66 68 233
Sex
Female 140 76 92 308
Total 239 142 160 541
About Right Respondent's Male 84 45 48 177
Sex Female 92 54 57 203
Total 176 99 105 380
Too Low Respondent's Male 3 1 2 6
Sex Female 1 2 2 5
Total 4 3 4 11
29
7. การวิเคราะหขอมูลเชิงปริมาณแบบ Independent-Sample T Test และ One-way
ANOVA
7.1 การวิเคราะหขอมูลเชิงปริมาณแบบ Independent-Sample T Test เปนการวิเคราะหขอมูลเชิง
ปริมาณที่เปนอิสระตอกันจํานวน 2 กลุม วามีความแตกตางกันหรือไม โดยเลือกคําสั่ง Analyze
> Compare Means > Independent-Sample T Test โดยสมมติวาขอมูลที่จะวิเคราะหมีการ
กระจายตัวแบบปกติ
เมื่อปรากฏหนาจอตามรูปดานบนแลวใหใสตัวแปรตามเชิงปริมาณที่ตองการวิเคราะห
ในชอง Test Variable(s) แลวตัวแปรตนในชอง Grouping Variable เมื่อใสตัวแปรตน
ในชองนี้แลว Define Group จะ active ใหทําการคลิกเพื่อกําหนดคาของตัวแปรตาม
คุณลักษณะของตัวแปรนั้นๆ ในกรณีที่นิสิตลืมคุณลักษณะของตัวแปรสามารถดูได
จาก Utilities > File Info ตามรูปดานลาง
30
คลิกเลือก Options แลวกําหนดระดับความเชื่อมั่นไวที่ 95% สําหรับคา Missing
Values ใหเลือก Exclude cases analysis by analysis ซึ่งหมายถึงไมรวมเอาขอมูล
ของ Case ที่มี missing values ในการวิเคราะห จากนั้นคลิกเลือก Continue แลว
ตามดวย OK
ไดผลการทดสอบออกมาตามตารางดานลาง โดยตารางแรกจะแสดงลักษณะขอมูล
แบบสถิติเชิงพรรณา โดยแบงตาม
Group Statistics
Std. Error
Respondent's Sex N Mean Std. Deviation Mean
Age of Respondent Male 636 44.18 17.033 .675
Female 878 46.67 18.288 .617
31
Independent Samples Test
การวิเคราะหขอมูลจําเปนตองตรวจสอบความแปรปรวนของประชากรที่นํามาทดสอบกอนวาเทากันหรือไม โดยพิจารณาจาก
Levene’s Test for Equality of Variances ซึ่งในกรณีนี้จะมีสมมติฐานเพื่อการวิเคราะหความแปรปรวนโดย
o Ho: ความแปรปรวนของขอมูลทั้ง 2 ชุดเทากัน
o Ha: ความแปรปรวนของขอมูลทั้ง 2 ชุดไมเทากัน
ในกรณีนี้พบวาคา Probability Value (p-value) ของ Levene’s Test เทากับ 0.002 ซึ่งนอยกวา 0.05 ดังนั้นจึงปฏิเสธ Null
hypothesis แลวสรุปวาความแปรปรวนของขอมุลทั้ง 2 ชุดไมเทากัน ดังนั้นการทดสอบ Independent Samples Test จึงพิจารณา
จากคา Equal variance not assumed ไดคา P-value เปน 0.007 ซึ่งนอยกวา 0.05 แสดงวาขอมูลทั้ง 2 ชุด แตกตางกันอยางมีนัย
สําคัญทางสถิติ (p<0.05) สําหรับในกรณีที่ขอมูลมีความแปรปรวนเทากันใหพิจารณาคา p-value ของ Independent Samples Test
จาก Equal variances assumed
7.2 การวิเคราะหขอมูลเชิงปริมาณแบบ One-Way ANOVA เปนการวิเคราะหขอมูลเชิงปริมาณตัว
แปรเดียวที่เปนอิสระตอกันจํานวน 3 กลุม (ขึ้นไป) วามีความแตกตางกันหรือไม โดยเลือกคํา
สั่ง Analyze > Compare Means > One-Way ANOVA ในที่นี้สมมติตัวแปรโดยเลือกจากไฟท
1991 U.S. General Social Survey โดย assumed ขอมูลมีการกระจายตัวแบบปกติ
ไดผลการวิเคราะหตามตารางดานลาง
34
Descriptives
Age of Respondent
95% Confidence Interval for
Mean
N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum
White 1262 46.20 18.032 .508 45.20 47.20 18 89
Black 203 43.27 16.794 1.179 40.95 45.60 19 88
Other 49 40.59 14.467 2.067 36.44 44.75 19 77
Total 1514 45.63 17.808 .458 44.73 46.52 18 89
ANOVA
Age of Respondent
Sum of
Squares df Mean Square F Sig.
Between Groups 2784.189 2 1392.095 4.409 .012
Within Groups 477048.21
1511 315.717
5
Total 479832.40
1513
4
Robust Tests of Equality of Means
Age of Respondent
Statistic(a) df1 df2 Sig.
Welch 5.529 2 118.615 .005
Brown-Forsythe 5.559 2 217.762 .004
a Asymptotically F distributed.
36
Other 2.68 2.828 1.000 -4.10 9.46
Other White -5.61 2.587 .091 -11.81 .59
Black -2.68 2.828 1.000 -9.46 4.10
Tamhane White Black 2.93 1.283 .068 -.15 6.01
Other 5.61(*) 2.128 .032 .36 10.85
Black White -2.93 1.283 .068 -6.01 .15
Other 2.68 2.379 .600 -3.12 8.48
Other White -5.61(*) 2.128 .032 -10.85 -.36
Black -2.68 2.379 .600 -8.48 3.12
Dunnett T3 White Black 2.93 1.283 .068 -.15 6.01
Other 5.61(*) 2.128 .032 .37 10.85
Black White -2.93 1.283 .068 -6.01 .15
Other 2.68 2.379 .597 -3.12 8.47
Other White -5.61(*) 2.128 .032 -10.85 -.37
Black -2.68 2.379 .597 -8.47 3.12
* The mean difference is significant at the .05 level.
37
8. การวิเคราะหขอมูลความสัมพันธของตัวแปรเชิงปริมาณ 2 ตัวแปรดวย correlation
8.1 การวิเคราะหสัมประสิทธิ์สหสัมพันธ (Correlation Coefficient) เปนการวิเคราะหหาความ
สัมพันธของตัวแปร X และ Y เชิงปริมาณ วามีความสัมพันธในเชิงเสนหรือไม โดยที่ไมทราบวา
ตัวแปรใดเปนตัวแปรตนหรือตัวแปรตาม ในที่นี้สมมติเลือกตัวแปร age กับ educ วามีความ
สัมพันธกันหรือไม ซึ่งสามารถใชคําสั่ง Analyze > Correlate > Bivariate แลวเลือกตัวแปรที่
ตองการหาความสัมพันธลงในชอง Variables จากนั้นคลิกเลือก Pearson ในกรณีที่ขอมูลชุดนี้
มีการกระจายตัวแบบปกติ และเลือก Kendall’s tau-n หรือ Spearman กรณีที่การกระจายไม
เปนปกติ และควรคลิกเลือกการทดสอบแบบ Two-tailed สําหรับ Flag significant correlations
เปนกําหนดใหโปรแกรมทําเครื่องหมาย * และ ** เพื่อดูระดับนัยสําคัญที่ 0.05 และ 0.01 ที่ขอ
มูล นอกจากนี้ตรวจสอบ Options โดยคลิกเลือก Mean and standard deviations (เปนการหา
จํานวน case คาเฉลี่ยและ คาเบี่ยงเบนมาตรฐานของขอมูลแตละตัว จะใชเมื่อคลิกเลือกการ
ทดสอบแบบ Pearson correlation สวน Cross-product deviation and covariance จะไม
กลาวถึง) และ Exclude cases pairwise (เปนการคํานวณคา r เปนคูๆ ในกรณีที่ตัวแปรมาก
กวา 2 ตัวขึ้นไป และถามีคา missing โปรแกรมจะตัดออกเฉพาะเปนคูๆ ไป แตถาเลือก
Exclude cases listwise โปรแกรมจะตัด missing ออกในทุกๆ ตัวแปรเพื่อใหเหลือคูที่เทากัน
ทุกตัวแปร)
ไดผลการคํานวณออกมาตามตารางดานลาง
Descriptive Statistics
Highest Year
Age of of School
Respondent Completed
Age of Respondent Pearson Correlation 1 -.254(**)
Sig. (2-tailed) . .000
N 1514 1508
Highest Year of Pearson Correlation -.254(**) 1
School Completed Sig. (2-tailed) .000 .
N 1508 1510
** Correlation is significant at the 0.01 level (2-tailed).
39
Nonparametric Correlations
Highest Year
Age of of School
Respondent Completed
Kendall's tau_b Age of Respondent Correlation
1.000 -.146(**)
Coefficient
Sig. (2-tailed) . .000
N 1514 1508
Highest Year of Correlation
-.146(**) 1.000
School Completed Coefficient
Sig. (2-tailed) .000 .
N 1508 1510
Spearman's rho Age of Respondent Correlation
1.000 -.209(**)
Coefficient
Sig. (2-tailed) . .000
N 1514 1508
Highest Year of Correlation
-.209(**) 1.000
School Completed Coefficient
Sig. (2-tailed) .000 .
N 1508 1510
** Correlation is significant at the 0.01 level (2-tailed).
40
9. การวิเคราะหขอมูลแบบ non-parametric statistics ที่สําคัญ
10.1 การวิเคราะหสถิติแบบ Chi-square ในประชากร 2 กลุมขึ้นไป เปนการทดสอบลักษณะตางๆ
ของสัดสวนในประชากร 2 กลุมวามีความสัมพันธกันหรือไม โดยใชคําสั่ง Analyze >
Descriptive Statistics > Crosstabs เหมือนขอที่ 6.2 แตกตางกันคือนิสิตตองใสคาทางสถิติใน
ตัวเลือก Statistics เพื่อสั่งใหโปรแกรมคํานวณคา Chi-square ดวย ขณะที่ตัวเลือก Cell ให
คลิกเลือกทั้ง Observed และ Expected โดยเลือกตัวอยางจากไฟท AML survival
41
ไดขอมูลตามตารางดานลาง
Cases
Valid Missing Total
N Percent N Percent N Percent
Chemotherapy * Status 23 100.0% 0 .0% 23 100.0%
Status
Censored Relapsed Total
Chemotherap No Count 1 11 12
y Expected
2.6 9.4 12.0
Count
Yes Count 4 7 11
Expected
2.4 8.6 11.0
Count
Total Count 5 18 23
Expected
5.0 18.0 23.0
Count
42
ตารางดานลางเปนการแสดงคา Chi-square พบวา p=.104 ซึ่งมากกวา 0.05 แสดง
วาไมสามารถปฏิเสธ Null hypothesis ได ดังนั้นปจจัยทั้ง 2 ตัวไมมีความสัมพันธกัน
หรือปจจัยทั้งคูที่นํามาทดสอบเปนอิสระตอกัน
Chi-Square Tests
N of Valid Cases 23
a Computed only for a 2x2 table
b 2 cells (50.0%) have expected count less than 5. The minimum expected count is 2.39.
12
10
4
Status
2
Censored
Count
0 Relapsed
No Yes
Chemotherapy
43
10.2 การเปรียบเทียบขอมูล 2 ชุดที่เปนอิสระตอกัน จะใชเมื่อขอมูลมีการแจกแจงไมเปนปกติ เปน
การทดสอบวาขอมูล 2 ชุดมีคากลางอยูที่ตําแหนงเดียวกันหรือไม ตางกันอยางไร ซึ่งในกรณีนี้
จะทดสอบเฉพาะ Mann-Whitney U Test โดยใชคําสั่ง Analyze > Nonparametric Test > 2
Independent Sample และเลือกใชตัวอยางจากไฟท 1991 U.S. General Social Survey โดย
สมมติใหขอมูลที่จะใชมีการแจกแจงแบบไมปกติ (การใชโปรแกรมจะคลายกับกรณีของ
Parametric แตตางกันที่นิสิตตองคลิกเลือกสถิติแบบ Mann-Whitney U Test ซึ่งการวิเคราะห
จะคลายๆ กับ T-test
Descriptive Statistics
Percentiles
N Mean Std. Deviation Minimum Maximum 25th 50th (Median) 75th
Age of Respondent 1514 45.63 17.808 18 89 32.00 41.00 60.00
Respondent's Sex 1517 1.58 .494 1 2 1.00 2.00 2.00
Mann-Whitney Test
Ranks
44
Test Statistics(a)
Age of
Respondent
Mann-Whitney U 259753.500
Wilcoxon W 462319.500
Z -2.317
Asymp. Sig. (2-tailed) .021
a Grouping Variable: Respondent's Sex
45
Descriptive Statistics
Percentiles
N Mean Std. Deviation Minimum Maximum 25th 50th (Median) 75th
Age of Respondent 1514 45.63 17.808 18 89 32.00 41.00 60.00
Race of Respondent 1517 1.20 .473 1 3 1.00 1.00 1.00
Kruskal-Wallis Test
Ranks
Test Statistics(a,b)
Age of
Respondent
Chi-Square 7.529
df 2
Asymp. Sig. .023
a Kruskal Wallis Test
b Grouping Variable: Race of Respondent
******************************************************************************************************
46