You are on page 1of 36

Analisis Data Kategori

Solusi Chapter 2
2.1

An article in the New York Times (February 17, 1999) about the PSA blood test
for detecting prostate cancer stated that, of men who had this disease, the test fails
to detect prostate cancer in 1 in 4 (so called false-negative results), and of men
who did not have it, as many as two-thirds receive false-positive results. Let C

( C)
denote the event of having (not having) prostate cancer and let + (-) denote
a positive (negative) test result.

a. Which is true: P (-|C)=1/4 or P(C|-)=1/4 ? P( C |+)=2/3 or P (+| C )=2/3 ?


b. What is the sensitivity of this test ?
c. Of men who take the PSA test, suppose P(C ) = 0.01. Find the probabilities in
the 2 x2 table for the joint distribution that cross classifies Y=diagnosis (+,-)

with X= true disease status (C, C )


d. Using (c ), find the marginal distribution for the diagnosis.
e. Using (c ) and (d), find P(C|+), and interpret.
Penyelesaian:

a. P (-|C)=1/4, P( C |+)=2/3 .
b. Given that a subject has the disease, the probability the diagnostic test is
positive is called the sensitivity. so sensitivity = P (+|C) = 1 - P (-|C) = 3/4 .

c. P(C|+) = 0.0075, P(C|-) = 0.0025, P( C |+) = 0.0150, P( C |-) = 0.9750 .


C

+
0.0075
0.015

0.0025
0.975

d. P(+) = 0.0075 + 0.0150 = 0.0225


P(-) = 0.0025 + 0.9750 = 0.9775
e. P(C|+) = 0.0075/0.0225 = 1/3 = 0.33
Peluang laki-laki yang memiliki kanker prostat dengan hasil positif adalah
0.33.
2.2

For diagnostic testing, let X = true status (1 = disease, 2 = no disease) and Y =


diagnosis (1 = positive, 2 = negative). Let i = P(Y = 1|X = i),i = 1, 2.
a. Explain why sensitivity = 1 and specificity = 1 2.

1 | Page

Analisis Data Kategori


Solusi Chapter 2
b. Let denote the probability that a subject has the disease. Given that
thediagnosis is positive, use Bayess theorem to show that the probability
asubject truly has the disease is 1 / [ 1 + 2 (1 ) ]
b. For mammograms for detecting breast cancer, suppose = 0.01,sensitivity =
0.86, and pecificity = 0.88. Given a positive test result, findthe probability that
the woman truly has reast cancer.
c. For mammograms for detecting breast cancer, suppose = 0.01, sensitivity =
0.86, and specificity = 0.88. Given a positive test result, find the probability
that the woman truly has breast cancer.
d. To better understand the answer in (c), find the joint probabilities for the 2 2
cross classification of X and Y . Discuss their relative sizes in the two cells that
refer to a positive test result.
Penyelesaian:
a. Sensitivity = P(Y = 1|X = 1) = 1
specificity = P(Y = 2|X = 2) = 1P(Y = 1|X = 2) = 12.
Sensitivity merupakan keadaan dimana subject terdeteksi memiliki
penyakit (disease) dan peluang pengujian diagnosisnya positive. Sehingga,
dapat dikatakan bahwa sensitivity = 1 = P(Y = 1|X = 1) . Kemudian,
Specificity merupakan keadaan dimana subject tidak terdeteksi memiliki
penyakit ( non disease) dan peluang pengujian diagnosisnya negative.
Sehingga, dapat dikatakan bahwa specifivity = 1- 2 = P(Y = 2|X = 2). Semakin
besar sensitivity dan specificity maka pengujian diagnosis akan semakin baik.
P(Y =1 X=1)P( X=1)
P
(
X=1
|
Y
=1
)
=
b.
P (Y =1X=1) P (X=1)+ P(Y =1X =2) P( X =2)
c. 0.86(0.01)/[0.86(0.01) + 0.12(0.99)] = 0.0675.
d. 11=P ( X =1,Y =1 )=0.86
22=P ( X=2, Y =2 ) =0.88
Maka, Joint probabilities yang didapat adalah sebagai berikut:
ij =P ( X=i ,Y = j )= i . j= 11 . 22=0,86 .0,88=0.7568
Misalkan relative sizes = 100 wanita. Dengan mengunakan

=0.01 maka

dapat dikatakan bahwa 1 dari 100 wanita dipastikan memiliki penyakit kanker
payudara. Untuk wanita yang terkena kanker payudara yang positive terdeteksi
2 | Page

Analisis Data Kategori


Solusi Chapter 2
memiliki peluang = 0.86 , jadi hal tersebut dapat mengindikasikan bahwa
satu orang positive terkena kanker payudara. Untuk wanita tanpa penyakit
kanker payudara peluangnya sebesar 0.88 untuk hasil yang negative. Sehingga,
terdapat 87 (0.88 x 99) wanita dari 99 orang wanita tanpa penyakit kanker
payudara yang memiliki hasil yang negative. Kemudian, 12 wanita terdeteksi
memiliki hasil positif (0.12 x 99).
2.3

According to recent UN figures, the annual gun homicide rate is 62.4 per one
million residents in the United States and 1.3 per one million residents in the UK.
a. Compare the proportion of residents killed annually by guns using the (i)
difference of proportions, (ii) relative risk.
b. When both proportions are very close to 0, as here, whoch measure is more
useful for describing the strength of association? Why?
Penyelesaian:
Tingkat pembunuhan tahunan di US : 62.4 per sejuta tempat tinggal
Tingkat pembunuhan tahunan di UK : 1.3 per sejuta tempat tinggal
a. Membandingkan proporsi penduduk yang dibunuh setiap tahun dengan
menggunakan beda peluang dan relative risk.
Beda Peluang
Beda peluang= pembunuhanUS pembunuhanUK

62.4
1.3

1000000 1000000

0.0000611
Estimasi titik beda peluang penduduk yang dibunuh setiap tahun di US dan

UK adalah 0.0000611
Relative Risk

RR= matiUS
matiUK
62.4
1000000
RR=
1.3
1000000

3 | Page

Analisis Data Kategori


Solusi Chapter 2
RR=48

Risiko penduduk terbunuh setiap tahunnya di US 48 kali lebih besar


daripada penduduk di UK.

b. Antara dua proporsi ukuran tetap tertentu biasanya lebih penting ketika kedua
proporsi mendekati 0 atau 1 dibanding ketika mereka berada dekat tengah
rentang. Pertimbangkan perbandingan dua obat pada proporsi subyek yang
memiliki efek samping saat menggunakan obat-obatan. Perbedaan antara 0.010
dan 0.001 sama dengan perbedaan antara 0.410 dan 0.401, yaitu 0.009.
Perbedaan pertama lebih mencolok, karena 10 kali lebih memiliki efek
samping dengan satu obat dengan yang lain. Dalam kasus tersebut, rasio
proporsi lebih ukuran deskriptif yang relevan. Rasio proporsi tersebut disebut
Relative Risk. Relative Risk merupakan perbandingan antara dua buah odds,
sehingga kita dapat mengetahui kekuatan asosiasi antar keduanya. Tidak hanya
perbedaan proporsi yang didapat dari beda proporsi.

2.5

Consider the following two studies reported in the New York Times:
a. A British study reported (December 3, 1998) that, of smokers who get lung
cancer, women were 1.7 times more vulnerable than men to get small-cell
lung cancer. Is 1.7 an odds ratio, or a relative risk?
b. A National Cancer Institute study about tamoxifen and breast cancer reported
(April 7, 1998) that the women taking the drug were 45% less likely to
experience invasive breast cancer compared with the women taking placebo.
Find the relative risk for (i) those taking the drug compared to those taking
placebo, (ii) those taking placebo compared to those taking the drug.
Penyelesaian:
a. Nilai 1,7 adalah relative risk karena perbandingan resiko penderita kanker
antara perempuan dan laki-laki.
b. Dik : women taking the drug were 45% less likely to experience invasive
breast cancer compared with the women taking placebo
drug = 55% placebo atau bisa ditulis dengan

= 0,55

i. relative risk untuk wanita yang memakai drug dibandingkan dengan


placebo:

4 | Page

Analisis Data Kategori


Solusi Chapter 2

RR =

1
2

= 0,55

ii. relative risk untuk wanita yang memakai placebo dibandingkan dengan drug
2
1
RR = 1 = 0,55 = 1,82

2.7

For adults who sailed on the Titanic on its fateful voyage, the odds ratio between
gender (female, male) and survival (yes, no) was 11.4. (For data, see R. Dawson,
J. Statist. Educ. 3, no. 3, 1995.)
a. What is wrong with the interpretation, The probability of survival for females
was 11.4 times that for males? Give the correct interpretation.
b. The odds of survival for females equaled 2.9. For each gender, find the
proportion who survived.
c. Find the value of R in the interpretation, The probability of survival for
females was R times that for males.
Penyelesaian :
a. Peluang selamat untuk wanita 11.4 kali dibanding pria pernyataan ini
merupakan pernyataan untuk relative risk bukan odds ratio. Jika ingin
menginterpretasikan odds ratio maka seharusnya adalah Wanita yang selamat
ada 11.4 kali dari pria.
b. Jika odds untuk wanita = 2.9 maka proporsi wanita yang selamat adalah
2.9
=0.7435897436 0.744
. Jika odds ratio wanita yang selamat adalah
1+2.9
11.4

kali

dari

pria,

2.9
=0.2543859649 0.254
11.4

maka

odds

untuk

pria

adalah

sehingga proporsi pria yang selamat adalah

0.254
=0.2025518341 0.203
.
1+0.254
c.

Relative risk=

proporsiwanita yang selamat


proporsi pria yang selamat

5 | Page

Analisis Data Kategori


Solusi Chapter 2
Relative risk=

0.744
0.203

Relative risk=3.665024631 3.67

Peluang selamat untuk wanita 3.67 kali dibanding pria.

2.8

A research study estimated that under a certain condition, the probability a subject
would be referred for heart catheterization was 0.906 for whites and 0.847 for
blacks.
a. A press release about the study stated that the odds of referral for cardiac
catheterization for blacks are 60% of the odds for whites. Explain how they
obtained 60% (more accurately, 57%).
b. AnAssociated Press story that described the study stated Doctors were only
60% as likely to order cardiac catheterization for blacks as for whites. What is
wrong with this interpretation? Give the correct percentage for this
interpretation. (In stating results to the general public, it is better to use the
relative risk than the odds ratio. It is simpler to understand and less likely to be
misinterpreted. For details, see New Engl. J. Med., 341:279283, 1999.)
Penyelesaian:
a. Odds ratio

Odds ratio=

p 1/(1 p 1) 0.847 /(10.847)


=
=0.5744
p 2/(1 p 2) 0.906 /(10.906)

Sehingga dapat disimpulkan bahwa odds ratio pada katerisasi jantung untuk
yang kulit hitam adalah 0.5744 kali dari odds ratio untuk yang kulit putih.
b. Pernyataan : Dokter hanya 60% lebih mungkin untuk melakukan katerisasi
jantung pada orang kulit hitam daripada orang kulit putih.
Relative risk
0.847
RR=
=0.9348786
0.906
Artinya, risiko dokter melakukan katerisasi jantung pada orang kulit hitam
0.9348786 kali dibandingkan pada orang kulit putih.
Hal ini bertentangan dengan pernyataan Associated Press yang mengatakan
katerisasi jantung lebih banyak 60% dilakukan pada orang berkulit hitam
dibandingkan orang berkulit putih.

6 | Page

Analisis Data Kategori


Solusi Chapter 2

2.11 A 20-year study of British male physicians (R. Doll and R. Peto, British Med.J.,2:
1525-1536, 1976) noted that the proportion who died from lung cancer was
0.00140 per year for cigarette smokers and 0.00010 per year for nonsmokers. The
proportion who died from heart disease was 0.00669 for smokers and 0.00413 for
nonsmokers.
a. Describe the association of smoking with lung cancer and with heart disease,
using the difference of proportions, the relative risk, and the odds ratio.
Interpret.
b. Which response (lung cancer or heart disease) is more strongly related to
cigarette smoking, in terms of the reduction in deaths that could occur with an
absence of smoking?
Penyelesaian:
a. Tabel
Lung Cancer
Heart Disease
Merokok
0.00140
0.00669
Tidak Merokok
0.00010
0.00413
i. Asosiasi Kanker paru-paru dan merokok
1 2
Beda Peluang
=
= 0.0014 0.0001
=0.0013
artinya terdapat asosiasi yang sangat kecil antara kondisi merokok dan
kanker paru-paru.
Risiko relatif

1
2

0.00140
0.00010

= 14
artinya risiko orang yang merokok 14 kali terkena kanker paru-paru
dibandingkan dengan orang yang tidak merokok.
1
( 1 1 )
Odds ratio =
2
( 1 2 )

7 | Page

Analisis Data Kategori


Solusi Chapter 2

0.00140
( 10.00140 )
0.00010
( 10.00010 )

= 14.018 14.02
artinya orang yang merokok 14.02 kali lebih mungkin menyebabkan kanker
paru-paru daripada orang yang tidak merokok.
ii.

Asosiasi Penyakit jantung dan merokok


1 2
Beda Peluang
=
= 0.00669- 0.00413
=0.00256
artinya terdapat asosiasi yang sangat kecil antara kondisi merokok dan
penyakit jantung.
Risiko relatif

1
2

0.00669
= 0.00413
= 1.619 1.62
artinya risiko orang yang merokok 14 kali terkena penyakit jantung
dibandingkan dengan orang yang tidak merokok.
1
( 1 1 )
Odds ratio
=
2
( 1 2 )
0.00669
( 10.00669 )
=
0.00413
( 10.00413 )
= 1.62
artinya orang yang merokok 1.62 kali lebih mungkin menyebabkan penyakit
jantung daripada orang yang tidak merokok.
b. Dapat dibandingkan melalui Risiko relatif, jika yang diprioritaskan untuk orang
yang tidak merokok. Maka bentuk tabel kontingensi di atas sebagai berikut:
Meninggal
Kanker paru-paru
Penyakit jantung
Tidak Perokok
0.00010
0.00413
Perokok
0.00140
0.00669
Risiko relatif saat orang tersebut meninggal akibat kanker paru-paru

8 | Page

Analisis Data Kategori


Solusi Chapter 2
= j|h / j|i
= 0.00010/ 0.00140
= 0.0714
Risiko relatif saat orang tersebut meninggal akibat penyakit jantung
= j|h / j|i
= 0.00413/ 0.00669
= 0.6173
Asosiasi antara rokok dan kanker paru-paru lebih kecil daripada asosiasi rokok
dengan penyakit jantung. Jadi dapat disimpulkan apabila kondisi untuk orang
yang tidak merokok, maka respon yang lebih dipengaruhi akibat rokok adalah
penyakit jantung.
2. 12 A statistical analysis that combines information from several studies is called a
meta analysis. A meta analysis compared aspirin with placebo on incidence of
heart

attack

and

of

stroke

separately

for

men

and

for

women

(J.Am.Med.Assoc.295: 306-313, 2006). For the womens Health Study, heart


attacks were reported for 198 of 19,934 taking aspirin and for 193 of 19,942
taking placebo.
Yes
Aspirin 198
Placebo 193
Total
391
Penyelesaian:
^ =

n11n22
n12n21

no
19736
19749
39485

Total
19934
19942
39876

19819749
19319736

= 1,0266

2,66 % orang yang meminum aspirin cenderung terkena heart attack dan stroke
dibandingkan dengan orang yang meminum placebo.
Interval taksiran
Taraf konfidensi =95%
^ = 1,0266

^
Ln = ln 1,2066
^
Ln = 0,0263

9 | Page

Analisis Data Kategori


Solusi Chapter 2

SE=

SE=

1
1
1
1
+ + +
n11 n 12 n 21 n22

1
1
1
1
+
+
+
198 19736 193 19749

SE=0,1017

Interval taksiran
Ln

^ Z SE
2

0,0263 1,96 ( 0,1017 )


0,0263 0,1993

(0,173; 0,2256 )

^
untuk Ln

(0,8411 ; 1,2531)

^
untuk

2.13 Refer to table 2.1 about belief in afterlife.


a. Construct a 90% confidence interval for the difference of proportions, and
interpret.
b. Construct a 90% confidence interval for the odds ratio, and interpret.
c. Conduct a test of statistical independence. Report the P-value and interpret.
Penyelesaian:
Beliefe
in

T
o

Fe

Afterlife
Y
N
e
o
s
5
1

mal

es
Mal

9
3

6
1

5
5

es

Ge
nde
r

ta
l
6

10 | P a g e

Analisis Data Kategori


Solusi Chapter 2
8
4
2
a. 90% interval konfidensi untuk beda peluang dan interpretasikan
Beda Peluang
Beda peluang= yesfemales yesmales

509 398

625 502

0.8140.793
0.022

Standard Error
( ^ yesfemales ^
yesmales )=

yes females (1 yesfemales ) yesmales (1 yesmales )


+
n1
n2

509
509 398
398
(1
)
(1
)
625
625 502
502

+
n1
n2

1
2

1
2

0.024
Selang kepercayaan untuk beda peluang
^
^

yesfemales

(
yesfemales ^
yesmales )
yesmales ) Z ( ^

0.022 (1.96)( 0.024)


0.0252 ^ 0.0683

Interpretasi:
Estimasi titik beda peluang antara jenis kelamin wanita dan laki- laki yang
percaya akan adanya kehidupan setelah kematian secara adalah 0.022,
sedangkan estimasi selang kepercayaan beda peluangnya berkisar di angka
-0.0252 hingga 0.0683. Terdapat angka 0 (nol) dalam selang kepercayaan ini
mengindikasikan bahwa jenis kelamin laki- laki dan wanita bersifat saling
independen,dimana jika dikaitkan dalam hal ini dapat disimpulkan bahwa
peluang wanita percaya akan adanya kehidupan setelah kematian tidak
bergantung pada jenis kelamin laki- laki yang percaya akan adanya kehidupan
setelah kematian.

11 | P a g e

Analisis Data Kategori


Solusi Chapter 2

b. 90% interval konfidensi untuk odd ratio dan interpretasikan


^
Odds Ratio ( )
Odds Ratio=

n11 n22
n 21 n12

509 104
398 116

1.1466
Standard Error
1
1
1
1
^ ln ( )=
+ + +
n11 n12 n21 n22

1
1
1
1
+
+
+
509 116 398 104

0.0227
0.1507

Selang kepercayaan untuk odds ratio


^ ) Z ^ ln ( )
ln (
2

ln ( 1.1466 ) ( 1.96 )( 0.1507)

0.1368 ( 1.96 ) (0.1507)


^ ) 0.4322
0.1586 ln (
^ 1.5406
0.8534
Interpretasi:
Estimasi titik odds ratio antara jenis kelamin wanita dan laki- laki yang percaya
akan adanya kehidupan setelah kematian secara adalah 1.1466, ini
menyimpulkan bahwa wanita 14,66% lebih percaya akan adanya kehidupan
setelah kematian jika dibandingkan dengan laki- laki. Sedangkan estimasi
selang kepercayaan odds ratio berkisar di angka 0.8534 hingga 1.5406.
Terdapat angka 1 (satu) dalam selang kepercayaan ini mengindikasikan bahwa
jenis kelamin laki- laki dan wanita bersifat saling independen, dimana jika
dikaitkan dalam hal ini dapat disimpulkan bahwa peluang wanita percaya akan

12 | P a g e

Analisis Data Kategori


Solusi Chapter 2
adanya kehidupan setelah kematian tidak bergantung pada jenis kelamin lakilaki yang percaya akan adanya kehidupan setelah kematian.
c. Uji Independensi
Berikut akan diuji independensi antara kategori wanita dan laki-laki terhadap
kepercayaan akan adanya kehidupan setelah kematian. Uji independensi
berikut menggunakan uji Pearson Chi-Square.
Hipotesis Statistik
H 0 : laki .wanita = laki . wanita
Kepercayaan wanita dan laki- laki akan adanya kehidupan setelah kematian
saling independen.
H 0 : laki .wanita laki . wanita
Kepercayaan wanita dan laki- laki akan adanya kehidupan setelah kematian
saling dependen.
:5

Statistik Uji : Pearson Chi-Square


2
2
(nij ^ij )2
2
=
^ij
i=1 j=1
dimana

^ij =n i . . j

Kriteria Penolakan H0
Tolak H0 jika

2 > 2(I1)(J 1)

Perhitungan
^ij
Tabel
G
e
n
d
e
r
F
e
m
a
l

Beliefe in
Afterlife
Y
e
s

N
o

5
0
9
5
0

1
1
6
1
2

13 | P a g e

Analisis Data Kategori


Solusi Chapter 2
2
,
9
9
4
7
3
9
8
4
0
4
,
0
0
5
3

e
s

M
a
l
e
s

2
,
0
0
5
3
1
0
4
9
7
,
9
9
4
7

(nij ^ij )2
=
^ij
i=1 j=1
2

2=

(509502.9947)2 (116122.0053)2 (398404.0053)2 (10497.9947)2


+
+
+
502.9947
122.0053
404.0053
97.9947

2=0.0717+ 0.2956+0.0893+0.3680
2=0.8246
2(I1)(J 1 )= 21=3.8415

Jika nilai

dibandingkan dengan

lebih kecil dari nilai

21

21

nilai

yaitu sebesar 0.8426

sebesar 3.8415. Sehingga hipotesis nol diterima.

Penerimaan hipotesis nol ini menunjukkan bahwa kepercayaan wanita dan lakilaki akan adanya kehidupan setelah kematian saling independen.

2.16 Table 2.12 comes from one of the first studies of the link between lung cancer and
smoking, by Richard Doll and A. Bradford Hill. In 20 hospitals in London, UK,
patients admitted with lung cancer in the previous year were queried about their
smoking behavior of a noncancer control patient at the same hospital of the same

14 | P a g e

Analisis Data Kategori


Solusi Chapter 2
sex and within the same 5-year grouping on age. A smoker was defined as a
person who had smoked at least one cigarette a day for at least a year :
Tabel 2.12. Data for Problem 2.16
Have Smoked
Yes
No
Total

Lung Cancer
Cases
Controls
688
650
21
59
709
709

Based on data reported in Table IV, R. Doll and A.


B. Hill, Br. Med. J., 739748, September 30, 1950.

a. Identify the response variabel and the explanatory variable


b. Identify the type of study this was
c. Can you use these data to compare smokers with nonsmokers in terms of the
proportion who suffered lung cancer ? why or why not ?
d. Summarize the association, and explain how to interpret it ?
Penyelesaian:
a. The response variabel : patients admitted with lung cancer
The explanatory variabel : smoking behavior
b. The type of study is experimental research.
c. Yes, we can use the data to compare smokers with nonsmokers in terms of the
proportion who suffered lung cancer because we can calculate the odds ratio or
relative risk and know the associaton from the data in table 2.12.
d. The association :
Have

Lung Cancer

Smoked
Cases
Controls
Total
Yes
688
650
1338
No
21
59
80
Total
709
709
Proporsi untuk perokok yang terkena kanker paru paru :
1=

688
=0,514200299
138

Proporsi untuk yang tidak merokok yang terkena kangker paru paru
2=

21
=0,2625
80

Relative Risk untuk smokers yang terkena lung cancer :


RR=

1 0,514200
=
=1,96
2
0,2625

Odds Ratio untuk smokers yang terkena lung cancer :

15 | P a g e

Analisis Data Kategori


Solusi Chapter 2

Odds=

1 /(1 1 ) 0,5142 /(10,5142)


=
=2,97
2 /(1 2 ) 0,2625 /(10,2625)

Interpretasi :

Resiko orang yang merokok yang terkena kanker paru paru 1,96 kali dari

orang yang tidak merokok.


Kemungkinan orang yang merokok yang terkena kanker paru paru 2,97 kali
dari orang yang tidak merokok.

Uji Independensi
Hipotesis :
H0 :

ij = i . j

artinya Tidak ada asosiasi antara kebiasaan merokok dengan

kanker paru-paru
H1 :

ij i . j

artinya Ada asosiasi antara kebiasaan merokok dengan

kanker paru-paru
=5
Statistik uji :
2=
i

(nij u^ ij )2
u^ ij

Have

Lung Cancer

Smoked
Yes
u^
( ij )
(

No
u^ ij

Total
2=
i

Cases
688

Controls
650

(669)
21

(669)
59

80

(40)
709

(40)
709

1418

( n ij ^uij )

Total
1338

u^ ij

16 | P a g e

Analisis Data Kategori


Solusi Chapter 2
2

(688669) (650669) (2140) (5940)


=
+
+
+
669
669
40
40
2

2=19,12922
Kriteria Uji :
2 hitung 2 tabel , H0 ditolak
19,13 3,841 , artinya H0 ditolak .
Interpretasi :
Dengan taraf signifikan 5% H0 ditolak artinya Ada asosiasi antara kebiasaan
merokok dengan kanker paru-paru

2.18 Table 2.13 shows data from the 2002 General Social Survey cross classifying a
persons perceived happiness with their family income. The table displays the
observed and expected cell counts and the standardized residuals for testing
independence.
a. Show how to obtain the estimated expected cell count of 35.8 for the first
cell.
b. For testing independence, X2 = 73.4. Report the df value and the P-value, and
interpret.
c. Interpret the standardized residuals in the corner cells having counts 21 and
83.
d. Interpret the standardized residuals in the corner cells having counts 110 and
94.
Table 2.13. Data for Problem 2.18, with Estimated Expected Frequencies and
Standardized Residuals
Income
Above
Average
Average

Not Too

Happiness
Pretty

Happy
21
35.8
2.973
53
79.7
4.403

Happy
159
166.1
0.947
372
370.0
0.224

Very Happy
110
88.1
3.144
221
196.4
2.907
17 | P a g e

Analisis Data Kategori


Solusi Chapter 2
Below
Average

94
52.5
7.368

249
244.0
0.595

83
129.5
5.907

Penyelesaian :
Income
Above Average
Average
Below Average
Jumlah
n+j

Not Too

Happiness
Pretty

Happy
21
53
94

Happy
159
372
249

168

780

Jumlah
Very Happy

ni+

110
221
83

290
646
426

414

1362

ni+ n
n
^ij =
+j

a. Taksiran ekspektasi sel adalah

Untuk sel pada baris 1 dan kolom 1 adalah:


n n
^11= 1. .1
n
^11=

( 290 ) (168)
1362

^11=35.7709251101 35.8
Jadi, terbukti bahwa taksiran ekspektasi sel pertama pada tabel 2.13 adalah
35.8
b. H0 :

ij = i. . j

; Tidak ada asosiasi antara kebahagiaan dengan pendapatan

keluarga ( saling independen)


ij i . . j
H1 :
; Ada asosiasi antara kebahagiaan dengan pendapatan
keluarga ( saling dependen)
=0.05
Statistik uji: Uji Chi Kuadrat
2
( n ij ^ ij )
2
=
^ ij
2=

( 2135.8 )2 ( 159166.1 )2
( 83129.5 )2
+
++
35.8
166.1
129.5

18 | P a g e

Analisis Data Kategori


Solusi Chapter 2
2

=73.35246138 73.4
df =( I 1 )( J1 )=( 31 ) ( 31 )=4
pvalue=4.4 1015
Kriteria uji: Tolak H0 jika p-value , karena p-value < maka H0 ditolak.
Kesimpulan: Dengan taraf signifikan 5% dapat disimpulkan bahwa ada
asosiasi antara kebahagiaan dengan pendapatan keluarga ( saling dependen).
c. Standardized residuals (SE)
i+
1p

( 1 p+ j )
^ ij

n ^
SE ij = ij ij

Standardized residuals sel pojok (baris 1 kolom 1) adalah:


1+
1 p

( 1 p+1 )
^11

n ^
SE 11= 11 11
SE 11=

2135.8

35.8 1

290
168
1
1362
1362

)(

SE 11=2.973172873 2.973
Standardized residuals sel pojok (baris 3 kolom 3) adalah:
3+
1 p

( 1p +3 )
^ 33

n ^
SE 33= 33 33

19 | P a g e

Analisis Data Kategori


Solusi Chapter 2
SE 33=

83129.5

129.5 1

426
414
1
1362
1362

)(

SE 33=5.907023235 5.907
Jika

2< SE<2

maka diindikasikan bahwa kebahagiaan dengan

pendapatan keluarga terdapat asosiasi atau dapat dikatakan saling dependen.


Karena nilai keduanya kurang dari 2 maka keduanya mengindikasikan bahwa
kebahagiaan dengan pendapatan keluarga tidak terdapat asosiasi atau dapat
dikatakan saling independen.
d. Standardized residuals sel pojok (baris 1 kolom 3) adalah:
n13 ^ 13
SE 13=
^13 ( 1 p1.) ( 1 p .3 )
SE 13=

11088.1

88.1 1

290
414
1
1362
1362

)(

SE 11=3.144276645 3.144
Standardized residuals sel pojok (baris 3 kolom 1) adalah:
3+
1 p

1p
(
+1)
^ 31

n ^
SE 31= 31 31
SE 31=

9452.5

52.5 1

426
168
1
1362
1362

)(

SE 31=7.367665487 7.368
Jika

2< SE<2

maka diindikasikan bahwa kebahagiaan dengan

pendapatan keluarga terdapat asosiasi atau dapat dikatakan saling dependen.


Karena nilai keduanya lebih dari 2 maka keduanya mengindikasikan bahwa
kebahagiaan dengan pendapatan keluarga tidak terdapat asosiasi atau dapat
dikatakan saling independen.
20 | P a g e

Analisis Data Kategori


Solusi Chapter 2

2.20 In an investigation of the relationship between stage of breast cancer at diagnosis


(local or advanced) and a womans living arrangement (D. J. Moritz and W. A.
Satariano, J. Clin. Epidemiol., 46: 443454, 1993), of 144 women living alone,
41.0% had an advanced case; of 209 living with spouse, 52.2% were advanced; of
89 living with others, 59.6% were advanced. The authors reported the P-value for
the relationship as 0.02. Reconstruct the analysis they performed to obtain this Pvalue.
Penyelesaian:
Hipotesis:
H0 : Pilihan tempat tinggal perempuan dan tingkatan diagnosis penyakit kanker
payudara bersifat independen
H1 : Pilihan tempat tinggal perempuan dan tingkatan diagnosis penyakit kanker
tidak bersifat independen
Taraf signifikansi:
= 0.05
Statistik Uji:
P-value=0.02 (diketahui)
Kriteria uji :
Tolak H0 jika p-value < alpha, terima dalam hal lainnya.
Ternyata p-value=0.02 < alpha=0.05 maka H0 ditolak.
Interprestasi :
Dengan taraf signifikansi 5% bisa kita lihat bahwa ada asosiasi antara pilihan
tempat tinggal perempuan dan tingkatan diagnosis penyakit kanker.
2.22 Table 2.15 classifies a sample of psychiatric patients by their diagnosis and by
wheter their treatment prescribed drugs.
Table 2.15. Data for Problem 2.22
Diagnosis

Drugs

No Drugs

Total

Schizophrenia

105

113

Affective disorde

12

14

Neurosis

18

19

37

Personality disorder

47

52

99

Special symptoms

13

13

Total

182

94

276

Source: E. Helmes and G. C. Fekken, J. Clin. Psychol., 42: 569576, 1986.


Copyright by Clinical Psychology Publishing Co., Inc., Brandon, VT.
Reproduced by permission of the publisher.

21 | P a g e

Analisis Data Kategori


Solusi Chapter 2
a. Conduct a test of independence, and interpret the p-value.
b. Obtain standardized residuals, and interpret.
c. Partition chi-squared into three components to describe differences and
similarities among the diagnoses, by comparing (i) the first two rows, (ii) the
third and fourth rows, (iii) the last row to the first and second rowa combined
and the third and fourth rows combined.
Penyelesaian:
a. Hipotesis:
ij = i. . j
H0 :
, artinya diagnosis dan perlakuan untuk narkoba yang
diresepkan adalah independen.
ij i . . j
H1 :
,artinya diagnosis dan perlakuan untuk narkoba yang
diresepkan adalah dependen.
Statistik uji:

(nijij)2
=
ij
i
j
2

=0.05
dimana
11
12
21
22
31
2

74.51449
38.48551
9.231884
4.768116
24.39855

32
41
42
51
52
2

12.60145
65.28261
33.71739
8.572464
4.427536
2

(10574.51449) (838.48551)
(134.427536)
+
+ +
74.51449
38.48551
4.427536

2=84.18846705
Kriteria Uji: Tolak H0 jika

( I1) (J1)

Dengan taraf signifikan 95%, ternyata

=84.18846705>

( I 1 ) (J1)

=11.14

maka H0 ditolak, artinya diagnosis dan perlakuan untuk narkoba yang


diresepkan adalah dependen. Terlihat juga melalui p-value sebesar 0.00617 <
0.025,artinya termasuk dalam wilayah penolakan H0.

22 | P a g e

Analisis Data Kategori


Solusi Chapter 2
b. Standardized residuals digunakan untuk mengetahui sel mana yang
mengakibatkan kedua variabel merupakan dependen.
i+
1 p

( 1 p+ j )
^ij

n ^
SR= ij ij
Untuk masing-masing jenis perlakuan pada pengguna narkoba berikut
merupakan standardized residualnya.
-

SR(Schizophrenia)

SR(Affective disorde)

129.231884
=1.601
9.231884 ( 10.05 ) (10.659 )

1824.39855
=2.385
24.398554 ( 10.134 ) ( 10.659 )

SR(Personality disorder)

10574.51449
=7.874
74.51 (10.409 ) ( 10.659 )

SR(Neurosis)

4765.28261
=4.842
65.28261 ( 10.3587 ) ( 10.6848 )

SR(Special symptoms)

08.572464
=5.139
8.572464 ( 10.0471 )( 10.659 )

Sementara untuk diagnosis yang tidak menggunakan narkoba tidak perlu


dihitung, karena merupakan kebalikan dari pengguna narkoba. Jika AR (>|
2|) ,maka sel tersebut yang menyebabkan H0 ditolak. Jadi, sel yang
menyebabkan dependen adalah perlakuan Schizophrenia, Neurosis, Personality

23 | P a g e

Analisis Data Kategori


Solusi Chapter 2
disorder, dan Special symptoms untuk yang didiagnosis pengguna narkoba
ataupun tidak pengguna narkoba.
c. Chi kuadrat parsial
ij
i. . j
i.
H0 :
=
, artinya diagnosis dan perlakuan untuk narkoba yang
diresepkan adalah independen.
ij
i. . j
H1 :

,artinya diagnosis dan perlakuan untuk narkoba yang


diresepkan adalah dependen
Diagnosis

Drugs

No Drugs

Total

Schizophrenia

105

113

Affective disorde

12

14

Total

117

10

127

n
G2=2 nij ln ij
ij
i
j

( )

Dimana
104.102
11

4
8.89763

12

8
12.8976

21

4
1.10236

22

G2=2 105 ln

105
8
12
2
( 104.1024
)+8 ln ( 8.897638
)+ 12 ln ( 12.897648
)+ 2 ln ( 1.102362
))

G =2(0.901497+(0.85075)+(0.86565)+1.191384 )
G2=0.752952
ii.

H0 :

ij

i . . j

, artinya diagnosis dan perlakuan untuk narkoba yang

diresepkan adalah independen.

24 | P a g e

Analisis Data Kategori


Solusi Chapter 2
H1 :

ij

i . . j

,artinya diagnosis dan perlakuan untuk narkoba yang

diresepkan adalah dependen.


Diagnosis

Drugs

No Drugs

Total

Neurosis

18

19

37

Personality disorder

47

52

99

Total

65

71

136

nij
ij

( )

G2=2 nij ln
i

Dimana
17.6838
11

2
19.3161

12

8
47.3161

21

8
51.6838

22

( (

G2=2 18 ln

18
19
47
52
+19 ln
+ 47 ln
+52 ln
17.68382
19.31618
47.31618
51.68382

G 2=2(0.31899+(0.31358)+(0.31512)+0.317145)
G2=0.01487
iii.

H0 :

ij

i . . j

, artinya diagnosis dan perlakuan untuk narkoba yang

diresepkan adalah independen.


ij
i. . j
H1 :

,artinya diagnosis dan perlakuan untuk narkoba yang


diresepkan adalah dependen
Diagnosis

Drugs

No Drugs

Total

117

23

140

65

71

136

Total

182

94

276

25 | P a g e

))

Analisis Data Kategori


Solusi Chapter 2

G2=2 nij ln
i

n ij
ij

( )

Dimana
92.3188
11
12
21

4
47.68116
89.68116
46.3188

22

G =2 117 ln

117
23
65
71
( 92.31884
)+23 ln ( 47.68116
)+65 ln ( 89.68116
)+71 ln ( 46.31884
))

G 2=2(27.72031+(16.7680)+(20.92177)+30.32631)
G2=40.7137
Interpretasi
Jika tabel kontingensi dipartisi menjadi 2x2,dimana :
-

Komponen

pertama

dan

kedua

dibandingkan

nilai

2=0.752952< 12=5.02 , maka H0 diterima artinya diagnosis dan


perlakuan untuk narkoba yang diresepkan adalah independen.
-

Komponen

ketiga

2=0.01487< 12=5.02 ,
perlakuan untuk narkoba yang
-

dan

keempat

dibandingkan,

nilai

maka H0 diterima artinya diagnosis dan


diresepkan

adalah independen.

Komponen 1,2,5 dikombinasikan dan dibandingan dengan kombinasi

komponen ke-

3,dan 4 ,nilai

ditolak artinya diagnosis dan

=40.7137> 1 =5.02 , maka H0

perlakuan untuk narkoba yang diresepkan

adalah dependen. Hal ini yang menyebabkan terdapat asosiasi antara antara
diagnosis dan perlakuan untuk narkoba.

26 | P a g e

Analisis Data Kategori


Solusi Chapter 2

2.23 From a recent General Social Survey, cross-classifies the degree of


fundamentalism of subjects religious beliefs by their highest degree of education.
The table also shows standardized residuals. For these data X2=69.2 Write a report
of about 200 words, summarizing description and inference for these data.
Table 2.16. Table for Problem 2.23, with Standardized Residuals
Highest Degree
Less than high
school
High school or
junior collage
Bachelor or
graduate
Total
Penyelesaian:
Dengan rumusan

Religious Beliefs
Moderate
Liberal
138
108
161,45
124,74
-2,6
-1,9
648
442
632,09
488,38
1,3
-4,0
252
252
244,46
188,88
0,7
6,3
1038
802

Fundamental
178
137,81
4,5
510
539,53
2,6
138
208,66
-6,8
886
H0

Total
424
1660
642
2726

tidak terdapat asosiasi antara varibel Y (Religious

Beliefs : Fundamentalist, Moderate, Liberal) dengan variabel X (Highest Degree :


less than high school, high school or junior collage, Bachelor or Graduate)
melawan alternatif hipotesis

H1

terdapat asosiasi antara varibel Y (Religious

Beliefs : Fundamentalist, Moderate, Liberal) dengan variabel X (Highest Degree :


less than high school, high school or junior collage, Bachelor or Graduate).
Dengan tingkat kekeliruan sebesar 5%, didapat nilai
dibandingkan dengan

21

= 69,2. Nilai ini

dengan df = (I-1)(J-1)=(3-1)(3-1)=(2)(2)=4. Pada


2

tingkat kekeliruan yang sama didapat nilai


kriteria uji bahwa tolak

H0

berdasarkan nilai-nilai diatas dimana

X > 1

apabila
X

sebesar 9,49. Sesuai dengan


atau p-value < alpha. Maka

(69,2) >

21 (9,49) maka

H0

27 | P a g e

Analisis Data Kategori


Solusi Chapter 2
ditolak. Artinya dengan tingkat kekeliruan 5% dapat disimpulkan bahwa terdapat
asosiasi antara varibel Y (Religious Beliefs : Fundamentalist, Moderate, Liberal)
dengan variabel X (Highest Degree : less than high school, high school or junior
collage, Bachelor or Graduate).

2.26 A chi-squared variate with degrees of freedom equal of df has representation


Z 21 ++ Z 2df

, where

Z 1 , ., Z df

are independent standard normal variates.

a. If Z has a standard normal distribution, What distribution does Z2 have ?


b. Show that, if Y1 dan Y2 are independent chi-square variate with degrees of
freedom df1 dan df2 , then Y1 + Y2 has a chi-square distribution with df = df1 +
df2 .
Penyelesaian:
a. A chi squared distribution with d degrees of freedom is the distribution of a
sum of the squares of d independent standard normal random variable. Thus,
if Z2 has a chi-squared distribution with 1 degree of freedom.
df 1

b. Since Y1 is a chi squared random variable, Y1 =

Z 2i
i=1

where each Zi ~ N

df 2

(0,1). Similary, Y2 =

Z 2i
i=1

where each Zi ~ N (0,1). Then the sum Y1 + Y2

is
df 1

df 2

i=1

i =1

Y 1+ Y 2= Z 2i + Z 2i
df 1+df 2

Z 2i

i=1

Hence, by the definition of a chi squared distribution, Y 1 + Y2 also has a chi


squared distribusion with df1 + df2 degrees of freedom.

2.28 By trial and error, find a 3 3 table of counts for which the P-value is greater than
0.05 for the X2 test but less than 0.05 for the M2 ordinal test. Explain why this
happens.
28 | P a g e

Analisis Data Kategori


Solusi Chapter 2
Penyelesaian :
M2 didasarkan pengukuran korelasi pada trend linier dengan parameter tunggal,
pada kasus tabel kontingensi 3x3 akan ada 2 parameter yang dihitung. Nilai M2
tidak bersifat asimtotik dan ekor kurvanya cenderung jatuh di sebelah kanan
sehingga semakin kanan ekor kurvanya jatuh maka semakin kecil nilai pvaluenya. Saat df=2 maka nilai p-value yang dihasilkan dari M2 akan lebih kecil
dibandingkkan dengan =0.05 dan juga p-value dari chi-kuadrat.
2.30 Table 2.17 contains results of a study comparing radiation therapy with surgery in
treating cancer of the larynx. Use Fishers exact test to test
H 0 :> 1

H 0 :=1

against

. Interpret results.
Cancer Controlled
21
15

Surgery
Radiation Therapy

Cancer Not Controlled


2
3

Penyelesaian:
Hipotesis:
H 0 : =1

Tidak terdapat asosiasi antara terapi radiasi dengan operasi dalam

mengobati kanker laring


H 1 :>1

Terdapat asosiasi antara terapi radiasi dengan operasi dalam

mengobati kanker laring


=5

Statistik Uji:
n
n
(
)
t (n t )
p (t )=P ( n =t )=
n
(n )
1.

2.

.1

11

.1

29 | P a g e

Analisis Data Kategori


Solusi Chapter 2
n11 bisa bernilai 0,1,2,3,...,23
23!
18 !
23 18
(
)(
)
[
][
( 21 ! ) ( 2! ) ( 15 ! ) ( 3 ! ) ] 206448
21 15
P (21 ) =
=
=
=0.2755
749398
41 !
41
(36)
[ ( 36 !) (5 ! ) ]
Nilai yang ekstrim untuk

H1

adalah

n11

=23, jadi

23 !
18 !
23 18
(
)(
)
[
][
( 23! )( 0 ! ) ( 13 ! ) ( 5! ) ] 8568
23 13
P (23 )=
=
=
=0.0114
749398
41!
41
( 36)
[ ( 36 ! )( 5 !) ]
Sehingga didapat nilai P-value= 0.2755+0.0114= 0.2869
Kriteria Uji:
Tolak

H0

jika P-value

Dengan =0.05 , didapat nilai P-value sebesar 0.2869 maka

H0

diterima

Interpretasi:
Tidak terdapat asosiasi antara terapi radiasi dengan operasi dalam mengobati
kanker laring.

2.31 Refer to the previous exercise.


a. Obtain and interpret a two-sided exact P-value.
b. Obtain and interpret the one-sided mid P-value. Give advantages of this type of
P-value, compared with the ordinary one.
Penyelesaian:
a.

n11
18
19

Prob
0,0449
0,2126

20
21

0,3615
7
0,2755

22

0,0939

23

0,0114

P-value
1
0,95507
5
0,74238
5
0,38081
5
0,10531
5
0,0114

30 | P a g e

Analisis Data Kategori


Solusi Chapter 2
Pvalue=1P (20)

Pvalue=10.36157
Pvalue=0,63843

b. P-value one-sided (right tail) untuk

H a : >1

(the ordinary one) adalah:

P=P ( 21 ) + P ( 22 ) + P ( 23 )
P=0.2755+ 0.093915+ 0.0114
P=0.383815

Mid P-value untuk one-sided (righ tail) adalah:


mid Pvalue=

P ( 21 )
+ P ( 22 ) + P ( 23 )
2

mid Pvalue=

0.2755
+0.093915+ 0.0114
2

mid Pvalue=0.243065
Keuntungan menggunakan mid P-value dibandingan P-value yang biasa adalah
mid P-value lebih modern (Less Conservative) dibandingkan P-value yang
biasa.

2.33 In murder trials in 20 Florida counties during 1976 and 1977, the death penalty
was given in 19 out of 151 cases in which a white killed a white, in 0 out of 9
cases in which a white killed a black, in 11 out of 63 cases in which a black killed
a white, and in 6 out of 103 cases in which a black killed a black (M. Radelet, Am.
Social. Rev., 46: 918-927, 1981).
a
b

Exhibit the data as a three-way contingency table.


Construct the partial tables needed to study the conditional association
between defendant's race and the death penalty verdict. Find and interpret the

31 | P a g e

Analisis Data Kategori


Solusi Chapter 2
sample conditional odds ratios, adding 0:5 to each cell to reduce the impact of
c

the 0 cell count.


Compute and interpret the sample marginal odds ratio between defendant's
race and the death penalty verdict. Do these data exhibit Simpson's paradox?
Explain.

Penyelesaian:
a

Three-way contingency table.


Defendant's Race
White
Black

Victim's

Death Pinalty

Race
White
Black
White
Black

Yes
19
0
11
6

No
132
9
52
97

Tabel parsial
Tablel pasrial untuk masing-masing korban yang berkulit hitam dan berkulit
putih yaitu :
White Victim
Death
Defendant's Race
White
Black

Pinalty
Yes No
19
132
11
52

Odds Rasio bersyarat ketika untuk korbannya berkulit putih yaitu 0,6719.
Karena

odds

rasio

kurang dari 1, dapat disimpulkan bahwa terdakwa yang berkulit hitam lebih
cenderung mendapatkan hukuman mati daripada terdakwa yang berkulit putih
ketika korban nya berkulit putih.
Black Victim
Death
Defendant's Race
White
Black

Pinalty
Yes No
0
9
6
97

32 | P a g e

Analisis Data Kategori


Solusi Chapter 2
Odds Rasio bersyarat ketika korbannya berkulit hitam yaitu 0,7895. Karena odds
rasionya kurang dari 1, dapat disimpulkan bahwa terdakwa yang berkulit hitam
lebih mungkinmendapatkan hukuman mati daripada terdakwa yang berkulit
putih saat korban berkulit hitam. Secara umum, terdakwa yang berkulit hitam
lebih cenderung mendapatkan hukuman mati dari terdakwa berkulit putih tanpa
memandang ras para korban.
c.
Defendant's Race
White
Black

Death Pinalty
Yes
No
19
141
17
149

Untuk Odds Rasio marginalnya yaitu 1,1811. Karena Odds rasio lebih besar dari
1, disimpulkan bahwa terdakwa yang belkult putih lebih mungkin untuk
mendapatkan hukuman mati daripada terdakwa berkulit hitam terlepas dari ras si
korban

2.38 For three-way contingency tables:


a. When any pair of variables is conditionally independent, explain why there is
homogeneous association.
b. When there is not homogeneous association, explain why no pair of variables
can be conditionally independent.
Penyelesaian:
a. Dalam tabel I x J x K, asosiasi homogen XY artinya bahwa dalam setiap odds
ratio bersyarat dibentung menggunakan 2 level dari X dan 2 level dari Y yang
sama pada setiap level dari Z. Saat XY berasosiasi homogen, XZ juga
berasosiasi homogen, begitu juga YZ. Asosiasi homogen adalah bentuk yang
simetris yang jika diterapkan kepada setiap pasangan variabel pada kategori
variabel ketiga. Dengan kata lain, Jika X dan Y conditionally independent,
odds ratio bersyarat XY adalah sama dengan 1 pada setiap tingkat Z. Karena
odds ratio yang identik di semua tingkat Z sehingga ada homogeneous
association.

33 | P a g e

Analisis Data Kategori


Solusi Chapter 2
b. Ketika asosiasi tidak homogen, odds ratio bersyarat untuk setiap pasangan
variabel berbeda di antara variabel ketiga. Dengan kata lain, jika tidak ada
homogeneous association, maka odds ratio antara X dan Y tidak identik pada
semua tingkat Z, sehingga odds ratio tidak bisa sama dengan 1.0 di semua
tingkat Z, sehingga X dan Y tidak bisa conditionally independent.
Diketahui :

Sensitivity = 1 = 0.86
P (Y =1|X =1 )=
0.86=

P ( Y =1, X=1 )
P ( X=1 )

P ( Y =1, X =1 )
0.01

P (Y =1, X=1 ) =0.0086

Specifity = 1- 2=0.88

[ 1P ( Y =1|X =1 ) ] =1
0.88=1

P ( Y =1, X =2 )
P ( X =2 )

P ( Y =1, X =2 )
P ( X =2 )

dimana P ( X=2 ) =10.01=0.99


P ( Y =1, X =2 )
=10.88
0.99

P (Y =1, X=2 ) =( 0.12 )( 0.99 )


P (Y =1, X=2 ) =0.1288
Maka tabel kontingensi antara X dan Y adalah
X/Y
1

1
0.0086

pi

0.0014

0.01

0.8612
0.1288
0.99
0.8698
0.1302
Berdasarkan tabel marginal diatas dapat dilihat bahwa peluang marginal hasil
positif = 0.8698 lebih besar dibanding hasil negatif = 0.1302.
2.39 True, or false ?

34 | P a g e

Analisis Data Kategori


Solusi Chapter 2
a. In 2 x 2 tables, statistical independence is equivalent to a population odds
ratio value of =1.0.
b. We found that a 95% confidence interval for the odds ratio relating having a
heart attack (yes, no) to drug (placebo, aspirin) is (1.44, 2.33). If we had
formed the table with aspirin in the first row (instead of placebo), then the
95% confidence interval would have been (1/2.33, 1/1.44) = (0.43, 0.69).
c. Using a survey of college students, we study the association between opinion
about whether it should be legal to (1) use marijuana, (2) drink alcohol if you
are 18 years old. We may get a different value for the odds ratio if we treat
opinion about marijuana use as the response variable than if we treat alcohol
use as the response variable.
d. Interchanging two rows or interchanging two columns in a contingency table
has no effect on the value of the 2 or G2 chi-squared statistics. Thus, these
tests treat both the rows and the columns of the contingency table as nominal
scale, and if either or both variables are ordinal, the test ignores that
information.
e. Suppose that income (high, low) and gender are conditionally independent,
given type of job (secretarial, construction, service, professional, etc). Then,
income and gender are also independent in the 2 X 2 marginal table (i.e.,
ignoring, rather than controlling, type of job).
Penyelesaian:
a. True, Sudah terbukti
b. True,
Jika,bentuk tabel kontingensi sebagai berikut, maka odds rationya adalah
Placeb

Kanker
nPK

Tidak Kanker
nPT

o
Aspirin nAK
nAT
1= (nPKxnAT)/(nAKxnPT) .....(1)
Jika bentuk tabel kontingensi sebagai berikut, maka odds rationya adalah
Aspirin
Placeb

Kanker
nAK
nPK

Tidak Kanker
nAT
nPT

o
2= (nAKxnPT)/ (nPKxnAT)= 1/ 1

35 | P a g e

Analisis Data Kategori


Solusi Chapter 2
Jadi jika interval odds ratio= (1,44;2,33) saat perlakuan pertamanya adalah
placebo,maka saat perlakuan pertamanya adalah aspirin intervalnya adalah
(1/2,33;1/1,44)=(0,43;0,69).
c.
d. True,
2 or G2 do not change value with reordering of rows or of columns. When the
rows and/ or the columns are ordinal, the chi-squared test of independence
using test statistic 2 or G2 ignores the ordering information.
e. False. if X and Y are independent in each partial table, then X and Y are said
to be conditionally independent, given Z. All conditional odds ratio between
X and Y then equal 1. Conditional independence of X and Y, given Z, does
not imply marginal independence of X and Y.

36 | P a g e

You might also like