You are on page 1of 14

No OUTLOK TEMPERATURE HUMIDITY WINDY PLAY

1 Sunny Hot High FALSE No


2 Sunny Hot High TRUE No
3 Cloudy Hot High FALSE Yes
4 Rainy Mild High FALSE Yes
5 Rainy Cool Normal FALSE Yes
6 Rainy Cool Normal TRUE Yes
7 Cloudy Cool Normal TRUE Yes
8 Sunny Mild High FALSE No
9 Sunny Cool Normal FALSE Yes
10 Rainy Mild Normal FALSE Yes
11 Sunny Mild Normal TRUE Yes
12 Cloudy Mild High TRUE Yes
13 Cloudy Hot Normal FALSE Yes
14 Rainy Mild High TRUE No
Langkah Penyelesaian Kasus
Secara umum algoritma C4.5 untuk membangun pohon keputusan
adalah sebagai berikut:
1. Pilih atribut sebagai akar.
2. Buatt cabang untuk tiap-tiap nilai.
3. Bagi kasus dalam cabang.
4. Ulangi proses untuk setiap cabang sampai semua kasus pada
cabang memiliki kelas yang sama.
Langkah Penyelesaian Kasus
Node Jml Kasus (S) Tidak (S1) Ya (S2) Entropy Gain

1 TOTAL 14 4 10 0.863120569

0.258521037
OUTLOOK

CLOUDY 4 0 4 0
RAINY 5 1 4 0.721928095
SUNNY 5 3 2 0.970950594

TEMPERATURE 0.183850925

COOL 4 0 4 0
HOT 4 2 2 1
MILD 6 2 4 0.918295834

HUMIDITY 0.370506501

HIGH 7 4 3 0.985228136
NORMAL 7 0 7 0

WINDY 0.005977711

FALSE 8 2 6 0.811278124
TRUE 6 2 4 0.918295834
Rumus Entropy

Nilai Keputusan A Nilai Keputusan A Nilai Keputusan B Nilai Keputusan B


X LOG 2 X LOG 2
Jumlah Kasus Jumlah Kasus Jumlah Kasus Jumlah Kasus

Rumus Gain

Jumlah Kasus A X Entropy Keputusan A Jumlah Kasus B X Entropy Keputusan B


Entopy Total Total Kasus Total Kasus
4 4 10 10
𝑬𝒏𝒕𝒓𝒐𝒑𝒚 𝑻𝒐𝒕𝒂𝒍 = (− ∗𝐿𝑜𝑔2 ( )) + (− ∗𝐿𝑜𝑔2 ( ))
14 14 14 14
Entropy (Total) = 0.863120569

Sementara itu, nilai Gain pada pada baris OUTLOOK dihitung dengan
menggunakan persamaan 1 sebagai berikut.

Gain(Total, Outlook)=Entropy (Total)-

Gain(Total, Outlook)=0.863120569-((414*0.723+(-514*0.97))
Gain(Total,Outlook)=0,23
4 4 10 10
𝑬𝒏𝒕𝒓𝒐𝒑𝒚 𝑻𝒐𝒕𝒂𝒍 = (− ∗𝐿𝑜𝑔2 ( )) + (− ∗𝐿𝑜𝑔2 ( ))
14 14 14 14
Entropy (Total) = 0.863120569

Sementara itu, nilai Gain pada pada baris OUTLOOK dihitung dengan
menggunakan persamaan 1 sebagai berikut.

Gain(Total, Outlook)=Entropy (Total)-

Gain(Total, Outlook)=0.863120569-((414*0.723+(-514*0.97))
Gain(Total,Outlook)=0,23
Dari hasil pada tabel 2.2 dapat diketahui bahwa atribut dengan gain tertinggi adalah
HUMIDITY, yaitu sebesar 0.37. dengan demikian, HUMIDITY dapat menjadi node akar. Ada
dua nilai atribut dari HUMIDITY, yaitu HIGHT dan NORMAL. Dari kedua nilai atribut
tersebut, nilai atribut NORMAL sudah mengklasifikasikan kasus menjadi 1, yaitu
keputusannya Yes, sehingga tidak perlu dilakukan penghitungan lebih lanjut, tetapi untuk
nilai atribut HIGH masih perlu dilakukan perhitungan lagi

1
Humidity

1.1
?
Yes
Menghitung jumlah kasus, jumlah kasus untuk keputusan Yes, jumlah kasus untuk
keputusan No, dan entropynya dari semua kasus dan kasus yang dibagi berdasarkan
atribut OUTLOK, TEMPERATURE, dan WINDY yang dapat menjadi node akar dari nilai
atribut HIGH, setelah itu, lakukan penghitungan Gain untuk tiap-tiap atribut hasil
perhitungan ditunjukan oleh tabel
Jml Kasus Tidak Ya
Node Entropy Gain
(S) (S1) (S2)
1 HUMIDITY- HIGH 7 4 3 0.985228136
OUTLOOK 0.69951385
CLOUDY 2 0 2 0
RAINY 2 1 1 1
SUNNY 3 3 0 0
TEMPERATURE 0.020244207
COOL 0 0 0 0
HOT 3 2 1 0.918295834
MILD 4 2 2 1
WINDY 0.020244207
FASE 4 2 2 1
TRUE 3 2 1 0.918295834
Dari hasil pada tabel di atas dapat diketahui bahwa atribut dengan Gain tertinggi adalah
OUTLOOK, yaitu sebesar 0.67. dengan demikian OUTLOOK dapat menjadi node cabang dari
nilai atribut HIGH. Ada tiga nilai atribut tersebut, nilai atribut CLOUDY sudah
mengklasifikasikan kasus menjadi 1, yaitu keputusannya Yes dan nilai atribut SUNNY sudah
mengklasifikasikan kasus menjadi satu dengan keputusan No. sehingga tidak perlu
dilakukan perhitungan lebih lanjut, tetapi untuk nilai atribut RAINY masih perlu dilkukan
perhitungan lagi.
Pohon keputusan yang terbentuk sampai tahap ini ditunjukkan pada Gambar Berikut ini:
1
Humidity

Yes
1.1
Outlook

Yes 1.1.2 No
Menghitung jumlah kasus, jumlah kasus untuk keputusan Yes, jumlah kasus untuk
keputusan No, dan entropy dari semua kasus dan kasus yang dibagi berdasarkan atribut
TEMPERATURE dan WINDY yang dapat menjadi node cabang dari nilai atribut RAINY.
Setelah itu, lakukan penghitungan Gain untuk tiap-tiap atribut. Hasil perhitungan
ditunjukan oleh tabel di bawah ini

Dari hasil tabel 2.4 dapat diketahui bahwa atribut dengan Gain tertinggi adalah WINDY,
yaitu sebesar 1. Dengan demikian, WINDY dapat menjadi node cabang dari nilai atribut
RAINY. Ada dua nilai atribut dari WINDY, yaitu FALSE dan True. Dari kedua nilai atribut
tersebut, nilai atribut FALSE sudah mengklasifikasikan kasus menjadi 1, yaitu keputusan Yes
dan nilai atribut True sudah mengklasifikasikan kasus menjadi satu dengan keputusan No,
sehingga tidak perlu dilakukan perhitungan lebih lanjut nilai atribut ini.
Jml Kasus Tidak Ya
Node Entropy Gain
(S) (S1) (S2)

1 HUMIDITY- HIGH dan


OUTLOOK- RAINY 2 1 1 1
TEMPERATURE 0
COOL 0 0 0 0
HOT 0 0 0 0
MILD 2 1 1 1
WINDY 1
FALSE 1 0 1 0
TRUE 1 1 0 0
1
Humidity

1.1 Yes
Outlook

Yes No
1.1.2
Windy

Yes No

You might also like