Data
Tabel Keputusan untuk “Play Tennis”
Penyelesaian :
Kita akan menghitung jumlah kasus, jumlah kasus untuk keputusan Yes, jumlah kasus untuk keputusan No, dan Entropy dari semua kasus dan kasus yang dibagi berdasarkan TEMPERATUR, HUMIDITY, dan WINDY.
Lalu lakukan perhitugnan Gain untuk setiap atribut. Namun hitung dahulu Entropy untuk setiap kasus :
Rumus Entropy :
Keterangan :
S : Himpunan
kasus
A : Fitur
N : Jumlah partisi S
pi : Proporsi dari Si terhadap S
Baris total kolom Entropy dengan persamaan berikut :
Baris total kolom Entropy dengan persamaan berikut :
Rumus Gain :
Keterangan :
S : Himpunan kasus
A : Atribut
N : Jumlah partisi atribut A
[Si] : Jumlah kasus pada partisi ke-i
[S] : Jumlah kasus pada S
Nilai Gain pada baris OUTLOOK dihitung dengan persamaan berikut : Dan perhitungan untuk TEMPERATUR, HUMIDITY, dan WINDY, sama seperti di atas. Maka akan seperti yang ada pada tabel dibawah.
Tabel Perhitungan Node 1
Node
|
Jml
Kasus (S)
|
Tidak
(S1)
|
Ya
(S2)
|
Entropy
|
Gain
|
||
1
|
TOTAL
|
14
|
4
|
10
|
0.8631205
|
||
OUTLOOK
|
0.2585210
|
||||||
Cloudy
|
4
|
0
|
4
|
||||
Rainy
|
5
|
1
|
4
|
0.721928
|
|||
Sunny
|
5
|
3
|
2
|
0.970950
|
|||
TEMPERATURE
|
0.1838509
|
||||||
Cool
|
4
|
0
|
4
|
0
|
|||
Hot
|
4
|
2
|
2
|
1
|
|||
Mild
|
6
|
2
|
4
|
0.9182958
|
|||
HUMADITY
|
0.3705065
|
||||||
High
|
7
|
4
|
3
|
0.9852281
|
|||
Normal
|
7
|
0
|
7
|
0
|
|||
WINDY
|
0.0059777
|
||||||
False
|
8
|
2
|
6
|
0.8112781
|
|||
True
|
6
|
4
|
2
|
0.9182958
|
Dari tabel diatas dapat diketahui bahwa atribut dengan Gain tertinggi adalah HUMADITY, yaitu sebesar 0.37. Maka HUMADITY yang menjadi node akar.
Ada dua nilai atribut dari HUMADITY,
yaitu HIGH dan NORMAL. Dari kedua atribut, nilai atribut NORMAL adalah 1, yaitu keputusan Yes, sehingga tidak perlu perhitungan lebih
lanjut, tetapi untuk HIGH masih perlu
dilakukan perhitungan lagi.
Dari hasil tabel tersebut dapat digambarkan pohon keputusan sementara seperti
berikut :
Langkah selanjutnya yaitu, menghitung jumlah kasus, jumlah kasus untuk keputusan Yes, jumglah kasus utuk keputusan No, dan Entropy dari semua kasus dan kasus yang dibagi berdasarkan atribut OUTLOOK, TEMPERATURE, dan WINDY yang dapat menjadi node akar dari nilai atribut HIGH. Kemudian lakukan perhitungan Gain untuk tiap-tiap atribut.
Node
|
Jml Kasus
(S)
|
Tidak (S1)
|
Ya (S2)
|
Entropy
|
Gain
|
||
1.1
|
TOTAL
|
7
|
4
|
3
|
0.9852281
|
||
OUTLOOK
|
0.69951385
|
||||||
Cloudy
|
2
|
0
|
2
|
0
|
|||
Rainy
|
2
|
1
|
1
|
1
|
|||
Sunny
|
3
|
3
|
0
|
0
|
|||
TEMPERATURE
|
0.02024420
|
||||||
Cool
|
0
|
0
|
0
|
0
|
|||
Hot
|
4
|
2
|
1
|
0.9182958
|
|||
Mild
|
3
|
2
|
2
|
1
|
|||
WINDY
|
0.02024420
|
||||||
False
|
4
|
2
|
2
|
1
|
|||
True
|
3
|
2
|
1
|
0.9182958
|
Dari hasil tabel diatas
dapat diketahui bahwa atribut dengan Gain
tertinggi adalah OUTLOOK, yaitu
sebesar 0.7. Jadi OUTLOOK dapat
menjadi node cabang dari nilai atribut HIGH.
Ada tiga nilai atribut dati OUTLOOK, yaitu
CLOUDY, RAINY dan SUNNY. Dari ketiga nilai atribut
tersebut, nilai atribut CLOUDY adalah
1, yaitu keputusannya Yes dan nilai
atribut SUNNY menjadi keputusan No, sehingga tidak perlu dilakukan
perhitungan lebih lanjut, tetapi nilai atribut RAINY masih perlu dilakukan perhitungan lagi.
Pohon keputusan yang terbentuk sampai tahap
ini adalah terlihat pada gambar berikut :
Kemudian menghitung jumlah
kasus, jumlah kasus untuk keputusan Yes,
jumlah kasus untuk keputusan No, dan Entropy dari semua kasus dan kasus yang
dibagi berdasarkan atribut TEMPERATURE dan
WINDY yang dapat menjadi Node cabang dari nilai atribut RAINY. Kemudian lakukan perhitungan Gain untuk tiap-tiap atribut. Hasil
perhitungan seperti yang terdapat pada tabel dibawah :
Node
|
Jml
Kasus (S)
|
Tidak
(S1)
|
Ya
(S2)
|
Entropy
|
Gain
|
||
1.1.2
|
HUMADITY-
HIGH dan
OUTLOOK- RAINY
|
2
|
1
|
1
|
1
|
||
TEMPERATURE
|
0
|
||||||
Cool
|
0
|
0
|
0
|
0
|
|||
Hot
|
0
|
0
|
0
|
0
|
|||
Mild
|
2
|
1
|
1
|
1
|
|||
WINDY
|
1
|
||||||
False
|
1
|
0
|
1
|
0
|
|||
True
|
1
|
1
|
0
|
0
|
Dari hasil tabel diatas dapat diketahui bahwa atribut dengan Gain tertinggi adalah WINDY, yaitu sebesar 1. Jadi WINDY dapat menjadi node cabang dari nilai atribut RAINY.
Ada dua nilai atribut dari WINDY, yaitu
FALSE dan TRUE. Dari kedua nilai atribut tersebut, nilai atribut FALSE adalah 1, yaitu keputusannya Yes dan nilai atribut TRUE menjadi keputusan No, sehingga tidak perlu dilakukan
perhitungan lebih lanjut untuk nilai atribut ini.
Pohon keputusan yang terbentuk sampai tahap ini adalah terlihat pada gambar berikut :
Pohon keputusan yang terbentuk sampai tahap ini adalah terlihat pada gambar berikut :












0 komentar:
Posting Komentar