Skip to content Skip to sidebar Skip to footer

Contoh Perhitungan Algoritma C4.5 Dengan Gini Index

Contoh Perhitungan Gini Index pada Algoritma C4.5


Assalamualaikum Wr.Wb - Salam Sejahtera dan Salam Budaya.

Seperti yang di tuliskan pada buku karya Eko Prasetyo tahun 2014, Tertuliskan bahwa algoritma C4.5 merupakan struktur pohon keputusan dimana terdapat simpul yang mendiskripsikan setiap atribut dan setiap cabangnya melukiskan hasil dari atribut yang akan di uji. 

Untuk Algoritma C4.5 sendiri adalah bentuk salah satu perkembangan dari algoritma decision tree. Dimana bentuk dan hasil klasifikasinya berbentuk pohon keputusan yang akan dijadikan hasil dari pengambilan keputusan.

Nah, untuk penentuan pohon keputusan tersebut adalah dengan menggunakan nilai Entropy, Gain Ratio, Gain Info, dan Gini Index seperti yang sudah tertulis di bab analisis algoritma C4.5. Namun pada artikel ini akan tertuliskan bagaiman cara menghitung nilai Gini Index. Adapun dari tahapan menentukan nilai Entropy, dan Gain bisa kamu ketahui dengan membaca artikel dibawah ini ;

Baca Juga : Cara menghitung nilai Entropy Algoritma C4.5 Menggunakann Excel

Untuk menghitung nilai dari Gini Index adalah dengan menggunakan rumus seperti dibawah ini

Rumus Gini Index C4.5
Rumus Gini Index

Dimana C adalah jumlah dari masing-masing atribut dan Pi adalah jumlah atribut dari masing-masing kelas atau labelnya.

=1-(P(kelas1)^2 + P(Kelas2)^2 + P....... untuk semua masing-masing dari atribut.
Mengapa Harus Gini Index ?

Secara umum untuk menghitung algoritma C4.5 adalah dengan menentukan nilai Entropy dan Gain sebagai pemecahan pohon keputusan. Namun untuk Gini Index sendiri juga termasuk dari kriteria perhitungan dari algoritma C4.5. Ada juga beberapa alasan menggunakan kriteria penentuan dari Gini Index ini antara lain

  • Lebih cocok untuk jumlah partisi atau atribut yang lebih besar.
  • Menggunakan proporsi yang di kuadratkan
  • Bisa mengklasifikasikan dengan sempurna, dalam arti lain hasil dari Gini Index akan menjadi nol 
  • Terdistribusi merata seperti penentuan nilai Entropy.

Contoh Perhitungan Gini Index

Tabel Atribut

Pada gambar tabel diatas akan kita tentukan nilai gini index nya, dimana ada atribut Jenis Kelamin dengan jumlah Laki-Laki = 6 dan Perempuan = 4, Dari jumlah set data latih = 10 dimana ada dua label kelas antara lain Tepat = 6 dan Terlambat = 4.

Penyelesaian Gini Index

Gini Index Jenis Kelamin = Laki-Laki
  • 1-((Jumlah Tepat / Jumlah Total Laki-Laki)^2 + (Jumlah Terlambat / Jumlah Total Laki-Laki)^2).
  • 1-((3/6)^2 + (3/6)^2) = 0.5
Gini Index Jenis Kelamin = Perempuan
  •  1-((Jumlah Tepat / Jumlah Total Perempuan)^2 + (Jumlah Terlambat / Jumlah Total Perempuan)^2).
  • 1-((3/4)^2 + (1/4)^2) = 0.375
Nilai Gini Index pada Satu Atribut Jenis Kelamin.
  • (Jumlah Laki-Laki / Jumlah Total*Gini Index Laki-Laki )+ (Jumlah Perempuan / Jumlah Total* Gini Index Perempuan)
  • (6/10 * 0.5) + (4/10 * 0.375) = 0.45 
Contoh Hasil Gini Index
Contoh Hasil Gini Index


Untuk proses selanjutnya adalah lakukan perhitungan yang sama pada atribut-atribut lainnya. Untuk pembentukan pohon keputusan berbeda dengan menggunakan nilai Gain yang mengambil nilai tertinggi nya untuk menentukan akar pohonnya.

Pada penentuan menggunakan Gini Index dengan mengan mencari nilai Indeks Gini yang paling Kecil untuk menentukan akar pohon dan cabang-cabangnya pada pembentukan pohon keputusan

Nah itulah cara penyelesain masalah pada kasus atribut data numerik pada proses perhitungan Algoritma C4.5 dan jika kamu ingin belajar lebih dalam lagi, kamu bisa mendapatkan file excelnya.

Download Now

  • File Excel ini berisikan 8 sheet perhitungan dari 3 algoritma
  • Naive Bayes (atribut numerik, deskrit, campuran), k-NN (atribut numerik, campuran ), C4.5 (numerik, deskrit)
  • Harga File Rp. 85.000, -
  • Jika Custom Data pada satu Algoritma Rp. 150.000,-
  • Bonus perhitungan Confusion Matrix.
  • File Excel untuk Satu Agoritma saja Rp. 30.000,-

    Sekian dan Terimkasih. Semoga bermanfaat dan bisa memberikan pengalam edukasi serta kamu bisa temukan apa yang kamu cari, karena Sistemku adalah Informasimu."Jangan Lupa Bernafas dan Tetaplah Bersykur".

    Wassalamualaikum Wr.Wb - See You Later