Skip to content Skip to sidebar Skip to footer

Cara Menghitung Algoritma C4.5 Atribut Data Numerik atau Kontinu


Assalamualaikum Wr. Wb. Salam Sejahtera dan Salam Budaya.

Seperti yang sudah pernah saya bahas sebelumnya, mengenai perhitungan algoritma C4.5 menggunakan Excel, terdapat juga cara menghitung Entropy dengan cepat. Tapi data yang gunakan sebagai contoh adalah dengan data yang memiliki atribut diskrit atau kategorik. Namun seiring dengan berjalannya waktu, banyak juga teman-teman yang kebingungan apabila data yang digunakan adalah atribut bertipe numerik.

Nah, pada artikel ini akan tertuliskan cara menghitung algoritma C4.5  pada atribut data numerik menggunakan rumus excel.

Seperti yang sudah tertuliskan di bab analisis algoritma C4.5  sudah dijelaskan ada beberapa tahapan untuk proses perhitungannya yang meliputi ;

  1. Menentukan Nilai Entropy dari total jumlah dataset
  2. Menentukan Jumlah dan nilai Entropy dari masing-masing atribut berdasarkan label kelasnya
  3. Dan menentukan kriteria seperti Gain, Spilt Info, Gain Ratio atau juga bisa dengan menggunakan Indexs Gini
Namun dari beberapa kriteria yang sering digunakan adalah dengan menentukan nilai Gain dari setiap atributntya.

Penyelesaian Atribut Numerik

Nah, untuk menyelesaikan permasalahan yang kerap kali muncul adalah kebingungan menghitung nilai Entropy pada atribut data yang bertipe numerik. Berdasarkan pengalaman yang pernah saya lalui, akhirnya menemukan solusi yang bisa di bilang tepat. Berikut tahapannya ;

  1. Lakukan pemecahan nilai numerik dengan mengambil nilai value terbaik pada nilai gain terbesar. Pemecahan nilai tersebut dapat dengan mengambil nilai rata-rata dan nilai Median. 
Dataset

Tabel diatas adalah contoh sebuah set data yang bertipe numerik dan sudah ditentukan nilai rata-rata nya dan nilai Median.

Median adalah nilai tengah yang berfungsi untuk ukuran pemusatan data, cara kerja dari menentukan nilai median adalah dengan mengurutkan data dari angka terkecil hingga terbesar kemudian diambil lah nilai tengahnya. Nah untuk menentukan nilai Median dan rata-rata di excel adalah dengan menggunakan dua rumus yaitu
  1. =AVERAGE (blok cell / kolom yang akan ditentukan nilai reratanya )
  2. =MEDIAN (blok cell / kolom yang akan ditentukan nilai mediannya )
Setelah sudah ditentukan kedua nilai tersebut, maka selanjutnya adalah menghitung nilai Entropy dan Gain. Untuk menghitung kedua nilai itu dengan menggunakan Excel kamu bisa melihatnya di sini 👇


Setelah sudah melakukan perhitungan dan menentukan nilai Entropy dan Gain. Kemudian ambil value atribut yang memiliki nilai gain terbesar.

Tabel Perhitungan Entropy

Jika kamu lihat gambar tabel diatas, pada atribut IPS S3 dengan dua pemecahan antara nilai 2.94 dan 3.05, setelah itu ditentukanlah nilai Entropy dan Gain. Hasilnya adalah atribut dengan kriteria nilai 3.05 yang memiliki nilai Gain terbesar. Maka atribut itulah yang akan di jadikan sebagai atributnya. Kamu juga bisa lihat pada cell / kolom bewarna biru diatas.

Selanjutnya lakukan cara-cara itu pada atribut numerik lainnya. Metode ini saya dapatkan dari dosen pembimbing sewaktu saat masih menyelesaikan skripsi dulu. Tahapan ini juga sama dengan tahapan yang sudah dijelaskan pada buku yang berjudul "Data Mining, Mengolah Data Menjadi Informasi Menggunakan Matlab" penulis Eko Prasetyo. Namun didalam buku ini tidak dijelaskan cara mengambil nilai yang digunakan pada pemecahan nilai value.

Nah itulah cara penyelesain masalah pada kasus atribut data numerik pada proses perhitungan Algoritma C4.5 dan jika kamu ingin belajar lebih dalam lagi, kamu bisa mendapatkan file excelnya.

Download Now
  • File Excel ini berisikan 8 sheet perhitungan dari 3 algoritma
  • Naive Bayes (atribut numerik, deskrit, campuran), k-NN (atribut numerik, campuran ), C4.5 (numerik, deskrit)
  • Harga File Rp. 75.000, -
  • Jika Custom Data pada semua algoritma Rp. 150.000,-
  • Jika Custom Data pada satu Algoritma Rp. 85.000,-
  • Bonus perhitungan Confusion Matrix.
  • File Excel untuk Satu Agoritma saja Rp. 25.000,-
Bisa menghubungi Admin di menu Contact yang terletak di footer bawah.

Oke, sekian dan Terimakasih sudah berkunjung serta semoga bermanfaat dan bisa memberikan pengalaman yang edukasi buat kamu. Satu kata "Jangan Lupa Bernafas dan Tetap Bersyukur"
See You