Cara Menghitung Confusion Matrix 4 Kelas
Cara Menghitung Confusion Matrix untuk Lebih dari Dua Kelas
Assalamualaikum Wr. Wb. Salam sejahtera untuk kita semua.
Pertanyaan ini kerap muncul saat kita mulai menerapkan metode klasifikasi dalam proses pengolahan data menjadi informasi. Berdasarkan pengalaman saya, sebagian besar referensi atau buku yang kita temui lebih sering membahas perhitungan Confusion Matrix hanya untuk kasus dua kelas.
Lalu, bagaimana jika data penelitian kita menghasilkan lebih dari dua kelas? Misalnya, ada empat kelas yang harus kita evaluasi.
Tenang, pada kesempatan ini saya akan berbagi cara menghitung metrik evaluasi seperti Precision, Recall, Accuracy, dan Specificity untuk skenario multi-kelas. Tapi sebelumnya, pastikan teman-teman sudah memahami terlebih dahulu konsep dasar dari Confusion Matrix.
Baca Juga : Konsep Dasar Menghitung Mengggunakan Confusion Marix1. Menghitung Akurasi
Akurasi adalah persentase dari total data yang diidentifikasi dan dinilai benarMemahami True Positive (TP) dan Perhitungan Akurasi
Perhatikan tabel di atas. Di dalamnya terdapat tiga warna berbeda yang menunjukkan klasifikasi: warna hijau menandakan prediksi kelas yang benar (True Positive), sedangkan tabel berwarna biru merepresentasikan kelas aktual.
Apa itu True Positive (TP)?
TP atau True Positive adalah kondisi di mana sebuah kelas aktual berhasil diprediksi dengan benar. Artinya, sistem klasifikasi kita mengenali data tersebut secara tepat sesuai dengan label aslinya.
Nilai TP sangat berguna dalam menghitung metrik evaluasi seperti akurasi.
Letak TP pada Tabel
TP dapat ditemukan pada sel-sel berwarna hijau di kolom yang sesuai, yang menunjukkan prediksi tepat terhadap kelas aktual.
Akurasi = TP / Total Dataset
Akurasi = 2 + 5 + 5 + 6 / 24
Akurasi = 0.66 *
Akurasi = 2 + 5 + 5 + 6 / 24
Akurasi = 0.66 *
2. Menghitung Presisi (Precission)
presisi adalah Data yang diambil berdasarkan informasi yang kurang atau salah atau tidak tepat.Nah, perhatikan tabel diatas, terdapat berbagai warna macam pelangi pula. Formula Presisi adalah
Precision = TP/(TP+FP). Poin nomor satu kita sudah mendapatkan nilai TP Nah selanjutnya adalah kita harus mecari nilai FP (false positive).
pada tahap kali ini, kita akan mencari nilai FP dari masing-masing kelas. perhatikan warna tulisan dibawah ini dan kolom ditabel atas
FP(A) = 4 FP (B) = 0 FP (C) = 2 FP (D) = 0
setelah sudah menemukan masing-masing nilai FP, selanjutnya kalian hitung presisi tersebut juga dari masing-masing kelas
Precision = TP/(TP+FP) P(A) = 2 /(2+4) = 0.33 P(B) = 5 /(5+0) =1
P(C) = 5 /(5+2) = 0.71 P(D) = 6/(6+0) = 1
selanjutnya kalian jumlah semua hasil rata-rata tersebut dibagi jumlah kelas.
All Precision = P(A)+P(B)+P(C)+P(D) / Jumlah Kelas
Precision = 0.33 + 1 + 0.71 +1 / 4 = 0.76 *
Baca Juga : Menghitung Root Mean Squae Error (RMSE)
2. Menghitung Recall (Sensitivity)
Recall Adalah data yang tidak mampu diprediksi dengan benar.Nah, perhatikan tabel diatas, terdapat berbagai warna macam pelangi pula. Formula Recall adalah
Recall = TP/(TP+FN). Oke, Nilai TP sudah ketemu, FP juga sudah bisa kita temukan, lah bagaimana dengan FN ?
hampir sama juga langah poin nomor 2, kita cari dulu nilai FN dari masing-masing kelas.
dibawah ini perhatikan warna tulisan dan kolom yang ada ditabel atas ini.
FN(A) = 1 FN(B) = 4 FN (C) = 1 FN (D) = 0
nilai-nilai diatas didapatkan dari total sesuai warnanya. Setelah sudah menemukan masing-masing nilai FN, selanjutnya kalian hitung Recall tersebut juga dari masing-masing kelasnya.
Recall = TP/(TP+FN) R(A) = 2 /(2+1) = 0.66 R(B) = 5 /(5+4) =0.55
R(C) = 5 /(5+1) = 0.83 R(D) = 6/(6+0) =1
selanjutnya kalian jumlah semua hasil rata-rata tersebut dibagi jumlah kelas.
All Recall = R(A)+R(B)+R(C)+R(D) / Jumlah Kelas
Recall = 0.66 + 0.55 + 0.83 + 1 / 4 = 0.80 *
Nah, teman-teman itulah sedikit pengalaman admin tentang cara menghitung confusion matrix pada kasus lebih dari 4 kelas. Dan sebenarnya pada Konsep Dasar Menghitung Mengggunakan Confusion Marix masih ada tahap untuk menghitung Specificity dan AUC.
Terimakasih, semoga informasi ini bisa bermanfaat, apabila kamu berkenan bisa bantu donasi untuk pengembangan blog yang saya bangun melalui link ini https://saweria.co/MuizKhal .
Tapi teman-teman tak usah kawatir, jika memang masih belum memahami cara diatas simak juga penjelasan versi vidio, cek link dibawah :
oke terimakasih sudah mampir dan percaya pada materi yang saya berikan. Semoga Bermanfaat. Satu Kata "TETAP BERSYUKUR DAN JANGAN LUPA BERNAPAS".
See YOU.
Reference. Sumber Pustaka.
Romi Satria Wahono, N. S. (2014). A Comparison Framework of Classification Models. Advanced Science Letters, 20 (10-12) 1945-1950.
Preasetyo, E. (2014). Data Mining Mengolah Data Menjadi Informasi menggunakan Matlab. Yogyakarta: Andi .
Budi Santosa, A. U. (2018). Data Mining dan Big Data Analytics. Yogyakarta: Penebar Media Pustaka.