Tahapan Dasar Algoritma kNN (k-Nearest Neighbor)

Assalamualaikum Wr. Wb, Salam Budaya, dan Salam Sejahtera untuk kita semua.

Di kesempatan kali ini, saya ingin berbagi sedikit pengetahuan yang semoga bermanfaat, yaitu tentang apa itu algoritma k-NN atau k-Nearest Neighbor dalam dunia data mining dan data science.

Singkatnya, k-NN merupakan salah satu algoritma klasifikasi yang cukup populer dan sering digunakan dalam model prediktif. Algoritma ini termasuk ke dalam kategori supervised learning dalam machine learning, yang artinya ia belajar dari data latih (training data) untuk kemudian memprediksi data baru berdasarkan kemiripan.

Bagaimana Cara Kerja k-NN?

Konsep kerjanya cukup sederhana: ketika ada data baru yang ingin diklasifikasikan, k-NN akan melihat sejumlah k tetangga terdekat (nearest neighbors) dari data tersebut. Kemudian, hasil klasifikasi ditentukan berdasarkan mayoritas dari kelas tetangga-tetangga itu.

Jadi secara garis besar, k-NN akan menempatkan objek baru ke dalam kategori tertentu dengan melihat objek-objek yang paling mirip dengannya di dalam data latih.

Tujuan Penggunaan k-NN

Tujuan utama dari penggunaan algoritma ini adalah untuk mengklasifikasikan objek/data baru berdasarkan atribut atau ciri-ciri yang dimilikinya, dengan bantuan data latih yang sudah ada sebelumnya. Metodenya cukup sederhana tapi ampuh, yakni dengan mengambil keputusan berdasarkan nilai terbanyak (mayoritas) dari tetangga terdekat.

Kelebihan Algoritma k-NN

Beberapa alasan kenapa algoritma ini cukup disukai:

✅ Perhitungannya sederhana dan mudah dipahami
✅ Tidak butuh banyak komputasi kompleks
✅ Cocok untuk pemula yang baru belajar machine learning
✅ Tahan terhadap noise (data yang tidak konsisten)
✅ Efektif saat dataset latih berukuran besar

Menariknya lagi, dalam beberapa penelitian terbaru, performa k-NN bahkan terbukti mampu mengungguli algoritma klasifikasi lain seperti decision tree dalam situasi tertentu.

Diagaram Flow Proses k-NN

Tahapan Algoritma k-NN

Tahapan pertama adalah memasukkan nilai k, sedangkan nilai k minimalnya adalah 1 dan maksimalnya adalah jumlah set data latih

Kedua, adalah melakukan normalisasi untuk semua pola set data latih ataupun set data uji. Hal ini bertujuan supaya rentang keseluruhan nilai pola memiliki rentang nilai yang sama, antara 0 sampai 1. Perhitungan normalisasi yang digunakan adalah metode min-max.

datax adalah data yang akan dihitung normalisasinya yang diambil berdasarkan kolom datanya.

datamin adalah data terkecil di kolom yang sama

datamax adalah data terbesar di kolom yang sama dengan data yang akan dinormalisasi.

Tahap ketiga adalah menghitung jaraj Euclidean yang akan disimbolkan sebagai deuclidean (x,y).

dimana i adalah banyaknya set data dan x adalah jumlah set data uji, sedangkan y adalah set data latih.

Tahap selanjutnya adalah lakukan voting atau pemilihan dari jarak euclidean terkecil yang masuk peringkat sejumlah nilai k.

Langkah terakhir adalah menentukan hasil klasifikasi berdasarkan tahap keempat yang terbanyak.

Model Evaluasi

Algoritma k-NN adalah satu rumpun dengan algoritma Naive Bayes, Decision Tree, dan beberapa algoritma klasifikasi yang termasuk dalam metode supervised learning. Model evaluasi yang digunakan pada algoritma ini adalah menentukan nilai Accuracy, Precission,dan Recall. Dengan tahapan yang sama yaitu dengan menggunakan metode Tabel Confusion Matrix.

Demikian Terimakasih sudah percaya dan mau berkunjung semoga bermanfaat dan saya sampaikan satu kata " Jangan Lupa Bernafas dan Tetap Bersyukur". See You, & Wassalamualikum Wr. Wb

Sumber Referensi

Kartika, J. I., Santoso, E., & Sutrisno. (2017). Penentuan Siswa Berprestasi Menggunakan Metode K-Nearest Neighbor dan Weighted Product (Studi Kasus : SMP Negeri 3 Mejayan). Pengembangan Teknologi Informasi dan Ilmu Komputer, 352-360.

S. Mutrofin, A. Mu'alif, R. V. H. Ginardi and C. Fatichah, "Solution of class imbalance of k-nearest neighbor for data of new student admission selection," International Journal Of Artificial Intelegence Research, vol. 3, no. 2, pp. 47-55, 2019.

S. Mutrofin, A. Izzah, A. Kurniawardhani and M. Masrur, "Optimasi teknik klasifikasi modified k nearest neighbor menggunakan algoritma genetika," Jurnal Gamma, vol. 10, no. 1, 2015.

Pengalaman Edukasi

Tahapan Dasar Algoritma kNN (k-Nearest Neighbor)