Skip to content Skip to sidebar Skip to footer

Tahapan Dasar Algoritma kNN (k-Nearest Neighbor)

Algoritma k-NN

Assalamualikum Wr. Wb, Salam Budaya dan Salam Sejahtera

    Pada pembahasan ini saya akan memberikan kalian pengalaman yang beredukasi mengenai apa itu algoritma k-NN atau k-Nearest Neighbor ? 

    Algoritma k-NN adalah salah satu dari beberapa algoritma klasifikasi dalam model prediktif di dalam ilmu data mining atau data science. Algoritma ini juga termasuk bagian dari pembelajaran machine learning dalam kategori supervised learning dimana hasil dari query instance yang baru diklasifikasikan berdasarkan mayoritas dari kategori pada k-NN. 

    Tujuan dari dari algoritma k-NN adalah mengklasifikasikan objek baru berdasarkan atribut dan set data latih. Metode dari k-NN adalah mengambil nilai terbanyak dari beberapa hasil dari nilai k objek. 

Kelebihan Algoritma k-NN atau k-Nearest Neighbor diantaranya seperti
  1. Perhitungannya Sederhana
  2. Komputasinya Rendah
  3. Algoritma Mudah dipelajari
  4. Tahan terhadap derau
  5. Efektif jika set data latih yang digunakan sangat besar.
Dalam beberapa penelitian dewasa ini, algoritma k-NN juga bisa dibuktikan memiliki kinerja lebih baik dari algoritma klasifikasi lainnya seperti dalam keluarga algoritma decision tree.

Flow Chart  Algoritma k-NN
Diagaram Flow Proses k-NN

Tahapan Algoritma k-NN

  • Tahapan pertama adalah memasukkan nilai k, sedangkan nilai k minimalnya adalah 1 dan maksimalnya adalah jumlah set data latih
  • Kedua, adalah melakukan normalisasi untuk semua pola set data latih ataupun set data uji. Hal ini bertujuan supaya rentang keseluruhan nilai pola memiliki rentang nilai yang sama, antara 0 sampai 1. Perhitungan normalisasi yang digunakan adalah metode min-max. 
    • datax adalah data yang akan dihitung normalisasinya yang diambil berdasarkan kolom datanya.
    • datamin adalah data terkecil di kolom yang sama
    • datamax adalah data terbesar di kolom yang sama dengan data yang akan dinormalisasi.
  • Tahap ketiga adalah menghitung jaraj Euclidean yang akan disimbolkan sebagai deuclidean (x,y).
    • dimana i adalah banyaknya set data dan x adalah jumlah set data uji, sedangkan y adalah set data latih.
  • Tahap selanjutnya adalah lakukan voting atau pemilihan dari jarak euclidean terkecil yang masuk peringkat sejumlah nilai k.
  • Langkah terakhir adalah menentukan hasil klasifikasi berdasarkan tahap keempat yang terbanyak.

Model Evaluasi

    Algoritma k-NN adalah satu rumpun dengan algoritma Naive Bayes, Decision Tree, dan  beberapa algoritma klasifikasi yang termasuk dalam metode supervised learning. Model evaluasi yang digunakan pada algoritma ini adalah menentukan nilai Accuracy, Precission,dan Recall. Dengan tahapan yang sama yaitu dengan menggunakan metode Tabel Confusion Matrix.

Confusion Matrix

Demikian Terimakasih sudah percaya dan mau berkunjung semoga bermanfaat dan saya sampaikan satu kata " Jangan Lupa Bernafas dan Tetap Bersyukur".

See You, & Wassalamualikum Wr. Wb


Sumber Referensi

Kartika, J. I., Santoso, E., & Sutrisno. (2017). Penentuan Siswa Berprestasi Menggunakan Metode K-Nearest Neighbor dan Weighted Product (Studi Kasus : SMP Negeri 3 Mejayan). Pengembangan Teknologi Informasi dan Ilmu Komputer, 352-360.

S. Mutrofin, A. Mu'alif, R. V. H. Ginardi and C. Fatichah, "Solution of class imbalance of k-nearest neighbor for data of new student admission selection," International Journal Of Artificial Intelegence Research, vol. 3, no. 2, pp. 47-55, 2019.

S. Mutrofin, A. Izzah, A. Kurniawardhani and M. Masrur, "Optimasi teknik klasifikasi modified k nearest neighbor menggunakan algoritma genetika," Jurnal Gamma, vol. 10, no. 1, 2015.