Rumus KNN – Mengenal Teknik Klasifikasi yang Mudah Dipahami
Hello Kaum Berotak! Apakah kamu sedang mencari teknik klasifikasi yang mudah dipahami? Jika iya, maka kamu berada di tempat yang tepat. Kali ini, kita akan membahas tentang salah satu teknik klasifikasi yang sangat populer, yaitu K-Nearest Neighbor (KNN).
Apa Itu Rumus KNN?
KNN adalah salah satu teknik klasifikasi yang digunakan untuk memprediksi kelas dari suatu data berdasarkan data yang sudah ada sebelumnya. Teknik ini termasuk dalam kategori supervised learning, yang artinya kita sudah memiliki data yang diketahui kelasnya sebelumnya dan kita ingin memprediksi kelas dari data yang belum diketahui.
KNN bekerja dengan cara mencari k-nearest neighbors dari suatu data yang ingin diprediksi kelasnya. KNN mengukur jarak antara data yang ingin diprediksi dengan data yang sudah ada sebelumnya, kemudian memilih k data terdekat untuk menentukan kelas dari data yang ingin diprediksi.
Cara Kerja Rumus KNN
Cara kerja KNN dapat dijelaskan dengan langkah-langkah berikut:
- Pilih nilai k (jumlah data terdekat yang akan dipilih).
- Hitung jarak antara data yang ingin diprediksi dengan data yang sudah ada sebelumnya.
- Pilih k data terdekat berdasarkan jaraknya.
- Tentukan kelas yang paling sering muncul di antara k data terdekat sebagai kelas dari data yang ingin diprediksi.
Contoh penggunaan KNN adalah dalam klasifikasi jenis bunga. Kita memiliki data bunga dengan kelas yang sudah diketahui (misalnya, iris setosa, iris versicolor, dan iris virginica). Kemudian, jika kita memiliki data bunga baru yang belum diketahui kelasnya, kita dapat menggunakan KNN untuk memprediksi kelas dari data tersebut.
Kelebihan dan Kekurangan Rumus KNN
Sebagai salah satu teknik klasifikasi yang populer, KNN memiliki kelebihan dan kekurangan yang perlu diketahui sebelum menggunakannya:
Kelebihan Rumus KNN
- Mudah dipahami dan diimplementasikan.
- Tidak memerlukan parameter yang kompleks.
- Dapat digunakan untuk data yang kompleks dan tidak linear.
Kekurangan Rumus KNN
- Sensitif terhadap nilai k.
- Membutuhkan waktu komputasi yang cukup besar terutama pada data yang besar.
- Tidak efektif pada data yang memiliki dimensi tinggi.
Cara Menggunakan Rumus KNN
Untuk menggunakan KNN, langkah-langkahnya adalah sebagai berikut:
- Pilih nilai k.
- Hitung jarak antara data yang ingin diprediksi dengan data yang sudah ada sebelumnya.
- Pilih k data terdekat berdasarkan jaraknya.
- Tentukan kelas yang paling sering muncul di antara k data terdekat sebagai kelas dari data yang ingin diprediksi.
Untuk menghitung jarak antara data, dapat digunakan beberapa metrik seperti Euclidean distance atau cosine similarity. Selain itu, penting juga untuk melakukan preprocessing pada data seperti normalisasi atau scaling agar hasil yang diperoleh lebih akurat.
Contoh Implementasi Rumus KNN
Berikut adalah contoh implementasi KNN menggunakan Python:
from sklearn.neighbors import KNeighborsClassifier# load iris datasetfrom sklearn.datasets import load_irisiris = load_iris()# split dataset into train and test setfrom sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3, random_state=42)# create KNN classifierknn = KNeighborsClassifier(n_neighbors=5)# fit the model using training dataknn.fit(X_train, y_train)# predict the class of test sety_pred = knn.predict(X_test)# evaluate the modelfrom sklearn.metrics import accuracy_scoreprint('Accuracy:', accuracy_score(y_test, y_pred))
Dalam contoh di atas, kita menggunakan dataset iris dan membaginya menjadi train set dan test set. Kemudian, kita membuat KNN classifier dengan k=5 dan melakukan fitting pada training set. Setelah itu, kita melakukan prediksi pada test set dan menghitung akurasi dari model yang telah dibuat.
Kesimpulan
Rumus KNN merupakan salah satu teknik klasifikasi yang mudah dipahami dan diimplementasikan. Teknik ini dapat digunakan untuk memprediksi kelas dari suatu data berdasarkan data yang sudah ada sebelumnya. Meskipun KNN memiliki kelebihan dan kekurangan, namun teknik ini tetap populer dan sering digunakan dalam pemrosesan data.
Itulah pembahasan singkat tentang rumus KNN. Semoga artikel ini dapat membantu kamu untuk memahami teknik klasifikasi yang satu ini. Jangan lupa untuk berlatih dan terus belajar agar dapat menguasai teknik ini dengan baik. Sampai jumpa kembali di artikel menarik lainnya!