Rumus Euclidean Distance: Cara Menghitung Jarak Antar Data
Hello Kaum Berotak! Apakah kamu sedang belajar tentang data science atau machine learning? Jika iya, pasti kamu sudah tidak asing lagi dengan istilah Euclidean Distance. Rumus ini sangat penting dalam mengukur jarak antara dua data pada ruang multidimensi. Nah, dalam artikel kali ini, kita akan membahas lebih dalam tentang rumus Euclidean Distance dan bagaimana cara menggunakannya.
Apa itu Euclidean Distance?
Euclidean Distance merupakan sebuah metode untuk mengukur jarak antara dua titik dalam sebuah ruang. Metode ini didasarkan pada Teorema Pythagoras, yaitu rumus untuk menghitung panjang sisi miring segitiga siku-siku. Dalam konteks data science, Euclidean Distance digunakan untuk menghitung jarak antara dua data pada ruang multidimensi. Jarak ini bisa dihitung dalam berbagai dimensi, seperti dua dimensi, tiga dimensi, atau bahkan dimensi yang lebih tinggi.
Bagaimana Cara Menghitung Euclidean Distance?
Untuk menghitung Euclidean Distance, kamu perlu mengetahui koordinat dari kedua titik yang akan diukur jaraknya. Misalnya, kita memiliki dua titik A dan B dengan koordinat (x1, y1) dan (x2, y2). Maka, Euclidean Distance antara titik A dan B dapat dihitung menggunakan rumus berikut:
d = sqrt((x2 – x1)2 + (y2 – y1)2)
Di mana sqrt adalah simbol untuk square root atau akar kuadrat.
Contoh: Jika titik A memiliki koordinat (2, 3) dan titik B memiliki koordinat (5, 7), maka Euclidean Distance antara titik A dan B dapat dihitung sebagai berikut:
d = sqrt((5 – 2)2 + (7 – 3)2) = sqrt(9 + 16) = sqrt(25) = 5
Artinya, jarak antara titik A dan B adalah 5 satuan.
Bagaimana Euclidean Distance Digunakan dalam Machine Learning?
Euclidean Distance sangat berguna dalam machine learning karena bisa digunakan untuk membandingkan data antara satu sama lain. Misalnya, kita memiliki sebuah dataset yang berisi beberapa data pelanggan toko online. Kita ingin mengelompokkan data tersebut menjadi beberapa kategori berdasarkan kesamaan karakteristik. Salah satu cara yang bisa dilakukan adalah dengan menghitung jarak Euclidean Distance antara setiap data pelanggan. Data yang memiliki jarak Euclidean Distance yang lebih dekat kemungkinan lebih mirip satu sama lain dan bisa dikelompokkan ke dalam satu kategori.
Bagaimana Cara Menghitung Euclidean Distance pada Data Multidimensi?
Euclidean Distance tidak hanya bisa digunakan pada data dua dimensi. Metode ini juga bisa digunakan pada data multidimensi yang memiliki lebih dari dua atribut. Misalnya, kita memiliki sebuah dataset yang berisi data pelanggan toko online dengan atribut harga, kualitas produk, dan jumlah pembelian. Kita ingin menghitung jarak antara dua data pelanggan berdasarkan ketiga atribut tersebut.
Untuk menghitung Euclidean Distance pada data multidimensi, kita perlu menghitung jarak antara masing-masing atribut terlebih dahulu. Misalnya, jika kita ingin mengukur jarak antara dua data pelanggan A dan B, maka kita perlu menghitung jarak antara harga, kualitas produk, dan jumlah pembelian masing-masing. Setelah itu, kita bisa menjumlahkan jarak antara setiap atribut untuk mendapatkan jarak total antara dua data tersebut.
Contoh Penggunaan Euclidean Distance pada Data Multidimensi
Supaya lebih jelas, berikut ini adalah contoh penggunaan Euclidean Distance pada data pelanggan toko online dengan tiga atribut harga, kualitas produk, dan jumlah pembelian:
Pelanggan | Harga | Kualitas Produk | Jumlah Pembelian |
---|---|---|---|
A | 100.000 | 8 | 5 |
B | 120.000 | 7 | 7 |
C | 150.000 | 9 | 3 |
Kita ingin mengukur jarak antara pelanggan A dan B berdasarkan ketiga atribut tersebut. Pertama, kita perlu menghitung jarak antara harga:
dharga = sqrt((120.000 – 100.000)2) = 20.000
Artinya, jarak antara harga produk yang dibeli oleh pelanggan A dan B adalah 20.000 rupiah.
Selanjutnya, kita perlu menghitung jarak antara kualitas produk:
dkualitas = sqrt((7 – 8)2) = 1
Artinya, jarak antara kualitas produk yang dibeli oleh pelanggan A dan B adalah 1 satuan.
Terakhir, kita perlu menghitung jarak antara jumlah pembelian:
dpembelian = sqrt((7 – 5)2) = 2
Artinya, jarak antara jumlah pembelian yang dilakukan oleh pelanggan A dan B adalah 2 satuan.
Jarak total antara pelanggan A dan B dapat dihitung dengan menjumlahkan jarak antara setiap atribut:
dtotal = sqrt(dharga2 + dkualitas2 + dpembelian2) = sqrt(20.0002 + 12 + 22) = sqrt(400.005) = 632,45
Artinya, jarak total antara pelanggan A dan B adalah sekitar 632,45 satuan.
Kesimpulan
Rumus Euclidean Distance sangat penting dalam data science dan machine learning karena bisa digunakan untuk mengukur jarak antara dua data pada ruang multidimensi. Metode ini didasarkan pada Teorema Pythagoras dan bisa digunakan pada data dengan berbagai dimensi. Dalam machine learning, Euclidean Distance bisa digunakan untuk membandingkan data antara satu sama lain dan mengelompokkan data ke dalam kategori tertentu. Untuk menghitung Euclidean Distance pada data multidimensi, kita perlu menghitung jarak antara setiap atribut terlebih dahulu dan menjumlahkannya untuk mendapatkan jarak total antara dua data tersebut.
Sekian artikel tentang Euclidean Distance kali ini. Semoga bisa bermanfaat bagi kamu yang sedang belajar data science atau machine learning. Sampai jumpa kembali di artikel menarik lainnya!