Apa perbedaan Minkowski, Euclidean, dan Manhattan Distance?

Perbedaannya terletak pada nilai parameter p, di mana Manhattan menggunakan p=1, Euclidean menggunakan p=2, sedangkan Minkowski adalah bentuk umum yang bisa menyesuaikan nilai p.

Kapan Minkowski Distance digunakan dalam machine learning?

Minkowski Distance digunakan dalam algoritma seperti KNN dan clustering untuk mengukur kedekatan atau kemiripan antar data berdasarkan fitur yang dimiliki.

Mengapa parameter p penting dalam Minkowski Distance?

Parameter p menentukan sensitivitas perhitungan jarak terhadap perbedaan data, sehingga memengaruhi hasil analisis dan akurasi model machine learning.

Apakah Minkowski Distance sensitif terhadap outlier?

Ya, semakin besar nilai p, semakin sensitif metode ini terhadap perbedaan besar atau outlier dalam data.

Minkowski Distance: Rumus, Fungsi, dan Implementasi

Dalam dunia data science dan machine learning, mengukur jarak antar data merupakan konsep fundamental yang menentukan akurasi model. Salah satu metode yang sering digunakan adalah Minkowski Distance, yaitu teknik perhitungan jarak yang fleksibel dan dapat digunakan dalam berbagai algoritma seperti clustering, klasifikasi, dan sistem rekomendasi.

Pada artikel ini, kita akan membahas secara lengkap apa itu Minkowski Distance, rumus, cara kerja, serta contoh perhitungannya. Dengan memahami konsep ini, kamu tidak hanya bisa menghitung jarak antar data, tetapi juga memahami bagaimana algoritma machine learning mengambil keputusan berdasarkan kedekatan data.

Daftar Isi

Apa Itu Minkowski Distance?

Minkowski Distance adalah metode pengukuran jarak dalam ruang multidimensi yang digunakan untuk menghitung perbedaan antara dua titik data berdasarkan parameter tertentu yang disebut p (order). Metode ini merupakan generalisasi dari beberapa teknik pengukuran jarak lain, seperti Manhattan Distance dan Euclidean Distance.

Dalam konteks data science dan machine learning, Minkowski Distance digunakan untuk menentukan tingkat kemiripan antar data. Nilai parameter p berperan penting dalam menentukan sensitivitas perhitungan terhadap perbedaan tiap dimensi, sehingga metode ini sangat fleksibel untuk berbagai jenis data.

Yang membuat Minkowski Distance menarik adalah kemampuannya untuk menyesuaikan kebutuhan. Misalnya:

Jika p = 1 → hasilnya menjadi Manhattan Distance
Jika p = 2 → hasilnya menjadi Euclidean Distance

Jadi, daripada menggunakan metode yang berbeda-beda, kamu cukup menggunakan satu rumus dengan parameter yang bisa diubah. Ini seperti punya satu alat serbaguna untuk berbagai kebutuhan analisis data.

Parameter p dalam Minkowski Distance

Parameter p adalah inti dari Minkowski Distance. Nilai ini menentukan bagaimana jarak dihitung dan seberapa besar pengaruh perbedaan antar dimensi.

Secara umum, berikut interpretasi nilai p:

p = 1 (Manhattan Distance)
Menghitung jarak dengan menjumlahkan selisih absolut antar dimensi. Cocok untuk grid atau data diskrit seperti koordinat kota.
p = 2 (Euclidean Distance)
Menghitung jarak “garis lurus” seperti dalam geometri. Ini adalah metode yang paling umum digunakan.
p > 2
Memberikan penalti lebih besar pada perbedaan yang besar. Artinya, dimensi dengan selisih besar akan lebih dominan dalam hasil akhir.

Semakin besar nilai p, semakin sensitif perhitungan terhadap outlier atau perbedaan besar. Sebaliknya, nilai p kecil lebih “toleran” terhadap variasi data.

Cara Kerja Minkowski Distance

Cara kerja Minkowski Distance bisa dibilang sebagai kombinasi dari konsep perbedaan absolut dan pemangkatan. Metode ini menghitung jarak antar dua titik dengan mempertimbangkan semua dimensi yang ada.

Berikut alur kerjanya:

Ambil dua titik data dalam ruang n-dimensi
Misalnya titik A dan B dengan beberapa fitur.
Hitung selisih tiap dimensi
Kurangi nilai pada masing-masing dimensi.
Ambil nilai absolut dari selisih tersebut
Agar tidak ada nilai negatif.
Pangkatkan hasil dengan nilai p
Di sinilah parameter p mulai berperan.
Jumlahkan semua hasil
Dari semua dimensi.
Ambil akar pangkat p dari total tersebut
Ini menghasilkan nilai jarak akhir.

Proses ini terlihat panjang, tapi dalam praktiknya sangat efisien dan bisa dihitung dengan cepat oleh komputer. Yang menarik, metode ini memberikan fleksibilitas tinggi karena kamu bisa mengatur sensitivitas terhadap perbedaan data.

Rumus Minkowski Distance

$d(x,y)=\left(\sum_{i=1}^{n} |x_i – y_i|^p\right)^{\frac{1}{p}}$

Penjelasan Rumus Secara Sederhana

Kalau dilihat sekilas, rumus Minkowski Distance memang terlihat kompleks. Tapi sebenarnya, kalau dipecah, semuanya cukup logis dan mudah dipahami.

|xᵢ – yᵢ| = menghitung selisih absolut pada dimensi ke-i
^p = memperkuat atau melemahkan pengaruh selisih tersebut
Σ (sigma) = menjumlahkan semua dimensi
^(1/p) = mengembalikan skala agar tetap proporsional

Bayangkan kamu sedang mengukur jarak antara dua titik dalam ruang 3D. Setiap dimensi punya kontribusi, dan nilai p menentukan seberapa besar kontribusi tersebut.

Jika p kecil, semua dimensi dianggap relatif seimbang. Jika p besar, dimensi dengan selisih besar akan lebih dominan. Jadi, rumus ini bukan hanya menghitung jarak, tapi juga “mengatur cara melihat perbedaan”.

Contoh Perhitungan Minkowski Distance (p = 1 / Manhattan)

Misalnya ada dua titik:

A = (1, 2, 3)
B = (4, 6, 3)

Langkah perhitungan:

|1 – 4| = 3
|2 – 6| = 4
|3 – 3| = 0

Total = 3 + 4 + 0 = 7

Karena p = 1, tidak ada akar tambahan. Hasilnya langsung dijumlahkan. Ini adalah bentuk paling sederhana dari Minkowski Distance.

Contoh Perhitungan Minkowski Distance (p = 2 / Euclidean)

Dengan data yang sama:

(1 – 4)² = 9
(2 – 6)² = 16
(3 – 3)² = 0

Total = 25
Akar dari 25 = 5

Ini menghasilkan jarak Euclidean, yaitu jarak garis lurus antara dua titik.

Contoh Perhitungan Minkowski Distance (p = 3 atau lebih)

Masih dengan data yang sama:

|1 – 4|³ = 27
|2 – 6|³ = 64
|3 – 3|³ = 0

Total = 91
Akar pangkat 3 dari 91 ≈ 4.48

Di sini terlihat bahwa hasilnya berbeda dari p=1 dan p=2. Ini menunjukkan bagaimana nilai p memengaruhi hasil akhir.

Perbandingan Minkowski vs Euclidean vs Manhattan

Metode	Nilai p	Karakteristik	Kegunaan
Minkowski	Variatif	Fleksibel	General purpose
Manhattan	1	Grid-based	Navigasi, city block
Euclidean	2	Geometris	ML, clustering

Minkowski Distance sebenarnya adalah bentuk umum dari dua metode lainnya. Ini membuatnya sangat fleksibel dalam berbagai kasus penggunaan.

Kelebihan Minkowski Distance

Fleksibel dan generalisasi metode lain
Bisa menggantikan Manhattan dan Euclidean hanya dengan mengubah parameter p.
Cocok untuk data multidimensi
Digunakan luas dalam data science dan machine learning.
Kontrol sensitivitas terhadap perbedaan data
Parameter p memungkinkan penyesuaian sesuai kebutuhan.

Kekurangan Minkowski Distance

Pemilihan parameter p tidak selalu mudah
Butuh eksperimen untuk mendapatkan hasil terbaik.
Sensitif terhadap skala data
Jika data tidak dinormalisasi, hasil bisa bias.
Lebih kompleks dibanding metode sederhana
Terutama jika p bukan 1 atau 2.

Kesimpulan

Pada pembahasan kita di simpulkan bahwa Minkowski Distance merupakan metode pengukuran jarak yang sangat fleksibel dalam dunia data science dan machine learning. Dengan menggunakan parameter p, metode ini dapat merepresentasikan berbagai jenis perhitungan jarak seperti Manhattan Distance dan Euclidean Distance dalam satu rumus yang sama.

Pemahaman terhadap konsep dan pemilihan nilai p yang tepat sangat berpengaruh terhadap hasil analisis data. Dengan menguasai Minkowski Distance, kamu dapat meningkatkan akurasi model serta lebih memahami bagaimana algoritma bekerja dalam mengukur kemiripan antar data.

Artikel ini merupakan bagian dari seri Kecerdasan Buatan KantinIT.com. Jika artikel ini bermanfaat, jangan lupa bagikan ke media sosial atau ke teman kamu.

What are You Looking For?

Minkowski Distance: Rumus, Fungsi, dan Implementasi

Apa Itu Minkowski Distance?

Parameter p dalam Minkowski Distance

Cara Kerja Minkowski Distance

Rumus Minkowski Distance

Contoh Perhitungan Minkowski Distance (p = 1 / Manhattan)

Contoh Perhitungan Minkowski Distance (p = 2 / Euclidean)

Contoh Perhitungan Minkowski Distance (p = 3 atau lebih)

Perbandingan Minkowski vs Euclidean vs Manhattan

Kelebihan Minkowski Distance

Kekurangan Minkowski Distance

Kesimpulan

Read Next

Apa Itu Feature Selection dalam Machine Learning?

Regresi Logistik Multinomial (MLR): Konsep dan Contoh

Apa Itu Anomaly Detection? Fungsi dan Cara Kerjanya

Minkowski Distance: Rumus, Fungsi, dan Implementasi

Apa Itu Minkowski Distance?

Parameter p dalam Minkowski Distance

Cara Kerja Minkowski Distance

Rumus Minkowski Distance

Contoh Perhitungan Minkowski Distance (p = 1 / Manhattan)

Contoh Perhitungan Minkowski Distance (p = 2 / Euclidean)

Contoh Perhitungan Minkowski Distance (p = 3 atau lebih)

Perbandingan Minkowski vs Euclidean vs Manhattan

Kelebihan Minkowski Distance

Kekurangan Minkowski Distance

Kesimpulan

Read Next

Apa Itu Feature Selection dalam Machine Learning?

Regresi Logistik Multinomial (MLR): Konsep dan Contoh

Apa Itu Anomaly Detection? Fungsi dan Cara Kerjanya

Subscribe to our Newsletter