Minkowski Distance: Rumus, Fungsi, dan Implementasi

Minkowski Distance

Dalam dunia data science dan machine learning, mengukur jarak antar data merupakan konsep fundamental yang menentukan akurasi model. Salah satu metode yang sering digunakan adalah Minkowski Distance, yaitu teknik perhitungan jarak yang fleksibel dan dapat digunakan dalam berbagai algoritma seperti clustering, klasifikasi, dan sistem rekomendasi.

Pada artikel ini, kita akan membahas secara lengkap apa itu Minkowski Distance, rumus, cara kerja, serta contoh perhitungannya. Dengan memahami konsep ini, kamu tidak hanya bisa menghitung jarak antar data, tetapi juga memahami bagaimana algoritma machine learning mengambil keputusan berdasarkan kedekatan data.

Apa Itu Minkowski Distance?

Minkowski Distance adalah metode pengukuran jarak dalam ruang multidimensi yang digunakan untuk menghitung perbedaan antara dua titik data berdasarkan parameter tertentu yang disebut p (order). Metode ini merupakan generalisasi dari beberapa teknik pengukuran jarak lain, seperti Manhattan Distance dan Euclidean Distance.

Dalam konteks data science dan machine learning, Minkowski Distance digunakan untuk menentukan tingkat kemiripan antar data. Nilai parameter p berperan penting dalam menentukan sensitivitas perhitungan terhadap perbedaan tiap dimensi, sehingga metode ini sangat fleksibel untuk berbagai jenis data.

Yang membuat Minkowski Distance menarik adalah kemampuannya untuk menyesuaikan kebutuhan. Misalnya:

  • Jika p = 1 → hasilnya menjadi Manhattan Distance
  • Jika p = 2 → hasilnya menjadi Euclidean Distance

Jadi, daripada menggunakan metode yang berbeda-beda, kamu cukup menggunakan satu rumus dengan parameter yang bisa diubah. Ini seperti punya satu alat serbaguna untuk berbagai kebutuhan analisis data.

Baca Juga: Cosine Similarity: Rumus dan Implementasi

Parameter p dalam Minkowski Distance

Parameter p adalah inti dari Minkowski Distance. Nilai ini menentukan bagaimana jarak dihitung dan seberapa besar pengaruh perbedaan antar dimensi.

Secara umum, berikut interpretasi nilai p:

  • p = 1 (Manhattan Distance)
    Menghitung jarak dengan menjumlahkan selisih absolut antar dimensi. Cocok untuk grid atau data diskrit seperti koordinat kota.
  • p = 2 (Euclidean Distance)
    Menghitung jarak “garis lurus” seperti dalam geometri. Ini adalah metode yang paling umum digunakan.
  • p > 2
    Memberikan penalti lebih besar pada perbedaan yang besar. Artinya, dimensi dengan selisih besar akan lebih dominan dalam hasil akhir.

Semakin besar nilai p, semakin sensitif perhitungan terhadap outlier atau perbedaan besar. Sebaliknya, nilai p kecil lebih “toleran” terhadap variasi data.

Baca Juga: Euclidean Distance: Cara Kerja, Rumus dan Contoh Perhitungan

Cara Kerja Minkowski Distance

Cara kerja Minkowski Distance bisa dibilang sebagai kombinasi dari konsep perbedaan absolut dan pemangkatan. Metode ini menghitung jarak antar dua titik dengan mempertimbangkan semua dimensi yang ada.

Berikut alur kerjanya:

  1. Ambil dua titik data dalam ruang n-dimensi
    Misalnya titik A dan B dengan beberapa fitur.
  2. Hitung selisih tiap dimensi
    Kurangi nilai pada masing-masing dimensi.
  3. Ambil nilai absolut dari selisih tersebut
    Agar tidak ada nilai negatif.
  4. Pangkatkan hasil dengan nilai p
    Di sinilah parameter p mulai berperan.
  5. Jumlahkan semua hasil
    Dari semua dimensi.
  6. Ambil akar pangkat p dari total tersebut
    Ini menghasilkan nilai jarak akhir.

Proses ini terlihat panjang, tapi dalam praktiknya sangat efisien dan bisa dihitung dengan cepat oleh komputer. Yang menarik, metode ini memberikan fleksibilitas tinggi karena kamu bisa mengatur sensitivitas terhadap perbedaan data.

Baca Juga: Manhattan Distance: Konsep, Rumus, dan Contoh

Rumus Minkowski Distance

d(x,y)=(i=1nxiyip)1pd(x,y)=\left(\sum_{i=1}^{n} |x_i – y_i|^p\right)^{\frac{1}{p}}

Penjelasan Rumus Secara Sederhana

Kalau dilihat sekilas, rumus Minkowski Distance memang terlihat kompleks. Tapi sebenarnya, kalau dipecah, semuanya cukup logis dan mudah dipahami.

  • |xᵢ – yᵢ| = menghitung selisih absolut pada dimensi ke-i
  • ^p = memperkuat atau melemahkan pengaruh selisih tersebut
  • Σ (sigma) = menjumlahkan semua dimensi
  • ^(1/p) = mengembalikan skala agar tetap proporsional

Bayangkan kamu sedang mengukur jarak antara dua titik dalam ruang 3D. Setiap dimensi punya kontribusi, dan nilai p menentukan seberapa besar kontribusi tersebut.

Jika p kecil, semua dimensi dianggap relatif seimbang. Jika p besar, dimensi dengan selisih besar akan lebih dominan. Jadi, rumus ini bukan hanya menghitung jarak, tapi juga “mengatur cara melihat perbedaan”.

Baca Juga: Similarity Metric: Pengertian, Jenis, Cara Kerja, dan Contoh

Contoh Perhitungan Minkowski Distance (p = 1 / Manhattan)

Misalnya ada dua titik:

A = (1, 2, 3)
B = (4, 6, 3)

Langkah perhitungan:

  • |1 – 4| = 3
  • |2 – 6| = 4
  • |3 – 3| = 0

Total = 3 + 4 + 0 = 7

Karena p = 1, tidak ada akar tambahan. Hasilnya langsung dijumlahkan. Ini adalah bentuk paling sederhana dari Minkowski Distance.

Contoh Perhitungan Minkowski Distance (p = 2 / Euclidean)

Dengan data yang sama:

  • (1 – 4)² = 9
  • (2 – 6)² = 16
  • (3 – 3)² = 0

Total = 25
Akar dari 25 = 5

Ini menghasilkan jarak Euclidean, yaitu jarak garis lurus antara dua titik.

Baca Juga: Algoritma Levenshtein Distance: Cara Kerja dan Contoh Soal

Contoh Perhitungan Minkowski Distance (p = 3 atau lebih)

Masih dengan data yang sama:

  • |1 – 4|³ = 27
  • |2 – 6|³ = 64
  • |3 – 3|³ = 0

Total = 91
Akar pangkat 3 dari 91 ≈ 4.48

Di sini terlihat bahwa hasilnya berbeda dari p=1 dan p=2. Ini menunjukkan bagaimana nilai p memengaruhi hasil akhir.

Perbandingan Minkowski vs Euclidean vs Manhattan

MetodeNilai pKarakteristikKegunaan
MinkowskiVariatifFleksibelGeneral purpose
Manhattan1Grid-basedNavigasi, city block
Euclidean2GeometrisML, clustering

Minkowski Distance sebenarnya adalah bentuk umum dari dua metode lainnya. Ini membuatnya sangat fleksibel dalam berbagai kasus penggunaan.

Baca Juga: Gaussian Mixture Model (GMM): Cara Kerja dan Implementasi

Kelebihan Minkowski Distance

  • Fleksibel dan generalisasi metode lain
    Bisa menggantikan Manhattan dan Euclidean hanya dengan mengubah parameter p.
  • Cocok untuk data multidimensi
    Digunakan luas dalam data science dan machine learning.
  • Kontrol sensitivitas terhadap perbedaan data
    Parameter p memungkinkan penyesuaian sesuai kebutuhan.

Kekurangan Minkowski Distance

  • Pemilihan parameter p tidak selalu mudah
    Butuh eksperimen untuk mendapatkan hasil terbaik.
  • Sensitif terhadap skala data
    Jika data tidak dinormalisasi, hasil bisa bias.
  • Lebih kompleks dibanding metode sederhana
    Terutama jika p bukan 1 atau 2.

Baca Juga: Algoritma Adalah: Jenis, Fungsi dan Contoh

Kesimpulan

Pada pembahasan kita di simpulkan bahwa Minkowski Distance merupakan metode pengukuran jarak yang sangat fleksibel dalam dunia data science dan machine learning. Dengan menggunakan parameter p, metode ini dapat merepresentasikan berbagai jenis perhitungan jarak seperti Manhattan Distance dan Euclidean Distance dalam satu rumus yang sama.

Pemahaman terhadap konsep dan pemilihan nilai p yang tepat sangat berpengaruh terhadap hasil analisis data. Dengan menguasai Minkowski Distance, kamu dapat meningkatkan akurasi model serta lebih memahami bagaimana algoritma bekerja dalam mengukur kemiripan antar data.

Artikel ini merupakan bagian dari seri Kecerdasan Buatan KantinIT.com. Jika artikel ini bermanfaat, jangan lupa bagikan ke media sosial atau ke teman kamu.

Subscribe to our Newsletter

Subscribe to our email newsletter to get the latest posts delivered right to your email.
Pure inspiration, zero spam ✨