Apa keunikan Affinity Propagation dibanding K-Means?

Keunikan Affinity Propagation adalah tidak membutuhkan nilai K dan menggunakan data asli sebagai pusat cluster (exemplar), sehingga hasil clustering lebih natural dan mudah diinterpretasikan.

Apa yang dimaksud exemplar dalam Affinity Propagation?

Exemplar adalah data point asli yang dipilih sebagai representasi atau pusat sebuah cluster. Setiap cluster memiliki satu exemplar yang mewakili anggota lainnya.

Bagaimana cara kerja Affinity Propagation?

Affinity Propagation bekerja dengan menghitung similarity matrix, menetapkan preference, lalu melakukan pertukaran pesan responsibility dan availability hingga konvergen dan cluster terbentuk.

Kapan Affinity Propagation sebaiknya digunakan?

Affinity Propagation cocok digunakan ketika jumlah cluster tidak diketahui, data berskala kecil hingga menengah, dan interpretasi hasil cluster lebih diutamakan.

Apa kelebihan Affinity Propagation?

Kelebihan Affinity Propagation meliputi penentuan jumlah cluster otomatis, penggunaan exemplar dari data asli, dan fleksibilitas dalam menangani struktur data kompleks.

Apa kekurangan Affinity Propagation?

Kekurangan Affinity Propagation adalah konsumsi memori tinggi, waktu komputasi relatif lama, serta keterbatasan skalabilitas pada dataset besar.

Affinity Propagation: Algoritma Clustering Tanpa Tentukan K

Clustering adalah salah satu teknik paling fundamental dalam data science dan machine learning. Hampir semua mahasiswa IT, atau peneliti yang berkutat dengan data pasti pernah berurusan dengan clustering, entah untuk mengelompokkan data pelanggan, dokumen teks, citra, atau bahkan data biologis. Tujuan utamanya sederhana yakni menemukan pola tersembunyi dengan mengelompokkan data yang mirip ke dalam satu grup. Namun, di balik konsep yang terlihat sederhana ini, ada banyak tantangan teknis yang sering bikin frustasi, terutama saat berhadapan dengan algoritma clustering konvensional.

Salah satu masalah klasik dalam clustering adalah keharusan menentukan jumlah cluster sejak awal, seperti pada K-Means. Dalam praktik nyata, sering kali kamu tidak tahu berapa jumlah cluster yang ideal. Menebak nilai K bisa berujung pada hasil yang bias atau tidak representatif. Di sinilah Affinity Propagation hadir sebagai alternatif menarik. Algoritma ini menawarkan pendekatan yang berbeda dan lebih fleksibel karena tidak mengharuskan penentuan jumlah cluster di awal, melainkan membiarkan data “berdiskusi” sendiri untuk menentukan struktur cluster terbaik.

Daftar Isi

Apa Itu Affinity Propagation?

Affinity Propagation adalah algoritma clustering berbasis similarity yang diperkenalkan oleh Brendan J. Frey dan Delbert Dueck pada tahun 2007. Berbeda dengan K-Means atau DBSCAN, Affinity Propagation tidak memulai proses clustering dengan asumsi jumlah cluster tertentu. Sebaliknya, algoritma ini bekerja dengan cara mengirimkan pesan antar data point untuk menentukan siapa yang paling layak menjadi pusat cluster, yang disebut sebagai exemplar.

Secara konseptual, Affinity Propagation bisa diibaratkan seperti proses pemilihan ketua dalam sebuah kelompok besar. Setiap anggota saling “merekomendasikan” siapa yang paling pantas menjadi ketua berdasarkan kedekatan atau kemiripan tertentu. Proses ini berlangsung secara iteratif sampai akhirnya terbentuk beberapa ketua (exemplar) beserta anggota kelompoknya masing-masing. Yang menarik, jumlah kelompok ini muncul secara alami dari proses tersebut, bukan ditentukan secara paksa di awal.

Dalam konteks data science, Affinity Propagation sangat berguna ketika kamu bekerja dengan data kompleks dan tidak memiliki intuisi yang kuat tentang jumlah cluster optimal. Algoritma ini sering digunakan dalam text clustering, image segmentation, bioinformatics, hingga analisis data akademik. Dengan pendekatan berbasis pesan dan similarity, Affinity Propagation memberikan perspektif baru dalam memahami struktur data secara lebih alami.

Konsep Dasar Affinity Propagation

Untuk memahami Affinity Propagation dengan baik, kamu perlu memahami beberapa konsep dasarnya.

Similarity yaitu ukuran seberapa mirip satu data point dengan data point lainnya. Similarity biasanya direpresentasikan dalam bentuk matriks, di mana setiap elemen menyatakan tingkat kemiripan antara dua data. Semakin tinggi nilainya, semakin mirip kedua data tersebut.
Exemplar adalah data point yang dipilih sebagai representasi atau pusat dari sebuah cluster. Tidak seperti centroid pada K-Means yang bisa berada di luar data asli, exemplar pada Affinity Propagation selalu merupakan salah satu data point asli.

Hubungan antara data point dan exemplar dibangun melalui pertukaran pesan. Setiap data point mengevaluasi seberapa cocok dirinya menjadi exemplar dan seberapa cocok data lain menjadi exemplar baginya. Proses ini menciptakan dinamika kompetisi dan kerja sama antar data point. Dari sinilah struktur cluster akhirnya terbentuk secara alami, berdasarkan kemiripan dan preferensi yang saling diperbarui sepanjang iterasi.

Cara Kerja Algoritma Affinity Propagation

Secara ringkas cara kerja Affinity Propagation, prosesnya dapat dijelaskan dalam satu rangkaian tahapan berikut:

Membangun Similarity Matrix
Proses dimulai dengan menghitung nilai kemiripan antar semua pasangan data point dan menyimpannya dalam sebuah similarity matrix. Nilai ini dapat diperoleh dari metrik seperti Euclidean distance, cosine similarity, atau metode lain yang sesuai dengan karakteristik data. Similarity ini menjadi dasar utama dalam menentukan hubungan antar data.
Menetapkan Preference Awal
Setiap data point diberi nilai preference yang menunjukkan kecenderungannya untuk menjadi exemplar atau pusat cluster. Nilai preference ini memengaruhi jumlah cluster yang akan terbentuk secara otomatis, tanpa perlu menentukan jumlah cluster sejak awal.
Pertukaran Pesan Responsibility dan Availability
Algoritma kemudian melakukan pertukaran dua jenis pesan, yaitu responsibility yang menunjukkan seberapa cocok suatu data menjadi exemplar bagi data lain, serta availability yang mencerminkan seberapa besar dukungan dari data lain terhadap kandidat exemplar tersebut.
Iterasi Hingga Konvergen
Perhitungan responsibility dan availability dilakukan berulang kali hingga nilai-nilai tersebut stabil. Pada tahap ini, algoritma dianggap telah mencapai konvergensi dan struktur cluster mulai terbentuk dengan jelas.
Penentuan Exemplar dan Pembentukan Cluster
Setelah konvergen, setiap data point memilih exemplar dengan nilai tertinggi. Data point yang terpilih sebagai exemplar menjadi pusat cluster, sementara data lainnya bergabung ke cluster yang paling sesuai.

Melalui tahapan ini, Affinity Propagation mampu membentuk cluster secara adaptif sesuai dengan struktur data, menjadikannya lebih fleksibel dibandingkan algoritma clustering yang mengharuskan penentuan jumlah cluster di awal.

Kelebihan Affinity Propagation

Tidak perlu menentukan jumlah cluster di awal
Sangat membantu ketika struktur data belum diketahui.
Menggunakan exemplar dari data asli
Hasil cluster lebih mudah diinterpretasikan dan divalidasi.
Mengurangi bias trial-and-error
Tidak seperti K-Means yang bergantung pada nilai k.
Fleksibel terhadap bentuk cluster
Mampu menangani cluster yang tidak bulat atau simetris.
Cocok untuk analisis mendalam
Ideal untuk dataset skala menengah dan eksplorasi data akademik.

Kekurangan Affinity Propagation

Konsumsi memori tinggi
Membutuhkan similarity matrix berukuran $N \times N$
Kurang skalabel untuk dataset besar
Menjadi bottleneck pada data berskala besar.
Sensitif terhadap parameter preference
Nilai yang tidak tepat dapat menghasilkan cluster berlebih atau terlalu sedikit.
Waktu komputasi relatif lama
Lebih lambat dibanding algoritma sederhana seperti K-Means.
Membutuhkan tuning berulang
Parameter sering perlu disesuaikan melalui eksperimen.

Perbandingan Algoritma Affinity Propagation

Aspek	Affinity Propagation	K-Means	Hierarchical Clustering
Jumlah Cluster	Otomatis	Harus ditentukan	Bisa fleksibel
Pusat Cluster	Data asli (exemplar)	Centroid	Tidak selalu jelas
Kompleksitas	Tinggi	Rendah	Menengah–tinggi
Skalabilitas	Terbatas	Sangat baik	Terbatas
Interpretasi	Mudah	Sedang	Kompleks

Dari tabel di atas, terlihat bahwa Affinity Propagation unggul dalam fleksibilitas dan interpretasi, tetapi kalah dalam skalabilitas. Pemilihan algoritma sebaiknya disesuaikan dengan tujuan analisis, ukuran dataset, dan kebutuhan interpretasi hasil.

Contoh Penggunaan Affinity Propagation

Berikut ini merupakan beberapa contoh penggunaan Affinity Propagation:

Clustering dokumen teks
Digunakan untuk mengelompokkan jurnal akademik, artikel berita, atau dokumen penelitian berdasarkan similarity (misalnya cosine similarity), tanpa menentukan jumlah cluster di awal.
Clustering dan segmentasi gambar
Diterapkan pada image segmentation atau pengelompokan fitur visual, dengan exemplar sebagai representasi visual tiap cluster.
Analisis data akademik dan riset
Digunakan untuk mengelompokkan data eksperimen atau hasil penelitian berdasarkan kemiripan karakteristik.
Eksplorasi data dengan struktur kompleks
Cocok untuk kasus ketika pola dan jumlah cluster sulit diprediksi sejak awal.

Kapan Harus Menggunakan Affinity Propagation

Affinity Propagation paling cocok digunakan ketika kamu tidak tahu jumlah cluster optimal dan membutuhkan interpretasi yang kuat. Dataset dengan ukuran kecil hingga menengah, serta kebutuhan analisis mendalam, adalah kandidat ideal.

Algoritma ini juga cocok untuk riset akademik, eksplorasi data awal, dan analisis berbasis similarity. Namun, untuk sistem produksi berskala besar, perlu pertimbangan tambahan terkait performa dan memori.

Kesimpulan

Pada pembahasan kita di atas dapat kita simpulkan bahwa Affinity Propagation menawarkan pendekatan clustering yang unik dan fleksibel dengan mengandalkan pertukaran pesan berbasis similarity. Keunggulan utamanya terletak pada kemampuannya menentukan jumlah cluster secara otomatis dan menghasilkan exemplar yang mudah diinterpretasikan. Hal ini menjadikannya sangat relevan untuk analisis data kompleks di dunia akademik dan data science.

Meskipun memiliki keterbatasan dalam hal skalabilitas dan konsumsi memori, Affinity Propagation tetap menjadi alat yang sangat berharga ketika kualitas dan makna cluster lebih diutamakan daripada kecepatan. Dengan pemahaman konsep, parameter, dan konteks penggunaan yang tepat, algoritma ini bisa menjadi senjata andalan dalam eksplorasi data modern.

Artikel ini merupakan bagian dari seri artikel belajar Kecerdasan Buatan dan jika ada ide topik yang mau kita bahas silahkan komen di bawah ya.

What are You Looking For?

Affinity Propagation: Algoritma Clustering Tanpa Tentukan K

Apa Itu Affinity Propagation?

Konsep Dasar Affinity Propagation

Cara Kerja Algoritma Affinity Propagation

Kelebihan Affinity Propagation

Kekurangan Affinity Propagation

Perbandingan Algoritma Affinity Propagation

Contoh Penggunaan Affinity Propagation

Kapan Harus Menggunakan Affinity Propagation

Kesimpulan

Read Next

Algoritma Mean Shift Adalah? Cara Kerja dan Contoh Penerapan

Q Learning: Konsep, Rumus, dan Contoh Implementasi

Adam Optimizer Adalah? Penjelasan Lengkap untuk Pemula

Affinity Propagation: Algoritma Clustering Tanpa Tentukan K

Apa Itu Affinity Propagation?

Konsep Dasar Affinity Propagation

Cara Kerja Algoritma Affinity Propagation

Kelebihan Affinity Propagation

Kekurangan Affinity Propagation

Perbandingan Algoritma Affinity Propagation

Contoh Penggunaan Affinity Propagation

Kapan Harus Menggunakan Affinity Propagation

Kesimpulan

Read Next

Algoritma Mean Shift Adalah? Cara Kerja dan Contoh Penerapan

Q Learning: Konsep, Rumus, dan Contoh Implementasi

Adam Optimizer Adalah? Penjelasan Lengkap untuk Pemula

Subscribe to our Newsletter