support vector machine adalah

Support Vector Machine (SVM): Pengertian, Jenis dan Cara Kerja

Support Vector Machine (SVM) pertama kali diperkenalkan oleh Vapnik pada tahun 1992 sebagai rangkaian harmonis konsep-konsep unggulan dalam bidang pattern recognition.

Metode SVM merupakan salah satu metode atau algoritma machine learning dengan pendekatan supervised learning yang dapat digunakan untuk masalah klasifikasi dan regresi.

Sebenarnya apasih Support Vector Machine itu? pada artikel ini kita akan belajar dengan detail mengenai Support Vector Machine.

Pengertian Support Vector Machine (SVM)

Support Vector Machine (SVM) merupakan salah satu metode machine learning dengan pendekatan supervised learning yang paling populer digunakan.

Metode SVM mengkelaskan data baru, mengelompokan data-data dengan memisahkannya berdasarkan hyperplane dengan ruang N-dimensi (N – jumlah fitur) yang secara jelas mengklasifikasikan titik data.

Metode ini sangat disukai oleh banyak orang karena algoritma ini dapat lebih menghasilkan akurasi yang signifikan dengan daya komputasi yang lebih sedikit.

Cara Kerja Support Vector Machine (SVM)

Cara kerja dari metode Support Vector Machine (SVM) dengan memetakan data ke ruang fitur berdimensi tinggi sehingga titik data dapat dikategorikan, meskipun data tidak dapat dipisahkan secara linear. Pemisah antar kategori ditermukan, kemudian data ditrasformasikan sedemikian rupa sehingga pemisah tersebut dapat digambarkan sebagai hyperplane. Setelah itu, karakteristik data baru dapat digunakan untuk memprediksi grup yang seharusnya memiliki record baru.

Contoh, perhatikan gambar berikut, dimana titik data terbagi dua kagegori berbeda.

cara kerja SVM data asli
Dataset asli

Kedua kategori tersebut dapat dipisahkan dengan kurva, seperti yang ditunjukkan pada gambar berikut.

Baca juga :   Neuromining: Pengertian, Cara Kerja dan Penerapannya
cara kerja SVM dengan pemisah data
Data dengan penambahan pemisah

Setelah transformasi, batas antara kedua kategori tersebut dapat ditentukan oleh hyperplane, seperti ditunjukan pada gambar berikut.

cara kerja SVM data yang di ubah
Data yang diubah

Hyperplane adalah garis dengan margin terbesar untuk kedua group. Terkadang ada yang menyebutnya garis di atas garis keputusan, tetapi istilah matematika yang benar adalah hyperplane, karena dalam dimensi lebih tinggi dari dua dan tidak akan menjadi garis lagi.

Fungsi matematika yang digunakan untuk transformasi dikenal sebagai fungsi kernel. SVM di IBM® SPSS® modeler mendukung jenis kernel berikut:

  • Linier
  • Polinominal
  • Fungsi Basis Radial (RBF)
  • Sigmoid

Fungsi kernel linier direkomendasikan ketika pemisahan data secara linier mudah dilakukkan. Dalam kasus lain, salah satu fungsi lain harus digunakan. Kamu harus mencoba dengan fungsi yang berbeda untuk mendapatkan model terbaik di setiap kasus, karena masing-masing menggunakan algoritma dan parameter yang berbeda.

Jenis-Jenis Support Vector Machine (SVM)

SVM terbagi menjadi dua jenis yaitu.

1. SVM Data Linier

Digunakan untuk data yang dapat dipisahkan secara linier, berarti jika sebuah dataset dapat diklasifikasikan menjadi dua kelas dengan menggunakkan sebuah garis lurus tunggal disebut linier dan klasifikasinya disebut sebagai Linear SVM Classifier.

2. SVM Data Non-Linier

Digunakan untuk data yang dapat dipisahkan secara non-linier, berarti jika sebuah dataset tidak dapat diklasifikasi menggunakan garis lurus disebut data non-linier dan klasifikasinya disebut sebagai Non-Linier SVM Classifier.

Perbedaan Data Linier dengan Non-Linier

Data linier dapat mengklasifikasikan data dengan pengklasifikasi linier. Pengklasifikasi linier membuat keputusan klasifikasinya berdasarkan kombinasi linier dari karakteristik.

perbedaan linier dan non linier

Pada gambar A kita dapat memisahkan label target secara linier dengan garis (seperti Support Vector Machines melakukan klasifikasi dengan garis keputusan). Pengklasifikasi linier dapat melakukan ini dengan kombinasi karakteristik linier. kita dapat menggunakan misalnya SVM untuk membuat model, tetapi kita juga dapat menggunakan banyak metode klasifikasi linier lainya seperti klasifikasi kuadrat.

Baca juga :   Kursor Laptop Tidak Mau Bergerak: Penyebab dan Solusinya

Pada gambar B kita dapat memisahkan label target secara linier. Data lebih kompleks dibagi, oleh karena itu kita bisa begitu saja menggunakan metode klasifikasi linier. Utungnya SVM dapat melakukan keduanya, klasifikasi linier dan non-linier.

Kelebihan dan Kekurangan Support Vector Machine (SVM)

Support Vector Machine seperti metode pada umumnya yang memiliki kelebihan dan kekurangan, adapun kelebihan dan kekurangannya sebagai berikut. 

Kelebihan

  • Efektif dalam ruang dimensi tinggi.
  • Masih efektif dalam kasus di mana jumlah dimensi lebih besar dari jumlah sampel.
  • Menggunakan subset titik pelatihan dalam fungsi keputusan (disebut vektor dukungan), sehingga menghemat memori.
  • Serbaguna, fungsi kernel yang berbeda dapat dituntukan untuk fungsi keputusan. Kernel umum disediakan, tetapi juga memungkinkan untuk menentukan kernel buatan.

Kekurangan

  • Jika jumlah fitur jauh lebih banyak daripada jumlah sampel, hindari pemilihan fungsi kernel yang berlebihan dan istilah regularisasi sangat penting.
  • SVM tidak secara lansung memberikan perkiraan probabilitas, ini dihitung menggunakan validasi silang lima kali lipat yang mahal.

Kesimpulan

Dari pembelajaran kita di atas dapat kita simpulkan bahwa Support Vector Machine atau yang sering disebut SVM merupakan metode mengkelaskan data baru, mengelompokan data-data dengan memisahkannya berdasarkan hyperplane dengan ruang N-dimensi (N – jumlah fitur) yang secara jelas mengklasifikasikan titik data.

Artikel ini merupakan bagian dari seri artikel belajar Kecerdasan Buatan dan jika ada ide topik yang mau kami bahas silahkan komen di bawah ya..