Algoritma Regresi Linear termasuk jenis aturan clasification and regression pada data mining. Algoritma regresi linear merupakan teknik untuk menentukan bahwa terdapat hubungan antara variable yang ingin diramalkan (variabel tak bebas) dengan variabel lain (variabel bebas).
Pada artikel ini kita akan belajar mengenal lebih dalam lagi mengenai Regresi Linear dari defenisi, jenis, fungsi dan contoh penerapanya.
Pengertian Regresi Linear
Regresi liner adalah suatu alat yang digunakan untuk mengetahui pengaruh antara satu dan beberapa variabel terhadap satu buah variabel. Variabel yang berpengaruh sering disebut variabel bebas, variabel independen atau variabel penjelas. Variabel yang dipengarhui sering disebut dengan variabel terikat atau variabel dependen. Regresi linear digunakan hanya dapat digunakan pada skala interval dan ratio.
Algoritma regresi linear merupakan teknik untuk menentukan bahwa terdapat hubungan antara variable yang ingin diramalkan (variabel tak bebas) dengan variabel lain (variabel bebas). Selanjutnya peramalan ini didasarkan pada asumsi bahwa pola pertumbuhan data historis yang bersifat linier, walaupun tidak sebenarnya 100% linier. Pola pertumbuhan ini didekati dengan suatu model yang menggambarkan hubungan-hubungan yang terkait dalam suatu keadaan.
Contoh dan Jenis-Jenis Regresi Linear
Beberapa jenis yang terdapat pada regresi linear.
1. Regresi Linier Sederhana
Regresi linear sederhana digunakan untuk mengetahui pengaruh antara satu buah variabel bebas terhadap satu buah variabel terikat. Persamaan umumnya adalah.
Y = α + βX
Y = variabel terikat.
X = variabel bebas.
Koefisien α = kosntata (intercept) yang merupakan titik potong antara garis regresi dengan sumbu Y pada koordinat kartesius.
Kamu dapat menggunakan regresi linear sederhana ketika.
- Data yang didapat berjenis interval atau ratio.
- Distribusi data normal.
- Jumlah sampel antara variabel bebas dan terikat sama.
- Memiliki hubungan linear.
Contoh kasus, hubungan antara tingkat polusi dan kenaikan suhu.
2. Regresi Linier Berganda
Jenis regresi linear yang perlu diketahui adalah regresi linear berganda. Sama seperti regresi linear sederhana, regresi linear berganda dapat dilakukan untuk mencari tahu korelasi antara variabel bebas dan terikat. hanya saja pada analisis jumlah variabel bebas yang diteliti lebih dari satu.
Kamu dapat menggunakan regresi linear berganda ketika.
- Data berbentuk interval atau rasio.
- Memiliki linearitas.
- Residual bersifat normal.
- Terhindar dari Heteroskedastisitas.
- Non Multikolinearitas.
Ketika semua asumsi telah terpenuhi, analisis regresi baru bisa dilakukan dengan menggunakan persamaan:
Y = α + β1 X2 + β2 X2 + βn Xn + e
Keterangan :
Y = Variabel terikat atau response.
X = Variabel bebas atau predictor.
α = Konstanta.
β = Slope atau Koefisien estimate.
Contoh kasus, Pertimbangan tugas menghitung tekanan dara. Dalam hal ini, tinggi badan, berat badan dan jumlah latihan dapat dianggap sebagai variabel bebas. Disini kamu dapat menggunakan regresi linear berganda untuk menganalisis hubungan antara tiga variabel independen dan satu variabel dependen, karena semua variabel yang dipertimbangkan bersifat kuantitatif.
3. Regresi Logistik
Regresi logistik sering disebut juga sebagai model logistik berlaku dalam kasus dimana terdapat suatu variabel dependen dan lebih banyak variabel independen.
Perbedaan mendasar antara regresi berganda dan logistik adalah bahwa variabel target dalam pendekatan logistik dalah diskrit (nilai biner atau ordinal).
Contoh kasus, Seseorang dapat menentukan kemungkinan memilih penawaran disitus web kamu (variabel dependen). Untuk tujuan analisis, kamu dapat melihat berbagai karakteristik pengunjung seperti situs asal mereka, jumlah kunjungan ke situs kamu dan aktivitas disitu kamu (variabel independen). Ini dapat membantu menentukan kemungkinan pengunjung tertentu yang lebih mungkin menerima tawaran tersebut. Akibatnya, ini memungkinkan kamu membuat keputusan yang lebih baik tentang apakah akan mempromosikan penawaran disitus kamu atau tidak.
4. Regresi Ordinal
Regresi ordinal melibatkan satu variabel dikomis dependen dan satu variabel independen, yang dapat berubah ordinal atau nominal. Ini memfasilitasi interaksi antara variabel dependen dengan beberapa level terurut dengan satu atau lebih variabel independen.
Untuk variabel dependen dengan M kategori, persamaan (m-1) akan dibuat. Setiap persamaan memiliki intersep yang berbeda tetapi koefisien kemiringan yang sama untuk variabel prediktor.
Dengan demikian, regresi ordinal menciptakan persamaan prediksi berganda untuk berbagai kategori. Dalam data mining regresi ordinal mengacu pada pembelajaran peringkat atau analisis peringkat yang dihitung menggunakakn model linier umum (GLM).
Contoh kasus, pertimbangan survei dimana responden seharusnya menjawab sebagai “setuju” atau “tidak setuju”. Dalam beberapak kasus, tanggapan seperti itu tidak membantu karena seseorang tidak dapat memperoleh kesimpulan yang pasti, memperumit hasil umum. Namun, kamu dapat mengamiti urutan alami dalam kategori dengan menambahkan tingkat pada tanggapan, seperti setuju, sangat setuju, tidak setuju dan sangat tidak setuju.
5. Regresi Logistik Multinomial
Regresi logistik multinomial (MLR) dilakukan ketika variabel dependen adalah nominal dengan lebih dari duat tingkat. Ini menentukan hubungan antara satu variabel independen level kontinu (interval, rasio atau dikotomis). Disini, variabel nominal mengacu pada variabel tanpa urutan intrinsik.
Contoh kasus, digunakan untuk memodelkan pilihan program yang dibuat oleh sekolah. Pilihan program dalam hal ini mengacu pada program olahraga dan program akademik. Pilihan jenis program dapat diprediksi dengan mempertimbangkan berbagai atribut, seperti seberapa baik siswa dapat membaca dan menulis pada mata pelajaran yang diberikan, jenis kelamin dan penghargaan yang diterimanya.
Fungsi Regresi Lenear
1. Memperbaiki Kesalahan
Salah satu fungsi regresi yaitu bisa memperbaiki kesalahan. Kesalahan dapat berhubungan dengan keputusan yang diambil untuk bisnis. Sebelum diaktulisasikan, keputusan itu dapat dihitung dulu untuk mengetahui hasilnya. Apabila hasilnya, maka bisa diperbaiki.
Contoh, pemilik bisnis memutuskan ingin manambah jam operasional untuk meningkatkan penjualan. Ketika dihitung menggunakan regresi mendapatkan hasil budget pemilik bisnis keluarkan terlalu over, sehingga berpotensi mengalami kerugian.
2. Memperkirakan Masa Depan
Regresi linear bisa memperikirakan masa depan yang berhubungan dengan peluang. Algortima ini juga sering digunakan untuk mencoba apakah peluang yang ada tepat diambil atau tidak.
3. Memberikan Insight Baru
Dapat memberikan pengetahuan terbaru untuk kamu. Contohnya, kamu ingin mengetahui stok produk yang harus disediakan ketika sedang masuk musim ramai pembeli yang belanja di waktu tertentu.
4. Meningkatkan Efisiensi
Algoritma dapat digunakan supaya operasional bisnis lebih efisien dan menghasilkan output yang diinginkan.
Kelebihan Regresi Linear
- Implementasi yang mudah. Untuk implementasi tidak memerlukan banyak biaya teknik, baik sebelum peluncuran model maupun sebelum pemeliharaannya.
- Interpretabilitas. Tidak seperti JST, regresi linear relatif lebih mudah.
- Skalabilitas. Regresi linier tidak berat secara komputasi dan oleh karena itu cocok dalam kasus dimana penskalaan sangat penting.
- Optimal untuk pengaturan online. Model dapat dilatih dan dilatih ulang dengan setiap contoh baru untuk menghasilkan prediksi secara real-time, tidak seperti JST yang berat secara komputasi dan memerlukan banyak sumber daya komputasi dan memakan waktu lama untuk melatih ulang dengan data yang baru.
Kekurangan Regresi Linear
Kelemahan yang paling mencolok pada algoritma ini adalah karena hasil ramalan dari analisis regresi merupakan nilai estimasi, sehingga kemungkinan untuk tidak sesuai dengan data aktual tetaplah ada.
Kesimpulan
Pada pembahasan kita di atas dapat kita simpulkan bahwa Regresi Linear adalah alat yang digunakan untuk memahami hubungan antara dua atau lebih variabel. Ini memungkinkan kita untuk melakukan prediksi berdasarkan data historis dan menentukan sejauh mana variabel-variabel tersebut berpengaruh terhadap satu sama lain.
Keuntungan utama dari Regresi Linear adalah kemudahannya dalam interpretasi hasil dan aplikabilitasnya dalam berbagai disiplin ilmu, seperti ekonomi, ilmu sosial dan ilmu alam. Ini juga memberikan dasar yang kuat untuk analisis statistik yang lebih kompleks.
Namun, Regresi Linear memiliki asumsi tertentu yang perlu dipenuhi untuk menghasilkan hasil yang dapat diandalkan. Selain itu, ia lebih cocok untuk masalah yang melibatkan hubungan linear antara variabel, sementara beberapa masalah mungkin memerlukan teknik regresi yang lebih kompleks.
Apabila kamu tertarik mengenai topik seperti ini, kamu bisa mengunjungi arsip Data Mining dan kamu juga bisa baca artikel mengenai kecerdasan buatan.