
Regresi logistik adalah model statistik yang digunakan untuk memperkirakan probabilitas suatu peristiwa terjadi berdasarkan nilai variabel independen.
Output regresi logistik biasanya berupa probabilitas antara 0 dan 1, yang kemudian diklasifikasikan menjadi kategori.
Contoh:
probabilitas pelanggan membeli produk
probabilitas pasien terkena penyakit
probabilitas mahasiswa lulus
Regresi logistik digunakan untuk:
memprediksi klasifikasi data
mengukur peluang kejadian
mengetahui faktor yang memengaruhi suatu peristiwa
membuat model prediksi kategori
mendukung analisis keputusan
Ciri utama regresi logistik:
variabel dependen bersifat kategorikal
output berupa probabilitas
hubungan berbentuk kurva sigmoid
cocok untuk klasifikasi
Model regresi logistik menggunakan fungsi logit:
log(p / (1 − p)) = a + b1X1 + b2X2 + … + bnXn
Keterangan:
p = probabilitas kejadian
a = konstanta
b = koefisien regresi
X = variabel independen
Digunakan jika variabel dependen hanya memiliki dua kategori.
Contoh:
lulus / tidak lulus
sakit / sehat
beli / tidak beli
Pelajari lebih lanjut mengenai Regresi Logistik Biner disini.
Digunakan jika variabel dependen memiliki lebih dari dua kategori.
Contoh:
jenis transportasi yang dipilih
kategori kepuasan pelanggan
Pelajari lebih lanjut mengenai Regresi Logistik Multinomial disini.
Digunakan jika kategori memiliki urutan.
Contoh:
tingkat kepuasan (rendah, sedang, tinggi)
level pendidikan
Misalnya perusahaan ingin memprediksi apakah pelanggan akan membeli produk berdasarkan:
usia
pendapatan
frekuensi kunjungan
Model regresi logistik dapat menunjukkan probabilitas pembelian serta faktor mana yang paling berpengaruh.
Hasil regresi biasanya berupa:
probabilitas
odds ratio
koefisien regresi
Interpretasi sederhana:
koefisien positif → meningkatkan peluang kejadian
koefisien negatif → menurunkan peluang kejadian
Gunakan regresi logistik jika:
variabel dependen berupa kategori
ingin memprediksi probabilitas
ingin melakukan klasifikasi
ingin mengetahui faktor risiko
| Regresi Linier | Regresi Logistik |
|---|---|
| Output angka | Output probabilitas |
| Hubungan linear | Kurva sigmoid |
| Prediksi nilai | Prediksi kategori |
| Untuk data kontinu | Untuk data kategorikal |
cocok untuk klasifikasi data
interpretasi probabilitas jelas
dapat menangani banyak variabel
model fleksibel
banyak digunakan di machine learning
tidak cocok untuk hubungan nonlinier kompleks
sensitif terhadap multikolinearitas
membutuhkan data cukup besar
interpretasi lebih kompleks dibanding regresi linier
Regresi logistik banyak digunakan dalam:
prediksi risiko penyakit
analisis kredit bank
prediksi churn pelanggan
deteksi fraud
analisis pemasaran
klasifikasi email spam
Agar analisis akurat:
✔ pastikan variabel dependen kategorikal
✔ cek multikolinearitas
✔ gunakan dataset cukup besar
✔ lakukan validasi model
✔ evaluasi akurasi prediksi
Regresi logistik adalah metode statistik penting yang digunakan untuk memprediksi probabilitas suatu kejadian berdasarkan beberapa variabel independen. Teknik ini sangat efektif untuk analisis klasifikasi dan banyak digunakan dalam penelitian, bisnis, kesehatan, dan machine learning.
Memahami regresi logistik akan membantu analis data membuat model prediksi yang lebih akurat dan informatif.
Jika Anda ingin memanfaatkan Analisis Regresi Logistik untuk analisa data yang lebih cerdas dan berdampak nyata, kami siap menjadi partner terpercaya Anda.





