
Regresi logistik biner adalah jenis regresi logistik yang variabel dependennya hanya memiliki dua kemungkinan nilai, misalnya:
ya / tidak
lulus / tidak lulus
beli / tidak beli
sakit / sehat
Model ini menghitung peluang suatu kejadian terjadi berdasarkan nilai variabel independen.
Metode ini digunakan untuk:
memprediksi probabilitas kejadian
mengklasifikasikan data menjadi dua kelompok
mengidentifikasi faktor yang memengaruhi keputusan
mendukung analisis prediktif
membantu pengambilan keputusan berbasis data
Model logistik menggunakan fungsi logit:
log(p / (1 − p)) = a + b1X1 + b2X2 + … + bnXn
Keterangan:
p = probabilitas kejadian
a = konstanta
b = koefisien regresi
X = variabel independen
Nilai probabilitas yang dihasilkan berada antara 0 dan 1.
Proses analisis umumnya melalui langkah berikut:
Menentukan variabel target (dua kategori)
Memasukkan variabel prediktor
Mengestimasi parameter model
Menghitung probabilitas hasil
Menentukan klasifikasi berdasarkan threshold
Biasanya nilai batas klasifikasi adalah 0,5:
p ≥ 0,5 → kategori 1
p < 0,5 → kategori 0
Misalnya perusahaan ingin memprediksi apakah pelanggan akan membeli produk berdasarkan:
usia
pendapatan
frekuensi kunjungan website
Model regresi logistik biner dapat menghasilkan probabilitas pembelian serta menunjukkan faktor mana yang paling berpengaruh terhadap keputusan pelanggan.
Koefisien dalam regresi logistik menunjukkan perubahan log odds.
Interpretasi sederhana:
koefisien positif → meningkatkan peluang kejadian
koefisien negatif → menurunkan peluang kejadian
Jika diubah menjadi odds ratio:
1 → peluang meningkat
< 1 → peluang menurun
Gunakan metode ini jika:
variabel dependen hanya dua kategori
ingin memprediksi probabilitas kejadian
melakukan analisis klasifikasi
ingin mengetahui faktor risiko
| Regresi Linear | Regresi Logistik Biner |
|---|---|
| Output angka | Output probabilitas |
| Hubungan linear | Kurva sigmoid |
| Untuk data kontinu | Untuk data kategori |
| Prediksi nilai | Prediksi kelas |
cocok untuk klasifikasi sederhana
interpretasi probabilitas jelas
fleksibel dengan banyak variabel
mudah diimplementasikan
banyak digunakan dalam machine learning
hanya untuk dua kategori
sensitif terhadap multikolinearitas
membutuhkan data cukup besar
tidak cocok untuk hubungan nonlinier kompleks
Model ini sering digunakan dalam:
prediksi churn pelanggan
analisis risiko kredit
diagnosis penyakit
deteksi spam email
prediksi kegagalan mesin
Agar model optimal:
✔ pastikan variabel target biner
✔ cek multikolinearitas
✔ gunakan dataset cukup besar
✔ lakukan validasi model
✔ evaluasi akurasi prediksi
Regresi logistik biner adalah metode statistik penting untuk memprediksi probabilitas suatu kejadian dengan dua kemungkinan hasil. Teknik ini sangat efektif untuk analisis klasifikasi dan banyak digunakan dalam berbagai bidang seperti bisnis, kesehatan, dan data science.
Memahami regresi logistik biner membantu analis membuat model prediksi yang akurat serta memahami faktor yang memengaruhi suatu keputusan.
Jika Anda ingin memanfaatkan Analisis Regresi Logistik Biner untuk analisa data yang lebih cerdas dan berdampak nyata, kami siap menjadi partner terpercaya Anda.





