Linear vs Logistik Regresi
Dalam analisis statistik, adalah penting untuk mengenal pasti hubungan antara pembolehubah yang berkenaan dengan kajian. Kadangkala ia mungkin satu-satunya tujuan analisis itu sendiri. Satu alat kukuh yang digunakan untuk mewujudkan kewujudan perhubungan dan mengenal pasti perhubungan itu ialah analisis regresi.
Bentuk analisis regresi yang paling mudah ialah regresi linear, di mana hubungan antara pembolehubah adalah hubungan linear. Dari segi statistik, ia menunjukkan hubungan antara pembolehubah penjelasan dan pembolehubah bergerak balas. Sebagai contoh, menggunakan regresi kita boleh mewujudkan hubungan antara harga komoditi dan penggunaan berdasarkan data yang dikumpul daripada sampel rawak. Analisis regresi akan menghasilkan fungsi regresi bagi set data, iaitu model matematik yang paling sesuai dengan data yang ada. Ini boleh dengan mudah diwakili oleh plot berselerak. Regresi grafik adalah bersamaan dengan mencari lengkung yang sesuai untuk set data yang diberikan. Fungsi lengkung ialah fungsi regresi. Menggunakan model matematik, penggunaan komoditi boleh diramalkan untuk harga tertentu.
Oleh itu, analisis regresi digunakan secara meluas dalam meramal dan meramal. Ia juga digunakan untuk mewujudkan hubungan dalam data eksperimen, dalam bidang fizik, kimia, dan dalam banyak sains semula jadi dan disiplin kejuruteraan. Jika hubungan atau fungsi regresi adalah fungsi linear, maka proses tersebut dikenali sebagai regresi linear. Dalam plot taburan, ia boleh diwakili sebagai garis lurus. Jika fungsi itu bukan gabungan linear parameter, maka regresi adalah bukan linear.
Regression logistik adalah setanding dengan regresi multivariate, dan ia mencipta model untuk menerangkan kesan berbilang peramal pada pembolehubah tindak balas. Walau bagaimanapun, dalam regresi logistik, pembolehubah hasil akhir hendaklah kategori (biasanya dibahagikan; iaitu, sepasang hasil yang boleh dicapai, seperti kematian atau kelangsungan hidup, walaupun teknik khas membolehkan maklumat yang lebih dikategorikan untuk dimodelkan). Pembolehubah hasil berterusan boleh diubah menjadi pembolehubah kategori, untuk digunakan untuk regresi logistik; namun, pembolehubah selanjar runtuh dengan cara ini kebanyakannya tidak digalakkan kerana ia mengurangkan ketepatan.
Tidak seperti dalam regresi linear, ke arah min, pembolehubah peramal dalam regresi logistik tidak perlu dipaksa untuk disambungkan secara linear, diedarkan secara lazim atau mempunyai varians yang sama dalam setiap kelompok. Akibatnya, hubungan antara peramal dan pembolehubah hasil tidak mungkin menjadi fungsi linear.
Apakah perbezaan antara regresi Logistik dan Linear?
• Dalam regresi linear, hubungan linear antara pembolehubah penjelasan dan pembolehubah tindak balas diandaikan dan parameter yang memuaskan model ditemui melalui analisis, untuk memberikan hubungan yang tepat.
• Regresi linear dijalankan untuk pembolehubah kuantitatif, dan fungsi yang terhasil ialah kuantitatif.
• Dalam regresi logistik, data yang digunakan boleh sama ada kategori atau kuantitatif, tetapi hasilnya sentiasa kategori.