Regresi Logistik Biner *IBM SPSS 23


Makasih, udah sediakan  waktu mengisi polling kami, salam hangat :)

Regresi linier seperti yang kita ketahui tidak dapat menyelesaikan kasus dimana variabel dependent bersifat dikotomi dan kategori dengan dua atau lebih kemungkinan (ex. sukses atau Gagal; terpilih atau tidak terpilih; lulus atau tidak lulus; melakukan pembelian atau tidak; mendapat promosi atau tidak, dan lain-lain). Regresi logistik umumnya melibatkan berbagai macam variabel prediktor baik numerik ataupun kategorik, termasuk variabel dummy. Pada regresi linier, variabel prediktor yang digunakan biasanya numerik, tetapi jika kita melibatkan campuran antara numerik maupun kategorik kita dapat menggunakan regresi logistik.

Regresi logistik membentuk persamaan atau fungsi dengan pendekatan maximum likelihood, yang memaksimalkan peluang pengklasifikasian objek yang diamati menjadi kategori yang sesuai kemudian mengubahnya menjadi koefisien regresi yang sederhana. Dua nilai yang biasa digunakan sebagai variabel dependen yang diprediksi adalah 0 dan 1 (ex. 1=berhasil, 0=gagal).

Regresi logistik menghasilkan rasio peluang (odds ratios) antara keberhasilan atau kegagalan suatu dari analisis. Dapat kita contohkan dengan seorang tokoh yang ingin menjadi presiden, akan lebih baik peluangnya jika menjadi ketua partai politik tertentu. Disini odds ratio yang dimaksud adalah seberapa besar peluang tokoh tersebut dengan mempertimbangkan variabel prediktor yang ada.

Regresi logistik akan membentuk variabel prediktor/respon (log (p/(1-p)) yang merupakan kombinasi linier dari variabel independen. Nilai variabel prediktor ini kemudian ditransformasikan menjadi probabilitas dengan fungsi logit.

Asumsi-asumsi dalam regresi logistik

  • Tidak mengasumsikan hubungan linier antar variabel dependen dan independent
  • Variabel dependen harus bersifat dikotomi (2 variabel)
  • Variabel independent tidak harus memiliki keragaman yang sama antar kelompok variabel
  • Kategori dalam variabel independent harus terpisah satu sama lain atau bersifat eksklusif
  • Sampel yang diperlukan dalam jumlah relatif besar, minimum dibutuhkan hingga 50 sampel data untuk sebuah variabel prediktor (bebas).

Persamaan Regresi Logistik

Regresi logistik menghasilkan rasio peluang yang dinyatakan dengan transformasi fungsi logaritma (log), dengan demikian fungsi transformasi log ataupun ln diperlukan untuk p-value, dengan demikian dapat dinyatakan bahwa logit(p) merupakan log dari peluang (odds ratio) atau likelihood ratio dengan kemungkinan terbesar nilai peluang adalah 1, dengan demikian persamaan regresi logistik menjadi:

logit(p) = log (p/1-p) = ln (p/1-p)

 dimana p bernilai antara 0-1.

Model yang digunakan pada regresi logistik adalah:

Log (P / 1 – p) = β0 + β1X1 + β2X2 + …. + βkXk

Dimana p adalah kemungkinan bahwa Y = 1, dan X1, X2, X3 adalah variabel independen, dan b adalah koefisien regresi.

Konsep Log Odds, Odds Ratio

Logit (log odds) merupakan koefisien slope (b) dari persamaan regresi. Slope disini adalah perubahan nilai rata-rata dari Y dari satu unit perubahan nilai X. Regresi logistik melihat perubahan pada nilai variabel dependen yang ditransformasi menjadi peluang, bukan nilai aslinya seperti pada regresi linier. Sebagai ilustrasi jika nilai peluang adalah 0,25, maka nilai odds adalah 3 (25 : 75), sedangkan jika nilai peluang 50, maka nilai odds adalah 1 (50 : 50), atau jika nilai peluang 0,33, maka nilai odds adalah 2 (33 : 67) dengan total keseluruhan nilai peluang adalah 1. Nilai odds ratio biasanya dapat kita lihat pada kolom B pada ‘variables in the equation’ output SPSS.

Kecocokan Model (model fit) dan fungsi likelihood

Likelihood berarti juga peluang atau probabilitas untuk hipotesis tertentu. Seperti yang kita ketahui pada kurva regresi linier kita lihat adanya hubungan linier, peningkatan pada sumbu Y akan diikuti dengan peningkatan pada sumbu X dan sebaliknya. Tetapi pada regresi logistik dengan nilai Y antara 0 dan 1, pendekatan linier tidak bisa kita gunakan. Oleh karena itu metode maximum likelihood sangat berguna dalam menentukan kecocokan model yang tepat bagi persamaan yang kita miliki.

Hipotesis dalam regresi logistik antara lain:

h0 = ketika persamaan regresi bernilai 0 [logit(p) = 0].

h1 = persamaan regresi berbeda nyata dari 0 [logit(p) ≠ 0].

Regresi logistik merupakan regresi non linier dimana model yang ditentukan akan mengikuti pola kurva linier seperti gambar di bawah ini.

Regresi logistik juga menghasilkan rasio peluang (odds ratios) terkait dengan nilai setiap prediktor. Peluang (odds) dari suatu kejadian diartikan sebagai probabilitas hasil yang muncul yang dibagi dengan probabilitas suatu kejadian tidak terjadi. Secara umum, rasio peluang (odds ratios) merupakan sekumpulan peluang yang dibagi oleh peluang lainnya. Rasio peluang bagi prediktor diartikan sebagai jumlah relatif dimana peluang hasil meningkat (rasio peluang > 1) atau turun (rasio peluang < 1) ketika nilai variabel prediktor meningkat sebesar 1 unit.

Lebih jelasnya kita dapat mengikuti ilustrasi berikut ini:

Kita ingin mengetahui apakah berat badan (weightgain) sapi para peternak di kota Ketapang bertambah signifikan atau tidak, dengan variabel prediktor adalah sex yang terdiri atas male (M) atau female (F), pemberian obat cacing (anthelmintic) secara rutin sesuai dosis yang dinyatakan dengan yes dan no, dan biaya pemeliharaan per bulan yang dinyatakan dalam US$. Kali ini kita akan menjalankan model logit menggunakan bantuan software IBM SPSS versi 23, untuk yang masih menggunakan SPSS seri di bawahnya jangan khawatir, masih kurang lebih sama koq cara aplikasinya,

Contoh data kamu bisa download disini >>>

1. tahap impor data (misalnya dari excel), Buka SPSS kamu,

file > read text data,

 pada kotak dialog open data, files of type > pilih excel, maka datanya muncul di layar, pilih lalu klik > open,

kemudian dimunculkan lagi jendela opening data, checklist seperti gambar > ok,

 

data telah masuk dalam record SPSS, berikut adalah dataview, lihat sususannya tidak beraturan, kamu bisa atur dalam variable view,

atur label, desimal, dan lain-lain dalam variabel view,

2. Tahap Analisis,

Analyze > regression > binary logistic,

Setelah muncul jendela logistic regression, masukkan weightgain kedalam dependen, dan variabel kategorik yaitu sex dan anthelmintic ke kotak covariates, lalu klik categorical, untuk menyesuaikan tipe data variabel kategorik,

Di jendela define covariates variables pilih reference category-first, kemudian klik changes > continue,

klik next lalu masukkan variabel kontinyu cost, ke dalam covariates,

kemudian continue > ok, maka outputnya akan ditampilkan,

  • Chi-Square model sebesar 18,440, angka ini menjelaskan kemampuan model dalam memprediksi variabel dependen weightgain. Dengan signifikansi 0,000 < 0,05, berarti terdapat peningkatan signifikansi dengan penambahan variabel sex, dan anthelmintic, ke dalam model.
  • -2 log likelihood menjelaskan signifikansi model layaknya R-sq pada regresi linier OLS.
  • Tabel Hosmer and Lemeshow test menunjukkan nilai penambahan signifikansi model dari konstanta, dan model sesudah ditambahkan variabel independen sex dan anthelmintic. Penambahannya cukup kecil dengan signifikansi 0,631 (>0.05).

  • Kita lihat kembali pada output variables in the equation menunjukkan model sesuai hipotesis null atau model tanpa prediktor,
  • Output variables not in the equation menunjukkan signifikansi masing-masing variabel independen terhadap weightgain. Dari tabel dapat kita lihat bahwa variabel anthelmintic(1) memberikan peningkatan yang signifikan terhadap model (0,000), sedangkan sex(1) tidak signifikan (0,298). Tetapi secara keseluruhan signifikan terhadap perbaikan model (overall statistics, sig = 0,000).

Dari output variables in the equation persamaan yang kita peroleh adalah (lihat nilai pada kolom B) :

Log odds(weightgain) = B0 + B1*sex(1) + B2*anthelmintic(1) + B3*cost

atau dengan nilai aslinya;

Log odds(weightgain) = -3,502 + 0,116*sex(1) + 2,638*anthelmintic(1) + 0,011*cost

Jika sex(1)=1 (lihat output coding), anthelmintic(1)=1 (lihat output coding), dan cost=US$ 100, maka persamaannya menjadi:

Log odds(weightgain) = -3,502 + 0,116(1) + 2,638(1) + 0,011(100)

Log odds(weightgain) = -3,502 + 0,116 + 2,638 + 1,1

Jika kita hilangkan log maka persamaan akan dalam bentuk eksponensial:

odds(weightgain) = e-3,502 + 0,116 + 2,638 + 1,1 

Interpretasi dari Persamaan

  • Untuk setiap perubahan per unit pada variabel sex(1) (koding dummy untuk variabel M/jantan), akan meningkatkan log weightgain sebesar 0,116.
  • Untuk setiap kenaikan pada variabel anthelmintic(1) sebesar 1 unit, maka akan meningkatkan log weightgain sebesar 2,638.
  • Untuk setiap penambahan sebesar US$1 terhadap variabel cost, maka akan meningkatkan peluang Log weightgain sebesar 0,011. Dari nilai signifikansi dapat kita simpulkan bahwa variabel yang signifikan berpengaruh terhadap log odds (weightgain) adalah pemberian obat cacing secara rutin (anthelmintic(1)), dan cost dengan nilai signifikansi berturut-turut 0,02 dan 0,018 (pada tingkat signifikansi 95%).

Kemudian mari kita interpretasikan nilai exp(B) pada output variables in the equation di atas:

  • Variabel sex(1) yang mengacu pada Male/Jantan, memiliki kecenderungan untuk mendapatkan pertambahan berat badan (weightgain) 1,122 kali daripada Female/betina yang menjadi kategori referensi kita (ini adalah koding dummy, dimana 0 untuk F dan 1 untuk M).
  • Variabel anthelmintic(1) yang mengacu pada yes, dimana pemberian obat cacing secara teratur dan sesuai dosis memiliki peluang sebesar 13,988 kali daripada kategori referensi kita yang mengacu pada no, dimana no dinyatakan sebagai tidak memberikan asupan obat cacing secara rutin dan sesuai dosis. variabel ini sangat signifikan mempengaruhi log odds (weightgain) dengan nilai signifikansi 0,002.
  • Variabel cost cenderung meningkatkan weightgain sebesar 0,030 kali dengan nilai signifikansi yang baik yaitu 0,018 < 0,05.(yoso)

download materi dalam bentuk pdf disini >>>

147 thoughts on “Regresi Logistik Biner *IBM SPSS 23

  1. Pagi mas Ary..
    numpang nanya neh (maaf sebelumnya kalau pertanyaannya terkesan sepele maklum masih dangkal pemahaman tentang statistik)
    Saya ingin menanyakan tentang salah satu sub dalam rancangan penelitian saya. Saya ingin melakukan analisa faktor yang berpengaruh terhadap preferensi responden untuk menanam (“1”) atau tidak menanam (“0”) pohon di lahan miliknya. Atas dasar respon yang bersifat biner/nominal tersebut saya hendak menggunakan regresi logit untuk menilai kecenderungan pengaruh faktor menggunakan nilai odd ratio terhadap respon.

    yang menjadi masalah adalah variabel bebas yang saya gunakan sebagai faktor tidak seragam atau ada yang bersifat kualitatif dan ada pula yang bersifat kuantitatif (data tipe ratio hasil pengamatan dan pengukuran)., dimana data-data kualitatif tersebut saya coba kuantitatifkan dengan menggunakan skala ordinal maupun likert. pertanyaan nya adalah :

    1. ketika mengkuantitatifkan suatu data kualitatif, haruskah jumlah ordo dan/atau kelas interval yang digunakan sama/seragam antara tiap parameter/variabel kualitatif yang lain.?

    2. dalam regresi logistik., apakah semua variabel bebas (Xn) yang digunakan harus merupakan variabel dengan tipe data yang sama (apakah harus seragam, ordinal saja/interval saja/rasio saja)?. apakah model tidak bisa digunakan jika variabel bebas yang dipakai tidak seragam atau kombinasi antara data ordinal, interval, dan ratio.?

    3. jika tidak bisa, apakah saya harus mengkonversi data kuantitatif yang bertipe ratio tersebut menjadi data bertipe interval/skala likert agar saya bisa menggunakannya dalam model regresi logistik.?

    4. jika harus menkonversi data kuantitatif bertipe ratio kedalam skala likert, haruskah jumlah kelas interval nya sama dengan jumlah ordo dan atau kelas interval dari data kulitatif yang telah dikuatitatifkan sebelumnya.?

    5. berhubungan dengan penentuan responden, berdasarkan kemungkinan respon “1” (memilih menananm pohon) dan “0” (tidak menanam pohon) bagaimana baiknya menetapkan jumlah responden.? jika total responden yg akan diambil sebanyak 60 responden, mana teknik penentuan responden yg lebih baik :
    a. jumlah responden yang menanam dan tidak menanam pohon ditentukan secara proposional (50% : 50%)., atau…
    b. jumlah responden yg menanam dan tidak menanam ditentukan secara acak..??

    Contoh beberapa variabel2 bebas yang dirancang untuk digunakan dalam penelitian:

    Harga kayu >> Rp/m3 >> tipe ratio
    Luas lahan kering responden >> Ha >> tipe ratio
    Jarak lahan kering dari rumah responden >> Km >> tipe ratio
    Pendapatan dari hutan rakyat >> Rp/tahun >> tipe ratio
    Pendapatan non-hutan rakyat >> Rp/tahun >> tipe ratio
    Jumlah ternak gembala >> ekor >> tipe ratio
    Jumlah Tenaga kerja dalam keluarga >> orang >> tipe ratio
    Umur responden >> tahun >> tipe ratio

    # Untuk variabel kualitatif dibawah ini, saya mengkuantitatifkan nya menjadi data bertipe ordinal dan nominal.., apakah data bertipe nominal dan ordinal dapat digunakan sebagai variabel bebas dalam regresi logistik? jika tidak bisa bagaimana cara mentransformasi ke tipe interval atau ratio.?

    Tingkat pendidikan terakhir responden >> kualitatif >> ordinal 4 ordo
    Keanggotaan dalam kelompok tani >> kualitatif >> ordinal 3 ordo
    Kelerengan lahan >> kualitatif >> interval 5 kelas
    Persepsi keberadaan tegakan hutan >> kualitatif >> ordinal 3 ordo
    Kebijakan insentif >> kualitatif >> nominal “1” dan “0”
    Pendidikan non formal >> kualitatif >> nominal “1” dan “0”
    Status sosial >> kualitatif >> ordinal 3 ordo
    Faktor Waris >> kualitatif >> nominal “1” dan “0”
    Kemudahan pemasaran kayu >> kualitatif >> ordinal 3 ordo

    Terima kasih., dan Mohon Pencerahaannya..

  2. wah wah wah mantaaaaaaaafff mas ari saya sangat tertolong sama penjelasan mas ari selama ini., saya jadi bisa mantap menggunakan model regresi logit ini dalam rancangan penelitian saya..
    Makasih banyak mas., semoga ilmu yang mas sharing kepada saya menjadi pahala yang terus mengalir..

  3. mas mo nanya lagi neh., masih boleh kan.?? hehehe..
    klo melakukan analisis regresi logistik dengan spss., output correlation matrix dihasilkan atas dasar korelasi pearson atau spearman mas.??

  4. alow ariyosooooooooo … mw nanya nie … seandainya pada saat pengujian spss ni … kan mau uji pengaruh …
    nah saya kan menguji perataan laba jadi pakai DUMI .. tapi variabel independen saya 1 dan dependen nya cuma 1.. mending pakai regresi apa yah ? huhuhuhue

    thankz yaaa
    ^_^

    1. Oke Marcelina,
      klo regresi antara 1 variabel dependen dengan 1 variabel independen itu bisa cukup dengan regresi linier sederhana, modelnya simpel yaitu Y = a + bX dimana Y = var dependen, a = konstanta, b = slope, X = var independen, kalo dengan variabel dummy, bukan berarti jadi regresi logistik, emang dummy itu angkanya 1 dan 0, tapi pada variabel independennya, bukan dependennya,..marcelina tetep bisa pake regresi sederhana dengan model Y = a + bx + dummy + e, dimana e itu error..coba liat beberapa referensi tentang regresi linier sederhana…karena biasanya pada model regresi yang ada variabel dummy (indikatornya), konstantanya tidak ikut dihitung, dengan kata lain harus dihilangkan..Okey….

  5. Pagi…
    Mas ari, saya yuni mahasiswa matematik yang lagi buat skrip tapi make regresi logistik..
    saya mau nanya, kalo uji goodnees of fit yang memakai nilai statistik pearson yang rumusnya

    chi_square = sigma j rj kwadrat
    rj = (yj- mj.phi_j)/ akar phi-j …dst
    nah yj, mj, & phi_j itu keterangannya pa ya mas???

    mohon bantuannya!!
    thank’s be4..^_^

  6. mas ari,, bukan rumus itu yang saya tanyakan.!!

    maksudku yang rumus statistik pearson untuk menguji apakah model yang sudah terbentuk memenuhi apa belum. itu rumus ada di bukunya hosmer & lemeshow, di agresti juga ada.
    penjelasan di sana bahwa mj itu jumlah percobaan dengan pola kovariate j. nah saya gag tau maksudnya pa mas??

  7. dear mas ari saya pengin meneliti pengentasan kemiskinan dengan Y = dependent merupakan biner data ( miskin dan tidak miskin) sedangkan X1 sampai Xn adalah independent yang di kontribusi oleh SKPD , apakah ada usulan mas ari untuk itu maksud saya ide agar supaya secara numerikal bisa dipertanggung jawabkan dari sekian banyak x………Xn terdapat yang masuk dalam skenario 1 sampai ke n
    secara nyata Variabel X1 … dengan indikator … dst
    ok mas ari dibalas ya X terdiri atas 37 kontributor SKPD dengan indikator sekitar 100

    1. mas agus,
      OK, saya masih belum mengerti kontribusi SKPD yang digunakan itu bentuknya kira-kira bagaimana,
      jika menggunakan 37 kontributor, apakah berarti menggunakan 37 variabel independen? apa saja itu, apakah semuanya numerik atau kategorik?

  8. Mas,

    Saya mahasiswa jurusan SI dan sedang melakukan penelitian, terdpt:
    1. 1 variabel independen (14 pertanyaan, tipe nominal Ya/Tidak)
    2. 5 variabel dependen (A,B,C,D,E)
    A (1 pertanyaan, tipe ordinal dg 8 pilihan)
    B (1 pertanyaan, tipe ordinal dg 6 pilihan)
    C (6 pertanyaan, tipe 5 poin Likert)
    D (7 pertanyaan, tipe 5 poin Likert)
    E (1 pertanyaan, tipe ordinal dg 5 pilihan)
    Saya ingin menanyakan uji hipotesa apa yg mana yg dipake? Apakah uji regresi logistik biner

    Terima kasih banyak

  9. Salam Kenal Pak ahli statistik (he..he)
    senang x saya menemukan blog Bpk. kebetulan lagi bingung tentang penelitian saya. mohon bantuan Bpk. judul penelitian saya hubungan informasi dalam laporan keuangan dengan tingkat akuntabilitas dan transparansi. dengan demikian informasi dalam laporan keuangan (X) dan akuntabilitas (y1), transparansi (y2). analisisnya korelasi apa yang cocok digunakan y pak?
    terimakasih banyak sebelumnya atas bantuan bpk semoga berkah dan amal bagi bapak. amin…

    wassalam

    1. salam kenal juga siska,
      saya juga sebenarnya masih belajar, jadi bukan ahli yaa..cuma sekedar ingin sharing apa yang saya ketahui :)
      mungkin dalam bayangan saya siska bisa membandingkan, korelasi mana yang paling signifikan apakah akuntabilitas dengan informasi laporan keuangan atau transparansi dengan informasi dalam laporan keuangan,,berarti tujuannya penelitian dan judulnya diganti.
      atau siska bisa baca materi tentang korelasi kanonik yang mengukur korelasi antara dua kelompok variabel, dimana kelompok variabel X dapat dikorelasikan dengan kelompok variabel Y (Y1 dan Y2).

  10. mas, maaf saya mau nanya, saya lagi nyusun skripsi dengan sampel total populasi sebesar 48 orang, tp saya disuruh buat uji power, saya blm mengerti apa yg hrs saya lakukan
    makasih banyuak ya

    1. bisa…uji power dilakukan buat nentuin apakah populasi sampel yang linda gunakan itu tepat, katakanlah dengan 48 populasi sampel, hasil yang kamu dapatkan masih memiliki standar error yang besar, maka lebih tepat lagi sampelnya ditambah…uji power akan dipengaruhi oleh beberapa hal misalnya:
      1) jumlah sampel; semakin besar jumlah sampel yang kamu gunakan, maka power dalam pengujian yang kamu lakukan akan semakin besar,
      2) tingkat signifikansi; semakin besar tingkat signifikansi, maka power dalam pengujian kamu akan semakin besar, berarti batas penerimaan akan hasil uji akan semakin kecil,
      3) semakin besar perbedaan antara nilai parameter sebenarnya dengan nilai yang ditentukan dalam hipotesis null, maka power pengujian kamu akan semakin besar..
      Nah, sebagai contoh kamu bisa melihat bab tentang uji one way anova disini >>…di bagian TUKEY POST HOC TEST, jika saja saya menambah jumlah sampel yang digunakan, mungkin lebih banyak kelompok yang signifikan, dengan demikian, power dalam pengujian saya akan semakin besar.
      OKEY,,sebagai catatan kamu juga bisa menggunakan TUKEY POST HOC TEST sebagai uji power, :)

  11. Salam kenal…
    saya evi mahasiswa matematika UPI (non dik).
    Saya ingin bertanya tentang overdispersi dalam regresi logistik.
    Yang masih saya bingungkan, overdispersi itu terjadi jika ada korelasi antar peluang respon (variabel Y), sedangkan yang saya tahu, dalam regresi logistik itu, variabel Y nya cuma 1.

    Mohon penjelasannya
    terima kasih

    1. iyap betul, overdispersi cuma terjadi pada model logit…mudahnya gini,overdispersi terjadi karna ketidakcocokan antara variabel respon (Yi) dengan nilai perkiraan Yi dimana Var(Yi) = niπi(1-πi), overdispersi terjadi jika Var(Yi) > niπi(1-πi), sedangkan underdispersi terjadi jika Var(Yi) < niπi(1-πi),..ini bisa terjadi karena penghilangan salah satu kovariat (1 atau 0), data yang saling berkorelasi, dan kompleksitas data yang tidak diketahui.
      emang bener variabel Y cuma 1, yang bertabrakan (tidak cocok) adalah variabel respon Y dengan nilai perkiraannya (predicted value)…akibatnya estimasi error maupun hasil uji goodness-of-fitnya ga sesuai harapan alias jadi aneh atau terganggu..karena itu ada lagi tahap adjusmentnya jika terjadi hal demikian, kamu bisa baca materi tentang quasilikelihood atau deviance statistic…okeh…

  12. mas ari, saya irun..
    saya mau nanya (maaf klo pertanyaanya spele…)
    apakah ada kriteria atau syarat khusus dalam melakukan analisis regresi logistik???? apakah semua data dapat dpat di analisis menggunnakan analisis regresi logistik??? mkasih…

    1. simple mba, dalam logit hanya menggunakan dua kategori yang bersifat dikotomi sebagai variabel dependen, misalnya 1 dan 0 yang mewakili sex (1=male/2=female), trus ga variabel yang kita gunakan gak harus berhubungan linier antara variabel dependen dan independen,trus variabel independen tak harus terdistribusi normal = artinya ga diperlukan uji normalitas data, trus lagi variabel tidak harus homoskedastis jadi ga perlu ada pengujian asumsi heteroskedastisitas, pokonya asumsi klasik yang biasa kita gunakan dalam regresi linier sederhana atau bertingkat ga berlaku dalam logit…saya kira itu aja :) met mencoba ya./…..

      1. terimakasih mas,, berarti semua data dapat di analisis menggunakan analisis regresi logistik ya mas???

      2. engga smua donk..yang klo variabel dependennya nya nominal atau ordinal continuous kan engga, harus biner :)

  13. selamat siang mas ari,saya nadia,saya ingin menanyakan,apakah perbedaan aplikasi logistik biner dengan logistik ordinal?maaf ya klo pertanyaan saya aneh..terima kasih..

    1. ga ga..ga aneh sama sekali koq :D..klo regresi logistik biner,variabelnya bersifat dikotomi,,artinya variabel independennya berpeluang 1 atau nol saja,,misalnya untuk kasus 1=berhasil dan 0=gagal…nah klo regresi logistik ordinal akan memasukkan peluang lain selain 1 dan 0, artinya jika dengan regresi logistik biner peluangnya adalah tinggi dan rendah saja, maka dengan regresi logistik ordinal dapat menjadi tinggi, rendah dan sedang, sehingga tidak bersifat dikotomi lagi,,,aneh juga klo pertanyaannya dibilang aneh, padahal bagus.. :)
      klo ada waktu saya akan posting bab lain mengenai regresi logistik ordinal deh..

      1. pak..sy mw tanya
        penelitian saya menggunakan regresi logistik…….-dan ketika melakukan uji asumsi klasik heteoskedastisitas ternyata ada salah satu variabel independennya yang terjadi heteroskedastisitas, apa yang harus saya lakukan…….. untuk mengeboatinya??
        terimakasih

  14. Hosmer and Lemeshow Goodness-of-Fit Test mengindikasikan bahwa kita dapat menerima H0 karena lebih dari 0,05 (1 > 0,05)

    kalau misalnya ini tidak terpenuhi karena kita tolak H0 gimana?

    1. Hasil dari Hosmer and Lemeshow Goodness-of-Fit Test akan menunjukkan jumlah kasus dan kontrol yang diharapkan pada masing2 grup variabel, dan merupakan tes statistik paling akhir dalam logit,,,,Jika kita tolak H0, maka 1 < 0,05, artinya terjadi lack of fit atau model yang digunakan kurang mewakili analisis,,saya kira begitu mas taufiq

  15. Mas Ari, saya mau tanya kalau misal hasil Cox and Snell R Square dan Nagelkerke R square saya kecil 0.027 dan 0.05. Apa penelitian saya layak? karena lebih dari tidak lebih dari 10% keanekaragaman yg dapat dijelaskan oleh model.
    Terimakasih sebelumnya.

    1. saya kira kurang layak nanda,,karena semakin tinggi nilai R-square, maka model yang digunakan akan semakin baik, karena seperti yang kita ketahui bahwa R-sq adalah jumlah keragaman yang dapat dijelaskan oleh model,,
      bisa dicek lagi pada tahap pengolahan datanya, mungkin ada yang tertinggal
      thx..

  16. Met malem….
    Mas, saya sedang mengerjakan TA menggunakan regresi logistik, tapi variabelnya menggunakan variabel nominal. Gmn cara merubahnya menjadi variabel kategorik atau apa lah.
    Saya menggunakan variabel respon Pendapatan, prediktornya jumlah penduduk, Inflasi, dll yang semuanya nominal. Bisa apa nggak ya mas? Gimana penanganannya mas?
    Mohon bantuannya.

    1. ga masalah adiiii (i-nya banyak ya)…dengan variabel nominal,,asal responnya tetap dikotomi alias tinggi atau rendah (1 atau 0)..merubah variabel nominal juga dapat menggunakan pemeringkatan, misalnya jumlah penduduk menjadi kriteria tinggi, sedang dan rendah,,asal terdapat keterangan yang jelas tinggi itu berapa hingga berapa, rendah itu berapa, dan seterusnya

  17. asl…mas salam kenal saya mahasiswi sem 7 yg mau nyusun skripsi,,mau bertnya sedikit???
    jadi, dalam variabel independen saya, ada 2 variabel yg menggunakan variabel dummy, kemudian saya juga menggunakan variabel kontrol, untuk mengendalikan variabel dependennya,,selain itu juga variabel dependen saya juga menggunakan dummy,,yang saya mau tanyakan:
    1.apakah itu menggunakan regresi???
    2. klo iya,,regresi jenis apakah???logistik or linier berganda or ada yang lain nya??
    makasih mass yg baik hati sebelumnyaaa…

    1. salam kenal juga aprina,
      jika menggunakan variabel dummy sebagai dependen,maka ia akan bersifat dikotomi kan?karena itu aprina bisa menggunakan regresi logistik biner,,perlu diketahui juga bahwa regresi linier bertingkat lebih tepat dengan data continuous
      makasih kembali…

  18. Mas ari, saya mau tanya..

    Saya sedang mengerjakan tugas akhir dengan judul “Analisis Pengaruh Stock Split Terhadap Trading Liquity, Earning Per Share, dan Stock Return, Stock Beta, dan Insider Ownership”.
    Di sini saya meneliti tentang pengaruh pemecahan saham terhadap masing2 tujuh variabel (ada 7 hipotesis).
    Itu ujinya menggunakan regresi yang mana ya? Adviser saya bilangnya menggunakan regresi logistik. Apa bisa menggunakan regresi logistik biner atau regresi logistik yang lainnya lagi?
    Trus saya perlu melakukan uji normalitas juga ngga ya?

    Mohon pencerahannya ya mas, terima kasih sebelumnya..

    1. tergantung variabel dependen yang winda gunakan, jika bersifat dikotomi, misal (1 = berhasil; 2 = gagal) maka dapat digunakan model logit biner, jika lebih dari dua kemungkinan, bisa menggunakan model logit ordinal..tetapi klo smua variabel baik dependen maupun dependennya bersifat continuous, ordinal, atau lainnya, maka cukup dengan regresi linier bertingkat saja. Jika memang menggunakan model logit, maka winda tidak perlu melakukan uji normalitas lagi, karena logit tidak mengasumsikan bahwa data harus tersebar secara normal, berbeda halnya jika menggunakan regresi linier bertingkat yang mengasumsikan adanya hubungan linier, data harus tersebar normal, dan data harus bebas dari asumsi klasik seperti multikolinearitas, autokorelasi, maupun heteroskedastisitas. mengenai hal2 tersebut bisa dibaca di bab lain Statistik 4 Life yang khusus membahasnya..okey//

  19. mas, saya lagi nyusun skripsi..
    judulnya ” menentukan model koefisien regresi logistik dengan menggunakan maksimum likelihood”..
    itu, kira” judulnya udah tepat apa belum?
    trus kira” pake teori apa yah mas?
    (maap agak membingungkan pertanyaan saya..)

    1. wah itu kurang spesifik dunk, emang nilai max likelihood adalah salah satu kriterianya,,nah sekarang yang mau dianalisis apa??

  20. pak saya mau bertanya…
    kalau ada peringatan di output logistik bahwa matrix kovarian tdk dapat dihitung berarti apa artinya?

    apakah data saya ada masalah?
    bagaimana solusinya?

    terima kasih…

  21. slmt siang mas ari..mau numpang nanya..
    saya lg ngambil skripsi dgn pengujian regresi logistik..
    saya menggunakan pengujian itu krn ikutin jurnal saya, tpt saya kurang ngerti ttg regresi logistik..
    saya bingung, bagaimana menentukan 0=ya dan 1=tidak.. sedangkan kuesioner untuk pertanyaan variabel dependennya (melakukan penghentian prosedur audit) menggunakan skala likert 1-4 (tdk prnh, kadang2, selalu dan hampir selalu)..
    truz kalau pengujiannya regresi logistik, kita perlu pengujian seperti uji normalitas, multikolinieritas, dan autokolerasi ga?

    mohon bantuannya ya mas..terima kasih.. :)

    1. iya, angka biner itu variabel dependennya hanya ada 2 kemungkinan,,klo dalam kasus kamu, mungkin melakukan penghentian bisa dinotasikan 0, atau tidak melakukan penghentian prosedur audit untuk 1 kali ya :)

  22. Mas, boleh nanya..
    1. Saya bnyk membaca ttg uji time effect buat menilai apakah data bisa di pool atau tidak. Apakah itu perlu? bagaimana caranya dengan menggunakan spss ya?
    2. Contoh di atas, mas ada atur di bagian categorical, itu buat variabel yg gmn ya mas? kl variabel independen saya ada yang dummy ada yg nominal apakah perlu disetting bagian categoricalnya?
    3. Hasil uji logistik saya juga menunjukkan hasil nagelkerke rsquare sebesar 100%, apa itu normal mas? soalnya hasilnya itu kan besar banget saya takut kl ada yang tidak normal pada data saya.

    Terima kasih buat ilmunya mas.. ^^

    1. teddy,
      1. uji time effect??ga lazim digunakan tuh, pool maksudnya gimana,,apakah disatuin menjadi konsep data panel??biasanya time effect masuk dalam bahasan time series
      2. untuk yang masuk bagian categorical itu adalah data-data jenis kategorik; atau data yang kita notasikan, misalnya (1 untuk memilih, dan 2 untuk tidak memilih dalam kasus pemilu), atau 1 untuk SD, 2 untuk SMP, 3 untuk SMU, atau 1 untuk wanita dan 2 untuk pria, dan seterusnya. Jika variabelnya dummy ga perlu dimasukkan ke dalam categorical, karena ya itu dummy, bukan variabel kategorik,,jadi dummy biarkan saja.
      3. Hasil negelkerke dan cox & snell itu ibaratnya r-square dalam regresi OLS, nilainya berkisar 0 – 1, semakin besar semakin baik, jadi nilai 0,100 artinya 10 persen, jadi ga akan mengganggu model dan ga ada masalah, karena r-square logit ga selalu besar nilainya.
      kira2 begitu ted..

      1. Buat yg no3, itu digambar contoh punya mas diatas bernilai 1.000 itu brarti 100% kan? punya saya juga begitu hasilnya, jadi agak penasaran kok bisa besar begitu.

        Oh iy mas, terus mas ad tips” ga biar hasil uji variabel in the equation nya lebih baik? (lebih sig) soalnya punya saya dari 13 variabel independen cm 2 yang hasilnya sig, tp sebenarnya tidak ada masalah juga, hanya ingin membuat hasil yang lebih baik kl bisa. ^^v

  23. pak, mau tanya kenapa bisa beda ya hasil koefisien persamaan regresi dan signifikansi jika kita memasukkan 3 dari 7 variabel, 5 dari 7 variabel atau 7-7 varibel sekaligus?
    jadi masing2 variabel gk bs berdiri sendiri, tapi sangat tergantung satu sama lain?

    1. iya dunk,,karena tidak semua variabel independen punya hubungan linier dengan dependennya pada kasus regresi biasa,,
      karena itu penghilangan variabel yang tidak signifikan terkadang bisa memperbaiki model persamaan..

  24. Mau nanya…
    Apakah di dalam regresi logistik biner tipe data variabel independen harus sama dengan tipe data variabel dependen?
    Mohon balasannya

    1. beda donk,,klo dependennya kan harus bilangan biner (0 atau 1), misalnya 0 untuk gagal dan 1 untuk sukses,
      buat var. independennya bisa aja skala atau continuous/ordinal..atau notasi :)

  25. mau tanya mas admin,,,kalau hasil olah datanya itu terdapat kalimat estimation terminated at iteration number 20 because maximum iterations has been reached. final solution can’t be found (dlm model summary block1 : method = enter),,, itu artinya apa ya?
    apakah dapat membuat hasil tersebut tidak dapat dipercaya? atau saya masih dapat melanjutkan pembahasannya?
    trimz b4…
    hopefully u can reply me soon

    1. hmmmm,,
      model summary menjelaskan analogi R-square seperti pada regresi linier, biasanya prediktor terbaik yang dipakai adalah Nagelkerke R square, apakah bernilai besar atau kecil??
      jika kecil, artinya ada ketidak-cocokan model dalam variabel yang digunakan..berarti ada variabel yang tidak mendukung model.
      coba cek dulu,,apakah marchella sudah benar menempatkan variabel dependen, independen, dan kovariat??apakah notasi yang mewakili variabel dependen dan independen sudah tepat??
      terakhir,,rekomendasi data yang digunakan untuk melakukan analisis logit minimal 50 kasus per prediktor/variabel independen, apakah itu sudah memenuhi,,kalau di contoh S4L datanya hanya sedikit, karena hanya untuk sekedar contoh.. :)

  26. saya mahassiswi yang sedang mengajukan skripsi. yang ingin saya tanyakan, dalam regresi logistik biner apakah variabel independennya juga harus 0 dan 1 ? misal untuk tingkat ekonomi saya mencantumkan 0 = kurang, 1 = cukup, 2 = lebih, apakah boleh? terimakasih sebelumnya. ulasan Bpk pasti sangat membantu saya ^_^

    1. tidak harus,,
      variabel independennya bebas, misalnya male & female; SD=1, SLTP=2, SLTA=3, dst..
      tetapi variabel dependen yang harus bilangan biner 0 dan 1

      1. ya,betul
        regresi termasuk dalam kasus SEM, tapi dalam logit sudah diketahui mana DV dan IV,
        sedangkan dalam terminologi SEM, semua variabel dapat saja berfungsi sebagai independen atau dependen, saling regresi antar variabel eksogen digunakan untuk membangun model..

  27. mas aryo..boleh konsultasi sedikit…kalau B (EXP) adalah nilai Oods Ratio yang dihasilkan, kalau B, Wald, S.E itu apa ya? apa beda B dengan B (exp)?

  28. sekalian nambah pertanyaan mas…apa yang dimaksud dengan simple correlation and multiple regression analysis? apa sama dengan uji korelasi pearson/ fischer exact dan analisis multivariat/analisis regresi logistik? matur nuwun sanget ya.

  29. kalau Regresi LOGISTIK ordinal variabel bebasnya semuanya lebih dari satu kategorik boleh gak???ato harus cuma binner(ato 2 kategorik )doank makasii

    1. iya donk, hipotesis yang diuji adalah nilai peluang/log odds bernilai 0 atau tidak..tapi intinya kita mencari peluang untuk variabel prediktor..

  30. ass, mau tanya untuk melihat variabel yang berpengaruh paling dominan pada regresi logistik itu dilihat dari mananya ya?? terima kasih pak, sya tunggu jwabannya…

  31. pagi mas..saya mw tny, dari kemren2 bingung mw diapakan data saya..udah di otak atik msh jg bingung.
    saya sdg penelitian dengan judul hubungan perilaku kepemimpinan dgn pemberdayaan diri.nha dengan:
    1. var.independ –> perilaku kepemimpinan, 30 soal dengan tipe soal likert(1-5) –> dari sini dihasilkan 3 tipe perilaku
    2. var.depend –> pemberdayaan diri (pemb.psikologis dan struktural). menggunakan 2 kuesioner (berbeda, krn masing2 kuesioner jumlah soalnya brbeda dan penilaian tiap soal antar kuesionernya beda), pke likert juga (pemb.psikologis 12 soal dan tiap soal ada poin 1-7, pemb.struktural 19 soal dan tiap soal ada poin 1-5)
    nha sy bingung uji korelasinya gmn???
    trus saya ingin melihat diantara 2 jenis pemberdayaan tsb mana yg lebih cenderung digunakan????
    kmrn sempat tny dosen ktny pke uji beda…nha trus korelasinya gmn??
    minta bantuannya y mas..sy bingung udah ngotak atik..terimakasih bnyk…

    1. nhaa saya juga bingung,,abisnya panjang bgt alur pertanyaannya
      ini aja kamu baca materi tentang uji one way anova disini>>>,,baca yang teliti,,jangan sampe kelewat ya,,klo dah itu,,lupain korelasinya
      nah udah itu, kerjain penelitian kamu pelan2 :)

  32. Siang pak…
    Maklum masih minim pengetahuan akan logit…
    Mau tanya pak, kan saya α∂a pakai likelihood juga… Nah pada kolom iterasi ny α∂a sampai step 20, apakah itu tidak apa2 y pak hasil output ny seperti itu?

    Θàή juga kenapa ќiτά mesti memakai metode ENTER ? Bukan yang lain?

    •-̶̶•̸Ϟ•̸•[τ̲̅н̲̅a̲̅и̲̅κ̲̅ ч̲̅o̲̅u̲̅]••̸Ϟ•̸-̶̶•-̶ ™ be4 pak…

    1. siang
      ga apa2 outputnya seperti itu,,
      kenapa enter?karena kita masukkan semua variabel langsung ke dalam persamaan tanpa memilah terlebih dahulu mana variabel yang signifikan dalam model dan mana yang tidak..
      jika kita gunakan forward, artinya kita masukkan variabel yang paling signifikan terlebih dahulu,,kemudian baru variabel lain.
      jika kita gunakan backward artinya kita masukkan dahulu seluruh variabel dalam model,,kemudian kita hilangkan variabel yang tidak signifikan terhadap model satu persatu
      kira2 begitu..

  33. Salam kenal,Kak
    Kak, ada tidak asumsi atau cara yang dapat dilakukan untuk membuat data menjadi signifikan (karena jika sig yang di ‘variables in the equation’ >0,05 )?atau tidak bisa diolah lagi ya?
    Dan apakah model yang fit (dilihat dari hosmer test) namun setengah atau sebagian besar variabelnya tidak signifikan dapat dikatakan sebagai regresi yang baik?
    Sebenarnya hasil penelitian yang bagaimana yang dapat dikatakan baik ya,kak?lebih ke modelnya yang hasilnya fit dengan data atau dari berapa banyak variabelnya yang signifikan, atau bagaimana ya?
    terim kasih,Kak…^^

    1. salam kenal juga,,
      jika nilai sig >0,05 maka H0 kita terima,artinya logit p=0,,nilai odds ratio harus antara 0 dan 1 (tidak boleh nol) dengan demikian model dalam persamaan kita tidak signifikan donk,,
      dalam logit kamu juga harus memiliki sampel yang cukup besar (misalnya 100), kurang dari itu kemungkinan besar model tidak signifikan atau bias.
      model dikatakan fit jika signifikan (< 0,05) dengan demikian dapat kita peroleh hipotesis tolak H0..
      coba perbanyak jumlah sampel kamu,,dan teliti lagi variabel kategorik yang digunakan :)

  34. Jika hasil pengujian regresi logistik menyatakan ada case yang missing maksudnya bgmana ya,Kak?Apakah interpretasinya sama seperti pada umumnya?atau harus ada perlakuan lagi?
    ex:
    Case Processing Summary
    Unweighted Casesa N Percent
    Selected Cases Included in Analysis 68 65.4
    Missing Cases 36 34.6
    Total 104 100.0
    Unselected Cases 0 .0
    Total 104 100.0
    a. If weight is in effect, see classification table for the total number of cases.

    1. hmm gawat juga klo missing casenya sampai 34,6%, artinya banyak kasus yang tidak terproses oleh software kamu,,dengan demikian hasilnya bisa bias,,
      biasanya disebabkan ada data pada variabel prediktor yang hilang, kemudian beberapa row juga akan diabaikan oleh SPSS, demikian juga untuk variabel prediktor lain yang sejajar..ini bisa terjadi dengan jumlah sampel yang besar,,apalagi sebagian besar software SPSS kita downlodan,gak ori,atau kopi-paste dari temen,kemungkinan besar tetep ada beberapa fitur/fungsi yang hilang..
      solusinya kamu coba input datanya secara manual (satu persatu),,kemudian coba kembali :)
      semoga membantu..

  35. dalam penelitian saya menggunakan regresi logistik. Di mana variabel dependennya dikotomi dan terdapat 3 variabel independen, 1 diantaranya dikotomi. Jika nilai variabel dependen dan variabel independen yang dikotomi tersebut memiliki nilai yang sama bagaimana solusinya? (tanpa mengubah sampel dan variabelnya)

    1. ga masalah,,terus aja..variabel independen juga ga mutlak harus pake nilai koq,,bisa aja kondisi sebenarnya (misal male, female, etc)

  36. mau tanya di regresi logistik, kenapa variablesin the equationnya yang salah satu variabel tidak keluar sehingga tidak bisa di interpretasikan …

    1. yakin udah diinput semua,,coba cek bentuk data yang masuk ke SPSS,,apakah ordinal atau string,,jika string ya tidak akan terbaca,,
      trus metode yang kamu gunakan,,apakah backward, stepwise atau enter,,jika menggunakan backward atau stepwise maka variabel yang tidak signifikan akan dihilangkan oleh SPSS :)

  37. selamat sore maz,,
    maaf agak curcol dkit,,he
    saya mahasiswi yang sekarang sedang skripsi tentang regresi logistik binner,, karena saya jurusan matematika murni jd saya hrus melakukan analisis secara manual,,oleh krn itu maz tlong dong dikasih penjelasan tentang proses / langkah yang hrus saya lakukan secara manual untuk analisis regresi logistik ninner ini…dan materi matematis apa saja yang hrus saya gunakan dalam proses analisis…?
    mohon bantuannya ya… ^_^
    terimakasih…

  38. Siang mas Ary…
    Mas, saya butuh bantuan untuk menentukan alat analisis apa yg tepat digunakan dalam penelitian saya. Objek penelitian saya jumlah populasinya sedikit (hanya 10) yg kesemuanya saya jadikan sampel penelitian. Adapun variabel2 yg dipakai sbb:
    X1 = jumlah karyawan –> data rasio
    X2 = ROA –> data rasio
    X3 = Leverage –> data rasio
    X4 = jumlah dewan komisaris –> data rasio
    X5 = kualitas dewan pengawas syariah –> kategorikal 4,3,2,1 (data ordinal)

    Y = indeks pengungkapan pada laporan tahunan (dalam %)

    Pertanyaan saya,
    1. Apakah data Y berupa indeks termasuk data ordinal atau rasio? Minta referensi teorinya mas…

    2. Apakah dalam penelitian tsb bisa digunakan analisis regresi dengan jumlah sampel yg kecil?

    3. Lalu jika dilakukan analisis korelasi menggunakan korelasi apa ya mas?

    Terima kasih, mohon pencerahannya mas…

  39. MAS MAU NANYA NI,,, SAYA MELAKUKAN PENELITIAN DENGAN MENGGUNAKAN REGRESI LOGISTIK,,,
    REGRESI LOGISTIK KAN DIGUNAKAN JIKA VARIABLE DEPENDENNYA BERSIFAK KATEGORI,, SAYA BACA INI D BUKU PAK IMAM GHOZALI,, NAH DOSEN SAYA NANYA NI,, SAPA ORANG YANG PERTAMA X MENGELUARKAN STATEMENT INI… MOHON BANTUANNYA YA……

    1. bukan kategori neng,,tapi biner (dua kemungkinan), atau 0 dan 1, ya dan tidak, sukses atau gagal, dll,,kalau kategori bisa aja kategorinya 4 atau 5 (itu bukan logistik lagi namanya)..emang bukan kata siapa-siapa,,itulah regresi logistik :)

  40. Mas, saya mau tanya..
    adakah cara untuk merubah regresi biner logistik ke regresi panel data?? soalnya data saya kan menggabungkan time series sama cross section tapi variabel dependennya biner..mohon pencerahannya ya Mas…terima kasih.

  41. mas mau nanya nih,mngkin gk dlam regresi logistik pke uji t? soalnya dosen saya nanya knapa untuk nguji variabel independennya gk pke uji parsial t.trima kasih

    1. mungkin aja na,,apa dulu tujuan penelitiannya,,uji t merupakan uji perbandingan antara 2 variabel yang saling lepas,,sedangkan logit untuk mengetahui rasio peluang variabel dependen terhadap independen yang dinyatakan dengan bilangan biner,,jika hanya membandingkan,,bisa aja cuma pake uji t atau anova

      1. judul penelitian saya “pengaruh kondisi keuangan, kualitas audit dan ukuran perusahaan pada perusahaan manufaktur yg trdpat di bei thun 2010-2011″ apakah bisa pke uji t mas? klo bisa pke uji t berarti bisa pake uji f simultan juga ya mas?
        trima kasih bnyak mas atas jawabannya

  42. mas admin kalo tanya, variabel dependen diukur dgn 5likert scale, trus diubah jadi binari: tinggi (1) renddah (2), krn mau pake reg logistik. Apa diperkenankan perubahan tsb? trmks sarannya.

  43. salam kenal kak,saya sedang menyusun skripsi dan lagi bnggung analisis data apa yg cocok untuk penelitian saya. jdul penelitian saya faktor-faktor yang mempengaruhi tingkat pemahaman IFRS.variabel independennya ada 7 dan dependennya ada 1(variabel dummy). variabel independennya ada 1 yang variabel dummy kak, yaitu status perguruan tinggi swasta atau negeri sedangkan 6 variabel independen lainnya adalh skala interval. yang saya ingi tanyakan analisis data apa yg cocok untuk penelitian saya ini kak? sedangkan setau saya variabel dummy itu termasuk skala nominal ya?. mohonnnnn bantuan nya ya kak….

  44. intinya pertanyaan saya itu, apakah analisis regresi logistik bisa digunakan dalam penelitian yg variabel independennya dummy(skala nominal). krna dr artikel2 yang saya baca analisis regresi logistik itu ketentuannya variabel indepent mempunya skala rasio atau interval. mohon di jawab ya kak….,makasih

    1. bisa pake dummy untuk independen,,dalam SPSS kamu bisa proses dulu kodingnya, insyaallah senin 14/1 ini akan saya posting materi “regresi logistik dengan variabel dummy”..

  45. mas,,,,saya mau tanya, begini….penelitian saya awalnya menggunakan analisis regresi linear, untuk variabel bebasnya X1, dan X2 skala datanya 0 dan 1, skor untuk jawaban benar 1 dan salah adlah 0. begitu juga variabel dependent (Y), untuk jawaban benar diberi skor 1 dan salah diberi skor 0. nah yang saya analisis dg regresi linear adalah skor total beberapa item pertanyaan dari variabel X1, X2 dan Y.
    nah,,,tapi kata dosen saya itu salah, katanya saya harus pakai regresi logistic, yang bener gimana ya mas? padahal hasil dari skor totalnya kan tida 1 dan 0??? mohon bantuannya

    1. iya,,coba baca materinya dengan benar,,jika Y kamu bersifat dikotomi (benar dan salah), kamu bisa pake regresi logistik dunk,,itu tidak akan memiliki hubungan linier, jadi ga cocok digunakan regresi linier,,,regresi linier hanya digunakan untuk variabel kontinyu

  46. Maaf mas, saya mau tanya,,
    sya sedang melakukan penelitian dengan menggunakan regresi logistik,,
    setelah diuji ternyata hasilnya data saya mengalami overdispersi, sehingga tidak ada pengaruh signifikan dari 5 variabel terhadap variabel dependennya..
    jumlah data saya 63 dan berupa data panel..
    saya mau tanya bagaimana mengatasi overdispersi selain dengan membuang/mengganti variabel?
    mohon masukannya..
    terimakasih.. :)

  47. pak saya menliti tentang flypaper effect dimana dikatakan terjadi flypaper itu jika PAD<DAU maka 1 dan sebaliknya 0. nah bagaimana kalau ternyata datanya PAD<DAU semua, jadi berkategori 1 semuakan dependentnya, apakah itu bisa dilanjutkan dgn logistik? mohon pencerahannya pak saya buta bener tentang analisis ini =,=

    1. nah lo..ga bisa donk..modelnya jadinya bukan kurva logit (lihat ilustrasi kurvanya) dan bukan kurva linier sekalipun..jadinya sudah bisa disimpulkan donk, jika PAD < DAU maka memang terjadi flypaper effect,,nah yang diteliti apanya klo sudah jelas??

  48. Mas ari,, saya masih belum faham kenapa kalau datanya panel harus runing regresi data panel dulu.hehe..
    kemudian di blog mas ari hanya dijelaskan regresi data panel dengan menggunakan eviews,, bagaimana jika menggunakan spss?
    mohon masukannya.. :)

  49. mas ari,,, saya rossy salam kenal,,,
    saya mau tanya mas,,,, judul skripsi saya kan pengaruh DER,NPM,ukuran perusahaan, DOL terhadap perataan laba di BEI tahun 2010-2012 mas,,, untuk variabel x-nya DER,NPM,ukuran perusahaan, DOL itu merupakan skala rasio mas,,, untuk variabel y-nya perataan labanya itu pakek dummy yaitu melakukan perataan laba (1) dan tidak melakukan perataan laba (0),,, saya mau tanya itu menggunakan jenis regresi apa mas??? klo regresi logistik itu ada uji parsialnya dan simultannya apa tidak mas??? tolong bantuannya mas,,, terimakasih

  50. Siang pak,jika variabel X1,X2 dan Y nya mempunyai variabel dummy,apakah bisa digunakan dengan Regresi Logistik?
    Ini untuk melihat pengaruh pak,
    Terimakasih

  51. selamat sore mas yg baik hati
    saya ingin bertanya
    di model saya ada 5 variabel utama ada 5 variabel kontrol. 3 dari 5 variabel utama adalah dummy variable itu menggunakan model regresi apa ya mas? terus variabel kontrol itu harus selalu ada atau boleh tidak ada mas (bolong2) untuk observasinya? terima kasih mas

    1. observasinya harus kumplit donk pak,,kecuali untuk data panel,bisa lewat opsi unobserved linear panel pak,,logistik juga bisa pake dummy,,bapak mw nyari apa, ngukur apa, tipe data apa nih saya masih gelap :D

  52. SALAM KENAL…

    Mas Ary mau tanya..judul skripsi saya kan faktor faktor yg berhubungan dengan prilaku masyarakat memilih pengobatan tradisional.. untuk variabel X-nya ada 6 variabel dan itu skala datanya ada nominal sama ordinal dan untuk variabel Y-nya itu sifatnya nominal kategorik 1= memilih pengobatan tradisional 0= tidak memilih pengobatan gtradisional..kira2 kalo pake regresi logistik itu cocok gak yaa…?

    mohon bantuannya..

  53. assalamu’alaikum mas ari. saya annisa. saya mau tanya mas, apabila hasil hosmer dan lemeshow test <0,05. apa yang harus saya lakukan selanjutnya? apakah saya harus melakukan uji lainnya? trimakasih mas sebelumnya.

    1. itu analogi yang sama dengan chi-square goodness of fit,,uji kecocokan model dalam mewakili data,,dimana hipotesis dalam logit H0 : β2 = 0; H1 : β2 ≠ 0 nilai p < 0,05 mengindikasikan bahwa kita dapat menolak H0, artinya model yang kita bangun signifikan. Artinya data pengamatan dengan model yang kita prediksi tidak berbeda secara signifikan. Sebenernya dalam regresi ini hanya ditentukan oleh jumlah sampel, jumlah yang berbeda sedikit saja dapat mengubah nilai uji hipotesis ini,,Nah,selamat diteruskan ngolahnya :)

  54. selamat siang mas,saya mau tanya regresi logistik biner itu kan tidak menggunakan uji normalitas, terus metode analisis data apa aja yg harus ada pd regresi logit itu mas?
    maaf klo pertanyaan saya sederhana, lagi nyusun proposal tp nyandet di metopen mas hehe
    mksih sblumnya

  55. assalamualaikum,,mas saya mau tanya nih,,saya olah data dengan reglog dan hasil dari spss17 nya gak bagus karena ada kata2 sperti ini “warnings the parameter covariance matrix cannot be computed. remaining statistics will be omitted” apa yah maksud nya mas…? ada kesalahn data atau saya salah programny?…tolong pencerahan n bantuan nya ya mas,,trima kasih… :-)

    1. wah istilahnya baru ya “reglog”, klo smua dah bener, tinggal kamu liat tipe datanya apa…klo diliat dr warningnya sih spss nya saja yg harus direinstall

  56. selamat malam mas,, saya eris sedang mengerjakan skripsi menggunakan analisis regresi logistik biner.. saya ingin bertanya apakah dalam analisis regresi logistik biner diperlukan uji asumsi klasik? kalau iya uji apa saja yg diperlukan? kalau tidak, mengapa?
    trimakasih banyak mas sebelumnya
    materi mas sangat bermanfaat :)

  57. Permisi mas, saya sedang mengerjakan skripsi yg meneliti hubungan pengaruh pola konsumsi dan investasi terhadap kesadaran berasuransi dengan metode pengolahan data regresi logistik. Data saya data primer dengan cara menyebarkan kuesioner. Yang mau saya tanyakan adalah pertanyaan di kuesioner saya juga harus dalam bentuk kategorik (ya/tidak) atau saya bisa menggunakan skala likert?

    Mohon sarannya Mas, terima kasih sebelumnya.

    1. untuk variabel dependennya ya dalam bentuk dikotomi (ya/tidak), sedangkan variabel penjelas dapat dirancang dengan skala apapaun baik itu likert, kontinyu, ataupun kelas

  58. assalamualaikum mas. salam kenal.
    maw nanya nie z punya skripsi tu judulnya hubungan pengetahun, sikap dan dukungan keluarga terhadap Inisiasi Menyusu Dini, penguji saya tu anjurkan saya menggunakan analisis regresi logistik, saya uda buat mas, tapi saya binggung pada hasilnya ini, nilai B, S.E, wald, Df dan nilai lower dan upper itu nilai apa mas, karna saya disuru cari apa maksud nilai ini….
    tolong bantuannya mas……

    1. waalaikum salam yuli,
      B itu konstanta, atau nilai untuk persamaan yang menjelaskan model, model logitnya adalah Log (P / 1 – p) = β0 + β1X1 + β2X2 + …. + βkXk ,nah tinggal kamu ganti persamaan β menjadi nilai B dalam output variables in the equation, X yuli ganti dengan variabel yang yuli gunakan, misalnya dukungan keluarga,dll.
      Kalau S.E itu standar error atau residual dari model, artinya tingkat kesalahan.
      Kalau Wald statistic adalah nilai signifikansi masing2 variabel, misalnya pada contoh diatas yang signifikan (< nilai kritik 0,05) hanya variabel education.
      exp(B) adalah nilai odds ratio, misalnya jika nilai exp(B) pada variabel status(1)=1,5, maka artinya responden menikah memiliki kecenderungan 1,5 kali daripada responden yang tidak menikah untuk melakukan pembelian kosmetik.
      Df itu derajat bebas (degree of freedom), belum jelas baca di buku statistik dasar.
      nilai lower dan upper itu adalah range (rentang terendah dan tertinggi) nilai exp(B) atau odds ratio,yuli baca kembali konsep odds ratio di atas.

  59. Assalamu’alaikum mas, mau nanya
    Saya lagi olah data, penelitian saya tentang analisis preferensi, menggunakan regresi logistik
    dari 11 variabel, ada 4 variabel yang berasal dari skala likert
    var1 ada 7 pertanyaan likert
    var2 ada 5 pertanyaan likert
    var3 ada 6 pertanyaan likert
    var4 ada 8 pertanyaan likert

    saya liat penelitian orang2, ada yg variabel likert nya masuk ke regresi logistiknya, ada juga yg enggak
    terus saya tanya dosen saya, dosen saya bilang : “hasil likert kamu indeks apa skor ? coba pelajari kalo indeks atau skor tidak boleh di-log atau di-ln”
    nah saya bingung.. ngga ngerti. gimana ya mas ?

    1. iya iffa, biasanya data dari hasil kuesioner cuma ditarik kesimpulan secara deskriptif aja,,atau digunakan untuk pemetaan preferensi, bisa juga uji-uji multivariat lain. Tapi jika dimasukkan ke dalam analisis, ia akan dihitung sebagai variabel kategorik, misalnya untuk salah satu item pertanyaan mengandung jawaban 1=setuju untuk berobat ke dokter, 2=kurang setuju, atau 3=ragu-ragu dan seterusnya. Tapi penjabarannya di bahasan akan panjang dan detail :)

  60. Assalamualaikum, mau tanya aku juga pake regresi logistik, nah setelah saya olah uji Homes and lemeshow ternyata tidak lolos, hasilnya 0,000<0,05 artinya model tidak layak, bagaimana cara mengatasinya, trimakasih

    1. Waalaikum salam..Uji hosmer ga menentukan banyak koq, hanya indikator peningkatan signifikansi, tanpa prediktor dan sesudah ditambahkan prediktor.klo dari 10 prediktor, dgn uji hosmer kita bisa memilih mana prediktor yg jika ditambahkan ke dalam persamaan logistik akan menaikkan signifikansi model..tp dgn prediktor kami, yg perlu kamu lihat adalah nilai signifikansi msg2 prediktor thd variabel penjelas aja

  61. Asslmkm mas.
    Saya bingung. Saya melakukan penelitian dengan regresi logistik biner. Jadi pada saat memasukkan variabel ke Categorical, kenapa harus memilih first pada bagian kanan bawah nya, karna ketika saya memilih last hasilnya sangat berbeda (membuat hubungan negatif sig dr salah satu variable saya menjadi berhubungan positif sig, begitu juga sebaliknya).
    Apa dasar utk memilih last atau first ini mas? Atau apakah ini merupakan salah satu treatment utk mengubah hubungan antar variable independen dg variable dependennya?
    Dan apakah semua variable independent yg dikotomi harus di Categorical kan? Bagaimana kalau satu saja?

    Terimakasih.

    1. Hmmm,kategori referensi artinya koding untuk variabel kategorik, dan ini sudah default ditentukan spss, jika kategori referensi pada variabel sex adalah male, maka jika kamu pilih ‘first’ maka male adalah kategori dasar artinya kodingnya menjadi m=0; f=1. Jika kamu pilih ‘last’ tentu hasilnya akan berbeda krn jadinya m=1;f=0, krn female mjd kategori dasar..pada 3 variabel misalnya race; black, white, yellow, jika kamu pilih black sbg reference, maka koding utk black yg menjadi first refference category adalah 0,1,1; white=1,0,1; dan yellow=1,1,0 lihat selalu yang ‘first’ mjd nol.di spss akan ada output koding otomatis dr spss. Variabel prediktor dikotomi tetap harus dinyatakan sebagai kovariat dalam logistik. Krn itu tetap menggunakan koding dan reference category..gmana (itu sapa namanya aneh), mengerti??

Berikan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s