Regresi Logistik Biner


Regresi linier seperti yang kita ketahui tidak dapat menyelesaikan kasus dimana variabel dependent bersifat dikotomi dan kategori dengan dua atau lebih kemungkinan (ex. sukses atau Gagal; terpilih atau tidak terpilih; lulus atau tidak lulus; melakukan pembelian atau tidak; mendapat promosi atau tidak, dan lain-lain). Regresi logistik umumnya melibatkan berbagai macam variabel prediktor baik numerik ataupun kategorik, termasuk variabel dummy. Pada regresi linier, variabel prediktor yang digunakan biasanya numerik, tetapi jika kita melibatkan campuran antara numerik maupun kategorik kita dapat menggunakan regresi logistik.

Regresi logistik membentuk persamaan atau fungsi dengan pendekatan maximum likelihood, yang memaksimalkan peluang pengklasifikasian objek yang diamati menjadi kategori yang sesuai kemudian mengubahnya menjadi koefisien regresi yang sederhana. Dua nilai yang biasa digunakan sebagai variabel dependen yang diprediksi adalah 0 dan 1 (ex. 1=berhasil, 0=gagal).

Regresi logistik menghasilkan rasio peluang (odds ratios) antara keberhasilan atau kegagalan suatu dari analisis. Dapat kita contohkan dengan seorang tokoh yang ingin menjadi presiden, akan lebih baik peluangnya jika menjadi ketua partai politik tertentu. Disini odds ratio yang dimaksud adalah seberapa besar peluang tokoh tersebut dengan mempertimbangkan variabel prediktor yang ada.

Regresi logistik akan membentuk variabel prediktor/respon (log (p/(1-p)) yang merupakan kombinasi linier dari variabel independen. Nilai variabel prediktor ini kemudian ditransformasikan menjadi probabilitas dengan fungsi logit.

Asumsi-asumsi dalam regresi logistik:

  • Tidak mengasumsikan hubungan linier antar variabel dependen dan independent
  • Variabel dependen harus bersifat dikotomi (2 variabel)
  • Variabel independent tidak harus memiliki keragaman yang sama antar kelompok variabel
  • Kategori dalam variabel independent harus terpisah satu sama lain atau bersifat eksklusif
  • Sampel yang diperlukan dalam jumlah relatif besar, minimum dibutuhkan hingga 50 sampel data untuk sebuah variabel prediktor (bebas).

Persamaan Regresi Logistik

Regresi logistik menghasilkan rasio peluang yang dinyatakan dengan transformasi fungsi logaritma (log), dengan demikian fungsi transformasi log ataupun ln diperlukan untuk p-value, dengan demikian dapat dinyatakan bahwa logit(p) merupakan log dari peluang (odds ratio) atau likelihood ratio dengan kemungkinan terbesar nilai peluang adalah 1, dengan demikian persamaan regresi logistik menjadi:

logit(p) = log (p/1-p) = ln (p/1-p)

dimana p bernilai antara 0-1.

Model yang digunakan pada regresi logistik adalah:

Log (P / 1 – p) = β0 + β1X1 + β2X2 + …. + βkXk

Dimana p adalah kemungkinan bahwa Y = 1, dan X1, X2, X3 adalah variabel independen, dan b adalah koefisien regresi.

Konsep Odds dan Relative Odds

Kita lihat sampel berikut ini:

Data berikut ini diberikan oleh pengurus mesjid di yang terletak diantara 2 kampung, data tersebut dapat dilihat sebagai berikut:

- Persepsi pengurus mesjid terhadap 100 orang warga di kedua kampung yang memiliki penyakit “PELIT” dalam memberikan sumbangan bagi keropak amal mesjid mereka,

- Variable prediktor yang digunakan adalah kampung A dan kampung B,

- Data disajikan dalam bentuk tabulasi silang (crosstab).

Penyakit Pelit

Kampung A

Kampung B

TOTAL

Ya

80 (0,8)

27 (0,27)

130 (0,65)

Tidak

20 (0,2)

73 (0,73)

70 (0,35)

TOTAL

100 (50%)

100 (50%)

200 (100%)

Dari data diatas konsep odds (peluang) dapat dijelaskan sebagai berikut:

- Warga kampung A yang memiliki kecenderungan “PELIT” adalah 80/20 = 40 terhadap 1 (anggaplah konsep taruhan yang artinya 4 : 1).

- Warga kampung A yang memiliki kecenderungan tidak “PELIT” adalah 20/80 = 0,25 terhadap 1 (dalam konsep taruhan artinya 1: 4).

- Demikian juga dengan warga kampung B yang memiliki kecenderungan “PELIT” dan tidak “PELIT” adalah 27/73 = 0,37 terhadap 1 (dalam konsep taruhan artinya 1 : 2)

Sedangkan konsep Relative Odds berdasarkan data diatas menunjukkan bahwa warga kampung A memiliki kecenderungan “PELIT” daripada warga kampung B sebesar 4/0,73 = 5,5 terhadap 1, dengan kata lain warga kampung A lebih pelit 5,5 kali daripada warga kampung B, atau dengan kata lain pengurus mesjid mempersepsikan bahwa warga yang memiliki penyakit “PELIT” kebanyakan berasal dari kampung A yaitu 5,5 kali daripada warga kampung B.

Konsep Log Odds, Odds Ratio

Logit (log odds) merupakan koefisien slope (b) dari persamaan regresi. Slope disini adalah perubahan nilai rata-rata dari Y dari satu unit perubahan nilai X. Regresi logistik melihat perubahan pada nilai variabel dependen yang ditransformasi menjadi peluang, bukan nilai aslinya seperti pada regresi linier. Sebagai ilustrasi jika nilai peluang adalah 0,25, maka nilai odds adalah 3 (25 : 75), sedangkan jika nilai peluang 50, maka nilai odds adalah 1 (50 : 50), atau jika nilai peluang 0,33, maka nilai odds adalah 2 (33 : 67) dengan total keseluruhan nilai peluang adalah 1. Nilai odds ratio biasanya dapat kita lihat pada kolom B pada ‘variables in the equation’ output SPSS.

Kecocokan Model (model fit) dan fungsi likelihood

Likelihood berarti juga peluang atau probabilitas untuk hipotesis tertentu. Seperti yang kita ketahui pada kurva regresi linier kita lihat adanya hubungan linier, peningkatan pada sumbu Y akan diikuti dengan peningkatan pada sumbu X dan sebaliknya. Tetapi pada regresi logistik dengan nilai Y antara 0 dan 1, pendekatan linier tidak bisa kita gunakan. Oleh karena itu metode maximum likelihood sangat berguna dalam menentukan kecocokan model yang tepat bagi persamaan yang kita miliki.

Hipotesis dalam regresi logistik antara lain:

  1. h0 = ketika persamaan regresi bernilai 0 [logit(p) = 0].
  2. h1 = persamaan regresi berbeda nyata dari 0 [logit(p) ≠ 0].

Regresi logistik merupakan regresi non linier dimana model yang ditentukan akan mengikuti pola kurva linier seperti gambar di bawah ini.

logistic curve2

Regresi logistik juga menghasilkan rasio peluang (odds ratios) terkait dengan nilai setiap prediktor. Peluang (odds) dari suatu kejadian diartikan sebagai probabilitas hasil yang muncul yang dibagi dengan probabilitas suatu kejadian tidak terjadi. Secara umum, rasio peluang (odds ratios) merupakan sekumpulan peluang yang dibagi oleh peluang lainnya. Rasio peluang bagi predictor diartikan sebagai jumlah relatif dimana peluang hasil meningkat (rasio peluang > 1) atau turun (rasio peluang < 1) ketika nilai variabel prediktor meningkat sebesar 1 unit.

Lebih jelasnya kita dapat mengikuti ilustrasi berikut ini:

Jika kita ingin mengetahui pembelian kosmetik merk tertentu oleh beberapa orang wanita dengan beberapa variabel penjelas antara lain adalah umur, tingkat pendapatan (low, medium, high), dan status (M – menikah; S untuk single). Pada data tersebut, pembelian merupakan variabel prediktor yang dijelaskan dengan angka 1 sebagai membeli dan 0 sebagai tidak membeli.

1. Dengan SPSS 17.0 data yang diinput dapat berupa:

2. Setelah data diinput, pilih Analyze – Regression – Binary logistic seperti berikut:

3. Setelah muncul kotak dialog logistic regression, masukkan variabel dependen purchase ke kolom  Dependent, dan ketiga variabel independen ke dalam kolom covariates, lalu pilih button categorical untuk memasukkan variabel kategorik yaitu pendapatan dan status – klik continue:

4. Setelah itu pilih option, checklist classification plot dan Hosmer-lemeshow goodness of fit, kemudian continue:

5. Kemudian pada method pilih enter, kemudian klik OK:

6. Output dan adalah sebagai berikut:

Output Case Processing Summary menghilangkan variabel yang tidak diperhitungkan dalam model.

Output classification table diatas menjelaskan bahwa persentase variabel yang diprediksi sebesar 88,9 persen adalah baik, dan dari perbandingan antara kedua nilai mengindikasikan tidak terdapatnya masalah homoskedastisitas.

Pada output variables in equation signifikansi adalah 0,05 artinya model tidak signifikan dan dengan demikian terima H0.

Pada output omnibus test menyatakan bahwa hasil uji chi-square goodness of fit lebih kecil dari 0,05, ini mengindikasikan bahwa model adalah signifikan.

Hasil output pada Cox-Snell R2 dan Nagelkerke R memiliki analogi sama dengan nilai R-square pada regresi linier, menyakatan bahwa sebanyak 50,2 persen keragaman dapat dijelaskan oleh model, sedangkan sisanya diluar model.

Hasil pada output Hosmer and Lemeshow Goodness-of-Fit Test mengindikasikan bahwa kita dapat menerima H0 karena lebih dari 0,05 (1 > 0,05).

output classification table mengindikasikan dalam model regresi logistik, masih terdapat masalah homoskedastisitas karena nilai persentase keseluruhan adalah sama (100%).

output variables in the equation menunjukkan nilai signifikansi berdasarkan Wald Statistic, jika model signifikan, maka nilai sig. adalah kurang dari 0,05.

Kolom Exp(B) menunjukkan nilai odds ratio yang dihasilkan. Nilai odds ratio yang mendekati 1,0 mengindikasikan bahwa variabel independen tidak mempengaruhi variabel dependen.

Output classplot diatas menunjukkan prediksi pada regresi logistik. Sumbu X menujukkan probabilitas yang diprediksi, sedangkan sumbu Y menunjukkan jumlah kasus yang diamati.

download versi pdf disini >>>>

About these ads
    • om dave
    • November 25th, 2009

    Pagi mas Ary..
    numpang nanya neh (maaf sebelumnya kalau pertanyaannya terkesan sepele maklum masih dangkal pemahaman tentang statistik)
    Saya ingin menanyakan tentang salah satu sub dalam rancangan penelitian saya. Saya ingin melakukan analisa faktor yang berpengaruh terhadap preferensi responden untuk menanam (“1″) atau tidak menanam (“0″) pohon di lahan miliknya. Atas dasar respon yang bersifat biner/nominal tersebut saya hendak menggunakan regresi logit untuk menilai kecenderungan pengaruh faktor menggunakan nilai odd ratio terhadap respon.

    yang menjadi masalah adalah variabel bebas yang saya gunakan sebagai faktor tidak seragam atau ada yang bersifat kualitatif dan ada pula yang bersifat kuantitatif (data tipe ratio hasil pengamatan dan pengukuran)., dimana data-data kualitatif tersebut saya coba kuantitatifkan dengan menggunakan skala ordinal maupun likert. pertanyaan nya adalah :

    1. ketika mengkuantitatifkan suatu data kualitatif, haruskah jumlah ordo dan/atau kelas interval yang digunakan sama/seragam antara tiap parameter/variabel kualitatif yang lain.?

    2. dalam regresi logistik., apakah semua variabel bebas (Xn) yang digunakan harus merupakan variabel dengan tipe data yang sama (apakah harus seragam, ordinal saja/interval saja/rasio saja)?. apakah model tidak bisa digunakan jika variabel bebas yang dipakai tidak seragam atau kombinasi antara data ordinal, interval, dan ratio.?

    3. jika tidak bisa, apakah saya harus mengkonversi data kuantitatif yang bertipe ratio tersebut menjadi data bertipe interval/skala likert agar saya bisa menggunakannya dalam model regresi logistik.?

    4. jika harus menkonversi data kuantitatif bertipe ratio kedalam skala likert, haruskah jumlah kelas interval nya sama dengan jumlah ordo dan atau kelas interval dari data kulitatif yang telah dikuatitatifkan sebelumnya.?

    5. berhubungan dengan penentuan responden, berdasarkan kemungkinan respon “1” (memilih menananm pohon) dan “0” (tidak menanam pohon) bagaimana baiknya menetapkan jumlah responden.? jika total responden yg akan diambil sebanyak 60 responden, mana teknik penentuan responden yg lebih baik :
    a. jumlah responden yang menanam dan tidak menanam pohon ditentukan secara proposional (50% : 50%)., atau…
    b. jumlah responden yg menanam dan tidak menanam ditentukan secara acak..??

    Contoh beberapa variabel2 bebas yang dirancang untuk digunakan dalam penelitian:

    Harga kayu >> Rp/m3 >> tipe ratio
    Luas lahan kering responden >> Ha >> tipe ratio
    Jarak lahan kering dari rumah responden >> Km >> tipe ratio
    Pendapatan dari hutan rakyat >> Rp/tahun >> tipe ratio
    Pendapatan non-hutan rakyat >> Rp/tahun >> tipe ratio
    Jumlah ternak gembala >> ekor >> tipe ratio
    Jumlah Tenaga kerja dalam keluarga >> orang >> tipe ratio
    Umur responden >> tahun >> tipe ratio

    # Untuk variabel kualitatif dibawah ini, saya mengkuantitatifkan nya menjadi data bertipe ordinal dan nominal.., apakah data bertipe nominal dan ordinal dapat digunakan sebagai variabel bebas dalam regresi logistik? jika tidak bisa bagaimana cara mentransformasi ke tipe interval atau ratio.?

    Tingkat pendidikan terakhir responden >> kualitatif >> ordinal 4 ordo
    Keanggotaan dalam kelompok tani >> kualitatif >> ordinal 3 ordo
    Kelerengan lahan >> kualitatif >> interval 5 kelas
    Persepsi keberadaan tegakan hutan >> kualitatif >> ordinal 3 ordo
    Kebijakan insentif >> kualitatif >> nominal “1” dan “0”
    Pendidikan non formal >> kualitatif >> nominal “1” dan “0”
    Status sosial >> kualitatif >> ordinal 3 ordo
    Faktor Waris >> kualitatif >> nominal “1” dan “0”
    Kemudahan pemasaran kayu >> kualitatif >> ordinal 3 ordo

    Terima kasih., dan Mohon Pencerahaannya..

    • Om Dave
    • November 29th, 2009

    wah wah wah mantaaaaaaaafff mas ari saya sangat tertolong sama penjelasan mas ari selama ini., saya jadi bisa mantap menggunakan model regresi logit ini dalam rancangan penelitian saya..
    Makasih banyak mas., semoga ilmu yang mas sharing kepada saya menjadi pahala yang terus mengalir..

    • Om Dave
    • November 30th, 2009

    mas mo nanya lagi neh., masih boleh kan.?? hehehe..
    klo melakukan analisis regresi logistik dengan spss., output correlation matrix dihasilkan atas dasar korelasi pearson atau spearman mas.??

      • ariyoso
      • November 30th, 2009

      biasanya pearson product moment om :)

    • marcelina
    • Desember 1st, 2009

    alow ariyosooooooooo … mw nanya nie … seandainya pada saat pengujian spss ni … kan mau uji pengaruh …
    nah saya kan menguji perataan laba jadi pakai DUMI .. tapi variabel independen saya 1 dan dependen nya cuma 1.. mending pakai regresi apa yah ? huhuhuhue

    thankz yaaa
    ^_^

      • ariyoso
      • Desember 1st, 2009

      Oke Marcelina,
      klo regresi antara 1 variabel dependen dengan 1 variabel independen itu bisa cukup dengan regresi linier sederhana, modelnya simpel yaitu Y = a + bX dimana Y = var dependen, a = konstanta, b = slope, X = var independen, kalo dengan variabel dummy, bukan berarti jadi regresi logistik, emang dummy itu angkanya 1 dan 0, tapi pada variabel independennya, bukan dependennya,..marcelina tetep bisa pake regresi sederhana dengan model Y = a + bx + dummy + e, dimana e itu error..coba liat beberapa referensi tentang regresi linier sederhana…karena biasanya pada model regresi yang ada variabel dummy (indikatornya), konstantanya tidak ikut dihitung, dengan kata lain harus dihilangkan..Okey….

    • Sri Wahyuni
    • Desember 12th, 2009

    Pagi…
    Mas ari, saya yuni mahasiswa matematik yang lagi buat skrip tapi make regresi logistik..
    saya mau nanya, kalo uji goodnees of fit yang memakai nilai statistik pearson yang rumusnya

    chi_square = sigma j rj kwadrat
    rj = (yj- mj.phi_j)/ akar phi-j …dst
    nah yj, mj, & phi_j itu keterangannya pa ya mas???

    mohon bantuannya!!
    thank’s be4..^_^

      • ariyoso
      • Desember 13th, 2009

      dear sri,
      j = frekuensi yang diamati
      rj = frekuensi yang diharapkan
      biasanya pearson chi square itu dinyatakan dengan ∑(Oj-rj)/rj

    • sri wahyuni
    • Desember 17th, 2009

    mas ari,, bukan rumus itu yang saya tanyakan.!!

    maksudku yang rumus statistik pearson untuk menguji apakah model yang sudah terbentuk memenuhi apa belum. itu rumus ada di bukunya hosmer & lemeshow, di agresti juga ada.
    penjelasan di sana bahwa mj itu jumlah percobaan dengan pola kovariate j. nah saya gag tau maksudnya pa mas??

    • agus santosa
    • Desember 27th, 2009

    dear mas ari saya pengin meneliti pengentasan kemiskinan dengan Y = dependent merupakan biner data ( miskin dan tidak miskin) sedangkan X1 sampai Xn adalah independent yang di kontribusi oleh SKPD , apakah ada usulan mas ari untuk itu maksud saya ide agar supaya secara numerikal bisa dipertanggung jawabkan dari sekian banyak x………Xn terdapat yang masuk dalam skenario 1 sampai ke n
    secara nyata Variabel X1 … dengan indikator … dst
    ok mas ari dibalas ya X terdiri atas 37 kontributor SKPD dengan indikator sekitar 100

      • ariyoso
      • Desember 27th, 2009

      mas agus,
      OK, saya masih belum mengerti kontribusi SKPD yang digunakan itu bentuknya kira-kira bagaimana,
      jika menggunakan 37 kontributor, apakah berarti menggunakan 37 variabel independen? apa saja itu, apakah semuanya numerik atau kategorik?

    • Novi
    • Februari 8th, 2010

    Mas,

    Saya mahasiswa jurusan SI dan sedang melakukan penelitian, terdpt:
    1. 1 variabel independen (14 pertanyaan, tipe nominal Ya/Tidak)
    2. 5 variabel dependen (A,B,C,D,E)
    A (1 pertanyaan, tipe ordinal dg 8 pilihan)
    B (1 pertanyaan, tipe ordinal dg 6 pilihan)
    C (6 pertanyaan, tipe 5 poin Likert)
    D (7 pertanyaan, tipe 5 poin Likert)
    E (1 pertanyaan, tipe ordinal dg 5 pilihan)
    Saya ingin menanyakan uji hipotesa apa yg mana yg dipake? Apakah uji regresi logistik biner

    Terima kasih banyak

    • Arman saidi
    • Maret 31st, 2010

    tolong rumus yang bakunya dong..!!!

    • Siska YD
    • April 2nd, 2010

    Salam Kenal Pak ahli statistik (he..he)
    senang x saya menemukan blog Bpk. kebetulan lagi bingung tentang penelitian saya. mohon bantuan Bpk. judul penelitian saya hubungan informasi dalam laporan keuangan dengan tingkat akuntabilitas dan transparansi. dengan demikian informasi dalam laporan keuangan (X) dan akuntabilitas (y1), transparansi (y2). analisisnya korelasi apa yang cocok digunakan y pak?
    terimakasih banyak sebelumnya atas bantuan bpk semoga berkah dan amal bagi bapak. amin…

    wassalam

      • ariyoso
      • Mei 8th, 2010

      salam kenal juga siska,
      saya juga sebenarnya masih belajar, jadi bukan ahli yaa..cuma sekedar ingin sharing apa yang saya ketahui :)
      mungkin dalam bayangan saya siska bisa membandingkan, korelasi mana yang paling signifikan apakah akuntabilitas dengan informasi laporan keuangan atau transparansi dengan informasi dalam laporan keuangan,,berarti tujuannya penelitian dan judulnya diganti.
      atau siska bisa baca materi tentang korelasi kanonik yang mengukur korelasi antara dua kelompok variabel, dimana kelompok variabel X dapat dikorelasikan dengan kelompok variabel Y (Y1 dan Y2).

    • linda
    • April 8th, 2010

    mas, maaf saya mau nanya, saya lagi nyusun skripsi dengan sampel total populasi sebesar 48 orang, tp saya disuruh buat uji power, saya blm mengerti apa yg hrs saya lakukan
    makasih banyuak ya

      • ariyoso
      • Mei 8th, 2010

      bisa…uji power dilakukan buat nentuin apakah populasi sampel yang linda gunakan itu tepat, katakanlah dengan 48 populasi sampel, hasil yang kamu dapatkan masih memiliki standar error yang besar, maka lebih tepat lagi sampelnya ditambah…uji power akan dipengaruhi oleh beberapa hal misalnya:
      1) jumlah sampel; semakin besar jumlah sampel yang kamu gunakan, maka power dalam pengujian yang kamu lakukan akan semakin besar,
      2) tingkat signifikansi; semakin besar tingkat signifikansi, maka power dalam pengujian kamu akan semakin besar, berarti batas penerimaan akan hasil uji akan semakin kecil,
      3) semakin besar perbedaan antara nilai parameter sebenarnya dengan nilai yang ditentukan dalam hipotesis null, maka power pengujian kamu akan semakin besar..
      Nah, sebagai contoh kamu bisa melihat bab tentang uji one way anova disini >>…di bagian TUKEY POST HOC TEST, jika saja saya menambah jumlah sampel yang digunakan, mungkin lebih banyak kelompok yang signifikan, dengan demikian, power dalam pengujian saya akan semakin besar.
      OKEY,,sebagai catatan kamu juga bisa menggunakan TUKEY POST HOC TEST sebagai uji power, :)

    • evi
    • April 22nd, 2010

    Salam kenal…
    saya evi mahasiswa matematika UPI (non dik).
    Saya ingin bertanya tentang overdispersi dalam regresi logistik.
    Yang masih saya bingungkan, overdispersi itu terjadi jika ada korelasi antar peluang respon (variabel Y), sedangkan yang saya tahu, dalam regresi logistik itu, variabel Y nya cuma 1.

    Mohon penjelasannya
    terima kasih

      • ariyoso
      • Mei 8th, 2010

      iyap betul, overdispersi cuma terjadi pada model logit…mudahnya gini,overdispersi terjadi karna ketidakcocokan antara variabel respon (Yi) dengan nilai perkiraan Yi dimana Var(Yi) = niπi(1-πi), overdispersi terjadi jika Var(Yi) > niπi(1-πi), sedangkan underdispersi terjadi jika Var(Yi) < niπi(1-πi),..ini bisa terjadi karena penghilangan salah satu kovariat (1 atau 0), data yang saling berkorelasi, dan kompleksitas data yang tidak diketahui.
      emang bener variabel Y cuma 1, yang bertabrakan (tidak cocok) adalah variabel respon Y dengan nilai perkiraannya (predicted value)…akibatnya estimasi error maupun hasil uji goodness-of-fitnya ga sesuai harapan alias jadi aneh atau terganggu..karena itu ada lagi tahap adjusmentnya jika terjadi hal demikian, kamu bisa baca materi tentang quasilikelihood atau deviance statistic…okeh…

    • irun89
    • Mei 6th, 2010

    mas ari, saya irun..
    saya mau nanya (maaf klo pertanyaanya spele…)
    apakah ada kriteria atau syarat khusus dalam melakukan analisis regresi logistik???? apakah semua data dapat dpat di analisis menggunnakan analisis regresi logistik??? mkasih…

      • ariyoso
      • Mei 8th, 2010

      simple mba, dalam logit hanya menggunakan dua kategori yang bersifat dikotomi sebagai variabel dependen, misalnya 1 dan 0 yang mewakili sex (1=male/2=female), trus ga variabel yang kita gunakan gak harus berhubungan linier antara variabel dependen dan independen,trus variabel independen tak harus terdistribusi normal = artinya ga diperlukan uji normalitas data, trus lagi variabel tidak harus homoskedastis jadi ga perlu ada pengujian asumsi heteroskedastisitas, pokonya asumsi klasik yang biasa kita gunakan dalam regresi linier sederhana atau bertingkat ga berlaku dalam logit…saya kira itu aja :) met mencoba ya./…..

        • irun89
        • Mei 24th, 2010

        terimakasih mas,, berarti semua data dapat di analisis menggunakan analisis regresi logistik ya mas???

        • ariyoso
        • Juni 1st, 2010

        engga smua donk..yang klo variabel dependennya nya nominal atau ordinal continuous kan engga, harus biner :)

    • evi
    • Mei 11th, 2010

    mau nanya lg mas…
    kalo untuk software yg di pakai untuk menguji overdispersi, bisa pakai SPSS atau minitab tidak?

      • ariyoso
      • September 11th, 2010

      pengujian overdispersi bisa menggunakan SPSS menggunakan fungsi GLM (Generalized Linear Model)

    • nadiaservina
    • Mei 27th, 2010

    selamat siang mas ari,saya nadia,saya ingin menanyakan,apakah perbedaan aplikasi logistik biner dengan logistik ordinal?maaf ya klo pertanyaan saya aneh..terima kasih..

      • ariyoso
      • September 11th, 2010

      ga ga..ga aneh sama sekali koq :D..klo regresi logistik biner,variabelnya bersifat dikotomi,,artinya variabel independennya berpeluang 1 atau nol saja,,misalnya untuk kasus 1=berhasil dan 0=gagal…nah klo regresi logistik ordinal akan memasukkan peluang lain selain 1 dan 0, artinya jika dengan regresi logistik biner peluangnya adalah tinggi dan rendah saja, maka dengan regresi logistik ordinal dapat menjadi tinggi, rendah dan sedang, sehingga tidak bersifat dikotomi lagi,,,aneh juga klo pertanyaannya dibilang aneh, padahal bagus.. :)
      klo ada waktu saya akan posting bab lain mengenai regresi logistik ordinal deh..

    • Tephie
    • Mei 30th, 2010

    Mas,numpang tanya..
    kalo untuk olah data regresi logistik di eviews ada cara-caranya gag?
    tolong dbantu y mas ^^,

      • ariyoso
      • September 11th, 2010

      kan dah jelas dipaparkan disini dengan SPSS 17, gimana

    • lisy
    • Mei 31st, 2010

    mas, mau tny, regresi logistik ini selain pake spss bisa pake aplikasi statistik lain seperti eviews gk ya???

      • ariyoso
      • Juni 1st, 2010

      bisa dunk…dicoba ya..

        • wiwi
        • Juli 23rd, 2010

        pak..sy mw tanya
        penelitian saya menggunakan regresi logistik…….-dan ketika melakukan uji asumsi klasik heteoskedastisitas ternyata ada salah satu variabel independennya yang terjadi heteroskedastisitas, apa yang harus saya lakukan…….. untuk mengeboatinya??
        terimakasih

        • ariyoso
        • September 21st, 2010

        kamu bisa tambah datanya, atau menghilangkan atau mengganti salah satu variabel,,

      • ariyoso
      • September 11th, 2010

      minitab bisa, eviews juga bisa

    • taufiq
    • Juni 11th, 2010

    Hosmer and Lemeshow Goodness-of-Fit Test mengindikasikan bahwa kita dapat menerima H0 karena lebih dari 0,05 (1 > 0,05)

    kalau misalnya ini tidak terpenuhi karena kita tolak H0 gimana?

      • ariyoso
      • September 11th, 2010

      Hasil dari Hosmer and Lemeshow Goodness-of-Fit Test akan menunjukkan jumlah kasus dan kontrol yang diharapkan pada masing2 grup variabel, dan merupakan tes statistik paling akhir dalam logit,,,,Jika kita tolak H0, maka 1 < 0,05, artinya terjadi lack of fit atau model yang digunakan kurang mewakili analisis,,saya kira begitu mas taufiq

    • nanda
    • Juli 6th, 2010

    Mas Ari, saya mau tanya kalau misal hasil Cox and Snell R Square dan Nagelkerke R square saya kecil 0.027 dan 0.05. Apa penelitian saya layak? karena lebih dari tidak lebih dari 10% keanekaragaman yg dapat dijelaskan oleh model.
    Terimakasih sebelumnya.

      • ariyoso
      • September 11th, 2010

      saya kira kurang layak nanda,,karena semakin tinggi nilai R-square, maka model yang digunakan akan semakin baik, karena seperti yang kita ketahui bahwa R-sq adalah jumlah keragaman yang dapat dijelaskan oleh model,,
      bisa dicek lagi pada tahap pengolahan datanya, mungkin ada yang tertinggal
      thx..

    • Adiiii
    • Juli 20th, 2010

    Met malem….
    Mas, saya sedang mengerjakan TA menggunakan regresi logistik, tapi variabelnya menggunakan variabel nominal. Gmn cara merubahnya menjadi variabel kategorik atau apa lah.
    Saya menggunakan variabel respon Pendapatan, prediktornya jumlah penduduk, Inflasi, dll yang semuanya nominal. Bisa apa nggak ya mas? Gimana penanganannya mas?
    Mohon bantuannya.

      • ariyoso
      • September 11th, 2010

      ga masalah adiiii (i-nya banyak ya)…dengan variabel nominal,,asal responnya tetap dikotomi alias tinggi atau rendah (1 atau 0)..merubah variabel nominal juga dapat menggunakan pemeringkatan, misalnya jumlah penduduk menjadi kriteria tinggi, sedang dan rendah,,asal terdapat keterangan yang jelas tinggi itu berapa hingga berapa, rendah itu berapa, dan seterusnya

    • Adiiii
    • Juli 20th, 2010

    Tambahan mas, saya menggunaka Minitab 14.
    Tolong dibantu ya mas…..

  1. asl…mas salam kenal saya mahasiswi sem 7 yg mau nyusun skripsi,,mau bertnya sedikit???
    jadi, dalam variabel independen saya, ada 2 variabel yg menggunakan variabel dummy, kemudian saya juga menggunakan variabel kontrol, untuk mengendalikan variabel dependennya,,selain itu juga variabel dependen saya juga menggunakan dummy,,yang saya mau tanyakan:
    1.apakah itu menggunakan regresi???
    2. klo iya,,regresi jenis apakah???logistik or linier berganda or ada yang lain nya??
    makasih mass yg baik hati sebelumnyaaa…

      • ariyoso
      • September 18th, 2010

      salam kenal juga aprina,
      jika menggunakan variabel dummy sebagai dependen,maka ia akan bersifat dikotomi kan?karena itu aprina bisa menggunakan regresi logistik biner,,perlu diketahui juga bahwa regresi linier bertingkat lebih tepat dengan data continuous
      makasih kembali…

  2. oiaa satu lagi data saya,,menggunakan skala nominal,,baik dependen maupun independennya…

    • vilia
    • September 27th, 2010

    mz, tolong donk kasih contoh analisis regresi logistik tapi dengan software minitab.. tks

    • winda
    • Oktober 20th, 2010

    Mas ari, saya mau tanya..

    Saya sedang mengerjakan tugas akhir dengan judul “Analisis Pengaruh Stock Split Terhadap Trading Liquity, Earning Per Share, dan Stock Return, Stock Beta, dan Insider Ownership”.
    Di sini saya meneliti tentang pengaruh pemecahan saham terhadap masing2 tujuh variabel (ada 7 hipotesis).
    Itu ujinya menggunakan regresi yang mana ya? Adviser saya bilangnya menggunakan regresi logistik. Apa bisa menggunakan regresi logistik biner atau regresi logistik yang lainnya lagi?
    Trus saya perlu melakukan uji normalitas juga ngga ya?

    Mohon pencerahannya ya mas, terima kasih sebelumnya..

      • ariyoso
      • Oktober 20th, 2010

      tergantung variabel dependen yang winda gunakan, jika bersifat dikotomi, misal (1 = berhasil; 2 = gagal) maka dapat digunakan model logit biner, jika lebih dari dua kemungkinan, bisa menggunakan model logit ordinal..tetapi klo smua variabel baik dependen maupun dependennya bersifat continuous, ordinal, atau lainnya, maka cukup dengan regresi linier bertingkat saja. Jika memang menggunakan model logit, maka winda tidak perlu melakukan uji normalitas lagi, karena logit tidak mengasumsikan bahwa data harus tersebar secara normal, berbeda halnya jika menggunakan regresi linier bertingkat yang mengasumsikan adanya hubungan linier, data harus tersebar normal, dan data harus bebas dari asumsi klasik seperti multikolinearitas, autokorelasi, maupun heteroskedastisitas. mengenai hal2 tersebut bisa dibaca di bab lain Statistik 4 Life yang khusus membahasnya..okey//

    • yayuk
    • November 7th, 2010

    mas ari apakah uji regresi hanya dgunakan untuk uji pengaruh saja, kalo menggunakan skala likert bagaimana cara mengujinya??

    • yanti
    • November 15th, 2010

    ajari saya cara uji kalibrasi n diskriminasi dums… dari hasil analisis multivariat dg regresi logistik….

    • nuv
    • Februari 18th, 2011

    mas, saya lagi nyusun skripsi..
    judulnya ” menentukan model koefisien regresi logistik dengan menggunakan maksimum likelihood”..
    itu, kira” judulnya udah tepat apa belum?
    trus kira” pake teori apa yah mas?
    (maap agak membingungkan pertanyaan saya..)

      • S4L
      • Juni 28th, 2011

      wah itu kurang spesifik dunk, emang nilai max likelihood adalah salah satu kriterianya,,nah sekarang yang mau dianalisis apa??

    • restu
    • April 19th, 2011

    malam mas, saya restu. mau nanya neh. ada g’contoh soal tentang regresi logistik dengan dummy? makash atas jwbnya.^

    • INDAH
    • Mei 13th, 2011

    pak saya mau bertanya…
    kalau ada peringatan di output logistik bahwa matrix kovarian tdk dapat dihitung berarti apa artinya?

    apakah data saya ada masalah?
    bagaimana solusinya?

    terima kasih…

      • S4L
      • Juni 28th, 2011

      coba cek datanya, apakah sudah sesuai dengan asumsi logit??

  3. slmt siang mas ari..mau numpang nanya..
    saya lg ngambil skripsi dgn pengujian regresi logistik..
    saya menggunakan pengujian itu krn ikutin jurnal saya, tpt saya kurang ngerti ttg regresi logistik..
    saya bingung, bagaimana menentukan 0=ya dan 1=tidak.. sedangkan kuesioner untuk pertanyaan variabel dependennya (melakukan penghentian prosedur audit) menggunakan skala likert 1-4 (tdk prnh, kadang2, selalu dan hampir selalu)..
    truz kalau pengujiannya regresi logistik, kita perlu pengujian seperti uji normalitas, multikolinieritas, dan autokolerasi ga?

    mohon bantuannya ya mas..terima kasih.. :)

      • S4L
      • Juni 27th, 2011

      iya, angka biner itu variabel dependennya hanya ada 2 kemungkinan,,klo dalam kasus kamu, mungkin melakukan penghentian bisa dinotasikan 0, atau tidak melakukan penghentian prosedur audit untuk 1 kali ya :)

    • Teddy
    • Juli 10th, 2011

    Mas, boleh nanya..
    1. Saya bnyk membaca ttg uji time effect buat menilai apakah data bisa di pool atau tidak. Apakah itu perlu? bagaimana caranya dengan menggunakan spss ya?
    2. Contoh di atas, mas ada atur di bagian categorical, itu buat variabel yg gmn ya mas? kl variabel independen saya ada yang dummy ada yg nominal apakah perlu disetting bagian categoricalnya?
    3. Hasil uji logistik saya juga menunjukkan hasil nagelkerke rsquare sebesar 100%, apa itu normal mas? soalnya hasilnya itu kan besar banget saya takut kl ada yang tidak normal pada data saya.

    Terima kasih buat ilmunya mas.. ^^

      • S4L
      • Juli 10th, 2011

      teddy,
      1. uji time effect??ga lazim digunakan tuh, pool maksudnya gimana,,apakah disatuin menjadi konsep data panel??biasanya time effect masuk dalam bahasan time series
      2. untuk yang masuk bagian categorical itu adalah data-data jenis kategorik; atau data yang kita notasikan, misalnya (1 untuk memilih, dan 2 untuk tidak memilih dalam kasus pemilu), atau 1 untuk SD, 2 untuk SMP, 3 untuk SMU, atau 1 untuk wanita dan 2 untuk pria, dan seterusnya. Jika variabelnya dummy ga perlu dimasukkan ke dalam categorical, karena ya itu dummy, bukan variabel kategorik,,jadi dummy biarkan saja.
      3. Hasil negelkerke dan cox & snell itu ibaratnya r-square dalam regresi OLS, nilainya berkisar 0 – 1, semakin besar semakin baik, jadi nilai 0,100 artinya 10 persen, jadi ga akan mengganggu model dan ga ada masalah, karena r-square logit ga selalu besar nilainya.
      kira2 begitu ted..

        • Teddy
        • Juli 10th, 2011

        Buat yg no3, itu digambar contoh punya mas diatas bernilai 1.000 itu brarti 100% kan? punya saya juga begitu hasilnya, jadi agak penasaran kok bisa besar begitu.

        Oh iy mas, terus mas ad tips” ga biar hasil uji variabel in the equation nya lebih baik? (lebih sig) soalnya punya saya dari 13 variabel independen cm 2 yang hasilnya sig, tp sebenarnya tidak ada masalah juga, hanya ingin membuat hasil yang lebih baik kl bisa. ^^v

        • S4L
        • Juli 21st, 2011

        yoo wes,,
        ga da masalah kan??

    • jenni
    • Juli 13th, 2011

    pak, mau tanya kenapa bisa beda ya hasil koefisien persamaan regresi dan signifikansi jika kita memasukkan 3 dari 7 variabel, 5 dari 7 variabel atau 7-7 varibel sekaligus?
    jadi masing2 variabel gk bs berdiri sendiri, tapi sangat tergantung satu sama lain?

      • S4L
      • Juli 13th, 2011

      iya dunk,,karena tidak semua variabel independen punya hubungan linier dengan dependennya pada kasus regresi biasa,,
      karena itu penghilangan variabel yang tidak signifikan terkadang bisa memperbaiki model persamaan..

    • Febby
    • September 20th, 2011

    Mau nanya…
    Apakah di dalam regresi logistik biner tipe data variabel independen harus sama dengan tipe data variabel dependen?
    Mohon balasannya

      • S4L
      • September 22nd, 2011

      beda donk,,klo dependennya kan harus bilangan biner (0 atau 1), misalnya 0 untuk gagal dan 1 untuk sukses,
      buat var. independennya bisa aja skala atau continuous/ordinal..atau notasi :)

    • marchella
    • Desember 23rd, 2011

    mau tanya mas admin,,,kalau hasil olah datanya itu terdapat kalimat estimation terminated at iteration number 20 because maximum iterations has been reached. final solution can’t be found (dlm model summary block1 : method = enter),,, itu artinya apa ya?
    apakah dapat membuat hasil tersebut tidak dapat dipercaya? atau saya masih dapat melanjutkan pembahasannya?
    trimz b4…
    hopefully u can reply me soon

      • S4L
      • Desember 29th, 2011

      hmmmm,,
      model summary menjelaskan analogi R-square seperti pada regresi linier, biasanya prediktor terbaik yang dipakai adalah Nagelkerke R square, apakah bernilai besar atau kecil??
      jika kecil, artinya ada ketidak-cocokan model dalam variabel yang digunakan..berarti ada variabel yang tidak mendukung model.
      coba cek dulu,,apakah marchella sudah benar menempatkan variabel dependen, independen, dan kovariat??apakah notasi yang mewakili variabel dependen dan independen sudah tepat??
      terakhir,,rekomendasi data yang digunakan untuk melakukan analisis logit minimal 50 kasus per prediktor/variabel independen, apakah itu sudah memenuhi,,kalau di contoh S4L datanya hanya sedikit, karena hanya untuk sekedar contoh.. :)

    • Erlina MCR
    • Desember 28th, 2011

    saya mahassiswi yang sedang mengajukan skripsi. yang ingin saya tanyakan, dalam regresi logistik biner apakah variabel independennya juga harus 0 dan 1 ? misal untuk tingkat ekonomi saya mencantumkan 0 = kurang, 1 = cukup, 2 = lebih, apakah boleh? terimakasih sebelumnya. ulasan Bpk pasti sangat membantu saya ^_^

      • S4L
      • Desember 29th, 2011

      tidak harus,,
      variabel independennya bebas, misalnya male & female; SD=1, SLTP=2, SLTA=3, dst..
      tetapi variabel dependen yang harus bilangan biner 0 dan 1

        • Erlina MCR
        • Desember 30th, 2011

        Oh begitu ya.. Lalu apakah Analisis Regresi Logistik Biner Bivariat termasuk kategori SEM? Terimakasih..

        • S4L
        • Februari 19th, 2012

        ya,betul
        regresi termasuk dalam kasus SEM, tapi dalam logit sudah diketahui mana DV dan IV,
        sedangkan dalam terminologi SEM, semua variabel dapat saja berfungsi sebagai independen atau dependen, saling regresi antar variabel eksogen digunakan untuk membangun model..

      • jeri permana putra
      • Maret 26th, 2012

      mbk kalo boleh tau judul skripsinya ap y??? soalny saya jg tentang regresi logistik biner…

    • heri winarto
    • Januari 23rd, 2012

    mas aryo..boleh konsultasi sedikit…kalau B (EXP) adalah nilai Oods Ratio yang dihasilkan, kalau B, Wald, S.E itu apa ya? apa beda B dengan B (exp)?

    • heri winarto
    • Januari 23rd, 2012

    sekalian nambah pertanyaan mas…apa yang dimaksud dengan simple correlation and multiple regression analysis? apa sama dengan uji korelasi pearson/ fischer exact dan analisis multivariat/analisis regresi logistik? matur nuwun sanget ya.

      • S4L
      • Mei 1st, 2012

      wah ga perlu dijawab mas,,beda semua itu

    • enja
    • Februari 9th, 2012

    lebih dpt pencerahan abis baca blog ini, mksih mas :)

    • Niegita Septariana
    • Februari 20th, 2012

    tolong jelaskan tentang regresi logostik ordinal ya mas…makasi sblumnya :)

      • S4L
      • Februari 20th, 2012

      oke,,tunggu ya

    • cakra kurniawan
    • Februari 23rd, 2012

    kalau Regresi LOGISTIK ordinal variabel bebasnya semuanya lebih dari satu kategorik boleh gak???ato harus cuma binner(ato 2 kategorik )doank makasii

      • S4L
      • Mei 1st, 2012

      boleh,,namanya regresi logistik ordinal (cuma belum kita bahas disini), untuk biner ya cuma 2 kategori

  4. mas..maaf skali saya mau bertanya..mungkin ini terkesan aneh..jadi regresi logistik itu alat untuk menguji hipotesis penelitian bukan??terimakasih mas..

      • S4L
      • Mei 1st, 2012

      iya donk, hipotesis yang diuji adalah nilai peluang/log odds bernilai 0 atau tidak..tapi intinya kita mencari peluang untuk variabel prediktor..

    • ririk
    • Maret 12th, 2012

    ass, mau tanya untuk melihat variabel yang berpengaruh paling dominan pada regresi logistik itu dilihat dari mananya ya?? terima kasih pak, sya tunggu jwabannya…

    • zahra
    • Maret 26th, 2012

    pagi mas..saya mw tny, dari kemren2 bingung mw diapakan data saya..udah di otak atik msh jg bingung.
    saya sdg penelitian dengan judul hubungan perilaku kepemimpinan dgn pemberdayaan diri.nha dengan:
    1. var.independ –> perilaku kepemimpinan, 30 soal dengan tipe soal likert(1-5) –> dari sini dihasilkan 3 tipe perilaku
    2. var.depend –> pemberdayaan diri (pemb.psikologis dan struktural). menggunakan 2 kuesioner (berbeda, krn masing2 kuesioner jumlah soalnya brbeda dan penilaian tiap soal antar kuesionernya beda), pke likert juga (pemb.psikologis 12 soal dan tiap soal ada poin 1-7, pemb.struktural 19 soal dan tiap soal ada poin 1-5)
    nha sy bingung uji korelasinya gmn???
    trus saya ingin melihat diantara 2 jenis pemberdayaan tsb mana yg lebih cenderung digunakan????
    kmrn sempat tny dosen ktny pke uji beda…nha trus korelasinya gmn??
    minta bantuannya y mas..sy bingung udah ngotak atik..terimakasih bnyk…

      • S4L
      • Mei 1st, 2012

      nhaa saya juga bingung,,abisnya panjang bgt alur pertanyaannya
      ini aja kamu baca materi tentang uji one way anova disini>>>,,baca yang teliti,,jangan sampe kelewat ya,,klo dah itu,,lupain korelasinya
      nah udah itu, kerjain penelitian kamu pelan2 :)

    • nephitim
    • Maret 31st, 2012

    Siang pak…
    Maklum masih minim pengetahuan akan logit…
    Mau tanya pak, kan saya α∂a pakai likelihood juga… Nah pada kolom iterasi ny α∂a sampai step 20, apakah itu tidak apa2 y pak hasil output ny seperti itu?

    Θàή juga kenapa ќiτά mesti memakai metode ENTER ? Bukan yang lain?

    •-̶̶•̸Ϟ•̸•[τ̲̅н̲̅a̲̅и̲̅κ̲̅ ч̲̅o̲̅u̲̅]••̸Ϟ•̸-̶̶•-̶ ™ be4 pak…

      • S4L
      • Mei 1st, 2012

      siang
      ga apa2 outputnya seperti itu,,
      kenapa enter?karena kita masukkan semua variabel langsung ke dalam persamaan tanpa memilah terlebih dahulu mana variabel yang signifikan dalam model dan mana yang tidak..
      jika kita gunakan forward, artinya kita masukkan variabel yang paling signifikan terlebih dahulu,,kemudian baru variabel lain.
      jika kita gunakan backward artinya kita masukkan dahulu seluruh variabel dalam model,,kemudian kita hilangkan variabel yang tidak signifikan terhadap model satu persatu
      kira2 begitu..

    • Lina
    • April 1st, 2012

    Salam kenal,Kak
    Kak, ada tidak asumsi atau cara yang dapat dilakukan untuk membuat data menjadi signifikan (karena jika sig yang di ‘variables in the equation’ >0,05 )?atau tidak bisa diolah lagi ya?
    Dan apakah model yang fit (dilihat dari hosmer test) namun setengah atau sebagian besar variabelnya tidak signifikan dapat dikatakan sebagai regresi yang baik?
    Sebenarnya hasil penelitian yang bagaimana yang dapat dikatakan baik ya,kak?lebih ke modelnya yang hasilnya fit dengan data atau dari berapa banyak variabelnya yang signifikan, atau bagaimana ya?
    terim kasih,Kak…^^

      • S4L
      • Mei 1st, 2012

      salam kenal juga,,
      jika nilai sig >0,05 maka H0 kita terima,artinya logit p=0,,nilai odds ratio harus antara 0 dan 1 (tidak boleh nol) dengan demikian model dalam persamaan kita tidak signifikan donk,,
      dalam logit kamu juga harus memiliki sampel yang cukup besar (misalnya 100), kurang dari itu kemungkinan besar model tidak signifikan atau bias.
      model dikatakan fit jika signifikan (< 0,05) dengan demikian dapat kita peroleh hipotesis tolak H0..
      coba perbanyak jumlah sampel kamu,,dan teliti lagi variabel kategorik yang digunakan :)

    • Lina
    • April 1st, 2012

    Jika hasil pengujian regresi logistik menyatakan ada case yang missing maksudnya bgmana ya,Kak?Apakah interpretasinya sama seperti pada umumnya?atau harus ada perlakuan lagi?
    ex:
    Case Processing Summary
    Unweighted Casesa N Percent
    Selected Cases Included in Analysis 68 65.4
    Missing Cases 36 34.6
    Total 104 100.0
    Unselected Cases 0 .0
    Total 104 100.0
    a. If weight is in effect, see classification table for the total number of cases.

      • S4L
      • Mei 1st, 2012

      hmm gawat juga klo missing casenya sampai 34,6%, artinya banyak kasus yang tidak terproses oleh software kamu,,dengan demikian hasilnya bisa bias,,
      biasanya disebabkan ada data pada variabel prediktor yang hilang, kemudian beberapa row juga akan diabaikan oleh SPSS, demikian juga untuk variabel prediktor lain yang sejajar..ini bisa terjadi dengan jumlah sampel yang besar,,apalagi sebagian besar software SPSS kita downlodan,gak ori,atau kopi-paste dari temen,kemungkinan besar tetep ada beberapa fitur/fungsi yang hilang..
      solusinya kamu coba input datanya secara manual (satu persatu),,kemudian coba kembali :)
      semoga membantu..

  5. dalam penelitian saya menggunakan regresi logistik. Di mana variabel dependennya dikotomi dan terdapat 3 variabel independen, 1 diantaranya dikotomi. Jika nilai variabel dependen dan variabel independen yang dikotomi tersebut memiliki nilai yang sama bagaimana solusinya? (tanpa mengubah sampel dan variabelnya)

    • makasih :)

      • S4L
      • April 29th, 2012

      ga masalah,,terus aja..variabel independen juga ga mutlak harus pake nilai koq,,bisa aja kondisi sebenarnya (misal male, female, etc)

    • maily
    • Mei 2nd, 2012

    mau tanya di regresi logistik, kenapa variablesin the equationnya yang salah satu variabel tidak keluar sehingga tidak bisa di interpretasikan …

      • S4L
      • Mei 4th, 2012

      yakin udah diinput semua,,coba cek bentuk data yang masuk ke SPSS,,apakah ordinal atau string,,jika string ya tidak akan terbaca,,
      trus metode yang kamu gunakan,,apakah backward, stepwise atau enter,,jika menggunakan backward atau stepwise maka variabel yang tidak signifikan akan dihilangkan oleh SPSS :)

    • elvira nurani
    • Mei 6th, 2012

    selamat sore maz,,
    maaf agak curcol dkit,,he
    saya mahasiswi yang sekarang sedang skripsi tentang regresi logistik binner,, karena saya jurusan matematika murni jd saya hrus melakukan analisis secara manual,,oleh krn itu maz tlong dong dikasih penjelasan tentang proses / langkah yang hrus saya lakukan secara manual untuk analisis regresi logistik ninner ini…dan materi matematis apa saja yang hrus saya gunakan dalam proses analisis…?
    mohon bantuannya ya… ^_^
    terimakasih…

    • Sarie
    • Mei 23rd, 2012

    Siang mas Ary…
    Mas, saya butuh bantuan untuk menentukan alat analisis apa yg tepat digunakan dalam penelitian saya. Objek penelitian saya jumlah populasinya sedikit (hanya 10) yg kesemuanya saya jadikan sampel penelitian. Adapun variabel2 yg dipakai sbb:
    X1 = jumlah karyawan –> data rasio
    X2 = ROA –> data rasio
    X3 = Leverage –> data rasio
    X4 = jumlah dewan komisaris –> data rasio
    X5 = kualitas dewan pengawas syariah –> kategorikal 4,3,2,1 (data ordinal)

    Y = indeks pengungkapan pada laporan tahunan (dalam %)

    Pertanyaan saya,
    1. Apakah data Y berupa indeks termasuk data ordinal atau rasio? Minta referensi teorinya mas…

    2. Apakah dalam penelitian tsb bisa digunakan analisis regresi dengan jumlah sampel yg kecil?

    3. Lalu jika dilakukan analisis korelasi menggunakan korelasi apa ya mas?

    Terima kasih, mohon pencerahannya mas…

      • S4L
      • Mei 23rd, 2012

      tujuan penelitian kamu untuk apa??harus jelas dulu,,untuk regresi, jumlah sampel 10 tidak akan memadai

    • reni indri yenti
    • Mei 31st, 2012

    MAS MAU NANYA NI,,, SAYA MELAKUKAN PENELITIAN DENGAN MENGGUNAKAN REGRESI LOGISTIK,,,
    REGRESI LOGISTIK KAN DIGUNAKAN JIKA VARIABLE DEPENDENNYA BERSIFAK KATEGORI,, SAYA BACA INI D BUKU PAK IMAM GHOZALI,, NAH DOSEN SAYA NANYA NI,, SAPA ORANG YANG PERTAMA X MENGELUARKAN STATEMENT INI… MOHON BANTUANNYA YA……

      • S4L
      • Juni 5th, 2012

      bukan kategori neng,,tapi biner (dua kemungkinan), atau 0 dan 1, ya dan tidak, sukses atau gagal, dll,,kalau kategori bisa aja kategorinya 4 atau 5 (itu bukan logistik lagi namanya)..emang bukan kata siapa-siapa,,itulah regresi logistik :)

  6. Mas, saya mau tanya..
    adakah cara untuk merubah regresi biner logistik ke regresi panel data?? soalnya data saya kan menggabungkan time series sama cross section tapi variabel dependennya biner..mohon pencerahannya ya Mas…terima kasih.

      • S4L
      • Juni 5th, 2012

      jika dependennya biner,,tetep kamu akan mengukur rasio peluang kan??ya pakenya regresi logistik,

  7. mas mau nanya nih,mngkin gk dlam regresi logistik pke uji t? soalnya dosen saya nanya knapa untuk nguji variabel independennya gk pke uji parsial t.trima kasih

      • S4L
      • Juni 7th, 2012

      mungkin aja na,,apa dulu tujuan penelitiannya,,uji t merupakan uji perbandingan antara 2 variabel yang saling lepas,,sedangkan logit untuk mengetahui rasio peluang variabel dependen terhadap independen yang dinyatakan dengan bilangan biner,,jika hanya membandingkan,,bisa aja cuma pake uji t atau anova

      • judul penelitian saya “pengaruh kondisi keuangan, kualitas audit dan ukuran perusahaan pada perusahaan manufaktur yg trdpat di bei thun 2010-2011″ apakah bisa pke uji t mas? klo bisa pke uji t berarti bisa pake uji f simultan juga ya mas?
        trima kasih bnyak mas atas jawabannya

    • aida
    • Desember 18th, 2012

    mas admin kalo tanya, variabel dependen diukur dgn 5likert scale, trus diubah jadi binari: tinggi (1) renddah (2), krn mau pake reg logistik. Apa diperkenankan perubahan tsb? trmks sarannya.

      • S4L
      • Januari 2nd, 2013

      ga bisa donk, likert yang mau dipake kan skala 5, nah pada logistik variabelnya biner 0 dan 1 (gagal dan berhasil), beda khan??

  8. salam kenal kak,saya sedang menyusun skripsi dan lagi bnggung analisis data apa yg cocok untuk penelitian saya. jdul penelitian saya faktor-faktor yang mempengaruhi tingkat pemahaman IFRS.variabel independennya ada 7 dan dependennya ada 1(variabel dummy). variabel independennya ada 1 yang variabel dummy kak, yaitu status perguruan tinggi swasta atau negeri sedangkan 6 variabel independen lainnya adalh skala interval. yang saya ingi tanyakan analisis data apa yg cocok untuk penelitian saya ini kak? sedangkan setau saya variabel dummy itu termasuk skala nominal ya?. mohonnnnn bantuan nya ya kak….

      • S4L
      • Januari 12th, 2013

      jika variabel dependennya faham dan tidak faham, bisa dengan logistik koq

  9. intinya pertanyaan saya itu, apakah analisis regresi logistik bisa digunakan dalam penelitian yg variabel independennya dummy(skala nominal). krna dr artikel2 yang saya baca analisis regresi logistik itu ketentuannya variabel indepent mempunya skala rasio atau interval. mohon di jawab ya kak….,makasih

      • S4L
      • Januari 12th, 2013

      bisa pake dummy untuk independen,,dalam SPSS kamu bisa proses dulu kodingnya, insyaallah senin 14/1 ini akan saya posting materi “regresi logistik dengan variabel dummy”..

    • terima kasih bnyak kak pencerahannya….

    • nolly
    • Januari 11th, 2013

    mas,,,,saya mau tanya, begini….penelitian saya awalnya menggunakan analisis regresi linear, untuk variabel bebasnya X1, dan X2 skala datanya 0 dan 1, skor untuk jawaban benar 1 dan salah adlah 0. begitu juga variabel dependent (Y), untuk jawaban benar diberi skor 1 dan salah diberi skor 0. nah yang saya analisis dg regresi linear adalah skor total beberapa item pertanyaan dari variabel X1, X2 dan Y.
    nah,,,tapi kata dosen saya itu salah, katanya saya harus pakai regresi logistic, yang bener gimana ya mas? padahal hasil dari skor totalnya kan tida 1 dan 0??? mohon bantuannya

      • S4L
      • Januari 12th, 2013

      iya,,coba baca materinya dengan benar,,jika Y kamu bersifat dikotomi (benar dan salah), kamu bisa pake regresi logistik dunk,,itu tidak akan memiliki hubungan linier, jadi ga cocok digunakan regresi linier,,,regresi linier hanya digunakan untuk variabel kontinyu

    • Nana
    • Mei 27th, 2013

    Maaf mas, saya mau tanya,,
    sya sedang melakukan penelitian dengan menggunakan regresi logistik,,
    setelah diuji ternyata hasilnya data saya mengalami overdispersi, sehingga tidak ada pengaruh signifikan dari 5 variabel terhadap variabel dependennya..
    jumlah data saya 63 dan berupa data panel..
    saya mau tanya bagaimana mengatasi overdispersi selain dengan membuang/mengganti variabel?
    mohon masukannya..
    terimakasih.. :)

      • S4L
      • Mei 27th, 2013

      klo datanya pooled/panel maka kamu harus running regresi data panel dunk :) lihat bahasannya disini >>>

  10. pak saya menliti tentang flypaper effect dimana dikatakan terjadi flypaper itu jika PAD<DAU maka 1 dan sebaliknya 0. nah bagaimana kalau ternyata datanya PAD<DAU semua, jadi berkategori 1 semuakan dependentnya, apakah itu bisa dilanjutkan dgn logistik? mohon pencerahannya pak saya buta bener tentang analisis ini =,=

      • S4L
      • Mei 27th, 2013

      nah lo..ga bisa donk..modelnya jadinya bukan kurva logit (lihat ilustrasi kurvanya) dan bukan kurva linier sekalipun..jadinya sudah bisa disimpulkan donk, jika PAD < DAU maka memang terjadi flypaper effect,,nah yang diteliti apanya klo sudah jelas??

    • Nana
    • Juni 4th, 2013

    Mas ari,, saya masih belum faham kenapa kalau datanya panel harus runing regresi data panel dulu.hehe..
    kemudian di blog mas ari hanya dijelaskan regresi data panel dengan menggunakan eviews,, bagaimana jika menggunakan spss?
    mohon masukannya.. :)

      • S4L
      • Juni 5th, 2013

      bisa, lewat Mixed procedure (analyzed-mixed model-linear), hanya saya lum sempet posting :)

        • Nana
        • Juni 17th, 2013

        terimakasih atas tanggapannya mas arii,, saya pelajari dulu.. :)

    • rossy
    • April 18th, 2014

    mas ari,,, saya rossy salam kenal,,,
    saya mau tanya mas,,,, judul skripsi saya kan pengaruh DER,NPM,ukuran perusahaan, DOL terhadap perataan laba di BEI tahun 2010-2012 mas,,, untuk variabel x-nya DER,NPM,ukuran perusahaan, DOL itu merupakan skala rasio mas,,, untuk variabel y-nya perataan labanya itu pakek dummy yaitu melakukan perataan laba (1) dan tidak melakukan perataan laba (0),,, saya mau tanya itu menggunakan jenis regresi apa mas??? klo regresi logistik itu ada uji parsialnya dan simultannya apa tidak mas??? tolong bantuannya mas,,, terimakasih

      • S4L
      • April 27th, 2014

      perataan labanya dikotomi, jadi coba pake logistik,,,uji pendahuluan ga perlu dilakukan karena emang ga ada hubungan linier

  1. No trackbacks yet.

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Logout / Ubah )

Twitter picture

You are commenting using your Twitter account. Logout / Ubah )

Facebook photo

You are commenting using your Facebook account. Logout / Ubah )

Google+ photo

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s

Ikuti

Get every new post delivered to your Inbox.

Bergabunglah dengan 70 pengikut lainnya.

%d bloggers like this: