Friday 4 August 2017

Contoh Data Regresi Logistik Opções Binárias


Regresi linier seperti yang kita ketahui tidak dapat menyelesaikan kasus dimana variabel dependente bersifat dikotomi dan kategori dengan dua atau lebih kemungkinan (ex. Sukses atau Gagal terpilih atau tidak terpilih lulus atau tidak lulus melakukan pembelian atau tidak mendapat promosi atau tidak, dan lain-lain) . Regresi logistik umumnya melibatkan berbagai macam variabel prediktor baik numerik ataupun kategorik, termasuk varibel dummy. Pada regresi linier, variabel prediktor yang digunakan biasanya numerik, tetapi jika kita melibatkan campuran antara numerik maupun kategorik kita dapat menggunakan regresi logistik. Regresi logistik membentuk persamaan atau fungsi dengan pendekatan máxima verossimilhança, yang memaksimalkan peluang pengklasifikasian objek yang diamati menjadi kategori yang sesuai kemudian mengubahnya menjadi koefisien regresi yang sederhana. Dua nilai yang biasa digunakan sebagai variabel dependen yang diprediksi adalah 0 dan 1 (ex. 1berhasil, 0gagal). Regresi logistik menghasilkan rasio peluang (odds ratios) antara keberhasilan atau kegagalan suatu dari analisis. Dapat kita contohkan dengan seorang tokoh yang ingin menjadi presiden, akan lebih baik peluangnya jika menjadi ketua partai politik tertentu. Disini odds ratio yang dimaksud adalah seberapa besar peluang tokoh tersebut dengan mempertimbangkan variabel prediktor yang ada. Regresi logistik akan membentuk variabel prediktor / respon (log (p / (1-p)) yang merupakan kombinasi linier dari variabel independen. Nilai variabel prediktor ini kemudian ditransformasikan menjadi probabilitas dengan fungsi logit. Asumsi-asumsi dalam regresi logistik Tidak mengasumsikan hubungan linier antar Variabel dependem de independente Variabel dependen harus bersifat dikotomi (2 variabel) Variabel independente tidak harus memiliki keragaman yang sama antar kelompok variabel Kategori dalam variabel independente harus terpisah satu sama lain atau bersifat eksklusif Sampel yang diperlukan dalam jumlah relativo besar, mínimo dibutuhkan hingga 50 dados sampel Untuk sebuah variabel prediktor (bebas). Persamaan Regresi Logistik Regresi logistik menghasilkan rasio peluang yang dinyatakan dengan transformasi fungsi logaritma (log), dengan demikian fungsi transformasi log ataupun em diperlukan untuk p-value, dengan demikian dapat dinyatakan bahwa logit (p) merupakan log Dari peluang (odds ratio ) Atau razão de verossimilhança dengan kemungkinan terbesar nilai peluang adalah 1, dengan demikian persamaan regresi logistik menjadi: logit (p) log (p / 1-p) ln (p / 1-p) dimana p bernilai antara 0-1. Modelo yang digunakan pada regresi logistik adalah: Log (P / 1 8211 p) 0 1X1 2X2 8230. kXk Dimana p adalah kemungkinan bahwa Y 1, dan X1, X2, X3 adalah variabel independen, dan b adalah koefisien regresi. Contings de log de Konsep, Ratio de Odds Logit (probabilidades de log) merupakan koefisien slope (b) dari persamaan regresi. Slope disini adalah perubahan nilai rata-rata dari Y dari satu unidade perubahan nilai X. Regresi logistik melihat perubahan pada nilai variabel dependem yang ditransformasi menjadi peluang, bukan nilai aslinya seperti pada regresi linier. Sebagai ilustrasi jika nilai peluang adalah 0,25, maka nilai odds adalah 3 (25. 75), sedangkan jika nilai peluang 50, maka nilai odds adalah 1 (50. 50), atau jika nilai peluang 0,33, maka nilai odds adalah 2 (33. 67) dengan total keseluruhan nilai peluang adalah 1. Nilai odds ratio biasanya dapat kita lihat pada kolom B pada 8216variables na equação8217 saída SPSS. Modelo de Kecocokan (ajuste do modelo) e probabilidade de diversão. Probabilidade de ter um problema com a terapia. Seperti yang kita ketahui pada kurva regresi linier kita lihat adanya hubungan linier, peningkatan pada sumbu Y akan diikuti dengan peningkatan pada sumbu X dan sebaliknya. Tetapi pada regresi logistik dengan nilai Y antara 0 dan 1, pendekatan linier tidak bisa kita gunakan. Oleh karena itu metode máxima probabilidade sangat berguna dalam menentukan kecocokan modelo yang tepat bagi persamaan yang kita miliki. Hipotesis dalam regresi logistik antara lain: h0 ketika persamaan regresi bernilai 0 logit (p) 0. h1 persamaan regresi berbeda nyata dari 0 logit (p) 8800 0. Regresi logistik merupakan regresi não linier dimana modelo yang ditentukan akan mengikuti pola kurva linier seperti gambar Di bawah ini. Regresi logistik juga menghasilkan rasio peluang (odds ratios) terkait dengan nilai setiap prediktor. Peluang (probabilidades) dari suatu kejadian diartikan sebagai probabilitas hasil yang muncul yang dibagi dengan probabilitas suatu kejadian tidak terjadi. Secara umum, rasio peluang (odds ratios) merupakan sekumpulan peluang yang dibagi oleh peluang lainnya. Rasio peluang bagi prediktor diartikan sebagai jumlah relativo dimana peluang hasil meningkat (rasio peluang gt 1) atau turun (rasio peluang lt 1) ketika nilai variabel prediktor meningkat sebesar 1 unidade. Lebih jelasnya kita dapat mengikuti ilustrasi berikut ini: Kita ingin mengetahui apakah berat badan (weightgain) sapi para peternak di kota elgrow bertambah signifikan atau tidak, dengan variabel prediktor adalah sexo yang terdiri atas masculino (M) atau feminino (F), obit cate (Antihelmíntico) secara rutin sesuai dosis yang dinyatakan dengan sim dan não, dan biaya pemeliharaan por bulan yang dinyatakan dalam EUA. Kali ini kita akan menjalankan modelo logit menggunakan bantuan software IBM SPSS versi 23, untuk yang masih menggunakan SPSS seri di bawahnya jangan khawatir, masih kurang lebih sama koq cara aplikasinya, kamu bisa download datanya disini 1. tahap impor dados (misalnya dari excel), Buka SPSS kamu, arquivo gt ler dados de texto, pada kotak diálogo abrir dados, arquivos de tipo gt pilih excel, maka datanya muncul di layar, pilih lalu klik gt aberto, kemudian dimunculkan lagi jendela abrir dados, lista de verificação seperti gambar gt ok, dados telah Masuk dalam record spss, berikut adalah dataview, lihat sususannya tidak beraturan, kamu bisa atur dalam variável view: atur label, desimal, dan lain-lain dalam variabel view, 2. Tahap Analisis, Analise gt regression gt logística binária, Setelah muncul jendela logistic Regressão, masukkan weightgain kedalam dependen, dan variabel kategorik yaitu sexo dan anthelmintic ke kotak covariados, lalu klik categórico, untuk menyesuaikan tipe dados varibel kategorik, Di jendela Definir covariáveis ​​variáveis ​​pilih categoria de referência primeiro, kemudian klik muda gt continuar, klik próximo lalu masukkan variabel kontinyu custo, ke dalam covariações, opção kemudiana, kemudian continuar gt ok, maka outputnya akan ditampilkan, modelo Qui-Square sebesar 18,440, angka ini menjelaskan kemampuan Modelo dalam memprediksi variabel dependen weightgain. Dengan signifikansi 0,000 lt 0,05, berarti terdapat peningkatan signifikansi dengan penambahan variabel sexo, dan anthelmintic, ke dalam model. -2 log de probabilidade menjelaskan signifikansi modelo layaknya R-sq pada regresi linier OLS. Tabel Hosmer e Lemeshow test menunjukkan nilai penambahan signikansi modelo dari konstanta, dan modelo sesudah ditambahkan variabel independen sex dan anthelmintic. Penambahannya cukup kecil dengan signifikansi 0,631 (gt0,05). Kita lihat kembali pada variáveis ​​de saída na equação modelo de menunjukkan sesuai hipotesis nulo atau modelo tanpa prediktor, Variáveis ​​de saída não na equação menunjukkan signifikansi masing-masing variabel independen terhadap weightgain. Dari tabel dapat kita lihat bahwa variabel anthelmintic (1) memberikan peningkatan yang signikan terhadap modelo (0,000), sedangkan sexo (1) tidak signifikan (0,298). Tetapi secara keseluruhan signifikan terhadap modelo perbaikan (estatísticas globais, sig 0,000). Variáveis ​​de saída de Dari na equação persamaan yang kita peroleh adalah (lihat nilai pada kolom B): Probabilidades de logs (ganho de peso) B0 B1sex (1) B2anthelmintic (1) B3cost atau dengan nilai aslinya Odds de registro -3g 502 0,116sex (1) 2,638, hemiltémico (1) 0,011, preço Jika (1) 1 (codificação de saída lihat), antihelmíntico (1) 1 (codificação de saída lihat), dan costUS 100, maka persamaannya menjadi: Probabilidades de logs (ganho de peso) -3,502 0,116 (1) 2,638 (1) 0,011 (100) Odds de registro (peso) -3,502 0,116 2,638 1,1 Jika kita hilangkan log maka persamaan akan dalam bentuk eksponensial: probabilidades (peso) e -3,502 0,116 2,638 1,1 Interpretasi dari Persamaan Untuk setiap perubahan por unidade Pada variabel sex (1) (koding dummy untuk variabel M / jantan), akan meningkatkan weightgain sebesar 0,116. Untuk setiap kenaikan pada variabel anthelmintic (1) sebesar 1 unidade, maka akan meningkatkan weightgain sebesar 2.638. Untuk setiap penambahan sebesar US1 terhadap variabel cost, maka akan meningkatkan peluang weightgain sebesar 0,011. Dann nilai signifikansi dapat kita simpulkan bahwa variabel yang signikan berpengaruh terhadap log odds (weightgain) adalah pemberian obat cacing secara rutin (antihelmíntico (1)), dan cost dengan nilai signifikansi berturut-turut 0,02 dan 0,018 (pada tingkat signifikansi 95). Kemudian mari kita interpretasikan nilai exp (B) variáveis ​​de saída de pada na equação di atas: Sexo variável (1) yang mengacu pada Masculino / Jantan, memiliki kecenderungan untuk mendapatkan pertambahan berat badan (weightg ain) 1,122 kali daripada Feminino / betina yang menjadi kategori Referensi kita (ini adalah koding dummy, dimana 0 untuk F dan 1 untuk M). Variabel anthelmintic (1) yang mengacu pada sim, dimana pemberian obat cacing secara teratur dan sesuai dosis memiliki peluang sebesar 13,988 kali daripada kategori referensi kita yang mengacu pada não, dimana no dinyatakan sebagai tidak memberikan asupan obat cacing secara rutin dan sesuai dosis. Variabel ini sangat signifikan mempengaruhi log odds (weightgain) dengan nilai signifikansi 0,002. Variabel cost cenderung meningkatkan weightgain sebesar 0,030 kali dengan nilai signifikansi yang baik yaitu 0,018 lt 0,05. (Yoso) download materi dalam bentuk pdf di bawah inti gtgtgtTutorial Contoh Analisis Regresi Logistik biner / dikotomi dengan SPSS Pada hari sebelumnya telah dibahas tentang konsep dari regresi Logistik Biner. Sesuai dengan janji penulis akan dibahas tutorial regresi logistik biner dengan SPSS. (Kayak pemilu aja ya.:p). Untuk contoh kasus kali ini, terinspirasi dari tugas kelompok perkuliahan yang diambil dari tugas kakak tingkat. Bisa dibilang copas lah ya. Tapi, jangan dilihat dari copasnya. Tapi lihat dari niatnya dan keinginan untuk saling berbagi semoga dapat membantu mengerjakan tugas, skripsi, tesis atau bahkan disertasi. Contoh Kasus Analisis Regresi Logistik biner: Dilakukan simulasi untuk melihat pengaruh antara variabel profitabilitas, kompleksitas perusahaan, opini auditor, likuiditas dan ukuran perusahaan terhadap ketepatan penyampaian laporan keuangan tahunan perusahaan. Profitabilitas diukur dengan ROA variabel kompleksitas terdiri atas 2 kategorik yaitu diberi angka 2 jika mempunyai anak perusahaan dan 1 jika perusahaan tidak mempunyai anak perusahaan opini auditor diukur dengan 2 jika mendapatkan opini wajar tanpa pengecualian dan 1 untuk opini yang lain likuiditas diukur dengan Razão atual dan ukuran Perusahaan diukur dengan logaritma valor de mercado natural. Variabel terikatnya adalah ketepatan penyampaian laporan keuangan, dengan kode 1 untuk perusahaan yang tepat waktu dan 0 untuk perusahaan yang terlambat. Data yang digunakan dalam penelitian ini tidak ditampilkan mungkin kalau teman ingin mencoba juga bisa didownload dibagian bawah nanti ya. Dalam tutorial ini menggunakan SPSS 20.Langsung saja ya dengan langkah-langkahnya. Langkah-langkah dalam pengujian analisis regresi logistik Pada posisi arquivo telah terbuka, maka akan terlihat pada layar dados tentang ketepatan penyampaian laporan keuangan perusahaan dengan sejumlah variabel-variabelnya. Untuk menganalisis, langkah awalnya adalah pilih menu Analisar. Kemudian pilih Regression from Binary Logistic. Maka akan muncul tampilan seperti di bawah ini. Masukan variabel yang berfungsi sebagai variabel tak bebas dari caixa varibel ke kolom dependente. Dan masukan semua varibel bebas pada kotak Covariate. Método Untuk, pilih Enter. Sebenarnya bisa dipilih metode apa saja karena modelo yang terbentuk akan sama (dalam artian penduga-penduga parameternya akan memiliki nilai-nilai yang sama). Akan tetapi, khusus metode Digite, harus dilakukan proses dua kali. Pertama, dados de diagrama de identidade, variável sem valor, variável, variável, mana yang, significa, setelah, itu, di, executar, lag, dengan, menggunakan, variabel, yang, signifikan, itu. Modelo yang terbentuk akan sama dengan modelo yang diperoleh dengan metode lain. Klik Categorical. Masukkan semua variabel bebas yang berbentuk kategori pada kotak covariável ke dalam kotak covariáveis ​​categóricas. Indicador padrão de biarkan contras pada. Untuk reference kategori pilih bagian kategori yang akan dipakai sebagai referensi atau pembanding yang akan digunakan dalam interpretasi odds ratio. Dapat menggunakan kategori akhir (último) atau kategori pertama (primeiro). Dalam penelitian ini digunakan kategori akhir (último). Kemudian klik Continue. Setelah itu pilih opção de menu. História da iteração do centang untuk dapat mengetahui proses iterasi yang telah berlangsung. Selain itu, akan ditemukan Classificação cortada, yang pada kondisi default sudah diisi dengan 0.5. Nilai ini disebut dengan o valor de corte atau probabilidade anterior. Peluang suatu observasi untuk masuk ke salah satu kelompok sebelum karakteristik variabel penjelasnya diketahui. Jika kita tidak mempunyai informasi tambahan tentang data kita, maka kita bisa menggunakan padrão. Misalnya pada penelitian ini, sebelumnya tidak pernah dilakukan penelitian apakah ukuran perusahaan condong pada satu sisi. Dengan alasan ini, dapat digunakan classificação ponto de corte sebesar 0,5. Namun, misalnya pada ada penelitian lain yang telah meneliti maka bisa dinaikkan / diturunkan classificação cutoff sesuai hasil penelitian. Dalam penelitian ini semua variabel numerik dalam default 0,5. Abaikan bagain yang lain, klik continua. Abaikan bagian yang lain, dan tekan OK maka akan keluar saída de Regresi Logistik. Intrepretasi Hasil analisis regresi logistik Setelah keluar output dari hasil executando dados de SPSS maka diperoleh hasil analisis sebagai berikut: Identifikasi Data yang Hilang Pada tabel di atas, dapat dilihat tidak ada data yang hilang (casos em falta). Pemberian kode variabel respond oleh SPSS Menurut pengkodean SPSS, yang termasuk kategori sukses adalah penyampaian laporan keuangan tahunan yang tepat. Pemberian kode untuk variabel penjelas yang kategorik Pengkodean variabel penjelas hanya dilakukan untuk variabel penjelas yang kategorik karena akan dibentuk dummy variabel. Penelitian ini menggunakan dua variabel penjelas yang kategorik yaitu variabel Opini dan variabel Kompleksitas. Untuk variabel opini. Nantinya yang akan digunakan sebagai código de referência (kode pembanding) adalah Wajar Tanpa Pengecualian (lihat pada tabel di atas bagian codificações de parâmetros yang berkode nol). Sementara untuk variabel Kompleksitas. Yang menjadi kode pembanding adalah Punya anak perusahaan. Kode pembanding ini akan digunakan untuk interpretasi Odds Ratio. Uji Signifikansi Modelo Dari hasil SPSS dapat digunakan tabel 8220 Testes Omnibus de Coeficientes Modelos 8221 untuk melihat hasil pengujian secara simultan pengaruh variabel bebas ini. Berdasarkan tabel di atas diperoleh nilai Sig. Model sebesar 0.000. Karena nilai ini lebih kecil dari 5 maka kita menolak Ho pada tingkat signifikansi 5 sehingga disimpulkan bahwa variabel bebas yang digunakan, secara bersama-sama berpengaruh terhadap ketepatan penyampaian laporan keuangan suatu perusahaan. Atau minimal ada satu variabel bebas yang berpengaruh. Persentase Ketepatan Klasifikasi (Percentagem correta) Persentase ketepatan modelo dalam mengkasifikasikan observasi adalah 78.6 persen. Artinya dari 70 observasi, ada 55 observasi yang tepat pengklasifikasiannya oleh modelo regresi logistik. Jumlah observasi yang tepat pengklasifikasiannya dapat dilihat pada diagonal utama. Uji Parsial de Pembentukan Modelo Pada uji diharapkan Ho akan ditolak sehingga variabel yang sedang diuji masuk ke dalam modelo. Dengan bantuan tabel 8220Variables em The Equation8221 dapat dilihat variabel mana saja yang berpengaruh significa modelo de sehingga bisa dimasukkan ke. Jika nilai sig. lta maka Ho ditolak. Berdasarkan hasil di atas diketahui bahwa terdapat 2 variabel bebas yang significikan berpengaruh terhadap ketepatan penyampaian laporan keuangan perusahaan karena masing-masing variabel tersebut memiliki nilai signifikansi yang lebih kecil aa. Variabel-variabel tersebut adalah Profitabilitas (Sig.0.004) dan Likuiditas (Sig.0.000). Modelo yang terbentuk adalah: Dimana: X1i Profitabilitas X2i Likuiditas i1,2,8230, n 7. Interpretasi Odds Ratio Nilai Odds ratio ini juga disediakan oleh tabel 8220 Variáveis ​​na Equação 8221 pada kolom Exp (B): Berdasarkan hasil di atas kita dapat Menginterpretasikan Odds ratio sebagai berikut: Jika jumlah profitabilitas perusahaan bertambah 1 unidade maka kecendrungan perusahaan tersebut untuk tepat waktu menyampaikan laporan keuangan menjadi 2.780 kali lipat. Sebuah perusahaan yang tidak mempunyai anak perusahaan akan memiliki kecenderungan untuk menyampaikan laporan keuangan secara tepat waktu sebesar 3.057 kali dibanding perusahaan yang memiliki anak perusahaan (merujuk pada código de referência). Perusahaan dengan opini auditor adalah opini lain cenderung 0.848 kali (lebih rentah) untuk tepat waktu dalam menyampaikan laporan keuangan dibanding dengan perusahaan yang Wajar tanpa Pengecualian. Jika Relação atual pada likuiditas bertambah 1 persen maka perusahaan akan cenderung 1.708 kali untuk tepat waktu menyampaikan laporan keuangannya. Ketika ukuran perusahaan bertambah 1 unidade maka perusahaan tersebut cenderung 1.123 kali untuk tepat waktu dalam menyampaikan laporan keuangannya. Buat yang ingin mencoba silahkan download filenya dibawah ini: tutorial reglog biner (SPSS 20) Escrito por: Nasrul Setiawan Terima kasih sudah membaca artikel Análise regresi / Regresi Logistik / SPSS dengan judul Tutorial Contoh Analisis Regresi Logistik biner / dikotomi dengan SPSS. Anda bisa bookmark halaman ini dengan URL statistikceria. blogspot / 2013/01 / tutorial-analisis-regresi-logistik. html. Apabila ada yang kurang jelas silahkan tinggalkan komentar atau pesan.

No comments:

Post a Comment