Komponen Statistik Deskriptif

Statistik deskriptif menunjukkan karakteristik data yang kita kumpulkan. Jika kita mengamati klasemen sementara liga utama inggris, kita dapat melihat perolehan nilai, goal, kekalahan, draw, serta goal yang telah dicetak masing-masing klub di liga tersebut. Dengan demikian kita akan mengetahui tim mana yang paling produktif, yang paling banyak draw, rekor kandang, tandang dan sebagainya. Penyajian tabel inilah yang dapat kita sebut sebagai penyajian data secara deskriptif. 
Data Sampel dan Data Populasi
Data populasi adalah seluruh bagian dari kelompok data, seperti data berat bayi yang lahir di Indonesia pada tahun 2010, atau berat semen yang diproduksi oleh pabrik per zak.
Parameter
Jumlah yang menjelaskan populasi disebut sebagai parameter dan biasanya dinyatakan dalam huruf Yunani, sedangkan angka yang digunakan untuk menjelaskan kelompok data sampel disebut statistik.
Frekuensi (F)
Biasanya dinyatakan dengan persentase, bentuk yang tepat dalam menampilkan data frekuensi adalah diagram dan grafik.
Pada sampel di bawah ini kita lihat data perolehan suara pada pemilihan walikota kota A, dengan jumlah suara yang diperoleh bapak Mamat memimpin dengan 38,89%.
tabel-deskriptif
Data ini akan lebih menarik jika disajikan dalam bentuk diagram batang (bar chart) distribusi frekuensi suara pada pemilihan walikota kota A.
histogram
Atau dalam bentuk diagram kue (pie chart) seperti gambar di bawah ini;
pie-chart
Mode dan Median
Mode adalah nilai yang paling sering muncul, ia menyatakan jumlah kategori yang paling sering muncul pada suatu kasus. Ketika anda membagikan kuesioner kepada karyawan kantor untuk memilih apa yang paling suka mereka lakukan di waktu luang, jika sebagian besar menjawab mendengarkan musik, maka mendengarkan musik adalah mode. Mode cocok untuk diterapkan pada data yang bersifat nominal.
Median adalah nilai tengah, ia merupakan titik tengah pembagi data. Contoh berikut dapat mendeskripsikan median yang biasa digunakan untuk data-data ordinal.
median
Mean (M)
Mean merupakan rataan dari skor yang diukur, menghitung mean untuk variable X dapat menggunakan rumus:
mean_rumus
Fosfat yang dihasilkan dari limbah deterjen merk A, B, C, D, dan E adalah berturut-turut 43, 42, 31,32,37, hitunglah mean;
mean
Variabilitas/Dispersi
Salah satu teknik untuk mengelompokkan data pada teknik statistik deskriptif adalah menghitung dispersi atau variabilitas. Tiga cara menghitung variabilitas antara lain:
variabilitas1
Contoh perhitungan keragaman dan standar deviasi dapat kita lihat di bawah ini:
*** berikut ini diberikan data hasil ujian statistik dasar untuk 10 mahasiswa di perguruan tinggi LOLipop dengan data yang diberikan sebagai berikut:
variabilitas-contoh1
*** Menghitung Nilai Rataan:
variabilitas-contoh-21
*** Menghitung Keragaman (variance):
variabilitas-contoh-22
***Menghitung Standar Deviasi:
variabilitas-contoh-2
variabilitas-contoh-2ext
Standar error merupakan variabilitas distribusi sampling dalam statistik. Standar eror dinyatakan dengan rumus:
standar eror

dimana:

Se     = standar eror

S       = standar deviasi

N       = jumlah sampel

***jika diketahui standar deviasi = 4, dan jumlah sampel yang digunakan adalah 30, maka standar eror adalah;

standar eror2

Selang Kepercayaan (CI)

Selang kepercayaan memberikan batas bawah dan batas atas statistik pada kemungkinan tertentu yang ditentukan oleh peneliti. Tingkat kepercayaan yang biasa digunakan adalah 90%, 95%, dan 99%. Seorang peneliti akan menentukan tingkat kepercayaan dan jumlah sampel yang akan menentukan batas bawah dan batas atas CI yang digunakan.

CI = Mean + (standar eror x tingkat kepercayaan)

***jika diketahui jumlah sampel (n) adalah 30, standar eror (Se) adalah 0,73, sedangkan mean adalah 50, hitung selang kepercayaan pada taraf nyata 5%.

CI = 50 + (0,73 x 2,045)

(nilai 2,045 berasal dari tabel nilai kritik t dengan derajat bebas n-1) lihat tabel t
Maka CI = 50 + (1,5)

Sebaran Sampel dan Populasi

Sebaran frekuensi dari suatu variabel menggunakan populasi dan sampel populasi sebagai indikatornya. Sebaran sampel adalah gambaran kecil mengenai sebaran populasi. Semakin banyak sampel yang digunakan, maka frekuensi relatif sampel pada setiap kelas interval akan semakin mendekati frekuensi relatif populasi yang sebenarnya, dengan demikian sebaran sampel akan semakin jelas menggambarkan sebaran populasi.

Pada variabel kontinyu, kita dapat memilih interval kelas pada sebaran frekuensi dan grafik bentuk histogram. Namun ketika sampel bertambah maka interval kelas secara langsung juga akan bertambah, maka histogram sampel akan mendekat pola kurva  simetris (kurva sebaran). Kurva yang kita dapatkan tersebut dapat digunakan untuk mewakili sebaran populasi. Pada gambar di bawah ini ditunjukkan dua contoh histogram dengan populasi kecil dan populasi besar, dan kurva sebaran yang menggambarkan sebaran populasinya.

histogram1

kurva sebaran populasi

Metode dalam menerangkan sebaran populasi sampel adalah dengan melihat bentuk kurva sebaran. Kelompok sebaran dengan bentuk kurva seperti lonceng akan berbeda dengan kelompok sebaran dengan bentuk kurva U. kurva sebaran lonceng dan U mengindikasikan bentuk yang simetris, Sedangkan sebaran yang tidak simetris dikatakan menjulur ke arah kanan atau ke arah kiri, dimana salah satu sisinya lebih panjang daripada sisi yang lain seperti gambar berikut ini:

skewness

 beli buku referensi lengkapnya:

Pemaparan Statistik Deskriptif Dengan Stata 12

Ilustrasi pengolahan data dengan stata kita mulai dengan tabel 1, dimana UMR dinyatakan dengan minwag, inflasi dengan inflation, ekspor nonmigas dengan export, dan produk domestik bruto dalam GDP. UMR dalam Rupiah, inflation dengan indeks, export dengan miliar Rupiah, dan GDP dalam miliar Rupiah, kamu bisa download datanya dengan format excel disini >>>

data mentah
tabel 1. data UMR, inflasi, ekspor nonmigas, dan GDP
1. Tahap impor data dari excell;
ketentuan yang berlaku dalam stata antara lain baris pertama hanya berisi nama variabel, tidak ada pengamatan yang hilang atau sel yang kosong (kecuali dalam kasus unbalanced panel data), dan nama variabel tidak mengandung spasi.
pilih file > import > excel spreadsheet
import to stata
kemudian akan tampil jendela import tentukan worksheet tempat data kamu berada, checklist first row as variable names, kemudian ok.
jendela import stata
kemudian di jendela  command akan muncul datanya,
data tampak stata
2. mengetahui informasi umum mengenai data kita ketikkan di jendela command
.describe
maka akan tampil informasinya seperti berikut:
describe
informasi lain mengenai karakteristik masing-masing variabel adalah dengan command
.codebook
hasilnya seperti berikut:
codebook_year
codebook_minwag
codebook_inflation
codebook_gdp
kemudian command lain yang mendeskripsikan pengamatan data
.inspect
misalnya terhadap salah satu variabel menjadi;
.inspect gdp
hasilnya adalah:
inspect_GDP
3. kemudian command list juga diperlukan untuk menayangkan data dalam bentuk daftar,
.list
output:
list command
4. Kemudian command untuk menampilkan mean, keragaman, dan standar deviasi
.summarize
output:
summarize
5. untuk informasi yang lebih detail per variabel kita bisa menambahkan informasi seperti berikut:
. summarize (variabel_kamu), detail
misalnya variabel inflation ingin kita explore secara mendalam, maka:
.summarize inflation, detail
coba lihat informasi yang ditampilkan akan lebih lengkap,
summarize detail
Beli buku tutorial dan referensi :

Automatic Arima dengan Seasonal Adjustment

Ilustrasi
Kita kembali lagi ke data visit Bali yang dirilis oleh Disparda Bali, yang belum punya bisa download datanya disini; data terdiri atas 92 pengamatan.
Saat ini kita akan lakukan pemodelan time series dengan ARIMA, software yang kita gunakan adalah eviews 8.1,
1. Tahap input data,
Buka software eviews, file > import > import from file,

input_1

di dalam windows/lainnya, pilih file kamu > open,

input_2

Nah tampilan di bawah ini artinya data sudah terbaca, mainkan start cell hingga variabel month hilang, kita akan gunakan variabel time series default versi eviews aja,

input_4

Lihat, yang tersisa hanya variabel visit saja, kita akan mengatur variabel time seriesnanti, sama halnya jika variabel continyu kamu  > next,

input_5

Berikutnya dapat kamu ikuti seperti berikut ini, default eviews akan menentukan variabel time series sesuai jumlah baris, kita cukup mengatur waktu mulai dari kolomfrequency dan start date > finish,

input_6

tampilan data setelah masuk dalam record eviews, untuk menampilkan datanya cukup klik 2x pada variabel,

input_7

2. Tahap Analisis,
Kali ini kita akan lakukan pemodelan ARIMA dengan automatic ARIMA denganseasonal adjusment. Eviews akan otomatis melakukan pemilihan model yang terbaik untuk peramalan. Kita akan mencoba dua pendekatan seasonally adjustment dalam eviews, yaitu model ARIMA dengan pendekatan US.Cencus Bureaue X-11, dan modelautomatic ARIMA SEATS/TRAMO.
Klik 2x pada data visit, maka akan ditampilkan datanya,

analisis_1

Klik Proc > seasonal adjusment > Census X-13,

analisis_2 (1)

Karena dalam pemodelan ini kita mengabaikan variabel eksogenous, outlier, transformasi dan lain-lain, maka opsi variables kita abaikan saja (none),

analisis_3

Kemudian pilih ARIMA > Model, checklist X-11,

analisis_4

Kemudian pilih Seasonal Adjustment > Method, checklist X-11,

 

analisis_5

Terakhir pilih Output,  checklist semua kategori dalam FInal Series Output > ok,

analisis_6

Output:

output X-11

Dari output grafik dapat kita lihat bahwa model visit_D12 tidak mengandung komponen musiman tinggi, cenderung mengandung trend jangka panjang, sedangkan visit_D11 hampir mengikuti pola musiman visit dengan seasonal adjusment.

Mari kita lihat perbandingan antara visit_D11 dan visit setelah dilakukan seasonal adjusment oleh eviews.

output X-11_2

Nah disini dapat terlihat kemampuan model visit_D11 memprediksi visit denganseasonal adjusment, dengan jumlah komponen musiman yang hampir berimbang.
Berikutnya kita akan lakukan pendekatan seasonal adjusment denganSEATS/TRAMO yang menggunakan deteksi outliers secara otomatis,
Klik 2x pada data > Proc > Seasonal Adjustment > Census X-13,

analisis_2 (1)

Pada pilihan variables, automatic outliers checklist semua outliers type,

tramo_1

Buka ARIMA > model, checklist TRAMO auto,

Lihat di bagian differencing dan AR MA, TRAMO menentukan secara otomatis tingkat diferensiasi, autoregresif, dan moving average dengan maksimal order ke-2, untuk mengetahui cara penentuan order dalam ARIMA secara manual *stata 12, kamu bisa baca disini >>>

tramo_3

Kemudian pada bagian output, checklist seperti berikut ini,

tramo_4

Klik OK, maka outputnya ditampilkan sebagai berikut, langsung saya ambil perbandingan variabel visit, visit_D11 dengan pendekatan seasonally adjusment X-11, dan visit_S11 dengan pendekatan TRAMO/SEATS,

output tramo_2

Dari Grafik dapat kita lihat bahwa visit_S11 dengan tepat mendeteksi pola musiman visit_D11, tanpa trend jangka panjang. Lihat gari berwarna merah dan hijau. (yoso)

beli buku referensi terkait peramalan ekonometrika dan contoh penerapannya:

Sebaran Binomial *Excell

Dalam statistik, kita seringkali menemukan data deret hitung (count) yang berbentuk acak diskret, misalnya pada kasus pelemparan koin yang dilakukan sebanyak 6 kali, kita mungkin mendapatkan 3 gambar ataupun 3 angka yang keluar, dengan demikian peluangnya adalah 0,5 untuk gambar dan 0,5 untuk angka.

Atau kita pernah menjalani ujian dengan tipe pilihan ganda, tentunya peluang kita untuk memilih jawaban A, B, C dan D adalah sama untuk yang hanya menebak-nebak, yaitu 0,25 untuk jawaban benar dan 0,75 untuk jawaban salah. Terakhir adalah jika kita melihat data operasi transplan jantung di sebuah rumah sakit, maka kita akan temukan dari 20 kali operasi, berapa pasien yang dapat bertahan, tentunya peluangnya adalah 0,5 untuk berhasil dan 0,5 untuk gagal.

Beberapa ilustrasi di atas merupakan contoh kasus percobaan yang berjumlah n yang akan memberikan hasil antara sukses atau gagal, satu dari dua pilihan, atau katakanlah bersifat dikotomi. Percobaan ini seringkali disebut sebagai percobaan binom atau yang kita kenal dengan bernoulli trial dengan karakteristik yang berbeda dengan percobaan poisson yang telah kita bahas. Percobaan binom memiliki karakteristik antara lain:

  • Terdiri atas sejumlah n percobaan berjumlah tetap,
  • Hasil yang didapat hanya dua kemungkinan yaitu sukses atau gagal, atau sisi gambar atau sisi angka seperti pada

kasus pelemparan koin tadi,

  • Peluang sukses yang dinotasikan dengan p, adalah sama pada setiap percobaan,
  • Setiap percobaan adalah independen, artinya hasil dari satu percobaan tidak mempengaruhi hasil percobaan yang lain.

Hasil dari percobaan binom adalah jumlah keberhasilan, variabel diskret X yang menunjukkan jumlah keberhasilan disebut variabel acak binom. Nilai yang mungkin untuk percobaan binom adalah X=0,1,2, …,n dan peluang-peluang yang dihasilkannya akan menunjukkan sebaran binom yang dinotasikan dengan B(n,p).

Formula yang digunakan pada percobaan binom untuk mendapatkan sejumlah k keberhasilan pada n percobaan adalah seperti berikut:

rumus-1

Dimana:

n          = jumlah percobaan

k          = jumlah keberhasilan

n-k       = jumlah kegagalan

p          = kemungkinan keberhasilan pada satu kali percobaan

1-p       = kemungkinan kegagalan pada satu kali percobaan

Ilustrasi singkat:

Jika naomi menebak dari 10 pertanyaan pilihan ganda yang diberikan dalam ujian statistik, berapakah kemungkinan naomi menjawab 5 pertanyaan dengan benar jika pilihan jawaban yang diberikan adalah 5?

Untuk permasalahan Naomi kita memiliki n = 10, k = 5, dengan demikian peluang naomi menjawab benar p = 0,2, dan kemungkinan naomi menjawab salah adalah 0,8.

rumus-2

Maka P(5 jawaban benar dari 10 pertanyaan) ≈ 0,026

Probabilitas Binom Kumulatif

Ilustrasi di atas menerangkan peluang Naomi menjawab 5 jawaban dengan benar, bagaimana jika dikatakan paling banyak 5 jawaban benar?pertanyaan tersebut akan mengarah kepada peluang binom kumulatif dimana variabel acak binom akan jatuh pada rentang tertentu baik itu lebih besar dari atau sama dengan (>), kurang dari atau sama dengan (<).

Masalah tersebut dapat diselesaikan dengan menghitung P(6), P(7), P(8), P(9), P(10), yang kemudian dapat kita singkat dengan:

rumus-3

Dimana kita akan menghitung nilai-nilainya sebagai berikut:

P(k > 5, 10) = P(6) + P(7) + P(8) + P(9) + P(10)

Menghitung Sebaran Binom dengan Excell

Jika kita menghitung nilai Probabilitas dengan excell berdasarkan data ujian Naomi di atas, adalah seperti berikut ini:

19

Kemudian pada nilai probabilitas kita tinggal mengetikkan BINOMDIST (nomor cell, FALSE), seperti berikut:

27

Kita lihat pada gambar urutan dari formula BINOMDIST yaitu NUMBER (jumlah keberhasilan), TRIAL (jumlah percobaan), PROBABILITY (probabilitas keberhasilan), dan CUMULATIVE yang dinyatakan dengan FALSE yang menunjukkan 1-p (1-0,2).

Kemudian klik enter dan akan menunjukkan hasil 0,0264:

34

Kemudian kita akan mencari probabilitas kumulatifnya jika pertanyaan mengarah kepada rentang tertentu, dalam kasus ini peluang Naomi dapat menjawab paling banyak 5 jawaban benar ( < 5 ).

Untuk menjawab pertanyaan ini kita hanya mengganti fungsi kumulatif FALSE dengan TRUE seperti berikut ini:

44

Setelah kita enter hasilnya akan tampak seperti berikut:

52

Kita juga akan menghitung probabilitas naomi menjawab paling sedikit 5 jawaban benar ( > 5 ), dengan demikian kita akan menghitung P(6), P(7), P(8), P(9), dan P(10), sebagai berikut:

61

Kemudian kita lakukan proses yang sama pada P(7) dan seterusnya sehingga didapatkan hasil berikut:

7

Setelah didapatkan hasil masing-masing probabilitasnya, kita tinggal menggunakan fungsi SUM untuk mengetahui probabilitas kumulatif seperti di bawah ini:

8

Maka hasilnya akan ditampilkan sebagai berikut:

9

Beli buku tutorial dan referensi :

Pemaparan Data Kualitatif Dengan SPSS 23

Jika kita memiliki dua variabel kualitatif yang merupakan sebaran bersama (joint distribution), kita dapat merangkumnya dalam bentuk tabel frekuensi dua arah. Pada tabel frekuensi dua arah, variabel dikategorikan sebagai kelas pada baris dan pada kolom terdapat jenis variabel. Penjumlahan dari data bivariat disebut cross-tabulation atau cross-classification dalam sebuah tabel kontingensi.

Tabel frekuensi yang paling sederhana adalah 2×2, dimana setiap variabel hanya memiliki dua kelas. Sama halnya dengan tabel frekuensi 2×3, 3×3, dan lain-lain, dimana data tersusun dalam sejumlah baris dan kolom.

Berikut ini adalah contoh data golongan darah (bloodtype) dan jenis kelamin (sex):

data pos sampel1

Kita akan merangkum data ini ke dalam tabel frekuensi 2×2 dengan software SPSS 23:

  1. Langkah pertama buka software SPSS 23 kemudian impor data dari file dalam bentuk excel yang telah kita susun, pilih dari menubar file > open > data > open seperti gambar,

Pastikan type of files dalam bentuk excel,

analisis_cross1

analisis_cross2

2.   Setelah muncul kotak dialog opening excel data source, beri checklist pada box seperti berikut,

analisis_cross3

3.   Kemudian data kita akan terlihat seperti berikut dalam SPSS 23,

analisis_cross4

4.   Selanjutnya setelah data siap pilih di menubar analyze > descriptive statistics > crosstabs, seperti gambar,

analisis_cross5

5.   Setelah muncul kotak dialog crosstabs, masukkan variabel bloodtype ke dalam row, dan variabel sex ke dalam column,

analisis_cross6

6.   Kemudian akan ditunjukkan output tabel kontingensinya seperti berikut:

analisis_cross7

7.   Dan diagramnya sebagai berikut,

analisis_cross8

Jika sebuah variabel kualitatif memiliki kelas i dan kelas j, maka sebaran gabungan dari kedua variabel tersebut dapat dirumuskan dalam tabel frekuensi i x j.  Jika jumlah sampel n dan sel ke-ij memiliki frekuensi fij maka frekuensi relatif sel ij adalah:

rumus 1

Frekuensi relatif dinyatakan dalam persentase.

Untuk tabel frekuensi dua arah, kita dapat menghitung total pada baris dan kolomnya. Untuk kolom ke-i totalnya adalah:

f = fi1 + fi2 + fi3 + … + fij

Sementara itu untuk kolom ke-j total kolom fij adalah:

f.j = f1j + f2j + f3j + … + fij

Berdasarkan pada total kolom dan baris di atas kita dapat menghitung frekuensi relatif masing-masing, untuk sel ke-ij, untuk baris i maka frekuensi relatifnya adalah :

rumus 21

Dan frekuensi relatif bagi kolom j adalah :

rumus 22

8.   Selanjutnya dari menubar analyze > descriptive > crosstab, kita akan mencari frekuensi untuk masing-masing baris dan kolom, jangan lupa untuk mengatur persentase pada tab cells di bagian kanan kotak dialog crosstabs,

analisis_cross9

9.   Kita dapatkan output frekuensi berikut,

analisis_cross11

Dari hasil frekuensi relatif di atas kita dapat menyimpulkan apakan terdapat hubungan antara variabel baris dan kolom. Jika persentase baris sangat berbeda dengan baris yang lainnya maka sebaran dapat dikatakan memiliki keragaman yang tinggi, sehingga kita dapat menyimpulkan bahwa terdapat hubungan antar variabel, artinya variabel baris akan berpengaruh terhadap variabel kolom. Dan sebaliknya jika persentase antar kolom berbeda signifikan maka terdapat hubungan antar variabel dimana nilai variabel kolom berpengaruh terhadap nilai variabel baris.

beli buku referensi statistika deskriptif dilengkapi dengan perhitungan manual dan software SPSS; lihat buku >>>

Prosedur Koreksi Autokorelasi Model Cochrane-Orcutt

Autokorelasi adalah situasi dimana korelasi terjadi antar rangkaian pengamatan yang tersusun dalam deret waktu atau tempat. Pada regresi OLS, asumsi yang digunakan adalah tidak terdapat autokorelasi pada error. Katakanlah jika pada periode sekarang teradi pemogokan buruh yang menyebabkan turunnya produksi, maka tidak ada alasan untuk mengasumsikan produksi akan turun kembali pada periode berikutnya. Sama halnya untuk kasus regresi antar data silang (cross section), goverment expenditure daerah X dengan performa usaha kecil menengah di daerah tersebut, maka tidak akan terjadi kasus jika kenaikan performa usaha kecil menengah di daerah X akan berdampak terhadap kenaikan goverment expenditure pada daerah Y.

Autokorelasi dapat menyebabkan prediksi OLS menjadi tidak bias dan efisien, estimator yang bersifat BLUE tidak dapat kita peroleh.

Ilustrasi:

Berikut ini kita akan melihat hubungan antara jumlah produk nasional brutto (gnp) dan data consumer price index (cpi) ekuador, data tahunan terdiri atas 32 pengamatan sejak 1980 hingga tahun 2011, data diperoleh dari data popular indicator yang dikumpulkan oleh World Bank,

 Regresi sederhana dengan metode OLS akan kita ilustrasikan menggunakan software eviews 9.
 Kita tampilkan datanya dalam eviews,
data_1

buka kedua variabel atau spesifikasi persamaan melalui open – as equation, lalu masukkan persamaannya regresi seperti berikut ini,

data_2
 outputnya ditampilkan sebagai berikut,
output OLS

Kita akan transformasi variabel dengan fungsi logaritma, pilih gdp dan cpi – open – as equation,

data log

output untuk model log,

output model logKita akan plot data dalam scatterplot, dan plot residual,
Untuk melihat pola data dalam scatterplot open kedua variabel di atas, view &gt; graph, Setelah muncul graph option, pilih scatter, fit lines kita pilih regression line,
plot scatter data

Plot dari regresi OLS menggambarkan hubungan negatif gnp dengan cpi, sesuai koefisien regresi, setiap kenaikan satu satuan cpi akan menurunkan gnp sebesar 22,89 satuan. Lihat data tersebar cukup jauh dari garis regresi.

Kemudian kita plotkan fitted residual,
residual plot
plot residual kita dapatkan,
plot scatter data (1)

Secara umum residual tidak tersebar secara merata, melainkan berkumpul pada titik 1 – 0 -1, ini mengindikasikan adanya masalah korelasi antar residual pada persamaan regresi yang kita miliiki. Hal ini kemudian ditegaskan dengan hasil pengujian durbin-watson sebesar 0,498 yang terletak pada daerah autokorelasi positif.

Untuk koreksi masalah autokorelasi, kita akan lakukan prosedur Cochrane-Orcutt, yang dinyatakan dengan ρ (rho). Metode perulangan dalam cochrane-orcutt dilakukan dengan dua tahapan antara lain; (1) menentukan korelasi ρ antar beberapa pasang pengamatan dalam model, kemudian (2) menjalankan persamaan regresi dengan AR(1) atau sampai AR(2), untuk menghilangkan korelasi antar error.
Oleh karena itu kita akan merubah persamaan menjadi;
Yt = gnpt – rho*gnpt-1,

dan

Xt = cpit – rho*cpit-1

dengan;

µt = rho*µt-1 + εt

Prosedur iterasi cochrane-orcutt kemudian akan kita lakukan dengan bantuan eviews 9.
1. Pada data gnp dan cpi, open – as group,
2. Kemudian Proc – Make Equation,
equation ar(1)
3. Kemudian Buat persamaan regresi dengan AR(1) – OK,
equation ar(1)_2
 4. Output regresi dengan AR(1),
equation ar(1)_outputPersamaan regresi dengan AR(1) masih mengandung masalah autokorelasi yang diindikasikan dengan nilai statistik durbin-watson sebesar 0,72.
Mari kita lihat plot residual, pertama-tama dari output tadi kita membuat variabel residual baru dengan nama resid01 untuk persamaan ini. pada menu proc – make residual,
equation ar(1)_output make residualScatterplot untuk resid01,
equation ar(1)_output residual plotDari scatterplot persamaan AR(1), residual masih terkumpul pada beberapa poin axis-Y, gejala autokorelasi masih terlihat, hal ini ditegaskan dengan nilai statistik durbin-watson sebesar 0,73.
5. Kemudian kita masukkan kembali model AR(2) ke dalam persamaan,
equation ar(2)
6. Output regresi dengan AR(1) dan AR(2),
equation ar(2)_2
Nilai statistik durbin-watson telah mengindikasikan model telah terkoreksi dari masalah autokorelasi sebesar 1,75. Keragaman gnp yang dapat dijelaskan oleh cpi telah meningkat menjadi 96.09 persen. Dengan demikian persamaan untuk kondisi yang ideal (white noise) yang kita peroleh dari model AR(2) adalah:
GNP = 2419.87 – 1.09*CPI + [AR(1)=1.74,AR(2)=-0.78,UNCOND]
atau dalam bentuk lain:
GNPt = 2419,87 – 1,09*CPIt + µt
dimana:
µt = 1,74*µt-1 + 0,78*µt-2 + ε

Pengujian Indikasi Heteroskedastisitas Dengan Grafik

Pengujian indikasi heteroskedastisitas dengan metode grafik/scatterplot dapat dilakukan dengan langkah sebagai berikut:
Misalkan kita memiliki data seperti berikut:
scatter_1
1. Jalankan regresi linier dengan SPSS, untuk langkah melakukan regresi linier dapat dijalankan dengan comand ANALYZE – REGRESSION – LINEAR,
2.  Masukkan variabel sesuai dengan jenisnya (dependen dan independen) seperti berikut:
scatter_2
3. Klik PLOT disamping kanan,
4. Setelah muncul kotak dialog Linear Regression Plot, masukkan pada sumbu Xpredicted dependent variables atau ZPRED serta pada sumbu Yresidual atauZRESID, lalu centang Normal Probability Plots, – CONTINUE:
scatter_3

5. Setelah itu Klik OK, maka akan ditampilkan output seperti berikut:

scatter_4
Dapat kita lihat bahwa pada model bersifat homoskedastik, tidak terdapat masalahheteroskedastisitas, dimana peningkatan nilai variabel dependen pada sumbu X diikuti dengan peningkatan residual.
Berikut ini adalah contoh scatterplot dengan indikasi adanya masalah heteroskedastisitas:
scatter_5
Lihat pola scatterplot di atas, peningkatan nilai error pada sumbu X diikuti dengan keragaman yang meningkat pada sumbu Y.
Beli Referensi Lengkap :