Prosedur Koreksi Autokorelasi dengan Model Cochrane-Orcutt

Dec 6, 2015

Autokorelasi adalah situasi dimana korelasi terjadi antar rangkaian pengamatan yang tersusun dalam deret waktu atau tempat. Pada regresi OLS, asumsi yang digunakan adalah tidak terdapat autokorelasi pada error. Katakanlah jika pada periode sekarang teradi pemogokan buruh yang menyebabkan turunnya produksi, maka tidak ada alasan untuk mengasumsikan produksi akan turun kembali pada periode berikutnya. Sama halnya untuk kasus regresi antar data silang (cross section), goverment expenditure daerah X dengan performa usaha kecil menengah di daerah tersebut, maka tidak akan terjadi kasus jika kenaikan performa usaha kecil menengah di daerah X akan berdampak terhadap kenaikan goverment expenditure pada daerah Y.

Autokorelasi dapat menyebabkan prediksi OLS menjadi tidak bias dan efisien, estimator yang bersifat BLUE tidak dapat kita peroleh.

Ilustrasi:
Berikut ini kita akan melihat hubungan antara jumlah produk nasional brutto (gnp) dan data consumer price index (cpi) ekuador, data tahunan terdiri atas 32 pengamatan sejak 1980 hingga tahun 2011, data diperoleh dari data popular indicator yang dikumpulkan oleh World Bank, untuk contoh datanya kamu bisa download disini>>>,

Regresi sederhana dengan metode OLS akan kita ilustrasikan menggunakan software eviews 9.

Kita tampilkan datanya dalam eviews,


buka kedua variabel atau spesifikasi persamaan melalui open > as equation, lalu masukkan persamaannya regresi seperti berikut ini,


outputnya ditampilkan sebagai berikut,


Kita akan transformasi variabel dengan fungsi logaritma, pilih gdp dan cpi > open > as equation,


output untuk model log,


Kita akan plot data dalam scatterplot, dan plot residual,

Untuk melihat pola data dalam scatterplot open kedua variabel di atas, view > graph, Setelah muncul graph option, pilih scatter, fit lines kita pilih regression line,


Plot dari regresi OLS menggambarkan hubungan negatif gnp dengan cpi, sesuai koefisien regresi, setiap kenaikan satu satuan cpi akan menurunkan gnp sebesar 22,89 satuan. Lihat data tersebar cukup jauh dari garis regresi.

Kemudian kita plotkan fitted residual,


plot residual kita dapatkan,


Secara umum residual tidak tersebar secara merata, melainkan berkumpul pada titik 1 > 0 > -1, ini mengindikasikan adanya masalah korelasi antar residual pada persamaan regresi yang kita miliiki. Hal ini kemudian ditegaskan dengan hasil pengujian durbin-watson sebesar 0,498 yang terletak pada daerah autokorelasi positif.

Untuk koreksi masalah autokorelasi, kita akan lakukan prosedur Cochrane-Orcutt, yang dinyatakan dengan ρ (rho). Metode perulangan dalam cochrane-orcutt dilakukan dengan dua tahapan antara lain; (1) menentukan korelasi ρ antar beberapa pasang pengamatan dalam model, kemudian (2) menjalankan persamaan regresi dengan AR(1) atau sampai AR(2), untuk menghilangkan korelasi antar error.

Oleh karena itu kita akan merubah persamaan menjadi;

Yt = gnpt – rho*gnpt-1,
dan 
Xt = cpit – rho*cpit-1
dengan;
µt = rho*µt-1 + εt


Prosedur iterasi cochrane-orcutt kemudian akan kita lakukan dengan bantuan eviews 9.

1. Pada data gnp dan cpi, open > as group,

2. Kemudian Proc > Make Equation,


3. Kemudian Buat persamaan regresi dengan AR(1) > OK,


4. Output regresi dengan AR(1),


Persamaan regresi dengan AR(1) masih mengandung masalah autokorelasi yang diindikasikan dengan nilai statistik durbin-watson sebesar 0,72.

Mari kita lihat plot residual, pertama-tama dari output tadi kita membuat variabel residual baru dengan nama resid01 untuk persamaan ini. pada menu proc > make residual,


Scatterplot untuk resid01,


Dari scatterplot persamaan AR(1), residual masih terkumpul pada beberapa poin axis-Y, gejala autokorelasi masih terlihat, hal ini ditegaskan dengan nilai statistik durbin-watson sebesar 0,73.

5. Kemudian kita masukkan kembali model AR(2) ke dalam persamaan,


6. Output regresi dengan AR(1) dan AR(2),


Nilai statistik durbin-watson telah mengindikasikan model telah terkoreksi dari masalah autokorelasi sebesar 1,75. Keragaman gnp yang dapat dijelaskan oleh cpi telah meningkat menjadi 96.09 persen. Dengan demikian persamaan untuk kondisi yang ideal (white noise) yang kita peroleh dari model AR(2) adalah:

GNP = 2419.87 - 1.09*CPI + [AR(1)=1.74,AR(2)=-0.78,UNCOND]

atau dalam bentuk lain:

GNPt = 2419,87 – 1,09*CPIt + µt

dimana:

µt = 1,74*µt-1 + 0,78*µt-2 + ε

Download bahasan ini dalam bentuk pdf di bawah>>>

Automatic ARIMA dengan Seasonal Adjustment

Nov 19, 2015

Ilustrasi
Kita kembali lagi ke data visit Bali yang dirilis oleh Disparda Bali, yang belum punya bisa download datanya disini; data terdiri atas 92 pengamatan.
Saat ini kita akan lakukan pemodelan time series dengan ARIMA, software yang kita gunakan adalah eviews 8.1,
1. Tahap input data,
Buka software eviews, file > import > import from file,



di dalam windows/lainnya, pilih file kamu > open,



Nah tampilan di bawah ini artinya data sudah terbaca, mainkan start cell hingga variabel month hilang, kita akan gunakan variabel time series default versi eviews saja,



Lihat, yang tersisa hanya variabel visit saja, kita akan mengatur variabel time series nanti, sama halnya jika variabel continyu kamu  > next,



Berikutnya dapat kamu ikuti seperti berikut ini, default eviews akan menentukan variabel time series sesuai jumlah baris, kita cukup mengatur waktu mulai dari kolom frequency dan start date > finish,



tampilan data setelah masuk dalam record eviews, untuk menampilkan datanya cukup klik 2x pada variabel,



2. Tahap Analisis,
Kali ini kita akan lakukan pemodelan ARIMA dengan automatic ARIMA dengan seasonal adjusment. Eviews akan otomatis melakukan pemilihan model yang terbaik untuk peramalan. Kita akan mencoba dua pendekatan seasonally adjustment dalam eviews, yaitu model ARIMA dengan pendekatan US.Cencus Bureaue X-11, dan model automatic ARIMA SEATS/TRAMO.
Klik 2x pada data visit, maka akan ditampilkan datanya,



Klik Proc > seasonal adjusment > Census X-13,



Karena dalam pemodelan ini kita mengabaikan variabel eksogenous, outlier, transformasi dan lain-lain, maka opsi variables kita abaikan saja (none),



Kemudian pilih ARIMA > Model, checklist X-11,



Kemudian pilih Seasonal Adjustment > Method, checklist X-11,



Terakhir pilih Output,  checklist semua kategori dalam FInal Series Output > ok,



Output:



Dari output grafik dapat kita lihat bahwa model visit_D12 tidak mengandung komponen musiman tinggi, cenderung mengandung trend jangka panjang, sedangkan visit_D11 hampir mengikuti pola musiman visit dengan seasonal adjusment.
Mari kita lihat perbandingan antara visit_D11 dan visit setelah dilakukan seasonal adjusment oleh eviews.



Nah disini dapat terlihat kemampuan model visit_D11 memprediksi visit dengan seasonal adjusment, dengan jumlah komponen musiman yang hampir berimbang.

Berikutnya kita akan lakukan pendekatan seasonal adjusment dengan SEATS/TRAMO yang menggunakan deteksi outliers secara otomatis,
Klik 2x pada data > Proc > Seasonal Adjustment > Census X-13,



Pada pilihan variables, automatic outliers checklist semua outliers type,



Buka ARIMA > model, checklist TRAMO auto,



Lihat di bagian differencing dan AR MA, TRAMO menentukan secara otomatis tingkat diferensiasi, autoregresif, dan moving average dengan maksimal order ke-2, untuk mengetahui cara penentuan order dalam ARIMA secara manual *stata 12, kamu bisa baca disini >>>
Kemudian pada kolom Seasonal Adjusment > method, checklist SEATS dan Append Forecast,



Kemudian pada bagian output, checklist seperti berikut ini,



Klik OK, maka outputnya ditampilkan sebagai berikut, langsung saya ambil perbandingan variabel visit, visit_D11 dengan pendekatan seasonally adjusment X-11, dan visit_S11 dengan pendekatan TRAMO/SEATS,


 

Dari Grafik dapat kita lihat bahwa visit_S11 dengan tepat mendeteksi pola musiman visit_D11, tanpa trend jangka panjang. Lihat gari berwarna merah dan hijau. (yoso)
download materi ini versi pdf di bawah ini >>>

download link

Metode Pemulusan Eksponensial *IBM SPSS 23

Oct 30, 2015

Sebelumnya telah kita bahas metode peramalan pemulusan exponensial baik dengan SPSS 17 maupun dengan eviews 8.1. Kali ini akan kita lakukan metode pemulusan exponensial menggunakan software IBM SPSS 23, tentunya software terbaru dari IBM ini telah mengalami update yang cukup signifikan. Tetapi secara garis besar cara penggunaannya sama saja dengan versi yang lama. Kita kembali lagi ke data visit Bali yang dirilis oleh DISBUDPAR Bali, yang belum punya bisa download datanya disini;, data mengandung 92 pengamatan.


1. tahap analisis
pilih di menubar analyze> create traditional model,


2. Setelah muncul jendela time series modeller, masukkan variabel "visit" ke kotak dependent variables, method pilih exponential smoothing, lalu klik criteria,


3. Dalam jendela criteria - variables, kita akan menentukan model yang akan kita bangun, dalam contoh kali ini kita memilih simple (1,1,1)




  • simple artinya tidak memasukkan komponen trend dan musiman, sama dengan zero order autoregression pada ARIMA, dan diferensiasi tingkat pertama, dan juga moving average tingkat pertama (1,1,1).
  • Holt's linear trend cocok untuk data dengan komponen trend linier tanpa komponen musiman. Model Holt's dapat dikatakan sama dengan zero order autoregression, dengan diferensiasi tingkat kedua dan moving average tingkat kedua (1,2,2).
  • Browns Linear trend memasukkan komponen trend linier dan musiman, sama halnya dengan metode Holt's, dengan perbedaan pada zero order autoregression, diferensiasi tingkat dua, dan moving average tingkat kedua (1,2,2), dengan koefisien moving average tingkat kedua sama dengan kuadrat dari satu setengah kali koefisien moving average tingkat pertama.
  • Damped trend adalah untuk data dengan trend linier tetapi tidak mengandung komponen musiman, parameter pemulusannya adalah level, trend, dan damping trend. Ia sama dengan zero order autocorrelation, dengan diferensiasi tingkat pertama, dan moving average tingkat kedua (1,1,2).
4. Kemudian pilih statistic, seperti di bawah ini,


5. Lalu setting plot,



6. kemudian menubar save > ok > ok,




7. Outputnya ditampilkan sebagai berikut:



Stationary R-squared dan R-squared menunjukkan nilai positif masing-masing 0,106 dan 0,834, ini menunjukkan bahwa belum dapat dijelaskan apakah model yang digunakan dalam prediksi lebih baik daripada model dasar.
RMSE dan MAE menunjukkan kualitas kecocokan antara model yang dibangun dengan data aktual, nilai ini menunjukkan selisih atau residual dari model dasar dengan model yang diprediksi, semakin kecil selisihnya maka model akan semakin baik. Dengan kata lain RMSE dan MAE merupakan standar deviasi dari data.
Normalize BIC (bayesian information criterion) dapat bernilai negatif dan positif, semakin kecil nilainya, maka model akan semakin baik, tergantung dari struktur datanya.

8. Plot untuk hasil forecast ditampilkan sebagai berikut, data :



9. Berikut grafik perbandingan variabel visit dengan visit_1 :



untuk data hasil forecast dengan data aktual dapat kamu unduh dalam format excel disini 
untuk data output dengan format spss dapat kamu unduh disini 
download materi versi pdf dibawah >>>

download link

Konsep Data Ekonometrika

Oct 21, 2015

Tiga jenis data yang digunakan untuk analisis empiris ekonometrikan adalah time series, cross-section dan panel. Data-data tersebut terkadang digunakan bersamaan dalam analisis, misalnya kombinasi antara data time series dan cross-section.

1.  Data Runtun Waktu (time series)
Data time series adalah sekumpulan pengamatan terhadap nilai dimana variabel memiliki komponen waktu atau data yang digunakan sebagai variabel diambil pada beberapa interval waktu. Misalnya data harian, mingguan, bulanan, tahunan, kuartal, dan semester. Dengan perkembangan teknologi komputerisasi bahkan data sudah dapat diambil dalam hitungan hari, jam, menit maupun per detik, misalnya data harga bursa yang diambil secara terus menerus dengan standar waktu yang relatif singkat real time. Data time series mengasumsikan stationeritas yang bermakna bahwa nilai mean dan keragaman data tidak berbeda signifikan antar waktu. (Gujarati, 2004) 
Tentang stasioneritas telah dibahas pada bagian lain blog ini. Berikut ini adalah data kunjungan Ke Bali berdasarkan Badan Pusat Statistik Indonesia (BPS), Data ini masih belum stasioner, lihat pada bahasan uji stasioneritas data disini >>>

2.  Data Silang (cross-section)
Data dimana satu atau lebih variabelnya dikumpulkan pada waktu yang sama, misalnya sensus setiap 5 tahun sekali, data pemilih tetap yang diambil setiap 5 tahun sekali, data produksi perusahaan dan lain-lain. Ketika data runtun waktu mengasumsikan stasioneritas, data silang juga memiliki masalah yaitu heterogenitas. Karena ia mengasumsikan data harus bersifat homogen. (Gujarati, 2004)
Berikut adalah data hubungan antara nilai penjualan sektor industri Amerika Serikat terhadap keuntungan penjualan industri setelah pajak 2015 (non-adjusted) yang diambil dari US Census Bureau. Dari grafik kita dapat melihat bahwa data tidak tersebar normal.
 
3.  Data Panel (pooled data)
Data panel menggabungkan dua tipe data yaitu runtun waktu (time series) dan data silang (cross-section). Data panel juga biasa kite kenal dengan data longitudinal atau data mikropanel, dimana unit data silang (misalnya perusahaan atau keluarga) dilakukan survey sepanjang waktu. Misalnya, Lembaga sensus mengadakan sensus terhadap keluarga pada periode dengan interval tertentu. Pada setiap periode dikaji perubahan yang terjadi pada objek sensus, katakanlah jika sebuah rumah tangga mengalami perubahan kondisi keuangan, pertambahan jumlah keluarga, dan tingkat pendapatan dari sejak survey terakhir dilakukan. Dengan wawancara secara periodik tersebut, data panel akan memberikan informasi yang penting mengenai dinamika perilaku keluarga dalam sebuah rumah tangga.

Untuk konsep data panel bisa dibaca lebih lengkap disini >>>
Regresi data panel bisa dipelajari lengkap disini >>>
download materi versi pdf di bawah >>>

download link

Uji Park

Jan 17, 2010

Uji Park ini dikembangkan oleh Park pada tahun 1966 (Park, 1966). Dengan data yang kita miliki sebagai ilustrasi berikut ini:

Tahap-tahap uji:
1. Langkah menginput dan mengimpor data serta menjalankan regresi.
Untuk langkah input data tidak perlu diterangkan lebih jauh karena telah dibahas pada bahasan regresi dengan eviews, anda dapat melihatnya disini >>

2. Setelah itu kita akan membuat variabel baru, katakanlah disini res2 dengan menggunakan rumus resid^2, karena pada uji heteroskedastisitas kita akan bermain dengan residual kuadrat, langkahnya dilakukan dengan mengklik tombol Genr seperti berikut ini:
lalu isikan dengan res2 = resid^2, seperti berikut:

3. Setelah itu residual tadi akan kita regresikan dengan menggunakan persamaan ln(res2)=b0 + b1X1 + b2X2 + b3X3 + e. yaitu dengan memilih menu QUICK - ESTIMATE EQUATION - kemudian isikan log(res2) c x1 x2 x3 - lalu klik OK seperti berikut ini:

4. Setelah itu output akan didapatkan seperti berikut ini:

Kita dapat melihat koefisien yang dihasilkan dengan uji Park ini yaitu:
Log(res2) = 6,19 + 0,047 X1 - 0,01 X2 - 0,45 X3
t-statistik     (2,66)     (0,86)       (-0,28)     (-0,44)
p-value        (0,015)   (0,39)        (0,78)      (0,66)

Dari output diatas dapat kita lihat bahwa koefisien masing-masing variabel independen bersifat tidak signifikan, maka dengan demikian dapat kita simpulkan bahwa tidak ada masalah heteroskedastisitas pada model.
download materi ini versi pdf dibawah >>>
 

Stats

read in english