Earth and Green: Statistik

Regresi dan Korelasi

LANDASAN TEORI

2.1 Pengertian Regresi

Regresi adalah garis yang menunjukkan hubungan dua macam variabel (Estimating line). Analisis regresi mempunyai tiga kegunaan yaitu, deskripsi, kendali dan prediksi (peramalan). Tetapi manfaat utama dari kebanyakan penyelidikan statistik dalam dunia bisnis dan ekonomi adalah mengadakan prediksi atau (peramalan). Persamaan regresi (penduga / perkiraan /peramalan) dibentuk untuk menerangkan pola hubungan variabel-variabe

Dalam analisis regresi dikenal dua macam variabel yaitu :

1. Variabel Bebas (independent variable)

Variabel bebas adalah suatu variabel yang nilainya sudah diketahui

2. Variabel tidak bebas (dependen variable)

Variabel tidak bebas adalah suatu variabel yang nilainya belum diketahui atau yang akan diramalkan.

Untuk menentukan persamaan hubungan antarvariabel, langkah-langkahnya sbb :

1. Mengumpulkan data dari variabel yang dibutuhkan misalnya X sebagai variabel bebas dan Y sebagai variabel tidak bebas.

2. Menggambarkan titik-titik pasangan (x,y) dalam sebuah sistem koordinat bidang. Hasil dari gambar itu disebut SCATTER DIAGRAM (Diagram Pencar/Tebaran) dimana dapat dibayangkan bentuk kurva halus yang sesuai dengan data.

Cara menggambar SCATTER DIAGRAM

Gambar 2.1 Scatter Diagram

Kegunaan dari diagram pencar adalah : membantu menunjukkan apakah terdapat hubungan yang bermanfaat antara dua variabel, membantu menetapkan tipe persamaan yang menunjukkan hubungan antara kedua variabel tersebut, menentukan persamaan garis regresi atau mencari nilai-nilai konstan.

2.2 Regresi Linier

Tujuan analisis data ialah untuk memperkirakan atau memperhitungkan besarnya efek kuantitatif dari perubahan suatu kejadian terhadap kejadian lainnya. Setiap kebijakan (policy), baik dari pemerintah maupun swasta, selalu dimaksudkan untuk mengadakan perubahan (change). Sebagai contoh, misalnya pemerintah menambah jumlah pupuk agar produksi padi meningkat, pemerintah mengurangi impor tekstil supaya penjualan tekstil P.N. Sandang meningkat, pemerintah menaikkan gaji pegawai negeri agar prestasi kerja mereka meningkat, pemerintah memperbanyak akseptor agar tingkat kelahiran menurun, perusahaan meningkatkan pelayanan agar basil penjualan meningkat, seseorang mengurangi berat badan agar tekanan darahnya menurun, dan lain sebagainya.

Untuk keperluan evaluasi/penilaian suatu kebijaksanaan mungkin ingin diketahui besarnya efek kuantitatif dari perubahan suatu kejadian terhadap kejadian lainnya. Kejadian-kejadian tersebut, untuk keperluan analisis, bisa dinyatakan di dalam perubahan nilai variabel. Untuk analisis dua kejadian (events) kita gunakan dua variabel X dan Y. Analisis dua variabel ini, secara diskripstif sudah dibahas di dalam buku Statistik, Teori dan Aplikasi, Jilid I. Di dalam Jilid II ini akan dilakukan pembahasan lebih mendalam secara induktif (inference) dengan menggunakan konsep probabilitas. Di dalam bab ini hanya akan dibahas hubungan dua variabel, sedangkan dalam bab berikutnya akan dibahas hubungan lebih dari dua variabel.

Apabila dua variabel X dan Y mempunyai hubungan (korelasi), maka perubahan nilai variabel yang satu akan mempengaruhi nilai variabel lainnya. Hubungan variabel dapat dinyatakan dalam bentuk fungsi, misalnya Y = f (X) -4 Y = 2 + 1,5X. Apabila bentuk fungsinya sudah diketahui, maka dengan mengetahui nilai dari satu variabel (= X), maka nilai variabel lainnya (= Y) dapat diperkirakan/diramalkan. Data hasil ramalan yang dapat menggambarkan kemampuan untuk waktu yang akan datang, sangat berguna bagi dasar perencanaan. Misalnya ramalan produksi padi dan jumlah penduduk untuk keperluan perencanaan impor beras, ramalan penerimaan negara dipakai sebagai dasar perencanaan antar departemen, ramalan basil penjualan suatu perusahaan untuk dasar perencanaan produksi, dan lain sebagainya.

Variabel yang akan diramalkan harus dituliskan pada ruas kiri persamaan dan disebut variabel tidak bebas (dependent variable), sedangkan variable yang nilainya dipergunakan untuk meramalkan disebut variable bebas (independent variable). Dalam contoh Y = 2 + 1,5X, Y = variable tidak bebas, sebab nilainya tergantung pada nilai X. Kalau X = 10, Y = 2 + 1,5(10) = 17 dan kalau X = 20, Y = 2 + 1,5(20) = 32, tak bisa lain dari itu. Untuk membuat ramalan (forecasting) Y dengan menggunakan nilai dari X, maka X dan Y harus mempunyai hubungan yang kuat. Kuat tidaknya hubungan X dan Y diukur dengan suatu nilai, yang disebut koefisien korelasi, sedangkan besarnya pengaruh X terhadap Y, diukur dengan koefisien regresi.

2.2.1 Regresi Linier Sederhana

Tidak mungkin untuk memperkirakan hubungan antara dua variabel tanpa membuat asumsi terlebih dahulu mengenai bentuk hubungan yang dinyatakan dalam fungsi tertentu. Dalam beberapa hal, kita bisa mengecek asumsi tersebut setelah hubungan diperkirakan. Fungsi linear, selain mudah interpretasinya, juga dapat digunakan sebagai pendekatan (approximation) atas hubungan yang bukan linear (non linear). Regresi linier sederhana mengamati pengaruh satu variabel bebas (independent variable) terhadap variabel yang tidak bebas (dependent variable).

Persamaan Regresi Linear Sederhana

= a + BX

Keterangan

Y : Variabel dependent.

X : Variabel independent.

a. Konstanta dari regresi yaitu perpotongan antara garis regresi dengan sumbu Y (Saat X = 0 ).

b. Koefisien regresi merupakan arah garis regresi menunjuk besarnyaperubahan variabel independent yang mengakibatkan perubahan variabel dependent.

( a dan b merupakan nilai tetap untuk satu regresi).

Gambar 2.2 Grafik Fungsi Linear Y = a + BX

Nilai a dan b dapat dihitung dengan rumus :

Persamaan Y = A + BX juga bisa ditulis Y = B0 + B1, atau dengan simbol lainnya.

Beberapa simbol yang sering digunakan dalam fungsi linier ini adalah :

D = delta, simbol pertambahan X

DX = delta X, pertambahan Y

Dy = delta Y, pertambahan X

B = = rata-rata pertambahan Y per 1 unit (satuan) pertambahan X, atau pertambahan X1 unit untuk mengakibatkan pertambahan Y sebesar B

Y = 2 + 1,5X, A = 2, B = 1,5, artinya kalau X = 0, Y = 2

Kalau X bertambah 1 unit, Y bertambah 1,5 unit.

Hubungan di atas merupakan hubungan matematis. Secara teoretis, apabila X = 6, Y harus 2 + 1,5 (6) = 11. Tetapi dalam prakteknya tidak demikian sebab yang mempengaruhi Y bukan hanya X saja melainkan masih ada faktor lain yang tidak dimasukkan dalam persamaan. Faktor-faktor tersebut secara keseluruhan disebut kesalahan pengganggu atau "disturbance's error." Kesalahan pengganggu tersebutlah yang menyebabkan suatu ramalan sering tidak tepat.

Kesalahan ramalan menyebabkan perencanaan menjadi tidak akurat, sehingga kesalahan tersebut mengakibatkan risiko, dan karenanya harus diusahakan sekecil mungkin. Dalam membuat keputusan, selalu ada risiko yang disebabkan oleh adanya kesalahan (error). Karena kesalahan itu tak dapat dihilangkan sama sekali, maka betapapun kecilnya selalu ada. Risiko hanya bisa diperkecil dengan memperkecil (minimized error-minimized risk) dengan memperhitungkan kesalahan pengganggu, e, maka bentuk persamaan fungsi linier di atas menjadi sebagai berikut

Berdasarkan persamaan tersebut, maka nilai Y bisa lebih besar atau lebih kecil daripada A+BX tergantung apakah nilai e positif atau negatif. Kita selalu mengharapkan agar nilai e kecil dan tidak berkolerasi dengan X, sehingga dengan demikian kita dapat mengubah nilai X tanpa mempengaruhi nilai e, kemudian dapat memperhitungkan pengaruh X terhadap Y, secara rata-rata (on the average). Dalam praktek, untuk melihat hubungan antar X dan Y, kita mengumpulkan pasangan data (X, Y) sebagai observasi.

STANDARD ERROR OF ESTIMATE (Se)

Ketepatan garis regresi dapat dilihat apabila semua sebaran titik mendekati garis regresi. Penyebaran dan penyimpangan titik-titik tersebut dari garis regresi disebut dengan standard error of estimate.

atau

penyimpangan standar ini sama dengan deviasi standar, yaitu penyimpangan baku terhadap nilai rata-ratanya.

2.2.2 Regresi Linier Berganda

Untuk memperkirakan atau meramalkan nilai dari variabel Y, akan lebih baik apabila kita ikut memperhitungkan variabel-variabel lain yang ikut mempengaruhi Y. Dengan demikian, kita mempunyai hubungan antara satu variabel tidak bebas (dependent variable) Y dengan beberapa variabel lain yang bebas (independent variabel).

Regresi linier berganda pada dasarnya sama dengan regresi linier sederhana yang telah dikemukakan diatas, perbedaannnya hanya pada jumlah variabel bebasnya saja. Regresi linier berganda mengamati pengaruh lebih dari satu variabel bebas terhadap variabel tidak bebas, minimal ada dua buah variabel bebas.

Secara sistematis regresi linier berganda dapat ditulis :

a+ b₁X₁+b₂X₂+b₃X₃+…+b_nX_n

Dimana :

Y = Variabel yang diramalkan .

X₁,X₂,X₃,….X_n = Variabel yang diramalkan .

b_1,b₂, b₃,…..b_n = Koefisien regresi.

Untuk mencari nilai-nilai b₁, b₂, b₃, …, b_n dapat digunakan n persamaaan normal

∑ Y = αn + b₁ ∑ X₁ b₂∑ X₂ + b₃ ∑ X₃ + … + b_n ∑ X_n

∑ X₁Y = α ∑ X₁ + b₁ ∑ X₁ +b₂ ∑ X₁ X₂ + b₃ ∑ X₁ X₃ + … + b_n ∑ X₁X_n

∑ X₂ Y = α ∑ X₂ + X₁ + b₂ ∑ X₂ + b₃ ∑ X₂ X₃ + … + b_n ∑ X₂X_n

∑ X₃ Y = α ∑ X₃+ b₁∑ X₃ X₁ + b₂ ∑ X₃ X₂ + b₃∑ X₃ + … + b_n ∑ X₃X_n

∑ X₁Y = α ∑ X_n + b₁ ∑X_nX₁ +b₂∑X_nX₂ + b₃∑ X_nX₃ + … + b_n∑ X_nX_n

Uji signifikasi persamaan regresi :

Dimana :

JK_regresi = Jumlah kuadrat-kuadrat regresi

JK_residu = Jumlah kuadrat-kuadrat residu

k = dk = derajat bebas

n =ukuran sampel

F_hitung ³ F _tabel berarti persamaan tersebut signifikan

F_hitung < F _tabel berarti persamaan tersebut tidak signifikan

2.3 Korelasi

Korelasi merupakan teknik statistik yang digunakan untuk meguji ada/tidaknya hubungan serta arah hubungan dari dua variabel atau lebih. Koefisien korelasi memiliki nilai antara negatif satu dan positif satu. Jika koefisien korelasi bernilai positif maka variabel-variabel bernilai positif. Semakin dekat nilai koefisien ke positif satu semakin kuat korelasinya, dan begitu juga sebaliknya. Jika koefisien korelasi bernilai negatif maka variabel-variabel berkolerasi negatif. Semakin dekat nilai koefisien korelasi ke negatif satu semakin kuat korelasinya, demikian juga sebaliknya.

Korelasi terbagi tiga yaitu :

1. Korelasi simetris, bila dua variabel atau lebih berhubungan dan tidak saling mempengaruhi. Sifat hubungan, mungkin terjadi secara kebetulan, misal kenaikan gaji dengan turunnya hujan; sama-sama sebagai variabel bebas, misal tinggi badan dengan berat badan, keduanya variabel bebas dari variabel pertumbuhan; Indikator konsep sama kekuatan otot dengan ketahanan otot, keduanya indikator dari kemampuan kontraksi otot.

2. Korelasi asimetris adalah hubungan dua variabel dan ada sifat mempengaruhi, misal tingginya kadar lipoprotein dengan aterosklorosis.

3. Korelasi timbal balik adalah hubungan antar dua/lebih variabel dan saling mempengaruhi, misal malnutrisi dengan malabsorbsi. Karena malabsobrsi akan menyebabkan malnutrisi, sementara malnutrisi mengakibatkan atrofi selaput lendir usus yang mengakibatkan malabsorbsi.

4. Korelasi Person adalah bentuk statistik diskriptif dan statistik inferensial yang menggambarkan hubungan antara dua variabel berskala interval atau rasio.

Koefisien korelasi linier ( r ) adalah ukuran hubungan linier antara dua variabel/peubah acak X dan Y untuk mengukur sejauh mana titik-titik menggerombol sekitar sebuah garis lurus regresi. Secara matematis koefisien korelasi dapat dirumuskan dengan :

Dimana :

R = +1, berarti ada korelasi positif sempurna antara x dan y.

R = 0, berarti tidak ada korelasi.

R = -1, berarti ada korelasi negatif sempurnaantara x dan y.

Jika b positif maka r postif sedangkan jika b negatif maka r negatif.

a. Nilai r terletak dari –1 sampai +1 atau ditulis – 1≤ r ≤+1

b. Bila r mendekati +1 dan –1 maka terjadi korelasi tinggi dan terjadi hubungan linier yang sempurna antara X dan Y.

c. Bila r mendekati 0 hubungan liniernya sangat lemah atau tidak ada.

Misalnya:

r = - 0,6 , menunjukkan arah yang berlawanan, X↑ maka Y↓ atau X↓ maka Y↑

r = + 0,6 , menunjukkan arah yang sama, X↑ maka Y↑ atau X↓ maka Y↓

r = 0 menunjukkan tidak ada hubungan linier antara X dan Y

Uji satatistik yang dilakukan dengan menggunakan uji t yaitu :

Dimana :

R = koefisien korelasi

N = ukuran sampel

T _hitung ³ t _tabel berarti persamaan tersebut signifikan

T _hitung < t _tabel berarti persamaan tersebut tidak signifikan

Kegunaan Koefisen Korelasi

a. Menentukan hubungan dan besarnya hubungan antara 2 variabel

b. Dapat digunakan untuk peramalan terhadap variabel lainnya

c. Bisa digunakan sebagai penaksiran

Jenis-Jenis Koefisien Korelasi Sederhana

A. Koefisien Korelasi Pearson

Koefisien Korelasi Pearson adalah indeks atau angka yang digunakan untuk mengukur keeratan hubungan antara dua variabel yang datanya berbentuk data interval atau rasio. Disimbolkan dengan r.

Koefisien korelasi pearson dapat ditentukan dengan dua metode yaitu :

a. metode least square.

Koefisien korelasi linear dengan metode least square dirumuskan:

b. Metode product moment.

Koefisien korelasi (r) dengan metode product moment dirumuskan:

Keterangan :

r = koefisien korelasi

x = deviasi rata-rata variabel X

= X-

y = deviasi rata-rata variabel Y

= Y-

B. Koefisien korelasi rank spearman.

Koefisien korelasi rank spearman adalah indeks atau angka yang digunakan untuk mengukur keeratan hubungan antara dua variabel yang datanya berbentuk data ordinal yang disimbolkan dengan r.

Untuk mengitung koefisien korelasi rank, dapat digunakan langkah-langkah berikut:

1. Nilai pengamatan dari dua variabel yang akan diukur hubungannya diberi ranking. Pemberian ranking dimulai dari data terbesar atau terkecil. Jika ranking sama, diambil rata-rata.

2. Setiap besar ranking dihitung perbedaannya.

3. Perbedaan setiap pasang ranking tersebut dikuadratkan dan dihitung jumlahnya.

2.4 Tabel Korelasi

Sama halnya dengan diagram pencar, tabel korelasi juga menunjukkan adanya indikasi korelasi antara dua variabel. Pada tabel korelasi terdapat dua variabel yaitu variabel X dan Y. Proses pembentukan tabel korelasi hampir sama dengan proses pembentukan tabel regresi. Tabel korelasi disebut tabel frekuensi bervariabel dua.

Prosedur pembuatan tabel korelasi adalah sebagai berikut :

1. Menentukan jangkauan kedua variabel

r = data terbesar – data terkecil

2. Menentukan banyaknya kelas kedua variabel tersebut.

3. Menetukan panjang interval kelas kedua variabel tersebut.

4. Menentukan batas bawah kelas pertama dari kedua variabel tersebut. Batas kelas pertama diambil dari data terkecil atau data terkecil hasil pelebaran jangkauan.

5. Menempatkan kelas untuk variabel X pada kolom tabel dan kelas untuk variabel Y pada baris tabel.

2.5 Memilih persamaan regresi terbaik

Berapa nilai yang di gunakan sebagai alat unatuk memilih persamaan regresi terbaik adalah :

2.5.1 Koefisien Determininasi (R²)

Didefenisikan sebagai suatu ukuran besarnya keragaman antara y di sekitar rataannya yang dapat dijelaskan oleh persamaan regresi, semakin bersar nilai R² semakin baik persamaan regresi tersebut dalam menjelaskan keragaman data.

Maksimum nilai R² adalah 100% dan mnimal 0. Jika nilai R²=100%, misalnya untuk regresi linier sederhana semua titik data akan menempel ke garis regresi, semakin kecil R² maka data makin menyebar jauh dari garis. Oleh karena itu jika R² kecil maka keeratan hubungan antara X dan Y lemah dan jika R²=0 menunjukkan bahwa X tidak memiliki hubungan dengan Y. Untuk mengetahui nilai R² dapat dicari dengan persamaan berikut :

Dimana :

JKT = Jumlah kuadrat total terkoreksi.

JKG = Jumlah Kuadrat galat (sisa).

JKR = Jumlah kuadrat regresi.

Koefisien ini dapat ditentukan berdasarkan hubungan antara dua macam variasi, yaitu :

1. Variasi variabel Y terhadap garis regresi (Y’)

2. Variasi variabel Y terhadap rata-ratanya (Y)

Ada 2 Jenis Hubungan antara Variabel X dan Y

a. Hubungan sempurna antara variabel X dan Y.

b. Tidak ada hubungan antara variabel X dan Y.

Apabila penambahan variabel independent tidak terlalu banyak menaikkan nilai R² sedangkan biaya yang dikeluarkan untuk menambah variabel tersebut sangat besar, sebaiknya persamaan regresi tidak melibatkan variabel indepandent tersebut. R ²nilainya antara 0 dan 1 untuk menyatakan proporsi keragaman total nilai-nilai peubah Y yang dapat dijelaskan oleh nilai-nilai peubah X melalui hubungan linier tersebut.

Contoh : r = 0,6 artinya 0,36 atau 36 % diantara keragaman total nilai-nilai Y dapat dijelaskan oleh hubungan liniernya dengan nilai-nilai X. atau Besarnya sumbangan X terhadap naik turunnya Y adalah 36 % sedangkan 64 % disebabkan oleh faktor lain.

2.5.2 Kuadrat Tengah Galat (S²)

Sering dapat menunjukkan titik pemisah yang terbaik bagi banyaknya variabel independent yang sebaiknya dapat dilibatkan dalam regresi, memilih persamaan regresi yang terbaik dengan melihat nilai yang terkecil, secara matematis nilai S²dapat dicari sebagai berikut :

Dimana :

Yi = Nilai variabel dependent ke-i

= Nilai estimasi variabel dependent ke-i

n = Banyaknya pengamatan

p = Banyaknya parameter temasuk a

2.5.3 Nilai Dari Statistik Cp Mallows

Merupakan nilai dugaan bagi jumlah kuadrat simpangan persamaan regresi tersebut dari model sebenarnya yang tidak diketahui. Model yang lebih besar akan cenderung mempunyai nilai Cp yang lebih dekat kepada banyaknya parameter (p) termasuk a, model regresi yang baik adalah model yang nilai Cp nya hampir sama dengan banyaknya parameter. Nilainya dapat dicari dengan rumus :

Dimana :

Cp = Nilai dari Cp Mallows

JKG (p) = Jumlah kuadrat galat dari model yang mengandung parameter termasuk a

s² = Nilai dugaan kuadrat tengah galat dari persamaan terbersar

n = Banyaknya pengamatan

p = Banyaknya parameter termasuk a

2.5.4 Koefisien Determinasi Terkoreksi (R² Adjusted)

Sebenarnya merupakan koreksi dari R² adjusted yang nilainya dapat dicari berdasarkan rumus :

Dimana :

R² = Koefisien determinasi

N = Banyaknya pengamatan

P = Banyaknya parameter termasuk a

2.6 Pendeteksian Pengamatan yang Berpengaruh

Untuk mandeteksi apakah suatu pengamatan berpengaruh dalam persamaan maka ada beberapa nilai yang dapat digunakan yaitu :

2.6.1 Dffits

Nilai perbedaan diantara pendugaan Yi dengan Yi tanpa pengamatan ke I yang dibagi dengan keragaman nilainya diperoleh dengan rumus :

Dimana :

Y_i = Nilai pendugaan Y_i tanpa pengamatan ke-i

Y_i,-I = Nilai pendugaan Y_i tanpa pengamatan ke-i

s-i = Dugaan simpangan baku tanpa pendugaan ke-i

h_ii = Unsur ke-I dari diagonal matrix HAT

Suatu pengamatan akan berpengaruh dalam persamaan regresi apabila pengamatan tersebut mempunyai nilai :

Dimana :

p = Banyaknya parameter, termasuk a

n = Banyaknya pengamatan

2.6.2 Dfbetas

Nilai dari dugaan koefisien b ke-j dengan dugaan koefisien b ke-j tanpa melibatkan pengamatan ke-i yang dibagi dengan dugaan simpangan baku dari perubahan koefisien b ke-j tersebut. Nilai dari (DFBETAS)_ji dapat diperoleh dari rumus berikut :

Dimana :

b_j = Dugaan koefisien b ke-j

b_j,I= Dugaan koefisien b ke-j tanpa pengamatan ke-i

s_i sc_jj = Dugaan simpangan baku dari perubahan koefisien b ke j

C_jj = Unsur diagonal dari matrix (x’ x)^-1

Pengamatan akan berpengaruh apabila pengamatan tersebut memiliki nilai :

2.6.3 Cook’s D

Pada pengamatan COOK’S D, pengamatan ke-I diukur oleh jarak. Dijarak tersebut dapat dirumuskan sebagai berikut :

Dimana :

r_i = Nilai dari studentizet residual pada pengamatan ke-i

p = Banyaknya parameter, termasuk a

n_ii = Unsur ke-i dari diagonal matrix HAT

Pengamatan akan berpengaruh apabila pengamatan tersebut memiliki nilai :

D_i > F ( p ; n – p ; α ) dengan α = 50%

2.7 Korelasi dan Regresi Linier dalam SPSS 9.0 for Windows

A. Menyiapkan Data Dalam SPSS 9.0 for Windows

Sebagai contoh analisis korelasi dan regresi linier pada bab ini adalah mendapatkan persamaan regresi linier antara variabel fertilitas (jumlah anak kandung yang dilahirkan hidup) dengan umur saat perkawinan pertama, jumlah tahun dalam ikatan perkawinan, jumlah anak yang telah meninggal dan pemakaian alat KB, bagi wanita pernah kawin dan berusia 10 – 49 tahun. Untuk menyiapkan data analisis ini diperlukan data k99p17i.sav dengan manipulasi data sebagai berikut:

a. Pastikan Anda bekerja dengan data Susenas individu (k99p17i.sav).

b. Lakukan proses Select Cases untuk case jenis kelamin wanita, usia 10 – 49 tahun dan pernah kawin. Case yang tidak sesuai dengan kondisi, akan difilter.

c. Lakukan Recode variabel k7r35 menjadi variabel KB dengan kondisi jika variabel k7r35 berisi 1 maka variabel KB berisi kode 1, jika variabel k7r35 berisi selain kode 1 maka variabel KB berisi kode 2, sedangkan jika variabel k7r35 berupa missing value (responden tersebut tidak termasuk target fertilitas) maka pada variabel KB berisi kode 0.

d. Simpan data tersebut dengan nama Multiple Regresi.sav.

B. Menggunakan Prosedur Regresi Dalam SPSS 9.0 for Windows

Untuk menggunakan menu regresi pada SPSS 9.0 for Windows, maka Anda harus melakukan beberapa langkah sebagai berikut:

a. Pastikan Anda telah bekerja dengan data Multiple Regresi.sav pada Window Data Editor.

b. Jika diperlukan, Anda dapat menguji beberapa asumsi yang diperlukan oleh analisis regresi linier, misalnya asumsi kenormalan. Lakukan analisis eksplorasi data melalui menu:

Analyze

Descriptive Statistics…

Explore.

Lakukan analisis tersebut dengan lengkap, kemudian lakukan analisis regresi linier dengan langkah-langkah berikut ini:

c. Dari menu, Anda klik

Analyze

Regression

Linear

d. Ketika muncul kotak dialog Linear Regression, maka lakukan beberapa hal antara lain.

ü Isikan variabel k7r34a sebagai Dependent

ü Variabel k7r32, k7r33, k7r34c dan KB ke dalam kotak Independent(s).

ü Untuk memilih metode regresi ini, Anda dapat memilihnya pada drop down list pada Method. Sebagai contoh Anda pilih Stepwise.

ü Jika Anda menginginkan untuk menghitung regresi hanya pada daerah kota saja (daerah = 1).

Gambar 2.3 Linear Regression

e. Klik Statistics… sehingga muncul kotak dialog Linear Regression: Statistics, kemudian lakukan beberapa hal antara lain:

ü pilih beberapa pilihan dalam Regression Coefficients.

ü Pilih pilihan Durbin-Watson dalam Residuals.

ü Pilih beberapa pilihan yang lain.

ü Klik Continue.

Gambar 2.4 Linear Regression Statistik

f. Klik Plots.. sehingga muncul kotak dialog Linear Regression: Plots, kemudian lakukan beberapa hal antara lain:

ü Pilhlah pilihan pada Standardized Residual Plots.

ü Masukkan variabel DEPENDENT ke dalam kotak X, sedangkan variabel *ZRESID pada kotak Y.

ü Klik Continue.

Gambar 2.5 Linear Regression Plot

g. Klik Save jika Anda ingin menyimpan hasil penghitungan regresi ini menjadi variabel dalam data Anda. Ketika muncul kotak dialog Linear Regression: Save, pilihlah variabel yang akan disimpan ke dalam data Anda. Lanjutkan dengan klik Continue.

h. Klik Options… untuk mengatur:

ü Kriteria uji signifikasi uji F yang akan digunakan oleh SPSS 9.0 for Windows dalam setiap tahapan proses sesuai dengan metode yang digunakan.

ü Memasukkan atau tidak memasukkan konstanta dalam output regresi.

ü Menangani missing value.

i. Klik Continue.

j. Klik OK.

2.8 Chi Kuadrat

Chi kuadrat satu sample adalah tehnik statistic yang digunakan untuk menguji hipotesis deskriftif bila dalam populasiu terdiri dari dua atau lebih klas, data berbentuk nominal sampelnya besar. Yang dimaksud hipotesis deskriptif disini bisa merupakan estimasi/ dugaan terhadap ada tidaknya perbedaan frekuensi antara kategori satu dan kategori lain dalam sebuah sample tentang sesuatu hal.

Rumus Chi Kuadrat :

Dimana:

kuadrat

f = frekuensi yang diobservasi

f = frekuensi yang diharapkan

Koefisien Kontingesi digunakan untuk menghitung antar variable bila datanya berbentuk nominal. Tehnik ini mempunyai kaitan erat dengan Chi Kuadrat yang digunakan untuk menguji Hipotesis Komparatif k Sample Independent.oleh karena itulah rumus yang digunakanmengandung nilai Chi Kuadrat.

Rumus :

Contoh:

Tabel 2.1 Input Data

Olah raga	Jenis profesi		Jumlah
Olah raga	Guru	Dokter
Tennis Meja	15	9	24
Golf	10	23	33
	25	32	57

Ke 2 yang menyenangi Tennis Meja

= = 0.4211

Ke 2 yang menyenangi Golf

= = 0.5789

a. f 1 yang menyenangi Tennis Meja:

f Guru = 0.4211 x 25 = 10.5275

f Dokter = 0.4211 x 32 = 13.4752

b. f yang menyenangi Golf

f Guru = 0.5789 x 25 = 14.4725

f Dokter = 0.5789 x 32 = 18.5248

Tabel 2.2 Frekuensi Tenis Meja dan Golf

Olah Raga	Guru		Dokter
	f	f	f		Jumlah
Tennis Meja	15	10.5275	9	13.4752	24
Golf	10	14.4725	23	18.5248	33
	25		32		57

= + + +

= 1.9001 + 1.4862 + 1.3822 + 93.0811

= 97.8496

H = Tidak ada pengaruh antara profesi dan jenis olah raga

H = Ada pengarauh antara jumlah profesi dan jenis olah raga

X = Table

Dik = (n-1) x (n-1)

= (2-1) x (2-1)

= 1

Table < Hitung artinya H ditolak dan H diterima jadi ada hubungan.

C = = = 0.64

Earth and Green

Rabu, 09 November 2011

Statistik

Tidak ada komentar:

Posting Komentar