Arsip untuk Oktober, 2009

Sebaran Binomial

Dalam statistik, kita seringkali menemukan data deret hitung (count) yang berbentuk acak diskret, misalnya pada kasus pelemparan koin yang dilakukan sebanyak 6 kali, kita mungkin mendapatkan 3 gambar ataupun 3 angka yang keluar, dengan demikian peluangnya adalah 0,5 untuk gambar dan 0,5 untuk angka.

Atau kita pernah menjalani ujian dengan tipe pilihan ganda, tentunya peluang kita untuk memilih jawaban A, B, C dan D adalah sama untuk yang hanya menebak-nebak, yaitu 0,25 untuk jawaban benar dan 0,75 untuk jawaban salah. Terakhir adalah jika kita melihat data operasi transplan jantung di sebuah rumah sakit, maka kita akan temukan dari 20 kali operasi, berapa pasien yang dapat bertahan, tentunya peluangnya adalah 0,5 untuk berhasil dan 0,5 untuk gagal.

Beberapa ilustrasi di atas merupakan contoh kasus percobaan yang berjumlah n yang akan memberikan hasil antara sukses atau gagal, satu dari dua pilihan, atau katakanlah bersifat dikotomi. Percobaan ini seringkali disebut sebagai percobaan binom atau yang kita kenal dengan bernoulli trial dengan karakteristik yang berbeda dengan percobaan poisson yang telah kita bahas. Percobaan binom memiliki karakteristik antara lain:

-          Terdiri atas sejumlah n percobaan berjumlah tetap,

-          Hasil yang didapat hanya dua kemungkinan yaitu sukses atau gagal, atau sisi gambar atau sisi angka seperti pada

kasus pelemparan koin tadi,

-         Peluang sukses yang dinotasikan dengan p, adalah sama pada setiap percobaan,

-         Setiap percobaan adalah independen, artinya hasil dari satu percobaan tidak mempengaruhi hasil percobaan yang

lain.

Hasil dari percobaan binom adalah jumlah keberhasilan, variabel diskret X yang menunjukkan jumlah keberhasilan disebut variabel acak binom. Nilai yang mungkin untuk percobaan binom adalah X=0,1,2, …,n dan peluang-peluang yang dihasilkannya akan menunjukkan sebaran binom yang dinotasikan dengan B(n,p).

Formula yang digunakan pada percobaan binom untuk mendapatkan sejumlah k keberhasilan pada n percobaan adalah seperti berikut:

rumus 1

Dimana:

n          = jumlah percobaan

k          = jumlah keberhasilan

n-k       = jumlah kegagalan

p          = kemungkinan keberhasilan pada satu kali percobaan

1-p       = kemungkinan kegagalan pada satu kali percobaan

Ilustrasi singkat:

Jika naomi menebak dari 10 pertanyaan pilihan ganda yang diberikan dalam ujian statistik, berapakah kemungkinan naomi menjawab 5 pertanyaan dengan benar jika pilihan jawaban yang diberikan adalah 5?

Untuk permasalahan Naomi kita memiliki n = 10, k = 5, dengan demikian peluang naomi menjawab benar p = 0,2, dan kemungkinan naomi menjawab salah adalah 0,8.

rumus 2

Maka P(5 jawaban benar dari 10 pertanyaan) ≈ 0,026

Probabilitas Binom Kumulatif

Ilustrasi di atas menerangkan peluang Naomi menjawab 5 jawaban dengan benar, bagaimana jika dikatakan paling banyak 5 jawaban benar?pertanyaan tersebut akan mengarah kepada peluang binom kumulatif dimana variabel acak binom akan jatuh pada rentang tertentu baik itu lebih besar dari atau sama dengan (>), kurang dari atau sama dengan (<).

Masalah tersebut dapat diselesaikan dengan menghitung P(6), P(7), P(8), P(9), P(10), yang kemudian dapat kita singkat dengan:

rumus 3

Dimana kita akan menghitung nilai-nilainya sebagai berikut:

P(k > 5, 10) = P(6) + P(7) + P(8) + P(9) + P(10)

Menghitung Sebaran Binom dengan Excell

Jika kita menghitung nilai Probabilitas dengan excell berdasarkan data ujian Naomi di atas, adalah seperti berikut ini:

1

Kemudian pada nilai probabilitas kita tinggal mengetikkan BINOMDIST(nomor cell, FALSE), seperti berikut:

2

Kita lihat pada gambar urutan dari formula BINOMDIST yaitu NUMBER (jumlah keberhasilan), TRIAL (jumlah percobaan), PROBABILITY (probabilitas keberhasilan), dan CUMULATIVE yang dinyatakan dengan FALSE yang menunjukkan 1-p (1-0,2).

Kemudian klik enter dan akan menunjukkan hasil 0,0264:

3

Kemudian kita akan mencari probabilitas kumulatifnya jika pertanyaan mengarah kepada rentang tertentu, dalam kasus ini peluang Naomi dapat menjawab paling banyak 5 jawaban benar ( < 5 ).

Untuk menjawab pertanyaan ini kita hanya mengganti fungsi kumulatif FALSE dengan TRUE seperti berikut ini:

4

Setelah kita enter hasilnya akan tampak seperti berikut:

5

Kita juga akan menghitung probabilitas naomi menjawab paling sedikit 5 jawaban benar ( > 5 ), dengan demikian kita akan menghitung P(6), P(7), P(8), P(9), dan P(10), sebagai berikut:

6

Kemudian kita lakukan proses yang sama pada P(7) dan seterusnya sehingga didapatkan hasil berikut:

7

Setelah didapatkan hasil masing-masing probabilitasnya, kita tinggal menggunakan fungsi SUM untuk mengetahui probabilitas kumulatif seperti di bawah ini:

8

Maka hasilnya akan ditampilkan sebagai berikut:

9

Statistika Inferensia

Seandainya kita memiliki 544 sampel pemilih dari populasi 1.000 orang di suatu kota. Data yang kita miliki kemudian akan kita gunakan untuk memeriksa seluruh populasi. Misalnya, apakah rata-rata umur seluruh responden kita 38 tahun? atau apakah Rp 1.000.000,- dapat mewakili jumlah gaji rata-rata mereka? Dapatkan kita katakan rata-rata umur mereka menyebar normal? Atau juga adakah informasi lain yang dapat kita gali lebih dalam dari data responden tersebut? Untuk kasus tersebut kita dapat menjelaskannya dengan statistika inferensia.

Statistika inferensia mencakup semua metode yang berhubungan dengan analisis sebagian data untuk kemudian sampai pada peramalan atau penarikan kesimpulan mengenai keseluruhan gugus data induknya (Walpole, 1995).

Bisa kita katakan bahwa ketika ingin meneliti suatu populasi yang lebih besar, kita hanya membutuhkan beberapa unit sampel acak untuk mengetahuinya, atau dengan kata lain kita ingin mengestimasi parameter dari sebuah populasi menggunakan data yang tersedia. Dalam statistika inferensia beberapa hal yang kita lakukan adalah:

-  Menemukan masalah

-  Membangun teori dan hipotesis

-  Merancang studi empiris dan mengumpulkan data

-  Menggunakan metode statistik dalam menganalisis data dan menguji hipotesis

-  Melaporkan hasil penelitian.

Ketika kita memiliki data tentang perkembangan luasan lahan kelapa sawit di Kalimantan Barat, berarti kita hanya memiliki data statistik deskriptif yang tersaji secara mentah. Tetapi ketika kita mengatakan pada 10 tahun ke depan perkembangan lahan kelapa sawit di Kalimantan Barat akan meningkat hingga 10.000 hektar dengan menyertakan beberapa variabel pendukungnya, maka kita telah masuk ke dalam statistika inferensia.

a.       Parameter

Ciri populasi  atau sembarang nilai yang menjadi karakteristik dari suatu populasi kita kenal sebagai parameter. Untuk menentukan parameter dari suatu populasi kita harus menentukan jenis dan jumlah populasi, kemudian menghitung mean (rataan) dari populasi, kemudian menentukan selang kepercayaan.

Parameter merupakan konstanta yang menjelaskan populasi, karena ia selalu dilambangkan dengan huruf Yunani. Oleh karena itu jika kita mendapatkan mean (rataan) dari beberapa bilangan adalah 10 (X = 10, maka dalam suatu populasi bilangan dinyatakan dengan µ = 10.

 

Statistik

(dari sampel)

Parameter

(dari populasi)

Mean

X

µ

Standar deviasi

S

σ

Proporsi

P

b.      Standar Eror

Standar eror merupakan variabilitas distribusi sampling dalam statistik. Standar eror dinyatakan dengan rumus:

rumus 1

dimana:

Se      = standar eror

S       = standar deviasi

N       = jumlah sampel

***jika diketahui standar deviasi = 4, dan jumlah sampel yang digunakan adalah 30, maka standar eror adalah;

rumus 2c.       Selang Kepercayaan (CI)

Selang kepercayaan memberikan batas bawah dan batas atas statistik pada kemungkinan tertentu yang ditentukan oleh peneliti. Tingkat kepercayaan yang biasa digunakan adalah 90%, 95%, dan 99%. Seorang peneliti akan menentukan tingkat kepercayaan dan jumlah sampel yang akan menentukan batas bawah dan batas atas CI yang digunakan.

CI = Mean + (standar eror x tingkat kepercayaan)

***jika diketahui jumlah sampel (n) adalah 30, standar eror (Se) adalah 0,73, sedangkan mean adalah 50, hitung selang kepercayaan pada taraf nyata 5%.

CI = 50 + (0,73 x 2,045)

(nilai 2,045 berasal dari tabel nilai kritik t dengan derajat bebas n-1) >>> lihat tabel t

Maka CI = 50 + (1,5)

d.      Hipotesis Statistik

Merupakan pernyataan atau pendugaan mengenai satu atau lebih populasi. Benar atau salah suatu hipotesis tidak dapat diketahui secara pasti kecuali jika kita memeriksa seluruh populasi yang tidak mungkin dilakukan. Karena itu kita dapat mengambil contoh acak dari populasi tersebut dan menggunakan informasi yang terkandung di dalamnya untuk menentukan apakah hipotesis tersebut benar atau salah.

Hipotesis dengan harapan akan ditolak disebut dengan hipotesis null (H0). Penolakan terhadap H0 akan mengakibatkan hipotesis alternative diterima yang dilambangkan dengan H1. Kita lihat model hipotesis berikut ini:

H0: p = 0,5

H1: p ≠ 0,5; p < 0,5; p > 0,5.

Atau dapat juga seperti berikut ini:

H0: rata-rata jumlah peserta yang mengikuti ujian adalah 120 orang (H0: µ = 120)

H1: rata-rata jumlah peserta yang mengikuti ujian adalah lebih dari 120 orang (H1:  µ ≠ 120) atau (H1: µ > 120)

Penyusunan Hipotesis

Hipotesis merupakan langkah pertama sebelum mengadakan penelitian, ia dirumuskan terlebih dahulu sebagai pedoman dalam mengambil kesimpulan.

Hipotesis Statistik adalah pernyataan atau dugaan mengenai satu atau lebih populasi. Benar atau salah suatu hipotesis tidak pernah diketahui dengan pasti, kecuali jika seluruh populasi diperiksa. hipotesis yang paling sering kita dengar adalah “menerima” dan “menolak”. Kalimat menolak dalam hipotesis dapat bermakna bahwa hipotesis yang diberikan adalah salah, sebaliknya kalimat menerima hanya semata-mata mengimplikasikan bahwa kita tidak mempercayai penolakan hipotesis tanpa ada bukti-bukti lebih lanjut. Oleh karena itu beberapa statistikawan maupun peneliti memilih menggunakan kata-kata “belum dapat diterima”, “tidak lebih baik daripada”, “tidak ada perbedaan antara”, dan lain-lain daripada harus menggunakan kata “menerima” atau “menolak”. Baru setelah ia melakukan pengujian, hipotesis tersebut akan ditolak.

contoh:

Jika seorang peneliti membandingkan antara mutu produk kesehatan perusahaan A yang diklaim lebih baik daripada mutu produk kesehatan perusahaan B, maka ia akan menyusun sebuah hipotesis sebagai berikut:

hipotesis pertama: produk kesehatan A lebih baik daripada produk kesehatan B

hipotesis kedua: produk kesehatan A tidak lebih baik daripada produk kesehatan B

dari kedua hipotesis tersebut jelas bahwa dalam menyusun hipotesis, sang peneliti (pada hipotesis kedua) tidak langsung menyatakan bahwa produk kesehatan A lebih buruk daripada produk kesehatan B. Setelah terbukti bahwa hipotesis pertama benar (produk kesehatan A lebih baik daripada B), maka ia akan menyatakan “menolak” hipotesis kedua dan “menerima” hipotesis pertama). Jika yang terjadi sebaliknya, maka ia akan menyatakan “menerima” hipotesis kedua bahwa produk kesehatan A tidak lebih baik daripada B.

Hipotesis yang dirumuskan dengan harapan akan ditolak membawa penggunaan istilah hipotesis nol yang dilambangkan dengan H0, Penolakan H0 akan mengakibatkan penerimaan suatu hipotesis alternatif yang biasa dinyatakan dengan H1.

Hipotesis nol (H0) harus menyatakan sebuah nilai atau pernyataan pasti, sedangkan hipotesis alternatif (H1) menyatakan sebaliknya.

Contoh 1:

Bila dilakukan penelitian mengenai pengaruh citra merek motor honda terhadap kepuasan konsumen, maka hipotesisnya menjadi:

H0 : citra merek motor Honda berpengaruh terhadap kepuasan konsumen

maka:

H1 : citra merek motor Honda belum tentu/tidak berpengaruh terhadap kepuasan konsumen

atau contoh 2:

Penelitian mengenai peluang keberhasilan suatu percobaan adalah  0,5, maka hipotesisnya akan menjadi:

H0 :  p = 0,5

H1 : p < 0,5; atau p > 0,5; atau p ≠ 0,5

Sumber: Walpole, R.E. 1995. Pengantar Statistika (Edisi ke-3). Gramedia Pustaka Utama: Jakarta.

Bookmark and Share

Teknik Pengukuran Dalam Statistik

Pengukuran adalah penetapan atau pemberian angka terhadap objek atau fenomena menurut aturan tertentu (Stevens, 1951). Angka merupakan arti kuantitatif dari pengukuran, dapat memberikan indikator tertentu kepada sifat objek yang diteliti.

Contohnya adalah jika indikator nilai mata kuliah B diberikan untuk mahasiswa yang mendapat nilai 60 – 75, dan  A untuk mahasiswa yang berhasil mendapatkan nilai > 75.

Pengukuran terkait dengan aturan yang dapat didefinisikan, misalnya kita katakan aturan yang terdapat dalam skala likert yang memberikan nilai 1 hingga 4 dengan kategori tidak setuju – kurang setuju – ragu-ragu – setuju. Aturan ini dapat diterjemahkan menjadi; jika objek setuju, berikan angka 4, dan jika tidak setuju berikan angka 1, serta jika ragu-ragu berikan angka 3.

Secara umum ada empat jenis ukuran atau yang biasa disebut skala dalam statistik antara lain:

1. Ukuran Nominal : dimana angka hanya sebagai label, tidak menunjukkan apa-apa.

2. Ukuran Ordinal : dimana angka yang diberikan mengandung pengertian tingkatan. Misalnya dalam pengurutan objek dari yang tertinggi ke terendah atau sebaliknya.

3. Ukuran Interval : dimana tiap tingkatan diberikan satu sifat yang lain. Misalkan selisih nilai antar mahasiswa A dan mahasiswa B yaitu 8 dan 6, maka intervalnya adalah 8-6=2.

4. Ukuran Rasio : rasio memiliki sifat pembanding. Kita dapat mengatakan bahwa umur anak A adalah 5 kali daripada umur anak B, hal tersebut berarti bahwa rasio anak A : B adalah 5 : 1.

Sumber: Nazir, M. 2003.  Metode Penelitian.  Ghalia Indonesia: Jakarta.

Bookmark and Share

Teknik Sampling

Sampel merupakan bagian dari populasi. Sampel dapat menerangkan keadaan suatu populasi pada bagian unit-unit populasi tertentu saja. Terdapat beragam teknik penarikan sampel, berikut ini adalah teknik sampling berdasarkan pembagian dari C.W. Churchman et al., dimana mula-mula sampling dibagi dua yaitu desain sampling tetap (fixed sampling design) dan Sequential Sampling.

1. Desain sampling tetap (fixed sampling design)

Desain sampling tetap, sampel dibentuk mengikuti aturan tertentu, dan aturan ini tidak berubah-ubah selama penarikan sampel berlaku. Desain sampling tetap dibagi dua yaitu: sampel  tanpa batasan (unrestricted random sample) dan sampel dengan batasan-batasan (restricted random sample).

Pada penarikan sampel tanpa batasan (unrestricted random sample), sampel ditarik secara langsung dari populasi. Populasi tidak dibagi-bagi terlebih dahulu atas subsample, teknik ini dapat dibagi lagi menjadi dua yaitu:

a) Sampel acak sederhana (simple random sampling)

Tiap unit populasi diberi nomor, kemudian sampel yang diinginkan ditarik secara acak.

b) Sampel sistematik (sistematic sample)

Unit dari populasi diberi nomor dan diurutkan, kemudian ditentukan nomor sebagai titik tolak menarik sampel. Contohnya adalah jika kita menarik sampel dengan kelipatan 5, maka sampel kemudian adalah sampel ke-10, sampel ke-15, dan seterusnya.

Sedangkan pada penarikan sampel dengan batasan (restricted random sampling), sampel ditarik dari populasi yang telah dikelompokkan. Mula-mula sampel dikelompokkan terlebih dahulu sampai ditarik dari masing-masing kelompok tersebut. Analoginya adalah kita dapat membuat pengelompokkan berdasarkan jenis kelamin, interval umur, profesi, tingkat pendapatan, tingkat pendidikan, dan lain-lain. Restricted Sampel dibagi kembali atas:

a) Multiple Stage Sample

Sampel ditarik dari kelompok populasi, tetapi tidak semua anggota populasi menjadi anggota sampel. Pada tiap kelompok populasi kita pilih sejumlah anggota tertentu untuk menjadi anggota sampel dengan jumlah yang sama, atau sebanding dengan besar relative anggota kelompok populasi yang masuk ke dalam sub sampel.

b) Stratified Sample

Populasi dibagi ke dalam kelompok yang homogen (berdasarkan strata) terlebih dahulu, kemudian ditarik sampel dari setiap strata.

c) Cluster Sampling

Populasi dibagi dahulu berdasarkan area (cluster). Anggota tiap subpopulasi tiap cluster tidak harus homogen, beberapa cluster dipilih dulu sebagai sampel, kemudian dipilih lagi anggota unit dari sampel cluster diatas.

d) Stratified Cluster Sampling

Sampel ditarik dengan teknik kombinasi antara stratified sampling dan cluster sampling.

2. Desain sampling skuensial (sequential sampling design)

Berbeda halnya dengan desain sampling tetap, jika dalam penarikan sampel tidak sama selama penarikan sampel berlangsung, maka desain sampling disebut sekuensial. Sampling sekuensial dapat dilakukan dengan dua cara yaitu: (a) menarik sampel secara bertingkat, dan (b) dengan mengamati satu persatu anggota-anggota populasi.

Sumber: Churchman dalam Nazir.  2003.  Metode Penelitian.  Ghalia Indonesia: Jakarta.

Bookmark and Share

Ikuti

Get every new post delivered to your Inbox.

Bergabunglah dengan 68 pengikut lainnya.