Transformasi Data


Kebanyakan variabel tidak memenuhi uji statistik parametrik karena tidak terdistribusi normal, keragamannya tidak homogen, atau keduanya. Menggunakan uji statistik parametrik seperti ANOVA atau regresi linier pada data tersebut dapat mengakibatkan hasil analisis yang keliru. Pada beberapa kasus, mentransformasi data akan membuat kecocokannya terhadap asumsi menjadi lebih baik.

Untuk mentransformasi data, anda dapat menggunakan operasi matematik pada setiap observasi, kemudian menggunakan angka-angka yang telah bertransformasi tersebut pada pengujian.

Berikut ini adalah jenis-jenis normalisasi data dengan transformasi:

normalisasi

Berikut ini 12 angka data time series nilai tukar Rupiah terhadap dollar Amerika Serikat; kolom kedua adalah data asli, kolom ketiga adalah data log, dan kolom ketiga adalah data akar unit:

Tahun

Data

Log

Akar Unit

1978

442

2,645422

21,0238

1979

623

2,794558

24,96197

1980

627

2,797268

25,03997

1981

632

2,80058

25,13563

1982

661

2,820464

25,7177

1983

889

2,949024

29,8203

1984

901

2,954734

30,017

1985

778

2,891192

27,89946

1986

855

2,932129

29,24585

1987

1.153

3,061852

33,95674

1988

1.325

3,12214

36,39739

Tentunya setelah data ditransformasi, kita juga harus melakukan transformasi terhadap hasilnya. Kita dapat melakukan lawan dari fungsi matematika yang anda gunakan pada transformasi data. Untuk data log, kita dapat melakukan transformasi balik dengan menambahkan pangkat 10 ke angka tersebut.

Pada transformasi log kita menggunakan nilai log dari variabel yang kita gunakan dari analisis. Transformasi log berguna untuk data dimana kita menemukan nilai residual yang semakin besar untuk nilai yang lebih besar dari variabel dependen. Trend pada nilai residual tersebut muncul seringkali karena error atau perubahan nilai dari variabel hasil merupakan persen dari data aktualnya.

Berikut ini adalah beberapa tipe data dengan transformasi yang lazim digunakan:

1. Data Jumlah/Total (amount)

Jumlah merupakan jenis data yang paling lazim ditemui. Datanya terdiri dari data positif (tidak negative), bilangan bulat, pecahan, dan angka irasional. Data jenis ini tidak mungkin negative, misalnya jumlah uang, ketinggian gedung, jangka waktu, dan lain-lain. Menganalisa data jumlah biasanya dengan mengambial angka logaritmanya. Beberapa ukuran yang biasanya digunakan dalam ilmu pengetahuan adalah ukuran logaritmik data actual. Misalnya skala Richter untuk mengukur gempa, mengukur intensitas suara, dan kecepatan peluru senapan.

2. Data Perhitungan (counts)

Perhitungan adalah jumlah dari suatu benda. Biasanya direpresentasikan dengan bilangan bulat non-negatif, seperti jumlah orang di kelas dan jumlah pegawai di perusahaan.

Akar unit (square roots) atau Logaritma (logarithms) biasanya diterapkan pada data perhitungan. Ada juga jenis transformasi yang disebut transformasi “Box-Cox” yang merupakan alat untuk mentransformasi data perhitungan.

3. Pecahan (fraction)

Merupakan data rasio dan biasanya merupakan data persentase dengan dasar perhitungan 100. Namun, semua angka rasional juga disebut pecahan.

Persen biasanya akan lebih mudah dibaca dengan log[ p/(1 – p) ], dimana p adalah persentase yang digambarkan sebagai pecahan antara 0 dan 1. Jika kita ingin mentransformasi persentase 100, transformasinya adalah log[ p/100-p) ].

4. Peringkat (rank)

Peringkat merupakan bilangan bulat yang menggambarkan tingkatan objek atau entitas. Seringkali variabel tambahan ditambahkan kepada data tersebut untuk mengindikasikan tingkatan objek yang dideskripsikan. Peringkat biasanya ditransformasikan dengan log.

5. Neraca (balance)

Neraca merupakan variabel yang diukur pada sebuah skala yang dapat berupa angka negative atau positif, biasanya memungkinkan bagi semua angka baik itu bilangan bulat, pecahan, rasional, dan irasional. Misalnya data keuntungan perusahaan, keuntungan/kerugian transaksi saham, temperatur suhu, dan lain-lain. Data neraca jarang ditransformasikan.

Sumber: Mosteller,F. and .Tukey, J., Data Analysis and Regression, Reading, MA: Addison-Wesley, 1977

About these ads
  1. maksih infonya..
    ikut mengkopy ya, untuk tugas nih..^^
    makasih banyak ya..

      • ariyoso
      • Desember 9th, 2009

      selama buat pendidikan & ga dipake macem2 :P
      saya seneng banget..OK yud..

    • Rafi
    • Januari 24th, 2010

    Pak bisa diberi penjelasan kalau mau mentransformasi data yg tidak normal dengan eviews langkah2nya bagaimana pak?
    Sebelumnya saya ucapkan terima kasih.

      • ariyoso
      • Januari 25th, 2010

      mentransformasi data sbenarnya cukup dilakukan di excell saja, bisa dengan fungsi sqrt, ln, log, dan lain2. adapun untuk mendeteksi normalitas data dengan eviews bisa dilakukan dengan histogram jarque-berra.

    • dian
    • Agustus 2nd, 2010

    pak, bagaimana cara menentukan transformasi apa yg sesuai dengna data kita?? apa kita bisa melakukan transformasi dengan SPSS??
    terima kasih atas infonya ^^

      • ariyoso
      • September 21st, 2010

      transformasi untuk data kontinu umumnya dilakukan dengan fungsi log10 ataupun ln, yang mudah aja neng, dengan excell bisa koq :)

    • IRMALIA
    • Desember 28th, 2011

    pak,gmn ia cara ngitungnyanya kolom ketiga pada akar unit bisa tinggi sperti itu??
    terimakasih

      • S4L
      • Desember 29th, 2011

      fungsi akar unit adalah akar kuadrat dari nilai tersebut, misalnya 4, nilai akar unitnya adalah 2

  2. klo pengertian transformasi dalam analisis data apa?

    • phi
    • Mei 29th, 2012

    data saya berjumlah 173 sampel, ada 90 sampel yg negatif karena ini berhubungan dengan laba-rugi fiskal, klu datanya ada yang negatifkan tidak bisa ditransform, bagaimana menormalkan data yang negatif tersebut?

      • S4L
      • Juni 5th, 2012

      data negatif bisa kamu rubah dengan fungsi ln (logaritma natural) atau pangkat seratus..pasti homogen

    • sulis tiani
    • Juni 4th, 2012

    asslamualaikum…
    pak klau data gk homogen gmn??, tpi udah normal,,,trimakasih

      • S4L
      • Juni 5th, 2012

      udah ditransformasi lum??kalo belum tapi datanya udah menyebar normal,,ya ga perlu ditransformasi,lanjut aja….jika data sudah ditransformasi,,misalnya dalam bentuk log atau ln,,pasti homogen kan??

  3. Mau tany…..leh mnt minta materi tentang transformasi yg lengkap untuk data yg tdk berdistribusi normal……?
    Mksh….

  1. No trackbacks yet.

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Logout / Ubah )

Twitter picture

You are commenting using your Twitter account. Logout / Ubah )

Facebook photo

You are commenting using your Facebook account. Logout / Ubah )

Google+ photo

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s

Ikuti

Get every new post delivered to your Inbox.

Bergabunglah dengan 70 pengikut lainnya.

%d bloggers like this: