Rabu, 12 Maret 2014

VALIDITAS DAN RELIABILITAS

VALIDITAS
       Secara umum validitas adalah mengukur apa yang seharusnya diukur. Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu instrumen pengukur (tes) dalam melakukan fungsi ukurnya (Azwar, 1996). Di dalam buku Encyclopedia of Educational Evaluation yang ditulis oleh Scarvia B. Anderson dan kawan-kawan disebutkan: "A test is valid if it measures what it purpose to measure. Atau jika diartikan lebih kurang demikian: sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Dalam bahasa Indonesia "valid" disebut dengan istilah "sahih."
     Suatu tes dapat dikatakan memiliki validitas yang tinggi jika tes tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang tepat dan akurat sesuai dengan maksud dikenakannya tes tersebut. Suatu tes yang menghasilkan data yang tidak relevan dengan tujuan diakannya oengukuran dikatakan tes yang memiliki validitas rendah. Sisi lain yang berkaitan dengan konsep validitas adalah masalah kecermatan. Suatu tes yang validitasnya tingg selain dapat menjalankan fungsi ukurnya dengan tepat, juga memiliki kecermatan tinggi. Artinya kecermatan didalam mendeteksi perbedaan-perbedaan kecil yang ada pada atribut yang diukurnya.
Contoh:
       Skor yang diperoleh dari hasil mengukur kemampuan mekanik akan menunjukkan kemampuan seseorang dalam memegang dan memperbaiki mobil, bukan pengetahuan orang tersebut dalam hal yang berkaitan dengan mobil. Tes yang mengukur pengetahuan tentang mobil bukanlah tes yang sahih untuk mekanik.
      Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil pengalaman. Hal yang pertama akan diperoleh validitas logis (logical validity) dan hal yang kedua diperoleh validitas empiris (empirical validity). Dua hal inilah yang dijadikan dasar pengelompokan validitas tes. Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas empiris.
1.   Validitas Logis. 
Istilah "validitas logis" mengandung kata "logis" yang berasal dari kata "logika", yang berarti penalaran. Dengan makna demikian maka validitas logis untuk sebuah instrumen evaluasi menunjuk pada kondisi bagi sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil penalaran.  Validitas logis ini terbagi menjadi beberapa jenis, antara lain:

  • Validitas Isi (Content Validity). Valditas isi berkaitan dengan kemampuan suatu instrumen mengukur isi (konsep) yang harus diukur. Ini berarti bahwa suatu alat ukur mampu mengungkap isi suatu konsep atau variabel yang hendak diukur.
  • Validitas konstruksi (Construct Validity). Konstruk adalah kerangka dari suatu konsep, validitas konstruk adalah validitas yang berkaitan dengan kesanggupan suatu alat ukur dalam mengukur pengertian suatu konsep yang diukurnya. Menurut Jack R. Fraenkel validasi konstruk (penentuan validitas konstruk) merupakan yang terluas cakupannya dibanding dengan validasi lainnya, karena melibatkan banyak prosedur termasuk validasi isi dan validasi kriteria.
  • Validitas ramalan (Predictive validity). Validitas ramalan adalah suatu kondisi yang menunjukkan seberapa jauhkah sebuah tes telah dapat dengan secara tepat menunjukkan kemampuannya untuk meramalkan apa yang bakal terjadi pada masa mendatang.
  • Validitas bandingan (Concurrent Validity). Tes sebagai alat pengukur dapat dikatakan telah memiliki validitas bandingan apabila tes tersebut dalam kurun waktu yang sama dengan secara tepat mampu menunjukkan adanya hubungan yang searah, antara tes pertama dengan tes berikutnya.
  • Reliabilitas stabil (stability reliability). Mengacu pada waktu. Untuk menentukan stabilitas, tes dilakukan ulang terhadap variabel yang sama di waktu yang berlainan. Hasil pengujian tersebut akan dibandingkaan dan berkorelasi dengan pengujian awal untuk memberikan stabilitas.
  • Reliabilitas terwakili (representative reliability). Mengacu pada keterandalan masing-masing grup. Menguji apakah penyampaian indikator sama jawabannya saat diterapkan ke kelompok yang berbeda-beda. 
  • Reliabilitas seimbang (equivalence reliability). Menerapkan banyak indikator yang dapat dioperasionalisasikan ke semua konsepsi pengukuran. Kesetaraan keandalan akan menggunakan dua instrumen untuk mengukur konsep yang sama pada tingkat kesulitan yang sama. Reliabilitas atau tidaknya pengujian akan ditentukan dari hubungan dua skor instrumen, atau lebih dikenal dengan hubungan antara variabel bebas (independen variable) dengan variabel terikat (dependen variable).
Untuk soal uraian, koefisien reliabilitasnya dihitung dengan rumus alpha dari Cronbach yang rumusnya adalah : 
2.     Validitas Empiris 
Istililah "validitas empiris" memuat kata "empiris" yang artinya "pengalaman". Sebuah instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman. Sebagai contoh sehari-hari, seseorang dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan bahwa orang tersebut memang jujur. Validitas empiris terbagi menjadi beberapa jenis antara lain:

RELIABILITAS
       Reliabilitas diterjemahkan dari kata reliability. Pengukuran yang memiliki reliabilitas yang tinggi maksudnya adalah pengukuran yang dapat menghasilkan data yang reliabel. Walaupun validitas memiliki nama lain seperti kepercayaan, keterandalan, keajegan, konsistensi, kestabilan dan sebagainya namun ide pokok dalam konsep reliabilitas adalah sejauh mana hasil suatu pengukuran dapat dipercaya. Hasil ukur dapat dipercaya apabila dalam beberapa kali pengukuran terhadap kelompok subjek yang sama diperoleh hasil yang relatif sama , kalau aspek yang diukur dalam diri subjek memang belum berubah. Pengertian relatif menunjukkan bahwa ada toleransi terhadap perbedaan-perbedaan kecil diantara hasil pengukuran. Bila perbedaan itu besardari waktu ke waktu, maka hasil pengukuran itu tidak dipercaya atau tidak reliabel.
      Reliabel juga dapat dikatakan menunjukkan konsistensi pengukuan yang dilakukan yang meliputi stabilitas, ekivalen, dan konsistensi internal. Reliabilitas ini sangat erat kaitannya dengan ketepatan dan ketelitian pengukuran. Pengukuran dikatakan stabiljika pengukuran pada sebuah objekdilakukan berulang-ulang pada waktu yang berbeda, menunjukkan hasil yang sama, dikatakan ekivalen jika pengukuran menunjukkan hasil pengukuran yang sama jika dilakukan peneliti lain atau memakai contoh item lain, serta dikatakan konsisten internal jika item-item atau indikator yang digunakan adalah konsisten satu sama lain.
Contoh:
      Kalau kita mengukur panjang sebuah meja kayu dengan menggunakan sebuah meteran berulang-ulang, baik dalam tenggang waktu yang singkat maupun tenggang waktu yang lama, apabila hasil pengukurannya sama maka dapat dikatakan bahwa meteran tersebut andal atau reliable untuk mengukur panjang meja. Demikian pula kalau kita melakukan pengukuran terhadap variabel fisik lainnya, misalnya waktu yang diperlukan oleh seorang perenang guna menempuh jarak 200 meter. Sebuah stopwatch yang reliabel akan selalu menunjukkan waktu tempuh sebagai perbandingan antara jarak 200 meter dengan kecepatan rata-rata yang diperlukan oleh perenang tersebut dari start sampai finish. Bila kecepatan rata-ratanya sama, tentu waktu tempuhnya yang ditunjukkan oleh stopwatch sama. Hasil pengukuran oleh stopwatch sebagai alat ukur dikatakan konsisten. Reabilitas ini terbagi menjadi beberapa jenis, diantaranya:
Aspek-aspek reliabilitas empiris soal objektif dibagi menjadi tiga macam, yaitu:
1.  Koefisien stabilitas

    Koefisien stabilitas (coefficient of stability) adalah jenis reliabilitas yang diperoleh dengan cara uji coba ulang (test–retest) yaitu dengan memberikan ujian dengan suatu soal kepada sekelompok individu kemudian mengujikan kembali soal tersebut pada kelompok sama pada waktu yang berbeda. Besarnya reliabilitas soal dihitung dengan mencari product moment antara skor hasil uji pertama dengan skor hasil uji kedua. Soal dikatakan reliabel bila koefisien stabilitas r11 atau rtt sama atau lebih besar dari 0,70.
2.  Koefisien ekuivalen

    Koefisien ekuivalen (coefficient of equivalence) adalah jenis reliabilitas yang diperoleh dengan cara menguji cobakan dua soal yang paralel pada kelompok sama dan waktu yang sama (equivalence forms method, parallel form method, atau alternate forms method). Jadi dalam hal ini ada dua soal yang paralel, artinya masing-masing soal disusun tersendiri, jumlah butir soal sama, isi dan bentuk sama, tingkat kesukaran sama, waktu serta petunjuk untuk mengerjakan soal juga sama. Skor hasil uji coba kedua soal dikorelasikan dengan rumus product moment untuk menghitung koefisien ekuivalen. Kedua jenis soal yang paralel bersifat reliabel jika angka koefisian ekuivalen yaitu r11 atau rtt besar atau sama dengan 0,70.
3.   Koefisien konsistensi internal
      Koefisien konsistensi internal (coefficient of internal consistency) adalah reliabilitas yang diperoleh dengan cara mengujicobakan suatu soal dan menghitung korelasi hasil uji coba dari kelompok yang sama. Ada tiga cara untuk memperoleh reliabilitas jenis ini yaitu; cara belah dua (split half method), cara Kuder Richardson 20 atau Kuder Richardson 21, dan cara Cronbach khusus untuk soal uraian.
      a.  Cara belah dua

Pada cara ini, soal diujicobakan kepada peserta didik dan hasilnya dibelah menjadi dua, yaitu belahan gasal dan belahan genap. Dalam hal ini jumlah butir soal harus genap. Kedua skor hasil belahan dikorelasikan dengan rumus product moment, hasilnya adalah relasi belahan r ½ ½ . Setelah ditemukan korelasi belahan, dihitung angka reliabilitas soal dengan rumus Spearman-Brown. Rumus Spearman-Brown adalah sebagai berikut:  
      b. Reliabilitas empiris soal uraian
Untuk soal uraian, koefisien reliabilitasnya dihitung dengan rumus alpha Cronbach yang rumusnya adalah:
keterangan :      SBt = simpangan baku total
                                SB1 = simpangan baku butir
Butir yang dimasukkan dalam rumus di atas hanya butir yang valid, sedangkan butir yang tidak valid (gugur), tidak diperhitungkan. Oleh karenanya reliabilitas hanya dihitung dari butir yang valid. Kriteria reliabilitas soal sama dengan soal bentuk objektif, yaitu soal reliabel bila r11   lebih dari sama dengan 0,70.
         c.  Cara Kuder Richardson 20
Rumus lain yang lebih banyak digunakan untuk menghitung koefisien konsistensi internal adalah rumus Kuder Richardson 20 (KR20). Cara ini menghasilkan angka yang lebih tepat. Rumus KR20 adalah :

keterangan :

                  SB2t = simpangan baku dari skor total
                  r11   = reliabilitas soal
                  k      = jumlah butir soal

Tidak ada komentar:

Posting Komentar