Rabu, 08 Januari 2014

Konsep Validitas dan Reliabilitas

KONSEP VALIDITAS DAN RELIABILITAS

Untuk mendapatkan data yang valid yaitu fakta yang diamati benar-benar tepat ukurannya, maka harus mengukur dengan benar.  Mengukur dengan benar berarti harus menggunakan alat ukur yang valid.

Validitas berasal dari kata validity, yang artinya sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya.  Suatu alat ukur memiliki validitas yang tinggi bila alat tersebut menjalankan fungsi ukur secara tepat atau memberikan hasil ukur yang sesuai dengan tujuan dilakukannya pengukuran.

Validitas suatu test atau instrumen adalah seberapa jauh alat itu mampu mengungkapkan dengan tepat ciri atau keadaan yang sesungguhnya dari obyek ukur.
Jadi test yang  valid adalah test yang mampu mengukur apa yang hendak diukur.

Validitas suatu tes dibedakan atas :
Validitas konsep
Validitas empiris

Validitas konsep terdiri atas :
1. Validitas content atau isi
Yaitu sampai seberapa jauh suatu tes dapat mengukur tingkat penguasaan terhadap isi atau materi tertentu yang harus dikuasai, sesuai dengan materi  pengajaran yang tercantum dalam GBPP.

Test itu dikatakan valid bila soal-soal atau butir-butir test itu mencerminkan keseluruhan isi atau content yang diujikan atau yang harus dikuasai secara proposional.

Untuk mengetahui validitas isi suatu test adalah :
Dengan berdasarkan telaah kisi-kisi test. 
Kisi-kisi test dibuat berdasarkan analisis kurikulum dan analisis text book yang digunakan.
2.Dengan mendasarkan pada analisis logika, tidak merupakan suatu koefisien yang dihitung secara statistika.

Isi suatu test harus mencakup semua pokok bahasan atau sub pokok  bahasan.
Kriteria untuk menentukan proporsi masing-masing pokok/sub pokok bahasan adalah dengan melihat :
-  jumlah halaman atau jumlah pertemuan setiap pokok bahasan
-  berdasarkan pendapat para ahli dalam bidang yang bersangkutan

2.Validitas construct
  Yaitu yang mempermasalahkan sampai seberapa jauh item-item suatu tes dapat mengukur variabel-variabel konsep yang hendak diukur, sesuai dengan konsep khusus atau definisi konseptual yang telah ditetapkan.
Contoh : mengukur sikap, minat, konsep diri, locus control, motivasi berprestasi, kecerdasan emosi,  dll.

Untuk menentukan validitas construct suatu instrument :
dengan proses penelaahan teoritis dari suatu konsep dari variabel yang hendak diukur.
Dengan penelaahan oleh para pakar.

Indikator-indikator dari construct  harus homogen, konsisten, dan konvergen  untuk mengukur construct dari variabel yang hendak diukur, dan indikator-indikator itu harus lengkap untuk mengukur suatu construct secara utuh.

Validitas empiris (validitas kriteria)
Adalah validitas yang ditentukan berdasarkan kriteria, baik kriteria internal maupun kriteria eksternal.

Validitas empiris ada 2 macam :
Validitas internal
Adalah validitas yang ditentukan berdasarkan criteria internal (dari instrumen atau test itu sendiri).
Validitas internal mempermasalahkan validitas butir atau item suatu instrumen dengan menggunakan hasil ukur instrumen tersebut sebagai suatu kesatuan sebagai kriteria.
Validitas internal = validitas butir

Validitas butir diperlihatkan oleh seberapa jauh hasil ukur butir tersebut konsisten dengan hasil ukur instrumen secara keseluruhan.

Validitas eksternal adalah validitas yang ditentukan berdasarkan   kriteria eksternal (hasil ukur instrumen atau test lain di luar dari instrumen atau test itu sendiri).

Kriteria eksternal itu dapat berupa hasil ukur instrumen baku atau yang dianggap baku, dapat pula hasil ukur lain yang sudah tersedia dan dapat dipercaya sebagai ukuran dari suatu konsep atau variabel yang hendak diukur.

Validitas eksternal dapat dibedakan lagi atas :
Validitas konkruen
Apabila criteria eksternal yang digunakan adalah ukuran atau penampilan saat ini atau saat bersamaan dengan pelaksanaan pengukuran.
Contoh : Menguji validitas test sumatif untuk mengukur penguasaan materi selama 1 semester dengan menggunakan hasil ulangan-ulangan  harian semester yang bersamaan sebagai criteria eksternal.

Validitas predictive
Apabila kriteria eksternal yang digunakan adalah ukuran atau penampilan masa yang akan datang.
Contoh : Menguji validitas test UMPTN dengan menggunakan IP semester 1 sebagai kriteria eksternal.   IP semester 1 merupakan penampilan masa yang akan datang pada saat pelaksanaan test masuk .  

RELIABILITAS

Reliabilitas berasal dari kata reliability yang berarti sejauh mana hasil suatu pengukuran dapat dipercaya.

Suatu hasil pengukuran dikatakan reliable atau dapat dipercaya bila dalam beberapa kali pengukuran  terhadap kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif sama, selama aspek yang diukur dalam diri subyek memang belum berubah.

Ada 3 konsep dalam reliabilitas :
1.  Konsistensi (tidak berubah-ubah),   nilai yang diberikan itu konstan.
    Ada 2 macam konsistensi, yaitu :

Konsistensi antar butir
- Makin tinggi konsistensi antar butir, maka reliabilitasnya makin tinggi.
- Makin tinggi nilai R, maka item-item nya makin konvergensi   dalam 
  mengukur hal-hal yang sama.
- Jadi test yang tidak bagus adalah jika item-itemnya terpencar.
- Hasil pengukuran data (skor tampak) -----> fakta
   mengukur yang sebenarnya ------> validitas
   tapi reliabilitas ----> konsistensi
Jika skor tampak dan skor murni makin dekat, berarti validitasnya makin tinggi

Konsistensi semua item (gabungan item)
Artinya hasil ukur item yang satu akan sama dengan hasil ukur item yang lain.

Skor butir dikotomi -----> KR-20

rii=k  1   ( Pi . qi
____     -_________
k – 1     St2

Skor butir kontinu

(=k -  1    .   1   -     ( Si 2
   k             St2

Keterangan :
K= banyaknya butir
Si2= varians skor butir I
Pi= proporsi jawaban benar butir I
qi= proporsi jawaban salah butir I
St2= varians skor total

2.Stability
Jika diukur hari ini, kemudian diukur lagi kepada sekelompok responden yang sama,  ternyata bedanya  kecil.  Atau jika dilakukan re-test (test ulang), bedanya kecil.
Jika kepada kelompok responden yang sama diberikan :
iPerangkat test yang sama dalam waktu yang berbeda, tapi kondisi waktunya sama, misal pagi hari ini dengan pagi esok
ii  Test ke dua kali, tapi tidak terjadi proses belajar, mksudnya setelah   test I tidak di treatment
iii Test ke 2 kalinya, dan tidak terjadi “ hallo efek”,  yaitu siswa tidak      diberitahu kalau akan ditest lagi

Maka test i dan test ii diukur korelasinya, jika korelasinya tinggi, berarti makin stabil.
Dalam stability ada konsistensi
Realibilitas, bisa ditunjukkan dengan equivalensi, misal :
Hasil ukur dengan no 1 –15 konsistensi dengan hasil ukur no 16 – 30
Korelasi paket A dan B mencirikan reliabilitas.
Reliabilitas konsistensi gabungan butir akan berhadapan dengan skor butir (mempersoalkan skor)

Misal dalam Test TPA, soalnya baru
Dikotomi----->  - tidak kontinu
- tidak ada skor ½ benar,  yang ada dikotomi 0    1

ALAT EVALUASI

Dalam pendidikan, alat evaluasi terdiri atas :
1. Tes
Tes adalah alat untuk mengukur pengetahuan atau penguasaan obyek ukur terhadap seperangkat konten atau materi tertentu. Jadi tes itu adalah kalau kita beri soal, lalu mereka menjawab dengan pengetahuan dan kemampuannya.
Tes (Performansi maksimum) adalah sebagai alat yang dipergunakan untuk mengukur pengetahuan atau penguasaan obyek ukur terhadap seperangkat konten atau materi tertentu. Tes merupakan sebagai alat ukur yang mempunyai standar obyektif sehingga dapat dipergunakan secara meluas, serta betul-betul dapat digunakan untuk mengukur dan membandingkan keadaan psikis atau tingkah laku individu. Jadi tes merupakan salah satu prosedur evaluasi yang komprehensif, sistematik, dan obyektif yang hasilnya dapat dijadikan dasar dalam pengambilan keputusan atas proses pengajaran yang dilakukan.

Jenis-jenis tes
- Tes pengetahuan yaitu : test hasil belajar
- Tes kemampuan yaitu : test achievement
Tes kemampuan adalah test pengetahuan digabung dengan tes          keterampilan (tes perbuatan)   

Fungsi tes :
Sebagai alat untuk mengukur prestasi belajar siswa
Yaitu alat untuk mengukur tingkat perkembangan atau kemajuan yang telah dicapai siswa setelah menempuh proses belajar mengajar dalam jangka waktu tertentu dan juga sebagai alat untuk mengukur keberhasilan program pengajaran.

Sebagai motivator dlam pembelajaran
Sebagai upaya untuk perbaikan kualitas pembelajaran.
Untuk menentukan berhasil tidaknya siswa sebagai syarat untuk melanjutkan pendidikan pada jenjang yang lebih tinggi.

2.Non - Tes
Merupakan alat evaluasi untuk mengukur variabel-variabel kuesioner, dan merupakan tes yang mudah.

ALAT EVALUASI NON TES

Sebenarnya ada 2 kelompok saja alat evaluasi non tes ini, yaitu :
1.Kuesioner
Dalam pengertian sempit, kuesioner merupakan daftar pertanyaan biasa.

2.Skala
Skala terbagi 2, yaitu :
Skala sikap, yaitu skala untuk mengukur variabel-variabel yang indikatornya tidak tampak, atau mengukur faktor internal individu (yang tidak tampak dari luar, yang tampak itu adalah akibatnya). Skala sikap mutlak diberikan langsung kepada responden yang bersangkutan.
Contoh skala sikap : lokus kontrol, konsep diri, kepuasan kerja.
Bagaimanan mengukur dengan skala ? Yang diskalakan itu adalah jawabannya.  Misal : skala sikap- sangat setuju, - setuju, - ragu-ragu, - tidak setuju, - sangat tidak setuju.
- ________________ +

Konsep pengukuran adalah memberikan kuantitas antara gejala yang diamati antara 2 kutub.
Pada masing-masing item (butir soal) harus bergradasi dari – ke +
Misal :
Masing-masing butir+-
SS51
S42
R33
TS24
STS15
Untuk skala sikap bisa juga menggunakan kategori  : - sangat baik, - baik , - …… dstnya. Atau juga dengan – sangat sering, - sering, - jarang, - kadang-kadang, - tak pernah.
Dalam  membuat skala sikap bisa dalam bentuk pertanyaan atau pernyataan. Kalau dalam bentuk pernyataan, responden berkedudukan sebagai orang pertama, tiap awal kalimat menggunakan kata Saya.  Tapi kalau dalam bnetuk pertanyaan, responden berkedudukan sebagai orang kedua,  jadi untuk responden menggunakan kata Anda, dan di akhiri dengan tanda tanya.  Untuk mendeteksi apakah pertanyaan valid atau tidak, lihat dari jawaban.

Skala penilaian, yaitu skala untuk mengukur variabel-variabel yang indikatornya tampak oleh orang lain (indikatornya konkrit).
Misalnya : kinerja guru, dapat diukur oleh orang-orang yang paling banyak terkait dengan guru.
Penulisan item-item harus disesuaikan dengan siapa yang menjadi respondennya.

(Drs Nurul Huda MPdI)

Tidak ada komentar:

Posting Komentar

Tentang hebatnya mengaji

Tentang hebatnya mengaji Ilmu Agama laksana air hujan menembus bumi, orang alim yang mengamalkan ilmunya laksana bumi yang subur. Orang yang...