KATA PENGANTAR
Puji syukur kehadirat
Tuhan Yang Maha Esa atas karunia dan rahmat-Nya sehingga makalah ini dapat terselesaikan dengan baik. Makalah ini disusun berdasarkan tugas yang telah diberikan
kepada kami sebagai tugas kelompok yang di dalamnya memuat latar belakang,
pembahasan, dan kesimpulan pembahasan dari makalah ini.
Dengan selesainya
makalah ini, kami mengucapkan terima kasih kepada Ibu dan Bapak Dosen mata
kuliah Evaluasi Hasil Belajar yang telah membimbing dalam penyusunan makalah
ini, dan kepada orang tua yang telah memberi motivasi selama pembuatan makalah
sehingga makalah dapat terselesaikan.
Dalam penyusunan
makalah ini, kami sudah berusaha semaksimal mungkin. Mohon maaf apabila masih
terdapat kesalahan-kesalahan atau kekurangan. Semoga makalah ini dapat
bermanfaat bagi mahasiswa lainnya juga bagi para pembaca umumnya.
Medan, September 2017
Penyusun,
DAFTAR ISI
BAB I
PENDAHULUAN
A. Latar Belakang
Evaluasi memiliki arti penting dalam kegiatan belajar mengajar yang
dilaksanakan oleh seorang guru. Diantara tujuan dari evaluasi adalah untuk
menilai ketercapaian tujuan pendidikan oleh anak didik, sarana untuk mengetahui
apa yang telah anak didik ketahui dalam kegiatan belajar mengajar, dan
memotivasi anak didik. Untuk mengevaluasi hasil belajar dan proses belajar
siswa, seorang guru menggunakan berbagai macam alat atau instrumen evaluasi
seperti tes tertulis, tes lisan, ceklis-observasi, angket-wawancara, dan
dokumentasi.
Keberhasilan
mengungkap hasil dan proses belajar ini sebagaimana adanya (objektivitas hasil
penilaian) sangat bergantung pada kualitas alat penilainya, di samping itu juga
yang tidak kalah pentingnya tergantung pada cara pelaksanaannya. Suatu alat
penilaian dikatakan mempunyai kualitas yang baik apabila alat tersebut memiliki
atau memenuhi dua hal, yaitu validitas (ketepatan) dan reliabilitas (ketetapan
atau keajegan) alat tes terjamin kualitasnya. Alat tes yang bagaimana dan
seperti apa yang dikatakan memiliki validitas dan reliabilias ini, selanjutnya
akan kita bahas dalam makalah ini berjudul “Validitas
Tas dan Reliabilitas Tes” ini.
B. Rumusan Masalah
Adapun
rumusan masalah yang ada didalam makalah ini yaitu:
1.
Apa dan
bagaimana validitas tes ?
2.
Apa dan
bagaimana Reliabilitas tes ?
C. Tujuan
Adapun
tujuan dari makalah ini yaitu:
1.
Untuk mengetahui
apa dan bagaimana validitas tes.
2.
Untuk mengetahui
apa dan bagaimana Reliabilitas tes.
BAB II
PEMBAHASAN
A. VALIDITAS TES
Validitas berasal dari kata validity yang
mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam
melakukan fungsi ukurnya (Azwar, 1986). Suatu skala atau instrumen pengukur
dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut
menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan
maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas
rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran.
Validitas tes biasa juga disebut sebagai kesahihan
suatu tes adalah mengacu pada kemampuan suatu tes untuk mengukur karakteristik
atau dimensi yang dimaksudkan untuk diukur. Valid berarti cocok
atau sesuai. Suatu tes dikatakan valid, apabila tes tersebut benar-benar
manyasar keapada apa yang dituju. Tes tersebut benar-benar dapat memberikan
keterangan atau gambaran tentang apa yang diinginkan. Jika tes itu bahasa, maka
tes tersebut harus diberikan gambaran tentang kemampuan dan kacakapan anak
dalam hal bahasa, dan bukan manunjukkan gambaran kecakapan anak dalam hal
ekonomi, ilmu bumi dan sebagainya. Guna menjelaskan pengertian valid ini, dapat
kita ambil contohnya jika kita ingin mengetahui berat dari suatu benda, maka
kita pergunakan alat pengukuran timbangan. Jika ingin mengetahui panjang
sesuatu, maka kita pergunakan alat pengukur meteran. Dan jika kita ingin
mengetahui suhu sesuatu, kita pergunakan alat pengukur thermometer.
Sifat
valid diperlihatkan oleh tingginya validitas hasil ukur suatu tes. Suatu alat
ukur yang tidak valid akan memberikan informasi yang keliru mengenai keadaan
subjek atau individu yang dikenai tes itu. Apabila informasi yang keliru itu
dengan sadar atau tidak dengan sadar digunakan sebagai dasar pertimbangan dalam
pengambilan suatu keputusan, maka keputusan itu tentu bukan merupakan suatu
keputusan yang tepat.
Jenis-Jenis Validitas Tes Secara Garis Besar
1.
Validitas isi (Content Validity)
Validitas
isi (Content Validity) adalah ketepatan suatu alat ukur ditinjau dari isi alat
ukur tersebut. Suatu alat ukur dikatakan memiliki validitas isi apabila isi atau materi atau bahan alat ukur
tersebut betul-betul merupakan bahan yang representatif terhadap bahan
pembelajaran yang diberikan. Artinya, isi alat ukur diperkirakan sesuai
dengan apa yang telah diajarkan berdasarkan kurikulum.
Cara
menyelidiki validitas isi alat ukur Matematika dapat dilakukan dengan
menggunakan pendapat suatu ‘panel’ yang terdiri dari ahli-ahli dalam bidang
matematika dan ahli-ahli dalam pengukuran. Bila cara tersebut sulit untuk
dilakukan, maka dapat dikerjakan dengan cara membandingkan materi alat ukur
tersebut dengan bahan-bahan dalam penyusunan alat ukur, dengan analisis
rasional. Apabila materi alat ukur cocok dengan materi penyusunan alat ukur,
berarti alat ukur tersebut memiliki validitas isi.
2.
Validitas Konstruksi (Construct
Validity)
Sebuah tes dikatakan memiliki
validitas konstruksi apabila butir-butir soal yang membangun tes tersebut
mengukur setiap aspek berfikir seperti yang disebutkan dalam tujuan
instruksional khusus. Dengan kata lain jika butir-butir soal mengukur aspek
berfikir tersebut sudah sesuai dengan aspek berfikir yang menjadi tujuan
instruksional.
Sebagai contoh jika rumusan Tujuan
Instruksional Khusus (TIK). “Siswa dapat membandingkan antara efek biologis dan
efek psikologis”, maka butir soal pada tes merupakan perintah agar siswa
membedakan anatar dua efek tersebut.
“Konstruksi” dalam pengertian ini
bukanlah “susunan” seperti yang sering dijumpai dalam teknik, tetapi merupakan
rekaan psikologis yaitu suatu rekaan yang dibuat oleh para ahli ilmu jiwa yang
dengan suatu cara tertentu “memerinci” isi jiwa atas beberapa aspek seperti
ingatan (pengetahuan), pemahaman, aplikasi dan seterusnya. Dalam hal ini,
mereka menganggap seolah-olah jiwa dapat dibagi-bagi. Tetapi sebenarnya tidak
demikian. Pembagian ini hanya merupakan tindakan sementara untuk mempermudah
mempelajari. Seperti halnya validitas isi, validitas konstruksi dapat diketahui
dengan cara memerinci dan memasangkan setiap butir soal dengan setiap aspek
dalam TIK. Pengerjaannya dilakukan berdasarkan logika bukan pengalaman.
Validitas isi dan validitas
konstruksi dapat dimasukkan kedalam logical validity, karena dalam penyusunan
soal tesnya mengacu kepada kriteria-kriteria yang secara teori dan logis harus
diperhatikan untuk mendapatkan tingkat validitas tinggi.
3.
Validitas Kesamaan (Concurent
Validity)
Alat
tes sebagai alat pengukur dapat dikatakan telah memiliki validitas kesamaan
apabila alat tes tersebut dalam kurun waktu yang sama dengan secara tepat mampu
menunjukkan adanya hubungan yang searah antara tes pertama dengan tes
berikutnya. Menurut Suharsimi, dalam hal ini alat tes
dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hal yang telah
lampau sehingga data pengalaman tersebut sekarang sudah ada.
4.
Validitas Prediksi/ Ramalan
Setiap kali kita menyebutkan istilah
“ramalan” maka didalamnya akan terkandung pengertian mengenai “sesuatu yang
bakal terjadi masa yang akan datang “ atau sesuatu yang pada saat sekarang
belum terjadi dan baru akan terjadi pada waktu-waktu yang akan datang. Apabila
istilah ramalan dikaitkan dengan validitas alat tes maka yang dimaksud dengan
validitas ramalan dari suatu alat tes adalah suatu kondisi yang menunjukkan
seberapa jauhkah sebuah alat tes dapat secara tepat menunjukkan kemampuannya
untuk meramalkan apa yang bakal terjadi pada masa yang akan datang.
5.
Kesahihan Tampang (Face Validity)
Kesahihan tampang ini
disebut juga dengan kesahihan semu, karena hasil yang ditunjukkan hanyalah
menyangkut “tampang” atau tampilan dari perangkat soal tes dikemas dengan baik,
seperti desain luar, format penulisan butir soal, jenis dan ukuran kertas yang
digunakan, dan sebagainya. Sedangkan criteria secara substansi isi soal dengan
kesesuaian perangkat soal tidak dibicarakan.
Sesahihan tampang ini
hanyalah untuk memberi kesan yang baik kepada peserta tes bahwa pelaksanaan
ujian dilakukan dengan serius, sehingga peserta tes juga akan berusaha dengan
sungguh-sungguh dalam mengerjakan soal.
Cara Mengetahui Validitas Alat Ukur
Sekali lagi diulangi bahwa sebuah
tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, dalam
arti memiliki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik
yang digunakan untuk mengetahui kesejajaran adalah teknik korelasi product
moment yang dikemukakan oleh Pearson dengan rumus:
Keterangan:
|
n
∑X
∑Y
∑XY
∑X2
∑Y2
|
: jumlah subyek atau
siswa
: jumlah skor X
: jumlah skor Y
: jumlah skor X dan Y
: jumlah skor X
dikuadratkan
: jumlah skor Y
dikuadratkan
|
Koefisien korelasi selalu terdapat -
antara 1,00 sampai + 1,00. Namun kerena dalam menghitung sering dilakukan
pembulatan angka-angka, sangat mungkin diperoleh koefisien lebih dari 1,00.
Koefisien negative menunjukkan hubungan kebalikan sedangkan koefisien positif
menunjukkan adanya kesejajaran untuk mengadakan interpretasi mengenai besarnya
koefisien korelasi adalah sebagai berikut:
·
Antara 0,800 sampai dengan 1,00 : sangat tinggi
·
Antara 0,600 sampai dengan 0,800 : tinggi
·
Antara 0,400 sampai dengan 0,600 : cukup
·
Antara 0,200 sampai dengan 0,400 : rendah
·
Antara 0,00 sampai dengan 0,200 : sangat rendah
Penafsiran harga koefisen korelasi
ada dua cara yaitu:
1.
Dengan melihat harga r dan diinterpretasikan misalnya
korelasi tinggi, cukup dan sebagainya.
2.
Dengan berkonsultasi ke table harga kritik r product
moment sehingga dapat diketahui signifikan tidaknya korelasi tersebut. Jika
harga r lebih kecil dari harga kritik dalam table, maka korelasi tersebut tidak
signifikan. Begitu juga arti sebaliknya.
Faktor-Faktor Yang Mempengaruhi Validitas Tes
1.
Pengaruh latar belakang kebudayaan siswa; seperti keadaan status ekonomi, perbedaan struktur
social (status social tinggi/rendah) perbedaan jenis kelamin tersebut akan
mempengaruhi validitas tes. Sebagai contoh tes inteligensi Binet simon, yang
dipersiapkan untuk anak-anak Eropa, akan tidak valid jika dikenakan terhadap
anak Indonesia yang mempunyai latar belakang kebudayaan/pengetahuan/kehidupan
yang berbeda-beda. Demikian juga apabila tes tersebut sama-sama dikenakan sama anak
desa, barangkali akan memberikan hasil rata-rata yang berbeda, apabila
group/kelompok yang diatas tersebut terdiri anak-anak yang mempunyai status
social ekonomi rendah. Perbedaan tersebut disebabkan antara lain disamping
perbedaan-perbedaan latar belakang social ekonomi akan berpengaruh terhadap
pembentukan pola tingkah laku anak, juga akan berpengaruh terhadap persepsi
anak dan pola responnya dalam menanggapi suatu masalah.
2.
Keadaan tipe tes;
tiap-tiap tes akan berpengaruh terhadap validitas jawaban anak. Tes subjektif (Essay test) akan mempunyai validitas
yang berbeda dibandingkan dengan tes objektif. Tes subjektif akan mempunyai
validitas yang lebih rendah, karena dengan tes subjektif kurang dapat
mengungkapkan materi tes secara tuntas dibandingkan dengan tes objektif.
Demikian juga diantara macam-macam tipe tes objektif, tes yang terdiri dari 2
alternatif (benar-salah, setuju-tidak setuju) akan mempunyai validitas yang
lebih rendah dibandingkan dengan tes objektif tipe pilihan ganda. Hal itu
disebabkan karena tes benar salah mempunyai tendensi untuk menerka-nerka yang
lebih besar dibandingkan tes pilihan ganda.
3.
Usaha menambah butir soal dengan maksud ingin
mempertinggi reliabilitas tes;
memang salah satu cara untuk mempertinggi reliabilitas tes adalah dengan
menambah butir-butir soal tes secara otomatis akan dapat mempertinggi
reliabilitas, salahnya justru akan dapat merendahkan validitas tes. Oleh karena
itu jika ingin meningkatkan reliabilitas tes dengan tidak akan merendahkan
validitas tes, hendaknya penambahan butir-butir soal tes tersebut dengan
menambahkan faktor-faktor baru dari materi tesnya, karena hal itu berarti
memperbanyak/memeprbesar sampel bahan tes.
4.
Kurang jelasnya petunjuk mengerjakan tes; adanya petunjuk/pengarahan bagaimana cara
mengerjakan tes dimaksudkan agar tidak terjadi kesalahan-kesalahan interpretasi
tentang bagaimana cara mengerjakan tes tersebut. Jika petunjuknya kurang jelas,
akan terjadi siswa yang memperoleh skor rendah tersebut barangkali disebabkan
karena mengalami kesulitan dalam menginterpretasi petunjuknya, bukan karena
tidak menguasai materinya.
Contoh
1: Mengetahui Validitas Tes Perbutir soal
Tabel Analisis
Soal Untuk Perhitungan Validitas Tes
No
|
Nama Siswa
|
Butir Soal
|
Skor Total
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|||
1
|
Ain aydira
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
0
|
1
|
8
|
2
|
Bunga Rizki
|
1
|
1
|
0
|
0
|
1
|
1
|
1
|
0
|
1
|
1
|
7
|
3
|
Bunga Rizka
|
0
|
1
|
1
|
0
|
0
|
1
|
0
|
1
|
0
|
1
|
5
|
4
|
Heri Irmada Sri Windari Ginting
|
1
|
0
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
0
|
7
|
5
|
M. Abdul Goffur
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
8
|
6
|
Puja
|
0
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
1
|
6
|
7
|
Pujianti
|
1
|
1
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
8
|
8
|
Roslinda wati
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
7
|
9
|
Sri Malemna Barus
|
1
|
1
|
1
|
1
|
0
|
0
|
1
|
0
|
1
|
1
|
7
|
10
|
Susi Susanti
|
0
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
0
|
0
|
6
|
Untuk menghitung validitas soal terlebih dahulu
membuat tabel persiapannya. Misalnya menghitung validitas soal no.4, maka:
No
|
Nama Siswa
|
Soal No.3
|
Skor Total
|
X2
|
Y2
|
XY
|
(X)
|
(Y)
|
|||||
1
|
Ain aydira
|
1
|
8
|
1
|
64
|
8
|
2
|
Bunga Rizki
|
0
|
7
|
0
|
49
|
0
|
3
|
Bunga Rizka
|
0
|
5
|
0
|
25
|
0
|
4
|
Heri Irmada Sri Windari Ginting
|
1
|
7
|
1
|
49
|
7
|
5
|
M. Abdul Goffur
|
1
|
8
|
1
|
64
|
8
|
6
|
Puja
|
0
|
6
|
0
|
36
|
0
|
7
|
Pujianti
|
1
|
8
|
1
|
64
|
8
|
8
|
Roslinda wati
|
1
|
7
|
1
|
49
|
7
|
9
|
Sri Malemna Barus
|
1
|
7
|
1
|
49
|
7
|
10
|
Susi Susanti
|
1
|
6
|
1
|
36
|
6
|
n= 10
|
7
|
69
|
7
|
485
|
51
|
Koefesien validitas
soal no.4 yaitu 0,624. Validitas soal tersebut meyakinkan karena berada pada
validitas tinggi.
Contoh
2: Mengetahui Validitas Tes Buatan Guru Dengan
Tes Yang Sudah Valid Dengan Mata Pelajaran Yang Sama
No
|
Nama Siswa
|
Skor Tes
Buatan Guru (X)
|
Skor Tes yang
Dipandang Valid (Y)
|
X2
|
Y2
|
XY
|
1
|
Ain aydira
|
8
|
9
|
64
|
81
|
72
|
2
|
Bunga Rizki
|
7
|
8
|
49
|
64
|
56
|
3
|
Bunga Rizka
|
5
|
7
|
25
|
49
|
35
|
4
|
Heri Irmada Sri Windari Ginting
|
7
|
8
|
49
|
64
|
56
|
5
|
M. Abdul Goffur
|
8
|
8
|
64
|
64
|
64
|
6
|
Puja
|
6
|
7
|
36
|
49
|
42
|
7
|
Pujianti
|
8
|
8
|
64
|
64
|
64
|
8
|
Roslinda wati
|
7
|
8
|
49
|
64
|
56
|
9
|
Sri Malemna Barus
|
7
|
8
|
49
|
64
|
56
|
10
|
Susi Susanti
|
6
|
7
|
36
|
49
|
42
|
n= 10
|
69
|
78
|
485
|
612
|
543
|
Indeks koefesien
korelasi (r) = 0,8480 jika dikomfirmasi dengan r tabel (rt) dengan
N=10, pada tarif signifikansi 99% diperoleh 0,7646 atau (re > rt).
Ini berarti bahwa ada korelasi yang signifikan antara hasil tes buatan guru
dengan hasil tes yang valid atau standar. Kesimpulannya ialan bahwa tes buatan
guru yang dicari validitasnya dapat dinyatakan valid.
B. RELIABILITAS TES
Kata reliabillitas
dalam bahasa Indonesia di ambil dari reliability dalam bahasa inggris, berasal
dari kata, reliable yang artinya dapat dipercaya. “reliabilitas” merupakan kata
benda, sedangkan “reliable” merupakan kata sifat atau keadaan.
Reliabilitas merupakan
penerjemahan dari kata reliability yang mempunyai asal kata rely dan ability.
Pengukuran yang memiliki reliabilitas tinggi disebut sebagai pengukuran yang
reliabel (reliable).Walaupun reliabilitas mempunyai berbagai arti seperti
kepercayaan, keterandalan, keajegan, kestabilan dan konsistensi, namun ide pokok
yang terkandung dalam konsep reliabilitas adalah sejauh mana hasil pengukuran
dapat dipercaya.
Dari beberapa
pengertian di atas jadi reliabilitas tes marupakan suatu alat ukur yang
digunakan untuk mengetahui konsistensi pengukuran tes yang hasilnya menunjukan
keajegan.Seorang dikatakan dapat dipercaya apabila orang tersebut berbicara
ajeg, tidak berubah-ubah pembicaraannya dari waktu ke waktu.Dalam sebuah tes
pentingnya diamati keajegan dan kepastian tes tersebut dilihat dari hasil tes
yang didapat.
Dengan demikian
reliabilitas dalam evaluasi pembelajaran merupakan sifat yang ada pada data
atau skor yang dihasilkan oleh instrumen, namun untuk memudahkan, reliabilitas
dapat dikatakan merupakan sifat dari instrumen juga. Maksudnya reliabilitas
bukanlah bersifat dikotomis, tetapi merupakan rentangan yang biasanya
dinyatakan dalam bentuk angka 0 – 1.
Cara Mencari Besarnya Reliabilitas
Beberapa metode yang dapat digunakan untuk mencari besarnya reliabilitas
antara lain:
1.
Metode Test-Retest
Untuk
menentukan reliabilitas tes dengan menggunakan metode test-retest, satu perangkat tes dilakukan dua kali terhadap
kelompok siswa yang sama dalam waktu yang berbeda. Kedua hasil tes
dikorelasikan, koefisien korelasi yang diperoleh menyatakan tingkat reliabilitas
tes. Semakin tinggi koefisien korelasi yang diperoleh, tes semakin stabil
dengan demikian skor siswa pada kedua tes tersebut cenderung tetap, atau
konsisten. Interpretasi reliabilitas instrumen untuk hal ini yaitu:
Besarnya Nilai r
|
Interpretasi
|
0,80 - 1,00
|
tinggi
|
0,60 - 0,80
|
cukup
|
0,20 - 0,60
|
agak rendah
|
0,00 - 0,20
|
rendah
|
Contoh
perhitungan reliabilitas tes-retest bentuk soal objektif tes
No Urut
|
Perolehan skor siswa
|
XY
|
X2
|
Y2
|
|
Siswa
|
tes pertama (X)
|
tes kedua (Y)
|
|||
1
|
45
|
47
|
2115
|
2025
|
2209
|
2
|
22
|
25
|
550
|
484
|
625
|
3
|
42
|
38
|
1596
|
1764
|
1444
|
4
|
35
|
37
|
1295
|
1225
|
1369
|
5
|
36
|
38
|
1368
|
1296
|
1444
|
6
|
33
|
30
|
990
|
1089
|
900
|
7
|
23
|
26
|
598
|
529
|
676
|
8
|
38
|
33
|
1254
|
1444
|
1089
|
9
|
26
|
30
|
780
|
676
|
900
|
10
|
40
|
42
|
1680
|
1600
|
1764
|
11
|
29
|
28
|
812
|
841
|
784
|
12
|
33
|
33
|
1089
|
1089
|
1089
|
13
|
41
|
43
|
1763
|
1681
|
1849
|
14
|
37
|
39
|
1443
|
1369
|
1521
|
15
|
36
|
36
|
1296
|
1296
|
1296
|
16
|
32
|
26
|
832
|
1024
|
676
|
17
|
38
|
35
|
1330
|
1444
|
1225
|
18
|
33
|
36
|
1188
|
1089
|
1296
|
19
|
44
|
45
|
1980
|
1936
|
2025
|
20
|
34
|
36
|
1224
|
1156
|
1296
|
21
|
41
|
42
|
1722
|
1681
|
1764
|
22
|
38
|
36
|
1368
|
1444
|
1296
|
23
|
35
|
36
|
1260
|
1225
|
1296
|
24
|
43
|
45
|
1935
|
1849
|
2025
|
25
|
37
|
39
|
1443
|
1369
|
1521
|
26
|
33
|
35
|
1155
|
1089
|
1225
|
27
|
14
|
24
|
336
|
196
|
576
|
28
|
23
|
28
|
644
|
529
|
784
|
29
|
32
|
38
|
1216
|
1024
|
1444
|
30
|
44
|
46
|
2024
|
1936
|
2116
|
jumlah
|
1037
|
1072
|
38286
|
37399
|
39524
|
n = 30
|
Formula yang digunakan
adalah:
Penyelelesaian:
2.
Metode Belah Dua (Split-Half Method)
Dengan menggunakan satu
perangkat tes yang dilakukan satu kali tes dapat juga ditentukan koefisien
dengan cara membangi dua tes tersebut. Jadi satu perangkat tes dibagi dua,
kedua skor tes dianggap dua macam tes yang paralel. Pembagian biasanya
dilakukan dengan patokan nomor soal ganjil dan nomor soal genap. Hal ini
dilakukan karena biasanya perangkat tes disusun mulai butir soal yang mudah
menuju butir soal yang sukar. Jadi akan diperoleh satu set soal bernomor ganjil
dan satu set lainnya bernomor genap. Kedua skor tes ini dikorelasikan, dan
hasil korelasi menunjukkan koefisien reabilitas. Namun demikian perlu
diperhatikan bahwa reliabilitas dengan teknik ini sangat relative karena
reliabilitas sangat tergantung pada cara penomoran dan pengelompokkan butir-butir
soal yang disusun. Cara perhitungan reliabilitas dengan belah dua sama seperti
perhitungan metode tes-retest.
Contoh perhitungan
reliabilitas split half bentuk soal objektif tes
No Urut
|
Ganjil (X)
|
Total Skor
|
||||
Siswa
|
1
|
3
|
5
|
7
|
9
|
|
1
|
1
|
1
|
1
|
1
|
0
|
4
|
2
|
1
|
0
|
1
|
1
|
1
|
4
|
3
|
1
|
1
|
0
|
1
|
1
|
4
|
4
|
0
|
1
|
1
|
0
|
1
|
3
|
5
|
1
|
1
|
1
|
1
|
0
|
4
|
6
|
1
|
0
|
1
|
1
|
1
|
4
|
7
|
1
|
1
|
1
|
0
|
1
|
4
|
8
|
0
|
1
|
1
|
1
|
1
|
4
|
9
|
0
|
1
|
0
|
1
|
1
|
3
|
10
|
1
|
0
|
1
|
1
|
1
|
4
|
No Urut
|
Genap (Y)
|
Total Skor
|
||||
Siswa
|
2
|
4
|
6
|
8
|
10
|
|
1
|
1
|
1
|
0
|
1
|
1
|
4
|
2
|
1
|
1
|
1
|
1
|
1
|
5
|
3
|
1
|
1
|
0
|
1
|
0
|
3
|
4
|
1
|
1
|
1
|
1
|
1
|
5
|
5
|
0
|
0
|
1
|
0
|
1
|
2
|
6
|
1
|
1
|
1
|
1
|
1
|
5
|
7
|
1
|
1
|
1
|
1
|
1
|
5
|
8
|
1
|
1
|
1
|
1
|
1
|
5
|
9
|
1
|
1
|
0
|
1
|
1
|
4
|
10
|
1
|
1
|
1
|
1
|
1
|
5
|
No Urut
|
Skor Soal
|
XY
|
X2
|
Y2
|
|
Siswa
|
Ganjil (X)
|
Genap (Y)
|
|||
1
|
4
|
4
|
16
|
16
|
16
|
2
|
4
|
5
|
20
|
16
|
25
|
3
|
4
|
3
|
12
|
16
|
9
|
4
|
3
|
5
|
15
|
9
|
25
|
5
|
4
|
2
|
8
|
16
|
4
|
6
|
4
|
5
|
20
|
16
|
25
|
7
|
4
|
5
|
20
|
16
|
25
|
8
|
4
|
5
|
20
|
16
|
25
|
9
|
3
|
4
|
12
|
9
|
16
|
10
|
4
|
5
|
20
|
16
|
25
|
Jumlah
|
38
|
43
|
163
|
146
|
195
|
3.
Metode Kuder-Richardson
Metode Kuder-Richardson
ini adalah pengembangan dari metode split-half, tetapi pada metode ini tidak
dibelah dua, melainkan didasarkan pada proporsi siswa yang menjawab benar dan
standar deviasi skor. Caranya adalah dengan mengkorelasikan skor-skor setiap
butir dengan skor total keseluruhan tes.
Rumus yang
dikemukanakan oleh Kuder-Richardson adalah sebagai berikut:
Keterangan
:
|
|
:
koevisien reliabilitas yang dicari
|
|
|
: varians
skor total
|
|
p
|
: proporsi
siswa yang menjawab benar
|
|
q
|
: 1 – p
|
|
pq
|
: hasil
perkalian p dan q
|
|
n
|
: jumlah
butir soal
|
Dengan mengacu pada soal reliabilitas split half maka reliabilitas perangkat
soal dapat diketahui sebagai berikut:
No Urut
|
Skor Soal
|
X
|
X2
|
|||||||||
Siswa
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
||
1
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
0
|
1
|
8
|
64
|
2
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
9
|
81
|
3
|
1
|
1
|
1
|
1
|
0
|
0
|
1
|
1
|
1
|
0
|
7
|
49
|
4
|
0
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
8
|
64
|
5
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
0
|
0
|
1
|
6
|
36
|
6
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
9
|
81
|
7
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
9
|
81
|
8
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
9
|
81
|
9
|
0
|
1
|
1
|
1
|
0
|
0
|
1
|
1
|
1
|
1
|
7
|
49
|
10
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
9
|
81
|
Jumlah
|
7
|
9
|
7
|
9
|
8
|
7
|
8
|
9
|
8
|
9
|
81
|
667
|
P
|
0,7
|
0,9
|
0,7
|
0,9
|
0,8
|
0,7
|
0,8
|
0,9
|
0,8
|
0,9
|
|
|
Q
|
0,3
|
0,1
|
0,3
|
0,1
|
0,2
|
0,3
|
0,2
|
0,1
|
0,2
|
0,1
|
|
|
Pq
|
0,21
|
0,09
|
0,21
|
0,1
|
0,2
|
0,21
|
0,2
|
0,09
|
0,2
|
0,09
|
1,47
|
·
Skor Rata-Rata Total
= 8,1
·
Varians Skor Total
·
Koevisien Reliabilitas
Koefisien korelasi berada antara 0 – 1.
Suatu instrumen penilaian dikatakan reliabel jika koefisien korelasinya ≥ 0,6,
makin tinggi koefisien korelasi makin reliabel instrumen tersebut, dan
sebaliknya. Instrumen penilaian yang di jadikan contoh termasuk kategori
instrumen yang kurang baik karena tidak reliabel. Untuk menjadikan instrumen
tersebut reliabel maka validitas butir yang tidak baik dibuang atau diganti.
Instrumen yang valid pasti reliabel, tetapi instrumen yang reliabel belum tentu
valid.
4.
Metode Equivalent-form Atau Pararel
Metode paralel dipilih apabila tidak
diinginkan mengujikan dua kali. Metode paralel dilakukan dengan cara menyusun
dua instrumen yang hampir sama (equivalent), kemudian di ujicobakan pada
sekelompok responden yang sama (responden mengerjakan dua kali) kemudian dari
hasil ujicoba tersebut dikorelasikan dengan teknik korelasi product moment.
Metode ini umumnya untuk menguji reliabilitas instrument bentuk tes (Eko Putro.
Widoyoko. 2012 : 158).
Instrumen paralel atau ekuivalen
adalah dua buah instrumen yang mempunyai kesamaan tujuan, tingkat kesulitan dan
susunan, tetapi butir – butir pertayaan/peryataan berbeda. Untuk menentukan
apakah intrument tersebut reliabel atau tidak, koefisien korelasi hasil
perhitungan atau “r hitung”(rh) dikonsultasi dengan “r tabel” (rt)
dalam tabel korelasi product moment. (rh ≥ rt)
maka diartikan ada korelasi yang signifikan dan intrument dianggap reliabel.
Sebaliknya (rt < rh) maka diartikan tidak ada korelasi
yang signifikan, maka kesimpulan instrumen dianggap tidak reliabel.
Faktor-Faktor Yang Mempengaruhi Reliabilitas
Reliabilitas dapat dipengaruhi oleh waktu
penyelenggaran tes-retes. Interval penyelengaraan yang terlalu dekat atau jauh,
akan mempengruhi koefisien reliabilitas. Faktor-factor lain yang mempengaruhi
di antaranya;
1. Panjang test; semakin panjang test evaluasi, semakin banyak jumlah item materi
pembelajaran diukur. Ini menunjukan dua kemungkinan yaitu test semakin
mendekati kebenaran, dan dalam memgikuti test, semakin kecil siswa
menebak. Berarti semakin tinggi koefisien reliabilitas.
2. Penyebaran skor; koefisien reliabiltas secara langsung dipengeruhioleh bentuk sebaranskor
dalam kelompok siswa yang diukur. Semakin tinggi sebaran semakin tingi estimasi
koefisien reliabilitas. Hal ini tejadi karena posisi skor siswa, secara
individual mempunyai kedudukan sama pada tes retest lain,sebagai acuan.
3. Kesulitan test; test normative yang terlalu mudah atau terlalu sulitskor untuk siswa
cenderung menghasilkan reliabilitas rendah. Fenomena tersebut, akan
menghasilkan sebaran skor yang cenderung terbatas pada salah satu sisi. Untuk
test yang terlalu mudah skor jawaban siswa akan mengumpul ada sisi atas, untuk
tes terlalu sulit skor jawaban siswa akan cenderung mengumpul pada ujung bawah.
Dua kejadian tersebut mempunyai kesamaan yaitu bahwa perbedaan di antara
individu adalah kecil dan cenderung tidak relevan.
4. Objektivitas; yang di maksud objekif yaitu derajat dimana siswa dengan kompetensi sama
mencapai hasil sama. Ketika prosedur test evaluasi memiliki objektivitas
tinggi, maka reliabilitas test tidak dipengaruhi oleh prosedur teknik
penskoran. Item test objektif yang dihasilkan tidak dipengaruhi pertimbangan
atau opini seorang evaluator.
BAB III
PENUTUP
Kesimpulan
Validitas
tes biasa juga disebut sebagai kesahihan suatu tes adalah mengacu pada kemampuan
suatu tes untuk mengukur karakteristik atau dimensi yang dimaksudkan untuk
diukur. Valid berarti cocok atau sesuai. Suatu tes dikatakan valid, apabila tes
tersebut benar-benar manyasar keapada apa yang dituju. Jenis-jenis validitas
tes secara garis besar:
·
Validitas isi
(Content Validity)
·
Validitas Konstruksi (Construct Validity)
·
Validitas Kesamaan (Concurent Validity)
·
Validitas Prediksi/
Ramalan
·
Kesahihan Tampang (Face Validity)
Faktor-Faktor
Yang Mempengaruhi Validitas Tes
·
Pengaruh latar
belakang kebudayaan siswa
·
Keadaan tipe tes
·
Usaha menambah
butir soal dengan maksud ingin mempertinggi reliabilitas tes
·
Kurang jelasnya
petunjuk mengerjakan tes
Reliabilitas merupakan penerjemahan dari kata reliability yang mempunyai
asal kata rely dan ability. Pengukuran yang memiliki reliabilitas tinggi
disebut sebagai pengukuran yang reliabel (reliable).Walaupun reliabilitas
mempunyai berbagai arti seperti kepercayaan, keterandalan, keajegan, kestabilan
dan konsistensi, namun ide pokok yang terkandung dalam konsep reliabilitas
adalah sejauh mana hasil pengukuran dapat dipercaya.
Beberapa metode yang dapat
digunakan untuk mencari besarnya reliabilitas antara lain:
·
Metode Test-Retest
·
Metode Belah Dua (Split-Half Method)
·
Metode Kuder-Richardson
·
Metode Equivalent-form
Atau Pararel
Faktor-Faktor Yang Mempengaruhi Reliabilitas
·
Panjang test
·
Penyebaran skor
·
Kesulitan test
·
Objektivitas
DAFTAR PUSTAKA
Bahan
Pembelajaran Evaluasi Pembelajaran Oleh Tim Dosen KDBK
If you're trying hard to lose kilograms then you absolutely have to get on this totally brand new custom keto meal plan diet.
BalasHapusTo create this keto diet, certified nutritionists, personal trainers, and professional cooks joined together to develop keto meal plans that are useful, painless, cost-efficient, and fun.
Since their first launch in 2019, hundreds of people have already transformed their figure and health with the benefits a proper keto meal plan diet can offer.
Speaking of benefits; clicking this link, you'll discover 8 scientifically-confirmed ones provided by the keto meal plan diet.