4 Juli 2011

latihan UAS Pengembangan Evaluasi Pendidikan

di 17.43
Reaksi: 


LATIHAN SOAL KULIAH BAGIAN II PEP


1.      Coba saudara jelaskan secara singkat-padat mengapa dalam rangka penerimaan mahasiswa baru, Tes Seleksi Perguruan Tinggi perlu diselenggarakan!

2.      Jelaskan secara singkat-padat persamaan/ perbedaan validitas ramalan dan validitas bandingan, dari segi tujuan tes, pembuat/ perancang tes, waktu penyelenggaraan tes dan teknik analisis yang dipakai!

3.      Dalam suatu kegiatan penelitian dalam rangka menguji reliabilitas tes, berdasarkan hasil output program SPSS diperoleh koefisien reliabilitas tes (alpha) sebesar 0,76. Coba saudara analisis, apa makna koefisien reliabilitas tes tsb.

4.      Apabila diketahui jumlah peserta tes ada 90 orang dan yang mengerjakan dengan betul butir soal nomor 1 Tes Objektif ada 60 orang:
a. Berapakah P (Indeks Kesukaran Soal) nomor 1?
b. Berikan kesimpulan saudara terhadap tingkat kesukaran butir nomor 1 di atas, berdasarkan hasil
    perhitungan pada poin a.

5.      Di bawah ini adalah tabel penyebaran skor hasil belajar Ibadah dari 10 orang siswa MTs Negeri Yogyakarta II:

Tabel penyebaran skor hasil belajar Ibadah dari 10 orang siswa MTs Negeri Yogyakarta II:


NO

NAMA
          SKOR  UNTUK  BUTIR  SOAL  NOMOR :


Xt
1
2
3
4
5
6
7
8
9
10

1

AHMAD

1

0

1

0

1

1

0

1

0

0
5
2
BEJO
0
0
0
1
0
0
1
0
1
1
4
3
CINTA
1
1
1
1
1
1
1
1
1
1
10
4
DEA
0
0
1
1
0
0
0
0
1
0
3
5
EVI
0
0
0
0
0
1
1
1
1
1
5
6
FARHAN
1
0
1
1
1
0
0
1
1
1
7
7
GUNAWAN
1
1
1
0
0
1
1
1
1
1
8
8
HIMAWAN
1
0
1
1
1
1
1
1
1
1
9
9
INDRA
1
0
1
0
1
1
0
1
1
1
7
10
JOJON
1
0
1
0
0
0
0
0
0
0
2
Total
     10= N
7
2
8
5
5
6
5
7
8
7
60=
∑Xt

Berdasarkan data di atas, hitunglah Indeks Tingkat Kesukaran Soal untuk butir nomor: 4 dan berikan kesimpulan saudara!

6.   Berdasarkan tabel penyebaran skor di atas, apakah benar bahwa butir soal nomor 1 sudah memiliki daya pembeda yang baik? Buktikan!

7.  THB bentuk uraian dalam mata pelajaran Al Quran Hadits yang  diikuti oleh 6 orang siswa MAN dengan jumlah butir soal sebanyak 5 butir. Skor hasil tes tertuang dalam tabel di bawah ini:



   Tabel   Nilai THB 6 orang siswa MAN dalam mata pelajaran Al Quran Hadits

Nama Testee
Skor untuk Butir Nomor:
1
2
3
4
5
A
8
5
9
3
6
B
3
9
4
8
3
C
9
10
8
5
8
D
4
5
3
7
4
E
8
8
5
9
3
F
6
6
6
6
6
   
    Apabila skor maksimum untuk tiap-tiap butir soal apabila testee menjawab betul  (jawaban sempurna
   100%) = 10, maka tentukanlah:
   a. Tingkat kesukaran butir soal nomor 1, dan;
   b. Daya beda butir nomor 4

8.  Apabila jumlah peserta tes ada 20 orang dan total skor jawaban betul butir soal nomor 1 Tes Subjektif/ Uraian= 130, dan skor maksimum apabila testee menjawab betul untuk tiap-tiap butir soal (jawaban sempurna 100%) = 10, maka, berapakah indeks tingkat kesukaran butir soal butir nomor 1 tersebut, serta beri kesimpulan saudara!:

 9. Tes objektif pilihan ganda 5 pilihan (A, B, C, D, E) terdiri dari 50 butir soal, setiap jawaban betul diberi skor= 1, dan jawaban salah diberi skor= 0. Setelah tes berakhir, diperoleh penyebaran pilihan jawaban yang dipilih oleh siswa, sbb:

Nomor Butir Item
Alternatif (Option)

Keterangan
A
B
C
D
E

1

(45)

1

2

1

1


2

5

9

11

(22)  

3
(  ): kunci jawaban.

     Apabila jumlah peserta tes 50 orang (N= 50), lakukanlah penganalisisan terhadap fungsi distraktor untuk  
     butir nomor 1!

10.                                     Item Statistics                                Alternative Statsistics           
                                  -----------------------------------           -----------------------------------------------------------------      
         Seq       Scale      Prop.       Biser.    Point                           Prop.                         Point
         No.     –Item     Coprrect                 Biser .        Alt.      Endorsing       Biser        Biser.    Key
         -----     --------      -----------     --------   ---------        --------      -------------     ----------             ----------  -----

            1        0-1         0.180      0.423     0.289          A          0.060        -0.172         0.086 
                                                                                    B          0.120        -0.124         -0.076 
                                                                                    C          0.180         0.423          0.289        *
                                                                                    D          0.400        -0.167         -0.132
                                                                                    E          0.230        -0.043         -0.031

     Berdasarkan hasil output di atas, coba saudara analisis butir nomor 1 di atas, dari segi:
     a. Tingkat kesukaran soal
           b. Daya pembeda butir
           c. Fungsi Distraktor

11 . Di bawah ini adalah hasil penampilan diskusi kelas siswa kelas VIII dalam mata pelajaran Akhlaq: 

              Indikator
Nama
Aspek penilaian

Jumlah
A
B
C
D
E

Amanah

4

3

5

4

5

21

Fauziah

5

4

4

5

4

22

        Munir

5

5

4

4

5

23

        Dst.






   Ket:                                                  Skala Penilaian: Skala Likert dengan 5 skala, yaitu:
   A. Aktif tanya                      Skor:    5 = Sangat baik          
               B. Aktif jawab                                 4 = Baik
               C. Mengemukakan ide                     3 = Sedang
               D. Menanggapi ide                          2 = kurang
               E. Jalinan Komunikasi                     1 = Sangat kurang
    Soal:
    a. Buatlah pedoman penafsiran terhadap hasil diskusi kelas di atas!
    b. Skor total Munir dalam penampilan diskusi tersebut= 23, bagaimanakah penampilan Munir dalam
        diskusi kelas tersebut ?
12. Diketahui soal tes objektif pilihan ganda terdiri dari 40 butir, jumlah pilihan (option) jawaban sebanyak 4 pilihan (A, B, C, dan D). Apabila Ali  menjawab benar 20 butir, jawaban salah 12, dan tidak dijawab 8, maka berapakah  skor yang diperoleh Ali apabila dalam pemberian skor:
      a. Menerapkan denda terhadap jawaban tebakan/ salah?
      b. Tanpa menerapkan denda terhadap jawaban tebakan/  salah?
13. Diketahui soal tes  bentuk jawaban singkat dengan jumlah soal sebanyak 20. Apabila jumlah jawaban  benar yang diperoleh Zahra sebanyak 18 butir, berapakah skor yang diperoleh Zahra?
14. Tes objektif pilihan ganda dengan jumlah soal sebanyak 40 butir dan tiap jawaban benar diberi skor= 1. Apabila penilaianmenggunakan acuan PAP (penilaian beracuan patokan),  maka berapakah nilai Amir apabila menjawab betul 30 butir soal.
15. Di bawah ini adalah hasil tes formatif Tarikh siswa kelas VIII MTs. Tes terdiri dari 5 butir soal uraian,
      apabila skor maksimum tiap-tiap butir soal (apabila jawaban betul sempurna) = 5: 

            Skor
Nama
Butir Nomor:

Jumlah
1
2
3
4
5

Amanah

5

5

5

4

5

24

Fauziah

5

4

4

5

4

22

        Munir

4

3

4

4

5

20

        Dst.







     Apabila penilaian menggunakan acuan PAP (penilaian beracuan patokan),  maka berapakah nilai  yang diperoleh Amanah?

16. Siswa kelas XI SMA diberi tes PAI dengan menggunakan bentuk pilihan ganda sebanyak 60  pertanyaan. Setiap pertanyaan  yang dijawab benar diberi skor satu (= 1).
      Apabila nilai rata-rata kelas= 25, dan simpangan baku (S) adalah 8,0, tentukan:
      a. Batas lulus (actual) siswa yang dinyatakan tuntas dalam belajar!
      b. Batas lulus ideal siswa yang dinyatakan tuntas dalam belajar!
      c. Batas lulus purposifl siswa yang dinyatakan tuntas dalam belajar!
PENYELESAIAN SOAL:

NO. 3:
Suatu instrumen dinyatakan telah memiliki reliabilitas apabila instrumen tersebut telah memiliki koefisien reliabilitas tes minimal sebesar 0,70. Berdasarkan print=out hasil SPSS, diketahui koefisien reliabilitas Alpha sebesar 0,76, berarti tes tersebut telah memiliki reliabilitas tes (reliabel).

NO. 4:
Diketahui:
-    Jumlah testee         = 90 orang
-    Jumlah testee yg menjawab betul butir nomor 1   = 60 orang, berarti:
a) Tingkat kesukaran (P): 60/90 = 0,75
b) Interpretasi: dengan P sebesar 0,75, berarti butir soal nomor 1 termasuk butir yang terlalu mudah,   
    karena besar P di atas 0,70 (lihat tabel interpretasi L Thorndike & Elizabeth Hagen)

NO. 5:
Berdasarkan penyebaran skor jawaban betul pada data di atas, diketahui:
-          Jumlah testee= 10 orang;
-          Jumlah testee yg menjawab betul butir nomor 4= 5 orang, berarti:
Tingkat kesulitan (P) butir soal nomor 4 sebesar:    P= 5/10 = 0,5; dengan P sebesar 0,5, berarti butir soal nomor 4 memiliki tingkat kesulitan sedang, yaitu antara 0,30 – 0,70 (lihat tabel interpretasi L Thorndike & Elizabeth Hagen)

NO. 6: Berdasarkan data penyebaran skor dari 10 orang testee di atas;
a) Kita kelompokkan menjadi 2 kelompok, karena jumlah testee 10 orang (N= 10), maka
    - testee kelompok atas (½ dari jumlah testee= 5 orang= ranking 1 s.d. 5) dan
    - testee kelompok bawah (½ dari jumlah testee= 5 orang = ranking 6 s.d. 10 )  
b) Testee kelompok atas: yaitu testee yang memiliki ranking 1 s.d. 5 ( berdasarkan jumlah skor (Xt)
     yang diperoleh adalah:
    - Cinta         (Skor total= 10);
    - Himawam (Skor total= 9);
    - Gunawan (Skor total= 8);
    - Farhan (Skor total= 7), dan
    - Indra (Skor total= 7).
c) Testee kelompok bawah: yaitu testee yang memiliki ranking 6 s.d. 10
    (berdasarkan jumlah skor (Xt) yang diperoleh adalah:
    - Ahmad (Skor total= 5);
    - Evi  (Skor total= 5);
    - Bejo (Skor total= 4);
    - Dea (Skor total= 3);
    - Jojon (Skor total= 2);
d) Berdasarkan skor jawaban betul yg diperoleh tiap-tiap testee untuk butir nomor 4, dijawab betul              oleh 5 orang testee. Apabila dilihat dari kelompok testee, maka:
- Jumlah testee kelompok atas yang menjawab betul butir soal (BA) nomor 4 (yang memiliki skor= 1)
  ada 3 orang (BA= 3), yaitu: Cinta, Farhan, dan Himawan, dan
- Jumlah testee kelompok bawah yang menjawab betul butir soal nomor 4 (yang memiliki skor=
  1) ada 2 orang (BB= 2), yaitu: Bejo dan Dea.
            e) Berarti Indeks Daya Beda (= D) butir nomor 4 adalah:
                            BA – BB                            3 - 2
                D = ------------------ =  --------------- = 0,2
                             ½ N                                ½ x 10    
               
      
            f) Interpretasi: D4 = 0,2, berarti butir no:4 termasuk butir soal yang memiliki daya beda cukup baik;
   antara 0,2 – 0,4 (Lihat tabel Ebel).

NO. 7: 
            a)  Berdasarkan tabel penyebaran skor butir nomor 1, diketahui:
-           Jumlah skor butir nomor 1= 38 (8+3+9+4+8+6)
-           Jumlah testee= 6,
-           Skor maksimum apabila testee menjawab betul tiap-tiap butir= 10, maka:
      Mean butir nomor 1= 38/6 = 6,3, sehingga;             
      Indeks Tingkat Kesukaran Soal= 6,3/10 = 0,63, berarti butir soal nomor 1 termasuk butir
      yang memiliki tingkat kesukaran sedang, yaitu antara 0,3 – 0,7 (lihat tabel L Thorndike dan
      Elizabeth Hagen).

            b)  Berdasarkan tabel penyebaran skor butir nomor 4, dari keenam testee, diketahui:
-   Testee kelompok atas (ranking 1 s.d. 3) adalah:
      C (skor= 9), A (skor= 8), dan E (skor= 8), berarti rata-ratanya:
      (9+8+8) : 3 = 25 : 3= 8,3 (MA = 8,3).
-   Testee kelompok atas (ranking 4 s.d. 6) adalah:
      F (skor= 6), D (skor= 4), dan B (skor= 3), berarti rata-ratanya:
      (6+8+3) : 3 = 17 : 3 = 5,7 (MB = 5,7).
-          Diketahui skor maksimum apabila testee menjawab betul tiap-tiap butir= 10, maka:
Indeks Daya Pembeda Soal Butir no 4:
 D=  (MA – MB) : 10    = (8,3 – 5,7) : 10
                        = 2,6 : 10
                                    = 0,26
-          Dengan D4 sebesar 0,26, berarti butir nomor 4 memiliki daya pembeda yg cukup baik, yaitu antara 0,2 – 0,4 (Lihat tabel Ebel).

NO. 8: Diketahui jumlah testee= 20 (N= 20), jumlah skor jawaban butir nomor 1= 130, skor maksimum
apabila testee menjawab betul= 10, berarti:
-          Mean butir nomor 1=  130/20 = 6,5, maka;
-          Indeks Tingkat kesukaran Soal= 6,5/10  = 0,65 (P= 0,65)
-          Dengan P sebesar 0,65, berarti butir nomor 1 tsb memiliki tingkat kesukaran yang sedang, yaitu antara 0,3 – 0,7 (Lihat tabel L. Thorndike & Elizabeth Hagen)
           
NO. 9:  Diketahui butir nomor 1; kunci jawaban= C, berarti distraktornya: A, B, D, dan E. Suatu distraktor
dikatakan telah menjalankan fungsinya dengan baik apabila minimal telah dipilih 5% dari seluruh
testee, maka:
-          Distraktor A dipilih oleh 45 orang testee, berarti: 45/50 x 100% = 90% (telah berfungsi dengan baik);
-          Distraktor B, D, dan E masing-masing dipilih oleh 1 orang, berarti: 1/50 x 100% = 2% (belum berfungsi dengan baik).

NO. 10:  Berdasarkan out put Program Iteman, dapat disimpulkan:
-          Tingkat kesukaran butir soal nomor 1(Lihat Prop. Correct) sebesar 0,180; berarti butir nomor 1 tergolong butir yang sulit (tingkat kesulitan atau P < 0,30);
-          Daya beda butir soal nomor 1(lihat Biser) sebesar 0,43; berarti butir nomor 1 tergolong butir yang memiliki daya beda baik (antra 0,40 – 0,70);
-          Fungsi distraktor butir nomor nomor 1(Lihat Prop Endorsing); Diketahui: kunci jawaban butir nomor 1 (* = key) adalah C, berarti distraktornya A, B, D, dan E. Distraktor dikatakan telah berfungsi dengan baik, apabila telah dipilih minimal 5% dari seluruh testee:
*      Distraktor A:   prop. endorsing= 0,060, berarti: 0,060 x100%= 6% (berfungsi dengan baik);
*      Distraktor B:   prop. endorsing= 0,120, berarti: 0,120x100%= 12% (berfungsi dengan baik);
*      Distraktor D:   prop. endorsing= 0,400, berarti: 0,400x100%= 40% (berfungsi dengan baik);
*      Distraktor E:   prop. endorsing= 0,230, berarti: 0,230x100%= 23% (berfungsi dengan baik).

NO. 11: Diketahui:
-          kategori skala: 1 s.d. 5;
-          aspek penilaian: 5 (A, B, C, D, dan E), maka:
a) Kemungkinan skor tertinggi yang dapat diperoleh testee:
    - 5 (skala) x 5 (aspek penilaian)= 25
b) Kemungkinan skor terendah yang dapat diperoleh testee:
    - 1 (skala) x 5 (aspek penilaian)= 5
                                       Skor tertinggi – skor terendah
c) Rentangan skor=   -------------------------------------------
                                             Banyak kategori
                                    25  -  5
  =  ------------- = 4
                                         5
d) Skor masing-masing kategori:
     - Sangat Kurang: 5 – 8 (testee yang memiliki skor 5, 6, 7, dan 8);
  - Kurang            : 9 – 12 (testee yang memiliki skor 9, 10, 11, dan 12);
                          - Cukup             : 13 – 16 (testee yang memiliki skor 13, 14, 15, dan 16);
                          - Baik                            : 17 – 20 (testee yang memiliki skor 17, 18, 19, dan 20);
                          - Sangat Baik                : 21 – 25 (testee yang memiliki skor 21, 22, 23, 24, dan 25).

                 - Skor Munir dalam penampilan dalam diskusi kelas tergolong sangat baik (skor antara 21 – 25)
NO. 12: Diketahui Tes Objektif Pilihan Ganda:
-          Jumlah butir: 40, dengan 4 pilihan (option = O);
-          Ali menjawab betul: 20 butir (R); jawaban salah: 12 (wrong = W), maka:
a) Skor Ali apabila dalam pemberian skor dengan menerapkan denda, untuk Tes Objektif
    Pilihan Ganda adalah:          
                                                           W                       12
                                                              S= R -  ------------ = 20 -  --------- =  16.
                                                                              O – 1                    5 - 1
   b) Skor Ali apabila dalam pemberian skor tanpa menerapkan denda adalah:
                                          S = R, maka Skor Ali= 20

NO. 13: Diketahui jumlah soal  tes jawaban singkat: 20 butir, Zahra menjawab benar 18 butir, maka skor
  Zahra:
-          Untuk tes jawaban singkat, Skor = Jumlah jawaban betul, maka skor Zahra: 18.

NO. 14: Diketahui jumlah soal Tes Objektif Pilihan Ganda: 40 butir, tiap jawaban benar diberi skor= 1,
  Ali menjawab betul 30 butir soal, maka nilai Ali apabila Penilaian menggunakan Acuan Patokan:
-          Skor Maksimum Ideal: 40 (butir) x 1 (bobot skor)= 40;
                                  SKOR ALI                                                              30
-          Nilai Ali=   --------------------------------------- X 10 (ATAU 100)  =    -------- X 10 = 7,5
                            SKOR MAKSIMUM IDEAL                                            40

NO. 15: Diketahui:
-          Jumlah butir soal uraian: 5 butir;
-          Skor maksimum jawaban betul: 5
-          Berarti Skor Maksimum Ideal apabila testee menjawab benar (secara sempurna) seluruh soal:
SMI= 5 x  5= 25.
-          Skor Amanah: 24, berarti Nilai Amanah apabila Penilaian beracuan Patokan (PAP):
               24
Nilai: ---------- x 10 (atau 100)    = 9,6
               25
NO. 16: Diketahui tes bentuk pilihan ganda
-          Jumlah: 60 butir soal;
-          Skor tiap jawaban betul: 1;
-          Rata-rata kelas (X)=: 25;
-          Simpangan baku (S)=: 8,0. maka:
a) Batas Lulus Aktual= (X + 0,25 SD)
                                   = 25 + (0,25 x 8)
                                   = 27
    Berarti skor yang dinyatakan lulus adalah 27, skor-skor di atas 27 dinyatakan tuntas dalam
    Belajar, sedangkan skor di bawah 27 dinyatakan gagal atau tidak lulus (belum tuntas).

b) Batas Lulus Ideal:
     - Skor maksimum yang mungkin dicapai dari tes tsb adalah 60.
     - Rata-rata idealnya= ½  dari skor maksimum di atas: ½ x 60= 30.
     - Simpangan bakunya= 1/3 (sepertiga) dari rata-rata ideal= 1/3 x 30= 10.
     - Batas lulusnya adalah=   30 + 0,25 (10) = 32,5.

c) Batas Lulus Purposif:
    - Mengacu pada penilaian acuan patokan, minimum telah mencapai 75% atau memperoleh
   skor 75 (untuk skala 0 – 100) atau 7,5 (untuk skala 0 – 10).




ANALISIS KUALITAS INSTRUMEN
HASIL BELAJAR


          Istrumen evaluasi dapat dibagi menjadi tiga kelompok: instrumen evaluasi hasil belajar kognitif, instrumen evaluasi hasil belajar afektif, dan instrumen evaluasi hasil belajar psikomotor. Instrumen ketiga hasil belajar tersebut perlu dianalisis sebelum dan atau sesudah digunakan yang tujuannya agar dapat dihasilkan instrumen evaluasi yang memiliki kualitas tinggi.
            Analisis instrumen  adalah suatu upaya untuk menelaah butir-butir instrumen (misalnya: butir-butir item THB)  yang telah disusun yang bertujuan untuk melihat dan mengkaji setiap butir soal agar diperoleh soal yang bermutu baik (berkualitas) sebelum soal dipergunakan

A. ANALISIS KUALITAS INSTRUMEN  EVALUASI HASIL KOGNITIF

        Pada umumnya hasil belajar kognitif dinilai menggunakan tes. Tes dalam bentuk butir-butir soal, sebelum digunakan hendaknya dianalisis terlebih dahulu agar memenuhi syarat sebagai alat evaluasi yang memiliki kualitas tinggi. Cara menganalisis butir-butir tes tersebut dapat ditempuh melalui dua cara, yaitu : 

                                                                                        Materi/Aspek
                                          KUALITATIF          Konstruksi
            2 CARA ANALISIS                                          Bahasa

                                                                                       - Validitas (ketepatan mengukur instrumen)
                                                                                       - Reliabilitas (kehandalan= keajegan instrumen)
                                                      KUANTITATIF      - Tingkat Kesukaran Soal (seberapa sulit/ mudah tes)
                                                                      - Daya Beda (Kemampuan tes untuk membedakan
kemampuan peserta tes
                                                                           - Fungsi Distraktor (=pengecoh dalam tes objektif)           

1.  ANALISIS VALIDITAS TES

                                                                                 Validitas Isi
                                                                                 (content validity)
                                                Validitas Teoritis   
                                                (Rasional)                 Validitas Konstruk
                   Tes Totalitas                                                    (construct validity)

                                                                                 Validitas Ramalan
                                                                                           (predictive validity)
  VALIDITAS                                       Validitas Empirik                      
      TES          
                                 Validitas Bandingan
Butir Soal                                               (concurrent validity)

a. Analisis Validitas Tes Secara Totalitas
                                                                            
          Analisis validitas tes secara totalitas Yng dimaksud di sini adalah analisis validitas tes secara keseluruhan, misalnya tes terdiri dari 40 butir soal, maka yang dianalisis adalah keseluruhan 40 butir tersebut.  
            Berdasarkan skema di atas dapat dilihat ada dua cara yang dapat dipergunakan untuk menganalisis  tingkat validitas tes secara totalitas. Pertama, penganalisisan yang dilakukan dengan jalan berpikir secara rasional atau penganalisisan dengan menggunakan logika (logical analysis). Kedua, penganalisisan yang dilakukan dengan mendasarkan diri kepada kenyataan empiris, di mana penganalisisan dengan menggunakan empirical analysis.

          1. Pengujian Validitas Tes Secara Rasional.

          Tes hasil belajar yang telah dilakukan penganalisisan secara rasional ternyata memiliki ketepatan mengukur, disebut tes hasil belajar yang telah memiliki validitas logika (logical validity). Istilah lain untuk validitas logika adalah : validitas rasional, validitas ideal, atau validitas das söllen.
            Validitas rasional adalah validitas yang diperoleh atas dasar hasil pemikiran/ berfikir secara logis. Dengan demikian, suatu tes hasil belajar dapat dikatakan telah memiliki validitas rasional, apabila setelah dilakukan penganalisisan secara rasionalternyata tes hasil belajar tersebut memang (secara rasional)  dengan  tepat  telah dapat mengukur apa yang seharusnya diukur.
            Untuk dapat menentukan apakah tes hasil belajar sudah memiliki validitas rasional ataukah belum, dapat dilakukan penelusuran dari dua segi, yaitu dari segi isinya (= content) dan dari segi susunan atau konstruksinya (= construct).

a) Validitas Isi (Content Validity)
           
           Validitas isi (content validity) adalah validitas yang mempertanyakan bagaimana kesesuaian antara butir-butir soal dalam  tes dengan deskripsi bahan yang diajarkan. Jadi, sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Oleh karena materi yang diajarkan tertera dalam kurikulum maka validitas isi ini sering disebut sebagai validitas kurikuler (Arikunto, 1977).
            Validitas isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara merinci materi kurikilum atau bahan materi buku pelajaran. Penganalisisannya dilakukan dengan menggunakan analisis rasional. Cara yang biasa ditempuh penyusun tes adalah dengan menyusun kisi-kisi soal. Setelah kisi-kisi disusun, penulisan butir-butir soal haruslah mendasarkan diri pada kisi-kisi yang telah disusun tersebut. Pada kisi-kisi itu, paling tidak harus terdapat aspek kompetensi dasar, bahan/ deskripsi bahan, indikator, dan jumlah pertanyaan per indikator, Sebelum kisi-kisi dijadikan pedoman penyusunan butir-butir soal, terlebh dahulu haruslah ditelaah dan dinyatakan baik. Setelah butir-butir pertanyaan disusun, mereka (butir-butir pertanyaan) juga harus ditelaahdan dengan mempergunakan kriteria tertentu, di samping disesuaikan dengan kisi-kisi. Penelaahan harus dilakukan oleh orang yang berkompeten di bidang yang bersangkutan, atau yang dikenal dengan penilaian oleh ahlinya (expert judgement).

b) Validitas Konstruk (Construct Validity)

          Valioditas konstruk adalah validitas yang mempertanyakan apakah butir-butir soal dalam tes itu telah sesuai dengan tingkatan kompetensi atau ranah yang ada sesuai yang dituntut dalam kurikulum. Seperti telah dibahas dalam bab ketiga bahwa tingkatan-tingkatan hasil belajar kognitif menurut Benjamin S. Bloom dibedakan menjadi enam ringkatan : kemampuan ingatan/ hafalan, pemahaman, aplikasi, analisis, sintesis dan evaluasi. Validitas konstruk ini berkaitan sejauhmana butir-butir soal tes itu telah tepat mengukur masing-masing tingkatan kemampuan tersebut sesuai dengan yang terumuskan dalam indikator hasil belajar yang tercantum dalam kurikulum. Sebagai contoh jika rumusan indikatornya memuat tingkat pemahaman :   "Siswa dapat menjelaskan pengertian makmum masbuk", maka rumusan butir soal pada tes harus mampu mengungkap kemampuan tingkat pemahaman pula, misalnya dengan perintah agar siswa menjelaskan pengertian makmum masbuk .
            Analisis validitas konstruk suatu tes dapat dilakukan dengan mencocokkan antara kemampuan berfikir yang tercantum dalam setiap rumusan indikator yang akan diukur. Dengan demikian kegiatan analisis validitas konstruk ini dilakukan secara rasional, dengan berfikir kritis atau menggunakan logika. Di samping itu, seperti dalam validitas isi, cara analisis dapat pula dilakukan dengan melakukan diskusi dengan orang yang ahli di bidang yang bersangkutan. Dengan kata lain, uji validitas konstruk dilakukan dengan cara expert judgement.
            Uji validitas konstruk dewasa ini juga sering dilakukan lewat program komputer, yaitu dengan analisis faktor. Apabila cara ini yang dipakai, uji validitas tersebut harus berdasarkan data empirik. Berarti, alat tes tersebut harus diujicobakan terlebih dahulu, dan data hasil ujicoba itulah yang kemudian dianalisis dengan komputer.
                                                               
2. Pengujian Validitas Tes Secara Empirik.              

Validitas empirik adalah ketepatan mengukur yang didasarkan analisis yang bersifat empirik atau bersumber pada (diperoleh) atas dasar pengamatan di lapangan. Dengan demikian, tes hasil belajar dapat dikatakan telah memiliki valisitas empirik apabila berdasarkan hasil analisis yang dilakukan terhadap  data hasil pengamatan di lapangan, terbukti bahwa tes hasil belajar itu dengan secara tepat telah dapat mengukur hasil belajar yang seharusnya diungkap.
Untuk dapat menentukan apakah tes hasil belajar sudah memiliki validitas empirik, dapat dilakukan penelusuran dari dua segi, yaitu dari segi daya ketepatan meramalnya (predictive validity) dan daya ketepatan bandingannya (concurrent validity).

a) Validitas Ramalan (Predictive Validity)

Meramal artinya memprediksi, yaitu memprediksi mengenai sesuatu  yang bakal terjadi di masa mendatang, jadi sekarang belum terjadi. Apabila dikaitkan dengan tes, maka sebuah tes dikatakan memiliki  validitas ramalan/ prediksi apabila tes tersebut mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan datang (Arikunto, 1997).
Tes seleksi penerimaan calon mahasiswa baru pada sebuah perguruan tinggi misalnya, adalah suatu tes yang diharapkan mampu meramalkan keberhasilan studi para calon mahasiswa dalam mengikuti program pendidikan di perguruan tinggi tersebut pada masa-masa yang akan datang. Berdasarkan nilai-nilai hasil tes tes seleksi tinggi (= baik) yang berhasil diraih oleh para peserta tes seleksi tersebut, maka mereka dinyatakan lulus dan dapat diterima sebagai mahasiswa pada perguruan tinggi tadi. Calon yang tersaring atau yang diputuskan diterima berdasarkan nilai-nilai hasil tes seleksi tersebut (= nilainya tinggi/ baik) sebetulnya terkandung adanya ramalan atau prediksi; yaitu bahwa mereka yang dinyatakan lulus dalan tes seleksi itu, diramalkan kelak akan menjadi mahasiswa yang sukses (memiliki prestasi belajar yang baik) dalam mengikuti program pendidikan di perguruan tinggi tersebut.
Uji atau analisis validitas ramalan tes seleksi tersebut dapat dilakukan dengan cara mengorelasikan antara niliai-nilai tes seleksi tersebut dengan nilai-nilai hasil belajar semester 1 dan 2 mereka setelah di perguruan tinggi (sebagai kriterium/ tolok ukur/ pembandingnya). Tes seleksi tersebut dikatakan telah memiliki validitas ramalan apabila terdapat kesejajaran arah (korelasi positif) antara nilai-nilai hasil tes seleksi yang diperoleh pada masa kini dengan nilai-nilai hasil belajar mereka kelak (setelah mereka menjadi mahasiswa).
Teknik analisis statistik yang dapat digunakan untuk mencari korelasi dalam rangka uji validitas ramalan ini adalah teknik analisis korelasi Product Moment dari Karl Pearson (Sudijono, 2005, Arikunto, 1997).
Rumus:

                                                             N. ∑XY   -  ∑X . ∑Y
                               rxy =                         
                                                                             2                                2                                                      
                                                      N.∑X-    ∑X                N. ∑Y-      ∑Y                                      


  






b)  Validitas Bandingan (Concurrent Validity)

        Tes sebagai alat pengukur dapat dikatakan telah memiliki validitas bandingan apabila tes tersebut dalam kurun waktu yang sama dengan secara tepat telah mampu menunjukkan adanya hubungan yang searah, antara tes yang pertama dengan tes berikutnya. Validitas bandingan disebut pula dengan istilah validitas sama saat, validitas ada sekarang atau validitas pengalaman.
(1) Validitas sama saat: 
Karena validitas tes itu ditentukan atas dasar data hasil tes yang  pelaksanaannya  dilaku-
kan pada kurun waktu yang sama (jangka pendek; antara satu s.d. dua minggu setelah tes yang pertama);
(2) Validitas pengalaman:
            Karena validitas tes itu ditentukan atas dasar pengalaman yang telah diperoleh (tes I);
(3) Validitas ada sekarang:
            Karena, setiap kali kita menyebut pengalaman, maka istilah itu akan selalu kita kaitkan dengan dengan hal-hal yang telah ada atau hal-hal yang telah terjadi pada waktu lalu, sehingga data mengenai pengalaman masa lalu tiu pada saat ini sudah ada di tangan.
            Dalam rangka menguji Validitas bandingan, data hasil tes yang diperoleh pada masa lalu (tes I), kita bandingkan dengan data hasil tes yang diperoleh sekarang ini. Jika hasil tes yang ada sekarang ini (tes II) mempunyai hubungan searah (korelasi positif yang signifikan) dengan hasil tes berdasar pengalaman yang lalu (tes I), maka tes tersebut dapat dikatakan telah memiliki validitas bandingan/ pengalaman.
          Apabila uraian di atas kita kaitkan dengan uraian tentang validitas ramalan, maka dapat disimpulkan bahwa baik validitas ramalan mupun validitas bandingan, kedua-duanya merupakan validitas yang ditinjau dalam hubungannya dengan alat pengukur lain yang dipandang sebagai kriterium/ sebagai patokan/ pegangan dalam menentukan ringgi rendahnya validitas alat pengukur yang sedang diteliti. Jika kriterium yang dihubungkan terdapat pada waktu yang akan datang, maka validitasnya disebut validitas ramalan. Sebaliknya, apabila kriterium itu terdapat atau tersedia pada saat sekarang atau pada kurun waktu yang  bersamaan dengan  alat pengukur yang sedang diuji validitasnya (tes II), maka validitas seperti ini disebut validitas bandingan.
            Cara melakukan analisis validitas bandingan ini sama dengan cara menganalisis validitas ramalan, yaitu dengan mengorelasikan hasil tes yang sekarang (variabel X) dengan hasil tes yang terdahulu (variabel Y) dengan Teknik Korelasi Product Moment dari Karl Pearson.

2. Pengujian Validitas Butir THB

          a) Pengertian Validitas Butir

Validitas butir soal adalah ketepatan mengukur yang dimiliki oleh sebutir tes dalam mengukur apa yang seharusnya diukur lewat butir soal tersebut.
THB yang dibuat/ disusun oleh para Pengajar/ Guru/ Dosen, sebenarnya adalah kumpulan dari sekian banyak butir item; dengan butir-butir soal tersebut para penyusun tes ingin mengukur atau mengungkap hasil belajar yang telah dicapai oleh masing-masing peserta didik, setelah mereka mengikuti proses pembelajaran dalam jangka waktu tertentu.
Setiap butir item dalam THB merupakan bagian tak terpisahkan dari THB tersebut. Semakin banyak butir item yang dijawab betul oleh testee, maka skor-skor total hasil tes tersebut akan semakin menunjukkan kemantapannya (semakin tinggi). Sebaliknya, semakin kecil  butir-butir  yang dijawab dengan betul, maka skor-skor total hasil tes itu akan semakin rendah atau menurun.  Apabila pernyataan tersebut dikaitkan dengan validitas; sebenarnya validitas itu akan sangat dipengaruhi/ tergantung pada validitas yang dimiliki oleh masing-masing butir item yang membangun tes itu.

b) Teknik Pengujian Validitas Butir

            Sebutir item dapat dikatakan telah memiliki validitas yang tinggi (dinyatakan valid), apabila skor-skor pada butir yang bersangkutan memiliki kesesuaian/ kesejajaran arah dengan totalnya. Dengan perkataan lain, ”Ada korelasi positif yang signifikan antara skor item (independent variable)  dengan skor totalnya (dependent variable). Dengan demikian, apakah sebutir soal dapat disimpulkan valid ataukah tidak, kita dapat menggunakan teknik korelasi sebagai teknik analisnya. Sebutir soal dapat dinyatakan valid, apabila skor item yang bersangkutan terbukti mempunyai korelasi positif yang signifikan dengan skor totalnya.
            Teknik korelasi yang dipandang tepat digunakan untuk analisis validitas butir soal ini adalah Teknik Korelasi Point Biserial. Hal ini melihat jenis data yang akan dianalisis adalah data diskret murni atau dikotomik dan kontinu. Seperti diketahui pada tes obyektif maka hanya ada dua kemungkinan jawaban, yaitu betl dan salah. Setiap butir yang dijawab betul umumnya diberi skor 1, sedangkan untuk jawaban salah diberikan skor 0 (data diskret murni/ dikotomik). Sedangkan skor total yang dimiliki oleh masing-masing testee adalah merupakan hasil penjumlahan dari setiap skor yang dimiliki oleh testee pada masing-masing butir item (misalnya: 0+1+1+1+0+1+1+0+0+1=6) itu adalah data kontinu.

                                                                     Mp – Mt                 p
       RUMUS :                                rpbi=     ―――――          ――
                                                                           SDt                   q

di mana:
rpbi          :    Koefisien korelasi point biserial 
Mp       :    Skor rata-rata hitung yang dimiliki oleh testee, dari butir item  yang  dijawab  betul               
                 oleh testee
Mt       :    Skor rata-rata dari skor total
SDt      :    Deviasi standar dari skor total
p          :    Proporsi  testee  yang  menjawab  betul,  untuk  butir  soal   yang   sedang   dianalisis
                 validitasnya.
q          :    Proporsi  testee  yang  menjawab salah,  untuk   butir  soal   yang   sedang   dianalisis
                validitasnya.


B. ANALISIS RELIABILITAS SOAL


*      Reliabiltas (reliability)=  Keajegan,  ketetapan (stability), kehandalan/ kemantapan (consistency)
§ Terkait dengan tingkat ketepercayaan yakni sejauhmana butir-butir soal dpt mengukur sesuatu secara konsisten dari waktu ke waktu.
§ Apabila istilah di atas dikaitkan dengan fungsi tes sebagai alat pengukur keberhasilan peserta didik, maka sebuah tes dikatakan reliable apabila hasil-hasil pengukuran  yang dilakukan dengan menggunakan tes tersebut secara berulangkali terhadap subyek yang sama, senantiasa menunjukkan hasil yang tetap sama atau ajeg dan stabil.
§ Dengan demikian suatu ujian dikatakan telah memiliki reliabilitas (= daya keajegan mengukur)

*      Cara Analisisnya : Analisis Empirik
-      Dilakukan setelah soal digunakan/ diujicobakan
-        Apabila koefisien reliabilitas tes lebih besar atau sama dengan 0,70, berarti Tes tsb   RELIABEL
-      Caranya dengan berbagai Formula antara lain yang paling sering digunakan:
v  Formula Alpha dari Cronbach (Untuk Tes Uraian)
v  Formula Belah Dua dari Spearman-Brown: untuk data diskret murni (skor: 1 dan 0);
v  Formula Kuder-Richardson (KR20 dan KR21): untuk data diskret murni, tanpa membelah dua tes):
v  Formula C. Hoyt (untuk data diskret murni maupun bentuk skala, contoh: skala likert).

Ø  Mencari/ menghitung Koefisien Reliabilitas Tes Uraian, dengan menggunakan Rumus Alpha :
                                            n                       ∑Si.2
r11 =        ———          1  ̶    ———        ; n = banyaknya butir soal
                                          n – 1                    ∑Si.2
                           
Di mana:
n          = banyaknya butir soal
              ∑Si.2      = jumlah varian skor item secara keseluruhan
              ∑Si.2    = varian total
       Catatan: Apabila r11 lebih besar atau sama dengan 0,70, berarti Tes tsb   RELIABEL
Ø  Mencari/ menghitung Koefisien Reliabilitas Tes Objektif, dengan menggunakan Formula Spearman-Brown (belah Dua):

RUMUS:
                                       2 . r½ ½)
                  r11 = rtt  =  ──────
                                       1 + r½ ½
di mana:
      r11 = rtt              =  Koefisien reliabilitas tes.
1 & 2               =  Bilangan konstan
      r½ ½                  =  Koefisien  korelasi  antara  separoh ( ½ )  tes  (belahan I), dengan separoh  (½ )  tes 
    (belahan II);  dicari   dengan Teknik Korelasi Product Moment;        

                                                             N. ∑XY   -  ∑X . ∑Y
                               r½½ =                         
                                                                             2                                2                                                      
                                                      N.∑X-    ∑X                N. ∑Y-      ∑Y                                      

      Cara membelah dua tes:
-      Model Kiri-Kanan,
Apabila soal terdiri dari 10 butir soal, maka:
Belahan I:          soal nomor 1 s.d. 5 (skor-skor nomor tsb dijumlahkan)
Belahan II:        soal nomor 6 s.d. 10 (skor-skor nomor tsb dijumlahkan)

-      Model Gasal-Genap
Apabila soal terdiri dari 10 butir soal, maka:
Belahan I:          soal nomor gasal/ ganjil:1, 3, 5, 7, 9 (skor-skor nomor tsb dijumlahkan)
Belahan II:        soal nomor 2, 4, 6, 8, 10 (skor-skor nomor tsb dijumlahkan)

v  Catatan: Apabila r11 lebih besar atau sama dengan 0,70, berarti Tes tsb   RELIABEL    


C.  ANALISIS TINGKAT KESUKARAN SOAL

1. TES OBYEKTIF

v Tingkat kesulitan (Item Difficulty):
          merupakan suatu pernyataan tentang seberapa sulit atau seberapa mudah sebuah butir soal bagi peserta  
          tes.
v Tingkat kesukaran ini umumnya dinyatakan dalam bentuk indek yg kmd disebut dengan Indeks Tingkat Kesukaran ( P ) : 0,00 – 1,00
v ITK dapat diperoleh dengan menghitung jumlah peserta tes yang menjawab betul pada soal tertentu dibagi jumlah seluruh peserta.
v KRITERIA :
                           
Interpretasi terhadap Proportional Correct (P)
(L. Thorndike dan Elizabeth Hagen)

Kategori Soal:
P > 0,70
 Terlalu Mudah (TM)
0,30 £ P £ 0,70
Sedang (S)
P < 0,30
Terlalu Sukar (TS)

v Rumus:
                                              B                                             N
                        P          =  ――――         ATAU   P   =  ――――
                                              JS                                            Np
                        P          : Indeks Tingkat Kesukaran Soal
B/ Np  : Jml peserta yg menjawab benar terhadap butir item ybs
                        JS/ N   : Jml seluruh peserta yg ikut tes

v CONTOH:

TABEL 18.1
PERHITUNGAN UNTUK MENCARI TINGKAT KESUKARAN BUTIR ITEM
UNTUK TES OBJEKTIF

NO

NAMA
          SKOR  UNTUK  BUTIR  SOAL  NOMOR :

1
2
3
4
5
6
7
8
9
10

1

AHMAD

1

0

1

0

1

1

0

1

0

0
2
BEJO
0
0
0
1
0
0
1
0
1
1
3
CINTA
1
1
1
1
1
1
1
1
1
1
4
DEA
0
0
1
1
0
0
0
0
1
0
5
EVI
0
0
0
0
0
1
1
1
1
1
6
FARHAN
1
0
1
1
1
0
0
1
1
1
7
GUNAWAN
1
1
1
0
0
1
1
1
1
1
8
HIMAWAN
1
0
1
1
1
1
1
1
1
1
9
INDRA
1
0
1
0
1
1
0
1
1
1
10
JOJON
1
0
1
0
0
0
0
0
0
0
10 = JS= N
    B
7
2
8
5
5
6
5
7
8
7

Tingkat
Kesukaran
               B  
    P =    ――
               JS
0,7

0,2

0,8

0,5

0,5

0,6

0,5

0,7

0,8

0,7

Interpretasi

TM
TS
TM








Ket.:    S = Sukar; TS=  Terlalu Sukar;  M= Mudah (Lihat Tabel Kriteria Thorndike dan E. Hagen
            di atas)

Contoh lain:
Apabila jumlah peserta tes ada 90 orang dan yang mengerjakan dengan betul butir soal nomor 1 Tes Objektif ada 60 orang. Berapakah P (Indeks Kesukaran Soal) nomor 1?
Jawab:
Diketahui: B = 60,   JS= 90, maka:
60       
P =  ―――   = 0,67  
                                    90


2. TES URAIAN
   
v Contoh menilai ringkat kesukaran/ kesulitan soal untuk tes uraian:

THB bentuk uraian dalam mata pelajaran Al Quran Hadits yang diikuti oleh 6 orang siswa MAN dengan jumlah butir soal sebanyak 5 butir. Skor hasil tes tertuang dalam tabel di bawah ini. Apabila skor maksimum apabila testee menjawab betul untuk tiap-tiap butir soal (jawaban sempurna 100%) = 10, maka; Tentukan indeks tingkat kesukaran butir soal butir nomor 2:

                                                    

Tabel 18.2
                            Perhitungan untuk mencari Tigkat Kesukaran Soal Tes Uraian

Nama Testee
Skor untuk Butir Nomor:
1
2
3
4
5

A


8

5

9

3

6
B

3
9
4
8
3
C

9
10
8
5
8
D

4
5
3
7
4
E

8
8
5
9
3
F

6
6
6
6
6
6 =
N
38 =
∑X1
43 =
∑X2
35 =
∑X3
 38 =
∑X4
30 =
∑X5
                                                                                    43                                                              
1.   Mencari/ menghitung Mean butir nomor 2 =    ────  = 7,17
                                                                                     6
                 7,17             Mean butir nomor 2
 2.  Mencari/ menghitung Indeks Tingkat kesukaran (TK) =  ─────
                                                                                                     10                Skor apabila jawaban sempurna
                                                 (100%)
                                                                                            =  0,72      
Dengan demikian sapat disimpulkan bahwa soal nomor 2 di atas termasuk soal yang memiliki kategori mudah ( di atas 0,70 ).
Tindak lanjut dari hasil analisis tingkat kesukaran butir soal ini adalah sbb.:
a) Mencatat soal yang sudah baik ( memiliki tingkat kesulitan cukup) dalam buku bank soal;
b) Bagi soal yang terlalu sukar ada dua kemungkinan, yaitu didrop/ dibuang  atau  diteliti  ulang di
    mana letak yang membuat soal tersebut terlalu sukar; mungkin kalimatnya yang tidak baik atau
    petunjuk mengerjakannya yang kurang jelas dan sebagainya, kemudian setelah diperbaiki
    dipakai kembali, atau disimpan untuk kepentingan yang lain (seperti untuk tes seleksi).
c) Untuk butir yang terlalu mudah juga ada tiga kemungkinan seperti yang dijelaskan pada poin b)
     di atas.

Contoh lain:
Apabila jumlah peserta tes ada 20 orang dan total skor jawaban betul butir soal nomor 1 Tes Subjektif/ Uraian= 130, dan skor maksimum apabila testee menjawab betul untuk tiap-tiap butir soal (jawaban sempurna 100%) = 10, maka, berapakah indeks tingkat kesukaran butir soal butir nomor 1 tersebut, serta beri kesimpulan saudara!:
Jawab:
Diketahui: ∑X1 = 130,   N= 20, skor maksimum apabila jawaban testee betul secara sempurna = 10, maka
                                                130                                                           
a)  Mean butir nomor 2 =    ────  = 6,5
                                                20                                 
      6,5             Mean butir nomor            1
b)  Indeks Tingkat kesukaran (TK= P) =  ─────
                                                                 10                Skor apabila jawaban testee betul secara sempurna
            (100%)
0,65  
     Berarti tingkat kesukaran butir no: 1 tergolong sedang; antara 0,30 £ P  £ 0,70

D.  ANALISIS DAYA BEDA SOAL

v Daya Beda Soal (item discrimination):
Suatu pernyataan tentang seberapa besar daya sebuah butir soal untuk dapat membedakan kemampuan antara testee yang berkemampuan tinggi (= pandai) dan testee yang kemampuannya rendah (= bodoh).
v Daya pembeda item dapat diketahui melalui/ dengan melihat besar kecilnya angka  indeks  diskrimi-
nasi item. Yaitu: sebuah  angka  atau  bilangan  yang  menunjukkan  besar  kecilnya  daya  pembeda
(discriminatory power) yang dimiliki oleh sebutir item.
v Discriminatory power  pada  dasarnya  dihitung atas dasar pembagian testee ke dalan dua kelompok,   
      yaitu  kelompok atas  (the higher group)  atau  kelompok  pandai,  dan  kelompok  bawah  (the lower  
      group), yaitu testee yang tergolong bodoh.
v Indeks Daya Beda ( D ) Soal berkisar : -1,00  s.d. 1,00. Semakin tinggi D semakin tinggi daya beda soal dan semakin baik soal tersebut.
v KRITERIA :
           
Besarnya Angka Indeks Diskriminasi Butir  (EBEL)
Keterangan
0.70 – 1.00
Excellent/Baik sekali
0.40 – 0.70
Good/Baik
0.20 - 0,40
Satisfactory/Cukup baik
< 0,20
Poor/Jelek dan harus dibuang
Bertanda negatif
Jelek sekali dan harus dibuang


1. CARA MENCARI INDEKS DAYA PEMBEDA SOAL TES OBYEKTIF

v Cara-cara menentukan kedua kelompok (kelompok atas dan bawah):
-   50% testee kelompok atas dan 50% testee kelompok bawah
-   20% testee kelompok atas dan 20% testee kelompok bawah
-   Pada umumnya para  pakar  di  bidang  evaluasi  pendidikan  lebih  banyak  dengan    menggunakan 
persentase 27% dari testee yang termasuk dalam kelompok atas dan  27% dari testee yang termasuk     
dalam kelompok bawah.  Hal ini disebabkan karena berdasarkan  bukti-bukti  empirik  pengambilan
subyek  27%  testee kelompok atas dan  27%   testee  kelompok   bawah   itu    telah    menunjukkan
kesensitifannya (cukup dapat dihandalkan).

v Rumus:
                                                BA - BB
                        D         =        ――――              
                                                   ½ N
            D         : Indeks Daya Beda
            BA        : Jml jawaban benar pada kelompok atas
            BB        : Jml jawaban benar pada kelompok bawah
            N         : Jumlah seluruh peserta tes

v CONTOH: menghitung daya pembeda butir soal nomor: 1 (lihat tabel 18.3):

         Langkah-langkah:
(1) Urutkan kedudukan testee mulai dari testee yang memiliki total skor (lihat kolom Xt) tertinggi s.d.
      terendah:
-        Cinta (10), Himawan (9), Gunawan (8), dst; apabila ada skor total yang sama, penentuan  urutan  ranking diurutkan  saja berdasarkan no urut testee saja. 
-      
  (2) Membagi testee menjadi 2 kelompok:
        a)  testee kelompok atas (testee yang menduduki ranking 1 s.d. 5) = kelompok pandai, dan; 
      b)  testee kelompok bawah (testee yang menduduki ranking 6 s.d. 10) = kelompok bodoh.
           Contoh:
                 Xt         Ranking:                Nama:

                 10               1                      Cinta
                  9                2                      Himawan         TESTEE KELOMPOK ATAS = 5 orang
                    8                3                      Gunawan                                 (PANDAI)
                    7                4                      Farhan  
                              6                5                      Indra
                        -----------------------------------------------------------------------------------------------------------------------------------------
                              5                6                      Ahmad
                              4                7                      Evi
                              3                8                      Bejo                 TESTEE KELOMPOK BAWAH = 5 orang
                              2                9                      Dea                                          (BODOH)
                              1                10                    Jojon

(3) Menghitung jumlah testee kelompok atas yang menjawab betul (yang memperoleh skor= 1) butir
      nomor 2 (= BA), ternyata ada 5 orang (BA= 5);
(4) Menghitung jumlah testee kelompok bawah yang menjawab betul (yang memperoleh skor= 1) 
      butir nomor 2 (= BA), ternyata ada 5 orang (BA= 2);

(5) Menghitung D (difference= daya beda soal):
      Diketahui:
-      Jumlah peserta tes kelompok atas yg menjawab benar 5 (BA= 5)
-      jumlah peserta tes kelompok bawah yang menjawab benar 2 (BB= 2),
-      Jumlah keseluruhan peserta 10 orang (N= 10), maka D butir soal nomor 1adalah:
                                            5 – 2                    3
D1 =          ――――     =   ―――     =    0,6    ((Lihat Tabel 18.3 di bawah)
                                            ½ (10)                  5
-      Interpretasi: Berarti   nomor 5 telah memiliki daya pembeda yang baik (antara 0.40 – 0.70)







TABEL 13.8
PERHITUNGAN UNTUK MENCARI DAYA BEDA SOAL (ITEM DISCRIMINATION)
UNTUK TES OBJEKTIF: Terdiri dari 10 butir soal yang diuji cobakan  kepada 10 orang testee)

NAMA
                        SKOR  UNTUK  BUTIR  SOAL  NOMOR :
  
     Xt
URUTAN
(ranking)

1
2
3
4
5
6
7
8
9
10


AHMAD
1
0
1
0
1
1
0
1
0
0
5
6
BEJO
0
0
0
1
0
0
1
0
1
1
4
7
CINTA
1
1
1
1
1
1
1
1
1
1
10
1
DEA
0
0
1
1
0
0
0
0
1
0
3
9
EVI
0
0
0
0
0
1
1
1
1
1
5
7
FARHAN
1
0
1
1
1
0
0
1
1
1
7
4
GUNAWAN
1
1
1
0
0
1
1
1
1
1
8
3
HIMAWAN
1
0
1
1
1
1
1
1
1
1
9
2
INDRA
1
0
1
0
1
1
0
1
1
1
7
5
JOJON
1
0
1
0
0
0
0
0
0
0
2
10
(10= N)
TOTAL
7
2
8
5
5
6
5
7
8
7
60=
∑Xt

BA
5











BB
2











KETERANGAN:
  BA  :   Jumlah testee kelompok atas yang menjawab betul butir nomor  1 (ada 5 orang, yaitu: Cinta, Farhan, dan Himawan, Gunawan, dan Indra)
BB   ::  Jumlah testee kelompok bawah yang menjawab betul butir nomor  4 ( ada 2 orang, yaitu:
   Bejo, Dea).

2. CARA MENCARI INDEKS DAYA PEMBEDA SOAL TES SUBYEKTIF (Tes Uraian)

CONTOH:
THB bentuk uraian dalam mata pelajaran Al Quran Hadits yang diikuti oleh 6 orang siswa MAN dengan jumlah butir soal sebanyak 5 butir. Skor hasil tes tertuang dalam tabel di bawah ini. Apabila skor maksimum apabila testee menjawab betul untuk tiap-tiap butir soal (jawaban sempurna 100%) = 10, maka;
Tentukan daya pembeda butir soal butir nomor 2:

   Tabel   Nilai THB 6 orang siswa MAN dalam mata pelajaran Al Quran Hadits

Nama Testee
Skor untuk Butir Nomor:
1
2
3
4
5
A

8
5
9
3
6
B

3
9
4
8
3
C

9
10
8
5
8
D

4
5
3
7
4
E

8
8
5
9
3
F

6
6
6
6
6

Langkah-langkah analisisnya sebagai berikut:

1. Membuat tabel perhitungan untuk menentukan kelompok atas dan kelompok bawah. Untuk menentukan pembagian kelompok ini langsung melihat skor masing-masing testee pada butir soal yang dianalisis, jadi tidak perlu melihat skor total yang dicapai masing-masing testee untuk tiap butir soal.

                                 Tabel  Perhitungan untuk mencari Indeks Daya Pembeda Soal Tes Uraian


Nama
Testee
Skor untuk Butir Nomor:

Kelompok
1
2
3
4
5

A


8

5

9

3

6

Bawah
B

3
9
4
8
3
Atas
C

9
10
8
5
8
Atas
D

4
5
3
7
4
Bawah
E

8
8
5
9
3
Atas
F

6
6
6
6
6
Bawah

2. Menghitung indeks daya pembeda soal dengan terlebih dahulu menghitung mean (rata-rata hitung) kelompok atas (MA) dan mean kelompok bawah (MB) butir nomor 2:

                             10 + 9 + 8                                 Skor testee kelompok atas                                  
            MA   =    ────────  =  9
                                   3                                          Skor maksimum tiap butir

                              6 + 5 + 5                               Skor testee kelompok bawah                                                                
            MB   =    ────────  =  5,33
                                   3                                      Skor apabila jawaban sempurna 100%

MB  –   MB                 
 2.  Mencari/ menghitung Indeks Daya Pembeda       =  ────────────────
       Skor maksimum tiap butir

            9  –   5,33               
 =    ─────────
                10  

                                                                                                                 =    0,37

Dengan demikian sapat disimpulkan bahwa soal nomor 2 di atas termasuk soal yang memiliki daya pembeda cukup  (  0,20 – 0,40 ).

v  SOAL:  Coba analisis butir nomor 5, apakah sudah termasuk butir yang   memiliki daya pembeda yang baik/ belum?  






D.   ANALISIS FUNGSI DISTRAKTOR

v Distraktor:
Yaitu alternatif jawaban salah pada tes Pilihan Ganda yang berfungsi sebagai pengecoh/ pengacau.
v Analisis fungsi distraktor dimaksudkan untuk melihat sebera efektif suatu distraktor dapat berfungsi.
v Suatu distraktor dikatakan berfungsi secara efektif bila dipilih minimal oleh 5 % dari keseluruhan peserta tes
v CONTOH:  Tes objektif pilihan ganda 5 pilihan (A, B, C, D, E) terdiri dari 40 butir soal, setiap jawaban betul diberi skor= 1, dan jawaban salah diberi skor= 0. Setelah tes berakhir, diperoleh penyebaran pilihan jawaban yang dipilih oleh siswa, sbb:

Nomor Butir Item
Alternatif (Option)

Keterangan
A
B
C
D
E

1

6

15

(25)

3

1


2

5

16

25

(3) 

1
(  ): kunci jawaban.

3

(45)

1

2

1

1


Apabila jumlah peserta tes 50 orang (N= 50), lakukanlah penganalisisan terhadap tiap-tiap distraktornya!

Butir no: 1       Kunci jawaban : C, berarti distraktornya: A, B, D dan E
Distraktor A:  dipilih oleh 6 orang, N= 50, berarti distraktor A dipilih oleh:
6/50 x 100% = 12 %  (minimal 5% dipilih oleh peserta tes/ testee)
Jadi distraktor A telah dapat menjalankan fungsinya dengan baik, karena dipilih oleh 
12 % dari keseluruhan testee  (minimal dipilih oleh 5% dari keseluruhan peserta tes/
testee).
Dst.

Butir no: 2       Kunci jawaban : D, berarti distraktornya: A, B, C dan E
Distraktor A:  dipilih oleh 5 orang, berarti: 5/50 x 100% = 10 %.
Jadi distraktor A telah dapat menjalankan fungsinya dengan baik.
Dst.

v  SOAL:  Coba analisis fungsi distraktor butir nomor 3 (B, C, D dan E)
                      
B. ANALISIS KUALITAS INSTRUMEN EVALUASI HASIL AFEKTIF

        Analisis instrumen penilaian afektif juga sama seperti pada penilaian kognitif dan psikomotor, dalam arti dapat dilakukan analisis secara kualitatif maupun kuantitatif (empirik). Dalam keadaan yang memaksa, instrumen penilaian afektif ini setelah dianalisis secara kualitatif dengan melibatkan teman sejawat, sudah dapat digunakan untuk melakukan kegiatan analisis secara kuantitatif.

C. ANALISIS KUALITAS INSTRUMEN EVALUASI HASIL  
    PSIKOMOTOR

            Sama seperti instrumen penilaian kognitif, instrumen penilain psikomotor juga dapat dianalisis secara teoritik atau dianalisis secara kualitatif dan analiis secara kuantitatif (empirik). Perlu diketahui bahwa tidak semua mata pelajaran dievaluasi aspek psikomotornya. Pada umumnya untuk keperluan penilaian oleh guru di Madrasah, penilaian psikomotor ini setelah dianalisis secara kualitatif, sudah dapat digunakan untuk melakukan penilaian. Cara melakukan analisis secara kualitatif untuk instrumen psikomotor ini dapat mengacu pada contoh analisis instrumen penilaian kognitif di atas.



           

0 komentar:

Posting Komentar

Ada kesalahan di dalam gadget ini
 

Lima Belas Menit Template by Ipietoon Blogger Template | Gadget Review