Selamat Datang Di Tugas Kuliahku, jika butuh softcopy, Silahkan email ke jhonmiduk8@gmail.com. Mohon donasi pulsa ke 081210668660 Untuk Kemajuan Blog, Terimakasih. Validitas | Tugas Kuliahku

Validitas


Ketentuan penting dalam evaluasi adalah bahwa hasilnya harus esuai dengan keadaan yang dievaluasi. Mengevaluasi dapat diumpamakan sebagai pekerjaan memotret. Gambar potret atau foto dapat dikatakan baik apabila sesuai dengan aslinya (bukan lebih baik dari aslinya). Gambar pemotretan hasil evaluasi tersebut didalam kegiatan evaluasi dikenal dengan data evaluasi. Data evaluasi yang baik sesuai dengan kenyataan disebut data valid. Agar dapat diperoleh data ang valid, instrument atau alat untuk mengevaluasinya harus valid. Jika pernyataan tersebut dibalik, instrument evaluasi dituntut untuk valid karena diinginkan dapat diperoleh data yang valid. Dengan kata lain, instrumen evaluasi dipersyaratkan valid agar hasil diperoleh dari kegiatan evaluasi valid.

Terdapat 2 jenis validitas, yang pertama yaitu menyangkut soal secara keeluruhan yang akan dibahas pada bagian awal bab ini. Sesudah selesai, disusul pembahasan validitas kedua, yakni validitasyang menyangkut butir soal atau item dan validitas factor yang menyangkut bagian materi.
1.      Macam – macam validitas
Didalam buku Encyclopedia of Educational Evaluation yang ditulis oleh Scarvia B. Anderson dan kawan-kawan disebutkan :
Atest is valid it measures what it purpose to measure. Atau jika diartikan lebih kurang demikian : sebuah tes dikatakan valid apabila te tersebut mengukur apa yang hendak diukur. Dalam bahasa Indonesia “valid” disebut dengan istilah “sahih”.
Sebenarnya pembicaraan validitas ini bukan ditekankan pada tes itu sendiri tetapi pada hasil pengetesan atau skornya.
Contoh :
Skor yang diperoleh dari hasil mengukur kemampuan mekanik akan menunjukan kemampuan seeorang dalam memegang dan memperbaiki mobil, bukan pengetahuan orang tersebut dalam ha yang berkaitan dengan mobil . tes yang mengukur pengetahuan tentang mobil bukanlh tes yang sahih untuk mekanik.
Validitas sebah tes dapat dikatakan dari hasil pemikiran dan dari hasil pengalaman. Hal yang pertaa akan diperoleh validitas logis (logical validity) dan hal yang kedua diperoleh validitas empiris (empirical validity). Dua hal inilah yag dijadikan dasar pengelompokan validitas tes.
Secara garis besar ada dua macam validitas, yaitu validitas logis dan empiris.
a.       Validitas Logis
Istilah “validitas logis” mengandung kata “logis” berasal dari kata “logoka”, yang berarti penalaran. Dengan makna demikian maka validitas logis untuk sebuah instrument  yang memenuhi persyaratan valid berdasarkan hasil enalaran. Kondisi valid tersebut dipandang tepenui karea  instrument yang bersangkutan sudah dirancang secara baik, mengikuti teori dan ketentuan yang ada. Sebagaimana pelaksanaan tugas lain misalnya membuat sebuah karangan, jika penulis sudah mengikuti aturan mengarang, tentu secara logis sudah disusun berdasarkan teori penyusunan instrument, secara logis sudah valid. Dari penjelasan tersebut kita dapat memahami bahwa validitas logis dapat dicapai apabil instrument disusun mengikuti ketentuan yang ada. Dengan demikian, dapat disimpulkan bahwa validitas logis tidak erlu diuji kondisinya tetapi langsung diperoleh sesudah instrument tersebut selesai disusun.
Ada dua macam validitas logis yang dpaat dicapai oleh sebuah instrument, yaitu: validitas isi dan validitas konstak (construct validity ).
 Validitas Isi (content validity)
         Validitas isi artinya ketepatan daripada suatu tes dilihat dari segi isi tersebut. Suatu tes hasil belajar dikatakan valid, apabila materi tes tersebut betul-betul merupakan bahan-bahan yang representatif terhadap bahan-bahan pelajaran yang diberikan. Dengan kata lain sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Oleh karena materi yang diajarkan tertera dalam kurikulum maka validitas isi ini sering disebut validitas kurikuler.
         Misalnya untuk siswa kelas I SMU akan diberikan tes Matematika, maka item-itemnya harus diambil dari materi pelajaran kelas I, apabila kita sisipkan item-item yang diambil dari materi pelajaran kelas III maka tes tersebut sudah tidak valid lagi.
         Untuk menilai apakah suatu tes memiliki validitas isi atau tidak dapat kita lakukan dengan jalan membandingkan materi tes tersebut dengan analisa rasional yang kita lakukan terhadap bahan-bahan yang seharusnya dipergunakan dalam menyusun tes tersebut. Apabila materi tes tersebut telah cocok dengan analisa rasional yang kita lakukan, berarti tes yang kita nilai itu mempunyai validitas isi. Sebaliknya apabila materi tes tersebut menyimpang dari analisa rasional kita, berarti tes tersebut tidak valid ditinjau dari validitas isinya.

Validitas Konstruk (construct validity)
         Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berpikir seperti yang disebutkan dalam Tujuan pembelajaran. Dengan kata lain jika butir-butir soal mengukur aspek berpikir tersebut sudah sesuai dengan aspek berpikir yang menjadi tujuan pembelajaran.
Misalnya kalau kita akan memberikan tes mata pelajaran IPA, kita harus membuat soal yang ringkas dan jelas yang benar-benar mengukur kecakapan IPA, bukan mengukur kemampuan bahasa karena soal itu ditulis secara berkepanjangan dengan bahasa yang sukar dimengerti.

b.      Validitas Empiris
Istilah “validitas empiris” memuat kata “empiris” yang artinya “pengalaman”. Sebuah instrument dapat dikatakan memiliki validits empiris apabila sudah diuji dari pengalaman. Sebagai contoh sehari-hari,seseorang dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan bahwa orang tersebut memang jujur. Contoh lain, sesorang dapat dikatakan kreatif apabila dari pengalaman telah dibuktikan bahwa orang tersebut telah banyak menghasilkan ide-ide baru yang diakui berbeda dari hal-hal yang sudah ada. Dari penjelasan dan contoh-contoh tersebut dapat diketahui bahwa validitas empiris tidak diperoleh hanya dengan menyusun instrument berdasarkan ketentuan seperti halnya validitas logis, tetapi harus dibuktikan melalui pengalaman.
Ada dua macam validitas empiris, yakni ada dua cara yang dapat dilakukan untuk menguji bahwa sebuah instrument memang valid. Pengujian tersebut dilakukan dengan membandingkan kondisi instrument yang bersangkutan dengan criteria atau sebuah ukuran. Criteria yng digunakan sebagai pembanding kondisi instrument dimaksud ada dua, yaitu : yang sudah tersedia dan yang belum ada tetapi terjadi di waktu yang akan datang. Bagi instrument yang kondisinya sesuai dengan kriterium yang sudah tersedia, yang sudah ada disebut memiliki validitas “ada sekarang”, yang dalam istilah bahasa Inggris disebut memiliki concurrent validity. Selanjutnya instrument yang kondisinya sesuai dengan kriterium yang diramalkan akan terjadi, disebut memiliki validitas ramalan atau validitas prediksi, yang dalam istilah bahasa Inggris disebut memiliki predictive validity.
Dari uraian adanya dua jenis validitas, yakni validitas logis yang ada dua macam, dan validitas empiris, yang juga ada dua macam, dan validitas empiris, yang juga da dua macam, maka secara keseluruhan kita mengenal adanya empat validitas, yaitu:
(1)   validitas isi,
(2)   validitas konstrak,
(3)   validitas “ada sekarang”, dan
(4)   validitas predictive.
Dua yang pertama yakni (1) dan (2) dicapai melalui penyusunan berdasarkan ketentuan atau teori, sedangkan dua berikutnya, yakni (3) dan (4) dicapai atau diketahui sesudah dibuktikan melalui pengalaman. Adapaun penjelasan masing-masing validits adalah sebagai berikut.
1)      Validitas isi (content validity)
Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khuseus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Oleh karena materi yang diajarkan tertera dalam kurikulum maka validitas isi ini sering juga disebut validitas kurikuler.
Validitas is]I dapat diusahakan tercapainya sejak saaat penyusunan dengan cara memerinci materi kurikulum atau materi buku pelajaran. Bagaimana cara memerinci materi untuk kepentingan diperolehnya validitas isi sebuah tes akan dibicarakan secara lebih mendalam pada waktu menjelaskan cara penyusunan tes.
2)      Validitas konstruksi (construct validity)
Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berpikir seperti yang disebutkan dalam Tujuan Instruksional Khusus. Dengan kata lain jika butir-butir soal mengukur aspek berpikir tersebut sudah sesuai dengan aspek berpiir yang menjadi tujuan instruksional.
Sebagai cotoh jika rumusan Tujuan Instruksional Khusus (TIK):
“Siswa dapat membandingkan antara efek biologis dan efek psikologis”, maka butir soal pada tes merupakan perintah agar siswa membedakan antara dua efek tersebut.
“Konstruksi” dalam pengertian inni bukanlah “susunan” seperti yang sering dijumpai dalam teknk, tetapi merupakan rekaan psikologis yaitu suatu rekaan yang dibuat oleh para ahli Ilmu jiwa yang dengan suatu cara tertentu “memerinci” isi jiwa atas beberapa aspek seperti : ingatan, (pengetahuan), pemahaman, aplikasi, dan seterusnya. Dalam hal ini, mereka menganggap seolah-olah jiwa dapat dibagi-bagi. Tetapi sebenarnya tidak demikian. Pembagian ini hanya merupakan tindakan sementara untuk mempermudah mempelajari.
Seperti hal nya validitas isi, validitas konstruksi dapat diketahui dengan cara memerinci dan memasangkan setiap butir soal dengan setiap aspek dalam TIK. Pengerjaannya dilakukan berdasarkan logika, bukan pengalaman. Dalam pembicaraan mengenai penyusunan tes hal ini akan disinggung lagi.
3)      Validitas “ada sekarang” (concurrent validity)
Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki validitas empiris jika hasilnya sesuai dengan pengalaman. Jika ada istilah “sesuai” tentu ada dua hal yang dipasangkan. Dalam hal ini hasil tes dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hal yang telah lampau sehingga data pengalaman tersebut sekarang sudah ada (ada sekarang, concurrent).
Dalam membandingkan hasil sebuah tes maka diperlukan suatu kriterium atau alat banding. Maka hasil tes merupakan suatu yang dibandingkan. Untuk jelasnya di bawah ini dikemukakan sebuah contoh.
Misalnya seorang guru ingin mengetahui apakah tes sumatif yang disusun sudah valid atau belum. Untuk ini diperlukan sebuah krieria masa lalu yang sekarang datanya dimiliki. Misalnya nilai ulangan harian atau nilai ulangan sumatif yang lalu.

4)      Validitas Prediksi (Predictive Validity)
Memprediksi artinya meramal, dengan meramal selalu mengenai hal yang akan dating jadi sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi atau validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang terjadi pada masa yang akan dating.
Misalnya tes masuk perguruan Tinggi adalah sebuah tes yang diperkirakan mampu meramalkan keberhasilan peserta dalam mengikuti kuliah dimasa yang akan dating. Calon tersaring berdasarkan kemampuan mengikuti kuliah. Jika  nilai tes nya tinggi tentu menjamin keberhasilannya kelak. Sebaliknya seorang dikatakan tidklulus tes apabila nilai tenya rendah, jadi diperkirakan tidak dapat mengikuti perkuliahan yang akan dating.
Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang diperoleh setelah peserta tes mengikuti pelajaran di Perguruan Tinggi. Jika ternyata siapa yang memiliki nilai tes lebih tinggi gagal dalam ujian semester 1 dibandingkan dengan yang dahulu nilai tesnya lebih rendah maka tes masuk yang dimaksud tidak memiliki validitas prediksi.
2.      Cara mengetahui validitas ukur
         Sekali lagi diulangi bahwa sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan criteria, dalam arti memiliki kesejajaran antara hasil tes tersebut dengan criteria. Teknik yng digunakan untuk mengetahui kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh Pearson.
         Rumus korelasi product moment ada dua macam, yaitu :
         a. korelasi product moment dengan simpangan, dan
         b. korelasi product moment dengan angka kasar.
Rumus korelasi product moment  dengan simpangan:

Dimana:
rxy           = koefisien korelasi antara variable X dan variable Y, dua variable yang dikorelasikan ( x = X -  dan y = Y - ).
xy         = jumlah perkalian x dengan y
X2          = kuadrat dari x
Y2          = kuadrat dari y



Contoh perhitungan:
Misalnya akan menghitung validitas tes prestasi belajar matematika. Sebagai kriterium diambil rata-rata ulangan yang akan dicari validitasnya diberi kode X dan rata-rata nilali harian diberi kode Y. Kemudian dibuat tabel persiapan sebagai berikut.
TABEL PERSIAPAN UNTUK MENCARI VALIDITAS TES PRESTASI MATEMATIKA
No.
Nama
X
Y
x
y
x2
y2
xy
1.
Nadia
6,5
6,3
0
- 0,1
0,0
0,01
0,0
2.
Susi
7
6,8
+ 0,5
+ 0,4
0,25
0,16
+ 0,2
3.
Cecep
7,5
7,2
+ 1,0
+ 0,8
1,0
0,64
+ 0,8
4.
Erna
7
6,8
+ 0,5
+ 0,4
0,25
0,16
+ 0,2
5.
Dian
6
7
- 0,5
+ 0,6
0,25
0,36
- 0,3
6.
Asmara
6
6,2
- 0,5
- 0,2
0,25
0,04
+ 0,1
7.
Siswoyo
5,5
5,1
- 1,0
- 1,3
1,0
1,69
+ 1,3
8.
Jihad
6,5
6
0
- 0,4
0,0
0,16
0,0
9.
Yanna
7
6,5
+ 0,5
+ 0,1
0,25
0,01
+ 0,05
10.
Lina
6
5,9
- 0,5
- 0,6
0,25
0,36
+ 0,3

Jumlah
65,0
63,8


3,5
3,59
2,65

 =  =  = 6,5
 =  =  = 6,38 dibulatkan 6,4
x = X -
y = Y -



Dimasukkan ke dalam rumus:
              
           

rxy =

 
Rumus korelasi product moment dengan angka kasar:



di mana:
rxy  = koefisien korelasi antara variabel X dan variabel Y, dua variabel yang  
          dikorelasikan.

Dengan menggunakan data hasil tes prestasi matematika di atas kini dihitung dengan rumus korelasi product moment dengan angka kasar yang table persiapannya sebagai berikut.

TABEL PERSIAPAN UNTUK MENCARI VALIDITAS
TES PRESTASI MATEMATIKA
No.
Nama
X
Y
X2
Y2
XY
1.       
Nadia
6,5
6,3
42,25
39,69
40,95
2.       
Susi
7
6,8
49
46,24
47,6
3.       
Cecep
7,5
7,2
56,25
51,84
54,0
4.       
Erna
7
6,8
49
46,24
47,6
5.       
Dian
6
7
36
49
42
6.       
Asmara
6
6,2
36
38,44
37,2
7.       
Siswoyo
5,5
5,1
30,25
26,01
28,05
8.       
Jihad
6,5
6
42,25
45,5
39
9.       
Yanna
7
6,5
49
36
45,5
10.   
Lina
6
5,9
36
34,81
35,4

Jumlah
65,0
63,8
426,0
410,52
417,3

Dimasukkan ke dalam rumus :
rxy =
rxy =
rxy =
rxy =  =
rxy =  = 0745
Jika diperbandinkan dengan validitas soal yang dihitung dengan rumus simpangan, ternyata teredapat perbedaan sebesar 0,003, lebih besar yang dihitung dengan rumus simpangan. Hal ini wajar karena dalam mengerjaka perkalian atau penjumlahan jika diperoleh 3 atau angka di belakang koma dilakukan pembulatan ke atas. Perbedaan ini sangat kecil sehingga dapat diabaikan.
Untuk memperjelas pengertian tersebut dapat disampaikan keterangan sebagai berikut.
-          Korelasi positif menunjukkan adanyahubungan sejajar atara dua hal. Misalnya hal pertama nilainya naik, hal kedua ikut naik. Sebaliknya jika hal pertama turun, yang kedua ikut turun.
Contoh korelasi positif antara nilai IPA dan Matematika.
IPA                 :           2,        3,         5,         7,         4,         3,         2
Matematika     :           4,         5,         6,         8,         5,         4,         3
Kondisi nilai Matematika sejajar dengan IPA karena naik dan turunnya nilai matematika mengikuti naik dan turunnya nilai IPA. Coba perhatikan!
-          Korelasi negatif menunjukkan adanya hubungan kebalikan antara dua hal. Misalnya hal pertama nilainya naik, justru yang kedua turun. Sebaliknya jika yang pertama turun, yang kedua naik.
Contoh korelasi negatif antara nilai Bahasa Indonesia dengan Matematika.
Bahasa Indonesia        :           5,         6,         8,         4,         3,         2
Matematika                 :           8,         7,         5,         1,         2,         3
Keadaan hubungan antara dua hal yang kita jumpai sehari-hari tidak selalu hanya positif atau negatif saja, tetapi 0. besarnya korelasi pun tidak menentu. Coba cermatilah bagaimana hubungan antara dua nilai mata pelajaran A dan B berikut ini.
Contoh korelasi tidak tertentu.
Nilai A                        : 5,       6,         4,         7,         3,         8,         7
Nilai B             : 4,       4,         3,         7,         4,         9,         4
Keadaan kedua nilai tersebut jika dihitung dengan rumus korelasi mungkin positif mungkin negatif. Coba hitunglah!
Koefisien korelasi selalu terdapat antara -1,00 sampai +1,00. namun karena dalam menghitung sering dilakukan pembulatan angka-angka, sangat mungkin diperoleh koefisien lebih dari 1,00. Koefisien negatif menunjukkan hubungan kebalikan sedangkan koefisien positif menunjukkan adanya kesejajaran untuk mengadakan interpretasi mengenai besarnya koefisien korelasi adalah sebagai berikut:
-        Antara 0,800 sampai dengan 1,00      : sangat tinggi
-        Antara 0,600 sampai dengan 0,800    : tinggi
-        Antara 0,400 sampai dengan 0,600    : cukup
-        Antara 0,200 sampai dengan 0,400    : rendah
-        Antara 0,00 sampai dengan 0,200      : sangat rendah
Penafsiran harga koefisien korelasi ada dua cara yaitu:
  1. Dengan melihat harga r dan diinterpretasikan misalnya korelasi tinggi, cukup, dan sebagainya.
  2. Dengan berkonsultsi ke tbel harga kritik r product moment sehingga dapat diketahui signifikan tidaknya korelasi tersebut. Jika harga r lebih kecil dari harga kritik dalam tabel, maka korelasi tersebut tidak signifikan. Begitu juga arti sebaliknya.

3. Validitas Butir Soal atau Validitas Item 
Apa yang sudah dibicarakan di atas adalah validitas soal secara keseluruhan tes. Di samping mencari validitas soal perlu juga dicari validitas item. Jika seorang peneliti atau seorang guru mengetahui bahwa validitas soal tes misalnya terlalu rendah atau rendah saja, maka selanjutnya ingin mengetahui butir-butir tes manakah yang menyebabkan soal secara keseluruhan tersebut jelek karena memiliki validitas rendah. Untuk keperluan inilahdicari validitas butir soal.
Pengertian umum untuk validitas item adalah demikian sebuah item dikatakan valid apabila mempunyai dukungan yang besar terhadap skor total. Skor pada item menyebabkan skor total menjadi tinggi atau rendah. Dengan kata lain dapat dikemukakan disini bahwa sebuah item memliki validitas yang  tinggi jika skor pada item mempunyai kesejaaran dengan skor total. Kesejajaran ini dapat diartikan dengan korelasi sehingga untuk mengetahui validitas item digunaka rumus korelasi seperti sudah diterangkan diatas.
Untuk soal-soal bentuk objektif skor untuk item biasa diberikan dengan 1 (bagi item yang dijawab benar) dan 0 (bagi item yang dijawab salah), sedangkan skor total selanjutnya merupakan jumlah dari skor untuk semua item yang membangun soal tersebut.
Contoh perhitungan :
TABEL ANALISIS ITEM UNTUK PERHITUNGAN VALIDITAS ITEM
No
Nama
Butir Soal/item
Skor Total
1
2
3
4
5
6
7
8
9
10
1
Hartati
1
0
1
0
1
1
1
1
1
1
8
2
Yoyok
0
0
1
0
1
0
0
1
1
1
5
3
Oktaf
0
1
0
0
0
1
0
1
0
1
4
4
Wendi
1
1
0
0
1
1
0
0
1
0
5
5
Diana
1
1
1
1
1
1
0
0
0
0
6
6
Paul
1
0
1
0
1
0
1
0
0
0
4
7
Susana
1
1
1
1
1
1
1
0
0
0
7
8
Helen
0
1
0
1
1
1
1
1
1
1
8

Misalnya akan dihitung validitas item nomor 6, maka skor tem tersebut disebut variable  X  dan skor total disebut variable Y.  selanjutnya perhitungan dilakukan dengan menggunakan rumus korelasi product moment, baik dengan rumus simpangan maupun rumus angka kasar.
Penggunaan kedua rumus tersebut masing-masing ada keuntungannya. Menggunakan rumus simpangan angkanya kecil-kecil, tetapi kdang-kadang pemecahannya rumit. Jika skor rata-rata (mean)-nya pecahan, simpangannya enderung banyak pecahan. Mengalikan pecahan persepuluhan ditambah tanda-tanda  + (plus) dan – (minus) kadang-kadang bias menyesatkan. Penggunaan rumus angka kasara bilangannya besar-besar tapi bulat. Jik ada kalkulator statistic disarankan menggunaka rumus angka kasar saja. Yang dibutuhkan hanyalah :  ∑X, ∑Y, ∑X2, ∑Y2, ∑XY, tidak perlu membuat table seutuhnya.
Coontoh perhitungan mencari validitas item
Untuk menghitung validitas item nomor 6, dibuat terlebih dahulu tabel persiapannya sebagai berikut.
TABEL PERSIAPAN UNTUK MENGHITUNG VALIDITAS ITEM NOMOR 6
No
`Nama
X
Y
 1
Hartati
1
8
2
Yoyok
0
5
3
Oktaf
1
3
4
Wendi
1
5
5
Diana
1
6
6
Paul
0
4
7
Susana
1
7
8
Helen
1
8







Keterangan :
X = skor item nomor 6
Y= skor total
Dari perhitungan kalkulator diperoleh data sebagai berikut:
∑X = 6                                                ∑x2 = 6
∑Y = 46                                  ∑Y2 = 288
∑XY = 37                               p =  = 0,75
 = 5,57                                 p =  = 0,25
 = 6,17

Sesudah diketahui ∑X, ∑X2, ∑Y, ∑Y2, dan ∑XY tinggal memasukkan bilangan-bilangan tersebut kedalam rumus korelasi product moment dengan rumus angka kasar.
Data diatas dimasukkan ke dalam rumus korelasi product moment dengan angka kasar sebagai berikut :
rxy =
rxy =
rxy =
rxy =  =
rxy =  = 0,421
Koefisien validitas item nomor 6 adalah 0,421. Dilihat secara sepintas bilangan ini memang sesuai dengan kenyataannya. Hal ini dapat diketahui dari skor-skor yang tertera baik pada item maupun skor total. Oktaf yang hanya memiliki skor total 3 dapat memperoleh skor 1 pada item, sedangkan yoyok dan wendi yang mempunyai skor total sama yaitu 5 skor pada item tidak sama. Validitas item tersebut kurang meyakinkan. Tentu saja validitasnya tidak tinggi.
Masih ada cara-cara lain untuk menghitung validitas item. Salah satu cara yang terkenal adalah menggunakan rumus Ypbi  yang rumus lengkapnya adalah sebagai berikut :
Text Box: γpbi =  (Mp-Mt)/St  √(p/q)



Keterangan :
Ypbi    = koefisien korelasi biserial
Mp       = rerata skor dari subyek yang menjawab betul bagi item yang dicari validitasnya
Mt       = rerata skor total
St         = standar deviasi dari skor total
P          = proporsi siswa yang menjawab benar (  )
q          = proporsi siswa yang menjawab salah ( q = 1 – p )
            Apabila item 6 tersebut dicari validitasnya dengan rumus ini maka perhitungannya melalui langkah sebagai berikut :
1.      Mencari

                                                             
2.      Mencari


3.      Dari kalkulator diperoleh harga standar deviasi, yaitu  = 1,7139 atau  = 1,8323. Untuk n kecil, diambil standar deviasi yang  = 1,7139.

4.      Menentukan harga p, yaitu

5.      Menentukan harga q, yaitu  atau 1 – 0,75 = 0,25

6.      Memasukan rumus                
Dari perhitungan validitas item 6 dengan dua cara ternyata hasilnya berbeda tetapi sangat kecil yaitu 0,0034. Mungkin hal ini disebabkan karena adanya pembulatan angka.

4.  Tes Terstandar sebagai Kriterium dalam Menentukan Validitas

            Tes terstandar adalah tes yang telah dicobakan berkali-kali sehingga dapat dijamin kebaikannya. Di negara-negara berkembang biasa tersedia tes macam ini, dan dikenal dengan nama standardizide test. Sebuah tes standar biasanya memiliki identitas antara lain: sudah dicobakan berapa kali dan di mana, beberapa koefisien validitas, realibilitas, taraf kesukaran, daya pembeda dan lain-lain keterangan dianggap perlu.

            Cara menentukan validitas soal yang menggunakan tes terstandar sebagai kriterium dilakukan dengan mengalikan koefisien validitas yang diperoleh dengan koefisien validitas tes terstandar tersebut. 
Contoh perhitungan :
TABEL PERSIAPAN PERHITUNGAN VALIDILITAS
TES MATEMATIKA DENGAN KRITERIUM
TER TERSTANDAR MATEMATIKA

Dimasukkan ke dalam rumus korelasi product moment  dengan angka kasar sebagai berikut:

           

         

         
Jika seandainya dari tes terstandar diketahui bahwa validitasnya 0,89 maka bilangan 0,108 ini belum merupakan validitas soal Matematika yang dicari. Validitas tersebqut harus dikalikan dengan 0,89 yang hasilnya 0,108 X 0,89 + 0,096.
5. Validitas Faktor
            Selain validitas factor soal secara keseluruhan dan validitas butir atau item, masih ada lagi yang perlu diketahui validitasnya, yaitu factor-faktor atau bagian keseluruhan materi. Setiap keseluruhan materi pelajaran terdiri dari pokok-pokok bahasan yang merupakan satu kesatuan.
Contoh : Guru akan mengevaluasi siswa untuk tiga pokok bahasan, yaitu Bunyi, Cahaya, dan Listrik. Untuk keperluan itu guru tersebut membuat 30 butir soal, untuk bunyi 8 butir, untuk cahaya 12 butir, dan untuk listrik 12 butir.
            Apabila guru ingin mengetahui validitas factor, maka ada tiga factor dalam soal ini. Seperti halnya pengertian validitas butir, pengertian validitas factor adalah sebagai berikut : butir- butir soal dalam factor dikatakan valid apabila mempunyai dukungan besar terhadap soal-soal secara keseluruhan. Sebagai tanda bahwa butir-butir tersebut mempunyai dukungan yang besar terhadap seluruh soal , yakni apabila jumlah skor untuk butir-butir factor tersebut menunjukkan adanya kesejajaran dengan skor total. Agar uraian ini lebih jelas, perhatikan table berikut dibawah.



CONTOH TABEL ANALISIS BUTIR UNTUK MENGHITUNG VALIDITAS BUTIR DAN VALIDITAS FAKTOR
Sudah dijelaskan bahwa butir-butir soal factor dikatakan valid apabila menunjukkan kesejajaran factor dengan skor total. Cara mengetahuui kesejajaran tersebut juga digunakan rumus kolerasi product moment. Misalnya kita akan mengetahui validitas factor 1, yakni soal-soal untuk materi bunyi, kita membuat daftar untuk menyejajarkan kedua skor tersebut sebagai berikut.
TABEL UNTUK MENGHITUNG KESEJAJARAN SKOR FAKTOR 1 DENGAN SKOR TOTAL
Nama Subjek
Skor Faktor 1 (X)
Skor Total (Y)
X2
Y2
XY
Amir
6
19
36
361
114
Hasan
7
25
49
625
175
Ninda
4
17
16
289
68
Warih
3
12
9
144
36
Irzal
8
29
64
841
232
Gandi
6
23
36
529
138
Santo
5
19
25
361
95
Tini
7
26
49
676
182
Yanti
5
16
25
256
80
Hamid
4
15
16
225
60
Dedi
7
26
49
676
182
Desi
8
30
64
900
240
Wahyu
5
20
25
400
100
Jumlah
…..
……
……
……
……

Data yang tertera dalam table tersebut digunakan untuk menentukan besarnya validitas factor 1. Langkah selanjutnya adalah menjumlahkan setiap kolom, kemudian dimasukkan kedalam rumus kolerasi product moment. Harga r yang diperoleh menunjukkan indeks validitas factor 1. Untuk factor 2 dan 3 caranya sama, hanya skor faktornya saja yang diganti.

KESIMPULAN
Ketentuan penting dalam evaluasi adalah bahwa hasilnya harus esuai dengan keadaan yang dievaluasi. Mengevaluasi dapat diumpamakan sebagai pekerjaan memotret. Gambar potret atau foto dapat dikatakan baik apabila sesuai dengan aslinya (bukan lebih baik dari aslinya). Gambar pemotretan hasil evaluasi tersebut didalam kegiatan evaluasi dikenal dengan data evaluasi. Data evaluasi yang baik sesuai dengan kenyataan disebut data valid. Agar dapat diperoleh data ang valid, instrument atau alat untuk mengevaluasinya harus valid. Jika pernyataan tersebut dibalik, instrument evaluasi dituntut untuk valid karena diinginkan dapat diperoleh data yang valid. Dengan kata lain, instrumen evaluasi dipersyaratkan valid agar hasil diperoleh dari kegiatan evaluasi valid.