Tulisan ini masih tentang IRT seperti judul di atas. Kenapa sih bahas IRT lagi? Ternyata oh ternyata, gara-gara nilai Try Out lalu ada deviasi (perbedaan/selisih nilai) antara nilai awal yang diberikan secara instan dengan hasil pengolahan IRT, masih banyak yang belum ikhlas. Padahal sudah dibilangin ya, ga penting kok merisaukan soal deviasi nilai antara nilai awal TO dengan hasil IRT. Ingat: yang penting itu adalah evaluasi tiap subtes pasca TO. Sudah dilakuin belum tuh evaluasi?
Sebagai penawar kerisauan tentang IRT, ya kita bahas lagi deh. Kita pakai data sampel ya, bukan data asli Try Out lalu sih tapi sebagai sampel yang bisa dijadikan ilustrasi dan acuan aja. In syaa Allah, mestinya cukup bisa memberikan gambaran yang lebih baik. Kita lihat data-data sampel berikut.
Data pertama: tabel nilai tiap butir soal.

Pada tabel di atas, ada empat baris. Baris pertama nomor soal, misalkan ini untuk pengolahan nilai subtes Pengetahuan Kuantitatif yang terdiri dari 15 soal, jadi ada nomor 1 – 15.
Baris kedua: Nilai Awal. Apa itu nilai awal? Nilai awal adalah nilai yang diberikan berdasarkan perkiraan tingkat kesulitan soal menurut pembuat soal yang kira-kira segitulah yang bisa didapat siswa. Nilai paling kecil dalam tabel di atas untuk nilai awal adalah 50 untuk soal nomor 1, 2, 6, 7, 14. Artinya soal pada nomor-nomor tersebut dianggap sebagai soal-soal yang paling mudah. Semakin besar nilai awal yang diberikan, berarti semakin sulit soalnya. Nomor 13 dan 15, nilai awalnya paling besar yang berarti pembuat soal mengelompokkan soal nomor tersebut sebagai soal paling sulit di antara 15 soal yang diberikan.
Baris ketiga: Bobot IRT. Ini adalah nilai yang muncul sebagai respon jawaban seluruh peserta, bukan diberikan di awal. Nilai tersebut diperoleh sebagai hasil pengolahan respon jawaban seluruh peserta. Jadi baru muncul setelah tes selesai dikerjakan. Ternyata ada deviasi nilai untuk semua nomor soal. Nomor soal yang paling berubah bobotnya secara signifikan adalah soal nomor 14. Versi nilai awal tadi, soal nomor 14 masuk kategori soal paling mudah namun ternyata hasil IRT malah menunjukkan nilai paling besar yang berarti soal nomor 14 ternyata jadi soal yang paling sulit. Kenapa bisa begitu? Katanya tadi di awal itu masuk kategori soal yang mudah, kok akhirnya malah jadi yang paling sulit?
Nah inilah kerennya IRT. Bobot nilai sangat dipengaruhi oleh jawaban peserta ujian. Di antara 15 soal yang diberikan, nomor 14 nilainya jadi yang paling besar berarti soal nomor ini paling banyak yang salah menjawab. Sementara nomor 2 sesuai perkiraan awal, jadi soal yang paling mudah dengan nilai bobot hanya 30.
Baris selanjutnya adalah deviasi, yang berarti perubahan nilai dari nilai awal menjadi bobot hasil IRT. Ada yang negatif, artinya turun tingkat kesulitannya. Ada yang positif yang berarti tingkat kesulitannya meningkat berdasarkan respon jawaban peserta. Wah, baru data nilai aja ternyata sudah panjang ya.
Data selanjutnya deh.

Tabel di atas misalnya adalah sampel 10 peserta dari sekian ribu peserta ujian. Peserta A sampai J. Peserta A – E menjawab jumlah soal Benar (B) sama banyak yaitu 8 soal, ada 7 soal yang dijawab Salah (S) atau Kosong (K). Sementara peserta F – J menjawab jumlah soal Benar sebanyak 7, sisanya 8 soal Salah atau Kosong. Dari respon tersebut, selanjutnya jadilah data nilai masing-masing seperti ditampilkan dalam tabel berikut.

Tabel kiri merupakan resume nilai hasil respon jawaban soal peserta. Untuk setiap peserta yang jumlah jawaban soal Benar sama banyaknya, ternyata nilai akhirnya belum tentu sama baik menurut nilai awal, apalagi berdasarkan nilai IRT. Hal itu terjadi karena nomor-nomor soal yang dijawab dengan Benar oleh setiap peserta, tidak ada yang persis sama.
Tabel kanan merupakan hasil pengurutan nilai awal dari yang terbesar ke yang terkecil. Peserta A menempati urutan pertama diikuti D, E, I, C dan seterusnya. Yang unik, peserta I yang jumlah jawaban Benarnya lebih sedikit dari C dan B, ternyata nilai awalnya bisa lebih tinggi.
Kita lihat pengurutan data nilai selanjutnya.

Tabel di atas, bagian kiri diurutkan menurut deviasi nilai akhir setelah IRT dibandingkan terhadap nilai awal. Peserta G mendapatkan kenaikan nilai paling besar, diikuti siswa J. Sehingga hasil akhir nilai menurut bobot IRT, peserta G dan J yang jumlah jawaban Benarnya lebih sedikit dari peserta A dan nilai awal juga berselisih lebih kecil 120, ternyata malah bisa menempati urutan pertama dan kedua dari nilai awal urutan ke-8 dan 9, melompati peserta A yang menempati urutan pertama berdasarkan nilai awal.
Nah, sampel nilai di atas itu yang menjadi gambaran apa yang nilai kalian alami dalam Try Nasional pada 7 nopember 2021 lalu. Pasti akan ada deviasi atau perbedaan nilai yang dialami oleh kalian saat membandingkan nilai awal Try Out yang muncul secara instan dari aplikasi Try Out dengan nilai hasil pengolahan IRT.
Berarti nilai Try Out tanpa IRT, ga valid dong?
Bukan begitu juga cara pandangnya, Gaess… Nilai instan yang didapat tetep representatif untuk dijadikan acuan dan evaluasi kok. Ga usah risau tentang hal tersebut. Tetep ya, yang utama adalah evaluasi, petakan kesulitan kalian dalam subtes apa, topik apa, bab apa?
Sudah cukup ya bahasan IRT nya, panjang mulu tuh bacaannya.
Yuk evaluasi dan konsultasi! Tetap semangat!!!
Leave a Reply