You are on page 1of 19

Analisis Butir Tes

BAB XI
ANALISIS BUTIR TES

PENDAHULUAN
Kelemahan utama butir tes buatan guru adalah konstruksinya kurang
tersusun dengan baik dan benar. Kelemahan ini terutama disebabkan
oleh terbatasnya waktu yang tersedia untuk menyusun butir tes yang
berkualitas dan tidak adanya kesempatan uji coba dan analisis butir-butir
tes yang digunakan di kelas. Di samping itu, masih banyak guru yang
kurang terlatih dalam menulis butir tes yang berkualitas. Akibat dari
kelemahan ini adalah banyak butir tes yang digunakan oleh guru tidak
valid dan tidak reliabel serta tidak dapat mengukur aspek hasil belajar
yang hendak diukur. Untuk mengatasi kelemahan ini maka setiap guru
diharapkan untuk memiliki pengetahuan dan keterampilan dalam
menulis, menganalisis, dan menilai kualitas tes.
Sejalan dengan itu, maka dalam bab ini dipaparkan konsep, teknik,
dan prosedur analisis butir tes yang mencakup perlunya analisis butir
tes, proses analisis butir tes, dan teknik pemilihan butir-butir tes yang
berkualitas. Setelah mendalami bab ini maka diharapkan para pembaca
akan dapat memahami dan mampu menganalisis dan memilih butir-butir
tes yang berkualitas.

229
Analisis Butir Tes

PERLUNYA ANALISIS BUTIR TES


Beberapa alasan mengapa diperlukan analisis terhadap butir-butir
tes adalah:
1. Untuk mengetahui kekuatan dan kelemahan setiap butir tes
sehingga dapat dilakukan perbaikan dan/atau pemilihan butir-butir
tes yang berkualitas.
2. Untuk memberikan informasi tentang spesifikasi butir tes secara
lengkap, sehingga akan lebih memudahkan bagi guru dalam
menyusun perangkat tes untuk memenuhi kebutuhan pengujian
dalam bidang dan tingkat tertentu.
3. Untuk segera dapat diketahui kelemahan yang terkandung dalam
setiap butir tes, seperti butir yang mudah atau sukar dan
kemampuan butir tes untuk membedakan siswa kelompok atas dan
kelompok bawah. Hal ini bila diketahui dengan segera akan
memungkin bagi guru untuk mengambil keputusan apakah butir tes
yang bermasalah harus dibuang, diperbaiki, atau tetap dipertahankan
guna mengukur hasil belajar siswa.
4. Agar dapat dijadikan acuan dalam menilai butir tes yang akan
disimpan dalam bank butir (item pool).
5. Untuk memperoleh informasi tentang butir tes, sehingga
memungkinkan untuk menyusun beberapa perangkat tes paralel.
Penyunan tes semacam ini akan sangat bermanfaat apabila akan
diadakan ujian ulang atau untuk mengukur hasil belajar sebelum dan
setelah pengajaran.

Analisis butir tes dilakukan untuk menyederhanakan dan menggu-


nakan informasi dari jawaban siswa untuk penetapan keputusan tentang
perangkat tes yang digunakan. Untuk kepentingan analisis butir tes,
maka tes perlu diujicobakan kepada kelompok responden yang memiliki
karakteristik setara dengan kelompok sasaran yang hendak diukur
dengan tes yang sedang dianalisis.

230
Analisis Butir Tes

Di samping itu, agar hasil analisis butir tes lebih cermat dan stabil
maka responden yang digunakan sebagai kelompok ujicoba harus setara
dengan kemampuan siswa yang akan diukur oleh tes yang sedang
dianalisis dan harus berjumlah banyak sehingga distribusi skor mereka
lebih bervariasi. Jumlah responden uji coba yang disarankan oleh
kebanyakan pakar pengukuran adalah berkisar antara 5 sampai dengan
10 kali lipat banyaknya butir tes yang akan dianalisis (Lihat: Nunnaly,
1970; Gable, 1986; Crocker dan Algina, 1986).

PROSES ANALISIS BUTIR TES


Analisis butir tes bertujuan untuk mendapatkan informasi tentang: (1)
Indeks kesukaran butir (2) Indeks daya beda butir. (3) Keberfungsian
pengecoh. (4) Korelasi biserial titik (point biserial correlation). (5)
Keseimbangan isi atau keterwakilan materi yang hendak diukur. Secara
empiris kelima informasi tersebut dibutuhkan karena saling berhubungan
antara satu dengan yang lainnya, di mana keberfungsian pilihan dapat
meningkatkan indeks kesukaran butir tes, indeks kesukaran butir tes
dapat menentukan daya beda butir, dan indeks kesukaran dan daya
beda butir dapat mempengaruhi interkorelasi butir, serta secara
keseluruhan ke lima informasi tersebut merupakan penentu tinggi
rendahnya koefisien reliabilitas tes.
Analisis butir tes akan bermanfaat secara maksimal apabila
diterapkan dalam tes acuan norma. Proses analisis butir pada tes acuan
norma dilakukan untuk menentukan: (1) seberapa sulit butir tes terhadap
kelompok siswa yang mencapai skor tinggi dan rendah, (2) seberapa
tepat setiap butir tes dalam membedakan kelompok siswa yang memiliki
kemampuan tinggi dan rendah, (3) untuk tes pilihan ganda, seberapa
efektif pilihan yang tersedia pada setiap butir tes. Secara matematis
tingkat kesukaran butir tes (p) adalah proporsi siswa yang menjawab
salah terhadap suatu butir tes, sedangkan daya beda adalah

231
Analisis Butir Tes

kemampuan butir tes untuk membedakan kelompok siswa yang memiliki


kemampuan tinggi dan rendah.

Tabel 11.1
Jawaban 34 Siswa SMP atas 10 Butir Tes Pilihan Ganda
Kelom- Nama Nomor Butir
pok Siswa 1 2 3 4 5 6 7 8 9 10
Ali A C B B C C B A B D
Bintang A C B B C C B A B D
Tuti A C B B C C E A B D
Atas Tini A B B B C C B A B D
Tatang A C B B C C B A B D
Agus A C B B C C B A B D
Mita A C B B C C B A B D
Maman A C B B C C B A B D
Denis A C B B C C B A B D
Joni A C B B B C B A B D
Kunci A C B B C C B A B D
Jumlah A 10 0 0 0 0 0 0 10 0 0
siswa B 0 1 10 10 1 0 9 0 10 0
yang C 0 9 0 - 9 10 0 0 0 0
memilih D 0 - 0 - 0 0 0 0 0 10
pilihan E - - - - - 1 - - -
Sedang Jumlah
Benar 14 12 12 13 12 13 11 11 12 12
Munir A C B B D C E A A D
Mamat A C B B D C D A B D
Mawar C B B B C C B A B C
Neti A C B B C C E A B D
Beti A C B B C C E A B B
Mono A C B B C C A B B B
Surya A C D B C C D C D A
Perdana A B A A C C B B C A
Bawah Tamin D C C A B B C B A D
Tia C B B B D C E C D D
Kunci A C B B C C B A B D
Jumlah A 7 0 1 2 0 0 1 5 2 2
siswa B 0 3 7 8 1 1 2 3 5 2
yang C 2 7 1 - 6 9 1 2 1 1
memilih D 1 - 1 - 3 0 2 0 2 5
pilihan E - - - - - - 4 - - -
Catatan: Tanda (-) tidak tersedia pilihan itu

232
Analisis Butir Tes

Indeks kesukaran dan indeks daya beda butir tes digunakan untuk
penyempurnaan butir-butir tes apabila dari hasil analisis ditemukan butir
yang: (1) terlalu mudah, (2) terlalu sukar, dan (3) tidak mampu
membedakan antara kelompok atas dan kelompok bawah. Di samping
itu, informasi yang diperoleh dari analisis butir mungkin pula digunakan
untuk menilai keefektifan pembelajaran di kelas dan menentukan pokok
bahasan atau subpokok bahasan yang memerlukan pengajaran
remedial.
Beberapa tahapan dalam analisis butir tes adalah: (1) memberi skor
terhadap jawaban siswa, (2) menyusun jawaban siswa dari skor tertinggi
ke skor terendah, (3) menentukan kelompok atas, kelompok sedang,
dan kelompok bawah dengan cara mengambil 27% dari skor tertinggi
sebagai kelompok atas dan 27% dari skor terendah sebagai kelompok
bawah, (4) membuat ringkasan respons setiap pilihan (khusus untuk tes
PG) pada kelompok atas dan kelompok bawah dan menghitung jumlah
jawaban benar pada kelompok sedang, (5) menghitung tingkat
kesukaran setiap butir tes, (6) menghitung daya pembeda setiap butir
tes, (7) memeriksa keberfungsian pilihan, pilihan yang ambigu, dan
kesalahan kunci jawaban (khusus untuk tes PG).

1. Indeks Kesukaran Butir Tes (p)

Indeks kesukaran butir tes adalah proporsi peserta yang menjawab


benar butir tes. Indeks kesukaran butir yang baik berkisar antara 0,3-0,7
paling baik pada 0,5; karena p = 0,5 dapat memberikan kontribusi
optimal terhadap korelasi biserial titik, daya pembeda butir, dan
koefisien reliabilitas tes. Butir-butir tes yang memiliki indeks kesukaran
di bawah atau di atas kriteria 0,3 - 0,7 dapat digunakan apabila ada
pertimbangan keterwakilan pokok bahasan yang diukurnya. Indeks
kesukaran butir tes dihitung dengan menggunakan rumus:

 Banyaknya siswa yang menjawab benar suatu butir tes 


p 
 Total siswa yang menjawab butir tes tersebut 

233
Analisis Butir Tes

atau dapat pula digunakan rumus:

 Banyaknya siswa kelompok atas  tengah  bawah yang menjawab benar suatu butir tes
p
 Total siswa yang menjawab butir tes tersebut

Nb
atau disingkat menjadi p 
Nt

Contoh perhitungan nilai p butir pada Tabel 11.1 adalah:

10  14  7
Butir nomor 1 p  0,91
34
Penggunaan informasi tingkat kesukaran butir tes. Tingkat
kesukaran butir tes dapat digunakan untuk kepentingan ujian dan
pembelajaran di kelas, seperti dicontohkan dalam Tabel 11.2.

2. Indeks Daya Pembeda Butir Tes (D)

Daya pembeda butir adalah kemampuan butir tes untuk


membedakan siswa mampu dan kurang mampu. Pembagian kelompok
siswa mampu dan tidak mampu dapat diacu dari pendapat Kelly (1939)
dalam Crocker dan Algina (1996) bahwa indeks daya beda butir yang
lebih stabil dan sensitif dapat dicapai dengan menggunakan 27 persen
kelompok atas dan 27 persen kelompok bawah. Rumus yang digunakan
untuk menghitung indeks daya beda butir (D) adalah:

234
Analisis Butir Tes

Jumlahsi wakelompokat s Jumlahsi wakelompokbawah



Yangmenjawab enar  yangmenjawab enar 
D   
Jumlahsal hsatukelompok
JA  JB
atau disingkat menjadi: D 
N

Tabel 11.2
Contoh Penggunaan Indeks Kesukaran Butir Tes (p)
Tujuan Prosedur Komentar
Menentukan Temukan butir-butir tes a. Skor tes yang rendah
konsep-konsep yang nilai p-nya paling mungkin disebabkan oleh
yang perlu rendah, nilai ini mungkin pembelajaran yang kurang,
diajarkan sebagai indikasi butir tes tidak benar, siswa
kembali perlunya pengajaran tidak belajar, atau motivasi
ulang rendah dalam merespons tes.
b. Skor sejumlah butir yang
homogen lebih reliabel
dibanding dengan skor satu
butir tes
Indikasi Hitung nilai p butir yang a. Lihat komentar a dan b
kekuatan dan sama pada suatu di atas.
kelemahan wilayah (misal propinsi) b. Cara ini hanya berlaku
kurikulum kemudian bandingkan untuk tes baku.

235
Analisis Butir Tes

pembelajaran dengan nilai p pada c. Butir-butir tes harus


skala yang lebih luas mengukur tujuan
(misal nasional) pembelajaran dan tujuan
kurikulum
d. Butir-butir te pada ujian
nasional sulit untuk mewakili
keragaman pembelajaran dan
budaya secara nasional
Memberi Melaporkan nilai p Laporan seperti ini akan sangat
umpan balik kepada masing-masing bermanfaat terutama bagi siswa
kepada siswa siswa yang merespons SMA dan mahasiswa
tes

Indikasi Kelompokkan lembar a. Metode ini hanya


adanya bias jawaban siswa perkiraan saja (tidak ilmiah).
atau (misalnya berdasarkan: b. Cara ini tidak dapat
ketidakwajaran jenis kelamin, suku, diterapkan pada sampel kecil
skor tes atau ras). Hitung nilai p sebab mungkin terjadi
butir pada masing- kesalahan pensampelan.
masing kelompok. Jika
berbeda berarti ada
indikasi bias tes.

Berdasarkan data pada Tabel 11.1 dapat dihitung nilai D butir 1, 5,


dan 7 sebagai berikut:

10  7
Butir nomor 1 D  0,3
10

96
Butir nomor 5 D  0,3
10

92
Butir nomor 7 D  0,7
10

Indeks daya beda butir (D) mempunyai rentang nilai –1 sampai


dengan +1. Nilai D positif berarti butir tes tersebut lebih banyak dijawab
oleh kelompok atas. Nilai D negatif berarti butir tes tersebut berfungsi

236
Analisis Butir Tes

sebaliknya, yaitu lebih banyak dijawab benar oleh kelompok bawah.


Beberapa kemungkinan nilai D adalah:
a. Nilai D negatif berarti lebih banyak dijawab benar oleh kelompok
bawah. Butir seperti ini perlu dikaji kembali, apakah perlu diperbaiki
atau sama sekali tidak digunakan dalam tes. Jika tidak ditemukakan
kesalahan dalam penulisan butir tes, maka kemungkinan yang
terjadi adalah kelompok atas belum mempelajari sasaran ukur butir
tersebut.
b. Nilai D positif berarti lebih banyak dijawab benar oleh kelompok
atas. Butir ini dapat digunakan dalam tes, terutama yang memiliki
indeks kesukaran 0,3 – 0,7.
c. Nilai D = 0 butir seperti ini tidak mampu membedakan kelompok
atas dan kelompok bawah. Jumlah jawaban benar pada kelompok
atas sama dengan jumlah jawaban benar pada kelompok bawah.
Butir seperti ini sebaiknya tidak digunakan.

Indeks daya beda butir berhubungan dengan reliabilitas tes. Indeks


daya beda yang tinggi dan positif akan dapat meningkatkan reliabilitas
tes. Jika tes akan digunakan untuk membandingkan hasil belajar siswa
maka sebaiknya digunakan butir-butir tes yang memiliki indeks daya
beda yang tinggi.

3. Keberfungsian Pengecoh (Khusus Tes PG)

Tujuan utama penempatan pengecoh dalam butir tes pilihan ganda


adalah untuk mengalabui siswa yang kurang pengetahuannya dalam
memilih jawaban yang benar. Suatu pengecoh dapat dipertahankan
apabila dipilih minimal 2 persen dari keseluruhan peserta tes, dipilih
minimal 5 persen kelompok bawah, dan lebih banyak dipilih oleh
kelompok bawah. Contoh butir nomor 7 pada Tabel 11.1, sebagai
berikut:
Pilihan Kelompok atas Kelompok Bawah
A 0 1
*B 9 2

237
Analisis Butir Tes

C 0 1
D 0 2
E 1 4

Setiap pengecoh dipilih minimal satu siswa pada kelompok bawah,


sedangkan pada kelompok atas hanya pengecoh E yang dipilih satu
siswa. Oleh karena ketidaktepatan jawaban dari sekelompok kecil siswa
dibanding dengan kelompok lainnya, maka disarankan agar dalam
memilih butir-butir tes harus mempertimbangkan beberapa hal
berikut:
a. Siswa yang memperoleh skor rendah pada keseluruhan butir tes,
berarti tidak memahami sasaran ukur tes. Jika terjadi sebaliknya,
maka butir-butir tes tersebut mungkin tidak valid, bias, atau skor
yang dicapai siswa tidak wajar. Butir-butir tes yang menyebabkan
skor keseluruhan siswa rendah seharusnya siswa pada kelompok
bawah tidak dapat menjawabnya. Suatu pengecoh berfungsi dengan
baik jika dipilih minimal 5 persen dari kelompok bawah dan lebih
banyak dipilih oleh kelompok bawah.
b. Tidak semua siswa yang memperoleh skor rendah menunjukkan
kurangnya penguasaan atas sasaran ukur tes. Pada contoh dalam
Tabel 11.1, tujuh dari sepuluh siswa yang berkemampuan rendah
dapat menjawab benar butir nomor dua. Demikian pula, tidak semua
siswa yang berkemampuan tinggi dapat menjawab benar semua
butir tes (lihat butir 2, 5, dan 7 pada Tabel 11.1).
c. Jika tidak satupun siswa pada kelompok bawah yang memilih
suatu pengecoh, maka pengecoh itu tidak berfungsi. Harus dikaji
mengapa pengecoh itu tidak berfungsi. Mungkin ada kesalahan tata
bahasa atau mungkin terlalu sulit bagi siswa berkemampuan rendah,
sehingga harus diganti atau diperbaiki.

4. Alternatif yang Ambigu (Khusus Tes PG)

238
Analisis Butir Tes

Suatu pilihan dikatakan ambigu jika siswa kelompok atas tidak dapat
membedakan kunci jawaban dengan satu atau lebih pengecoh yang
tersedia. Jika hal ini terjadi maka kelompok atas yang memilih pengecoh
tertentu hampir sama banyaknya dengan yang memilih kunci jawaban.
Perhatikan contoh berikut:
Contoh soal PKn
Isu politik uang sering kita dengar dalam setiap PILKADA di
seluruh Indonesia sejak masa reformasi, hal ini disebabkan
oleh, kecuali…
a. gampangnya memperoleh uang pelicin
b. lemahnya penegakan hukum di negara
kita*
c. peraturan yang tidak tegas
d. kurangnya kontrol dari masyarakat
Pilihan Kelompok Atas Kelompok Bawah
A 0 2
*B 6 4
C 6 4
D 0 2

Kunci jawaban B sama dengan pengecoh C masing-masing dipilih


enam orang siswa kelompok atas. Kedua pilihan tersebut perlu dikaji
dan direvisi sehingga hanya satu jawaban yang paling benar.

Perlu dicacat bahwa umumnya siswa pada kelompok bawah memilih


alternatif yang berbeda, namun tidak berarti pilihan tersebut harus
direvisi. Siswa yang tidak menguasai sasaran ukur tes akan kesulitan
untuk membedakan setiap pilihan yang tersedia, sebab mereka tidak
memiliki informasi yang cukup untuk memilih alternatif jawaban yang
benar.
Sebelum memastikan untuk memperbaiki suatu alteratif, kita harus
mengkajinya kembali, terutama terkait dengan pertanyaan: apakah tidak
berfungsinya pilihan itu disebabkan oleh ambigu ataukah karena

239
Analisis Butir Tes

ketidakcukupan pengetahuan untuk memilih jawaban yang benar.


Perhatikan contoh berikut:

Contoh soal Aritmetika: 4 + 5 x 6 = …..?


Pilihan Kelompok atas Kelompok bawah
A. 15 0 2
B. 30 0 2
* C. 34 5 3
D. 54 5 3

Ketidakcukupan dalam pembelajaran dan pemberian informasi


menyebabkan jawaban siswa pada kelompok atas menjadi ambigu.
Jika terlebih dahulu menjumlahkan angka 4 dan 5 hasilnya dikali 6
akan diperoleh 54 (jawaban D). Jika terlebih dahulu melakukan
perkalian angka 5 dan 6 hasilnya ditambah 4 akan diperoleh angka
34 (jawaban C). Butir seperti ini sebenarnya secara teknik tidak
salah, namun dari jawaban terlihat bahwa para siswa perlu diajari
prinsip-prinsip operasi Aritmetika seperti ini.

5. Kesalahan Kunci Jawaban (Khusus Tes PG)

Jika sebagian besar siswa kelompok atas memilih alternatif yang


salah, maka kebenaran kunci jawaban perlu dipertanyakan. Perhatikan
contoh berikut:

240
Analisis Butir Tes

Contoh soal PS Ekonomi


Perusahaan yang modalnya dari anggota dan dikelola
berdasarkan asas kekeluargaan adalah:
a. Firma
b. PT
c. Koperasi
d. BUMN
e. CV
Pilihan Kelompok Atas Kelompok Bawah
A 0 3
B 1 4
C 9 3
*D 2 2

Kunci jawaban seharusnya C tetapi guru menetapkan D sebagai


kuncinya.

6. Tebak Buta (Blind Guessing)

Jika pilihannya setara, membingungkan, atau para siswa sama


sekali belum memahami sasaran ukur suatu butir tes maka mereka
akan cenderung melewati butir itu atau mungkin akan berspekulasi
dalam memilih jawaban yang benar (tebak buta). Contoh penyebaran
jawaban siswa karena menebak secara buta, sebagai berikut:

241
Analisis Butir Tes

Contoh soal PS Ekonomi


Dari empat pernyataan tentang biaya dan beban berikut ini,
manakah pernyataan yang benar?
a. Biaya adalah pengorbanan yang telah dimanfaatkan
b. Beban adalah pengorbanan untuk memperoleh barang
atau jasa
c. Biaya adalah pengorbanan untuk memperoleh barang
atau jasa*
d. Biaya adalah beban yang telah dimanfaatkan dalam
menghasilkan pendapatan

Pilihan Kelompok atas Kelompok bawah


A 2 3
B 2 2
*C 3 3
D 3 2

Jawaban siswa dalam butir tersebut, khususnya pada kelompok atas


menunjukkan pola tebakan buta. Butir seperti ini menunjukkan
bahwa siswa memerlukan pengayaan atau pengajaran remedial atas
sasaran ukur butir tes, tidak hanya memperbaiki butir tes tersebut.
Tebak buta biasanya akan meningkatkan ketimpangan skor tes,
sehingga dapat mengurangi validitas butir dan reliabilitas tes.
Olehnya itu, untuk menghindari pengaruh tebakan secara buta
terhadap skor tes pilihan ganda maka dalam penskorannya dapat
digunakan rumus berikut:

Jumlah Salah
Skor = Jumlah Benar  Banyaknya Pilihan  1

S
atau S B
N 1

Contoh perhitungan:

242
Analisis Butir Tes

Untuk butir nomor 1 dan nomor 7 pada tabel 11.1 dapat dihitung
sebagai berikut:
3
Butir 1 Skor = 31   30
4 1

12
Butir 7 Skor = 22   18
4 1

Untuk menghindari pengaruh tebakan secara buta terhadap skor tes


benar-salah dapat digunakan rumus berikut:

Jumlah Salah S
Skor = Jumlah Benar  atau S  B 
2 2
Pengurangan skor melalui penggunaan rumus-rumus ini akan
merugikan siswa. Untuk mengatasi hal ini maka dalam pelaksanaan
tes siswa dianjurkan untuk tidak menebak jika sama sekali tidak
mengetahui jawabannya. Dalam hal ini akan terdapat sejumlah butir
yang ditinggalkan atau tidak dijawab oleh siswa-siswa tertentu.
Usaha siswa untuk meninggalkan sejumlah butir dihargai dengan
menggunakan rumus penskoran sebagai berikut:

Banyaknya butir yang tidak dijawab


Skor = Jumlah Benar  Banyaknya Pilihan  1
K
atau disingkat menjadi S  B 
N 1

Untuk tes benar-salah:


Banyaknya butir yang tidak dijawab
Skor = Jumlah Benar 
2
K
atau disingkat menjadi S  B 
2
Berbeda dengan rumus sebelumnya, penggunaan rumus ini akan
dapat meningkatkan skor yang dicapai siswa.

243
Analisis Butir Tes

7. Korelasi Biserial Titik (rpbi)

Korelasi biserial titik adalah korelasi antara skor butir tes dengan
skor total. Korelasi biserial titik dapat disamakan dengan daya beda
butir, namun rpbi itu sendiri perlu dihitung karena dapat memberikan
refleksi yang sebenarnya dari kontribusi setiap butir tes terhadap
keberfungsian tes. Semakin tinggi rpbi suatu butir tes semakin tinggi
kontribusinya dalam memprediksi total skor tes. Suatu butir tes dapat
dipertahankan apabila memiliki rpbi  0,30. Rumus yang digunakan
adalah:
M p  Mt p
rpbi 
t q
di mana:
Mp = rerata jawaban benar pada butir tes;
Mt = rerata skor total;
p = proporsi jawaban benar; dan
q = proporsi jawaban salah (1-p).

PEMILIHAN BUTIR TES YANG BERKUALITAS


Tujuan analisis butir tes adalah: (1) untuk memeriksa keberfungsian
pengecoh setiap butir tes, (2) memberi umpan balik kepada siswa atas
kinerja mereka dalam tes, (3) memberi umpan balik kepada guru sendiri
sehubungan dengan tingkat kesulitan belajar siswa, (4) menentukan
bagian-bagian dari tujuan pembelajaran yang memerlukan pengayaan;
(5) menemukan data-data obyektif untuk memperbaiki butir-butir tes, (6)
memilih butir-butir tes yang baik untuk dimasukkan dalam kumpulan
butir tes (bank butir). Petunjuk pemilihan butir tes sesuai dengan tujuan
pengukuran dapat dilihat pada Tabel 11.3.

Tabel 11.3
Petunjuk Pemilihan Butir Tes

244
Analisis Butir Tes

TUJUAN TES
Pengukuran kemampuan relatif siswa Pengukuran
KRITERIA Pengelompokkan Pembagian siswa kemampuan Absolut
keseluruhan siswa atas beberapa (Penguasaan tujuan
sesuai urutan kelompok sesuai pembelajaran di
kemampuannya kemampuannya kelas)
Tujuan Menentukan Membagi siswa Menilai pencapaian
umum kedudukan semua dalam dua kelompok siswa atas tujuan
siswa sesuai sesuai dengan pembelajaran.
capaiannya dalam kemampuan mereka.
pelajaran tertentu.
Tujuan Menentukan Membagi siswa Menentukan
khusus tes perbedaan hasil dalam dua persentase
belajar masing- kelompok. pencapaian siswa
masing siswa. atas tujuan
pembelajaran.
Kisi-kisi tes Butir-butir tes Butir-butir tes Butir-butir tes mewakili
mencakup mencakup semua subpokok
keseluruhan topik- keseluruhan topik bahasan dan tujuan
topik penting. penting. pembelajaran.
Penggunaan Pada setiap topik Pada setiap topik, Tidak memilih butir
indeks dalam kisi-kisi tes, pilih butir tes yang berdasarkan indeks
kesukaran pilih butir-butir tes nilai p-nya lebih kesukarannya (p),
butir (p) yang: Nilai p-nya besar dari persentase tetapi pelajari setiap
antara 0,16 dan siswa yang akan nilai p untuk
0,84 jika kinerja ditempatkan pada memastikan
dalam tes hanya kelompok atas. Misal mungkin terdapat
mengukur satu jika kelas akan dibagi kesalahan dalam
kemampuan. dua kelompok (50%) penulisan butir tes.
Nilai p-nya antara maka nilai p yang
0,40 dan 0,60 jika diambil = 0,60. Jika
kinerja dalam tes dibagi atas 27% dan
mewakili beberapa bawah maka butir
kemampuan yang harus memiliki nilai p
berbeda. = 0,35 (ini hanya
berlaku pada tes
yang mengukur satu
kemampuan)
Penggunaan Pada setiap topik Pada setiap topik Semua butir tes harus
daya beda dalam kisi-kisi tes, dalam kisi-kisi tes, memiliki nilai D > 0,0.
butir (D) pilih butir-butir tes pilih butir-butir tes Kecuali ada alasan
yang memiliki nilai yang memiliki nilai D kuat atas penggunan
D lebih besar atau lebih besar atau butir yang nilai D-nya
sama dengan sama dengan +0,30. negatif.
+0,30.

245
Analisis Butir Tes

Tabel 11.3 berisikan petunjuk pemilihan butir tes untuk pengukuran


hasil belajar siswa di kelas, baik untuk mengukur kemampuan relatif
ataupun kemampuan absolut. Tes kemampuan relatif digunakan untuk
mengelompokkan siswa sesuai tingkatan kemampuannya, sedangkan
tes kemampuan absolut digunakan untuk mengukur penguasaan siswa
atas tujuan pembelajaran.
Tujuan pembelajaran adalah merupakan pertimbangan utama dalam
penulisan dan pemilihan butir tes. Aturan yang dikemukakan dalam tabel
menjelaskan apakah suatu tes akan digunakan untuk mengukur satu
kemampuan atau lebih dari satu kemampuan. Suatu tes yang homogen
hanya mengukur satu kemampuan. Sementara itu tes yang heterogen
mengukur lebih dari satu kemampuan. Jika tes yang ditulis mencakup
butir-butir yang memungkinkan siswa menjawab benar hanya dengan
menebak (misal PG, BS) maka butir-butir yang dipilih kira-kira 5% lebih
mudah dari yang dijelaskan dalam Tabel 11.3.
Dalam penulisan butir tes yang mengukur kemampuan relatif siswa,
perlu diingat bahwa jika hendak memilih dari dua butir yang mengukur
tujuan belajar yang sama, maka pilihlah yang memiliki indeks daya beda
yang lebih tinggi. Jelasnya, jika dua butir tes mengukur tujuan belajar
yang sama, memiliki tingkat kesukaran yang sama, tetapi memiliki daya
beda yang tidak sama, maka pilihlah butir yang memiliki indeks daya
beda yang lebih tinggi.
Jika merancang tes acuan patokan untuk mengukur hasil belajar
siswa di kelas maka statistik butir tes kurang berperan dalam pemilihan
butir tes. Pertimbangan utama dalam pemilihan butir tes di kelas adalah
keterwakilan tujuan pembelajaran, karakteristik pokok bahasan dan
subpokok bahasan yang diukur, dan karakteristik siswa yang diukur.
Statistik butir tes hanya digunakan untuk menyempurnakan butir-butir
tes yang digunakan.

246
Analisis Butir Tes

KESIMPULAN
Analisis butir tes dilakukan untuk menyederhanakan dan
menggunakan informasi dari jawaban siswa untuk penetapan keputusan
tentang perangkat tes yang digunakan. Untuk kepentingan analisis butir
tes, maka tes perlu diujicobakan kepada kelompok responden yang
memiliki karakteristik mirip dengan kelompok sasaran yang hendak
diukur dengan tes yang sedang dianalisis. Di samping itu, agar hasil
analisis butir tes lebih cermat dan stabil maka responden yang
digunakan sebagai kelompok ujicoba harus berjumlah banyak sehingga
distribusi skor mereka lebih bervariasi. Jumlah responden uji coba yang
disarankan oleh kebanyakan pakar pengukuran adalah sekitar 5 sampai
dengan 10 kali lipat banyaknya butir tes yang akan dianalisis.
Alasan perlunya analisis butir tes: (1) mengetahui kekuatan dan
kelemahan butir tes sehingga dapat dilakukan perbaikan dan seleksi, (2)
memberikan informasi tentang spesifikasi butir tes secara lengkap, (3)
mengetahui daya beda dan tingkat kesukaran butir tes, (4) memilih butir
tes yang berkualitas untuk disimpan dalam bank butir, dan (5) untuk
menyusun perangkat tes paralel.
Jika menulis suatu tes untuk mengukur kemampuan relatif siswa
(penilaian acuan norma), maka perlu diingat bahwa jika dua butir tes
mengukur tujuan yang sama, memiliki tingkat kesukaran yang sama,
tetapi memiliki daya beda butir yang tidak sama, maka pilihlah butir yang
memiliki indeks daya beda yang lebih tinggi. Untuk tes acuan patokan,
yaitu untuk mengukur hasil belajar siswa di kelas maka statistik butir tes
kurang berperan dalam pemilihan butir tes. Pertimbangan utama dalam
pemilihan butir tes di kelas adalah keterwakilan tujuan pembelajaran,
karakteristik pokok bahasan dan subpokok bahasan yang diukur, dan
karakteristik siswa yang diukur. Statistik butir tes hanya digunakan untuk
menyempurnakan butir-butir tes.

247

You might also like