ANALISIS BUTIR SOAL
DIAJUKAN UNTUK MEMENUHI
SALAH SATU TUGAS
MATA KULIAH EVALUASI REMEDIASI PEMBELAJARAN

OLEH
:
PRAKSEDIS
O. NABU 163112540120005
MONA
WULANDARI 163112540120018
ISTIANA
EKA PUTRI 163112540120020
SYIFA
UNAJAH 163112540120037
SELLYTA
Br HASUGIAN 163112540120055
NOVA
NOVIANTY 163112540120059
ADRIANA
G. KOLO 163112540120060
IMA
AUFYA HIDAYAH 163112540120061
SHUFI RAHMATILLAH 163112540120111
SHINTA
KARLINA 163112540120120
D4
KEBIDANAN
FAKULTAS
ILMU KESEHATAN
UNIVERSITAS
NASIONAL JAKARTA
KATA
PENGANTAR
Puji syukur
kami panjatkan kehadirat Tuhan Yang Maha Esa karena dengan rahmat, karunia,
serta taufik dan hidayah-Nya kami dapat menyelesaikan makalah analisis butir soal ini dengan
baik meskipun banyak kekurangan didalamnya.
Kami sangat
berharap makalah ini dapat berguna dalam rangka menambah wawasan serta pengetahuan
kita mengenai penelaahan analisis butir soal. Kami juga menyadari sepenuhnya
bahwa di dalam makalah ini terdapat kekurangan dan jauh dari kata sempurna.
Oleh sebab itu, kami berharap adanya kritik, saran dan usulan demi perbaikan
makalah yang telah kami buat di masa yang akan datang, mengingat tidak ada
sesuatu yang sempurna tanpa saran yang membangun.
Semoga makalah sederhana ini dapat dipahami bagi siapapun yang membacanya.
Sekiranya makalah yang telah disusun ini dapat berguna bagi kami sendiri maupun
orang yang membacanya. Sebelumnya kami mohon maaf apabila terdapat kesalahan
kata-kata yang kurang berkenan dan kami memohon kritik dan saran yang membangun
demi perbaikan di masa depan.
Jakarta, November 2016
Penyusun
DAFTAR
ISI
Halaman
KATA
PENGANTAR ........................................................................ i
DAFTAR
ISI ........................................................................................ ii
BAB
I PENDAHULUAN
A.
Latar Belakang .......................................................................... 1
B.
Rumusan Masalah ..................................................................... 1
C. Tujuan ......................................................................................... 1
BAB
II PEMBAHASAN
A. ANALISIS BUTIR SOAL KUALITATIF ............................... 2
1. ANALISIS BUTIR SOAL KUALITATIF ............................... 2
2. ANALISIS BUTIR SOAL KUANTITATIF ............................. 4
B. MANFAAT ANALISIS BUTIR SOAL ..................................... 19
BAB
III PENUTUP
A. Kesimpulan ............................................................................ 21
B.
Saran ..................................................................................... 22
DAFTAR PUSTAKA
BAB
I
PENDAHULUAN
A.
Latar
Belakang
Dalam
dunia pendidikan, penilaian merupakan bagian yang tidak terpisahkan dari proses
belajar mengajar. Sistem penilaian yang baik akan mendorong guru menggunakan
strategi mengajar yang lebih baik dan memotivasi anak untuk belajar lebih giat.
Penilaian biasanya dimulai dengan kegiatan pengukuran. Pengukuran (measurement)
merupakan cabang ilmu statistika terapan yang bertujuan untuk membangun
dasar-dasar pengembangan tes yang lebih baik sehingga menghasilkan tes yang
berfungsi secara optimal, valid, dan reliabel. Proses belajar mengajar
dilaksanakan tidak hanya untuk kesenangan atau bersifat mekanis saja tetapi
mempunyai misi atau tujuan bersama.
Dalam
usaha untuk mencapai misi dan tujuan itu perlu diketahui apakah usaha yang
dilakukan sudah sesuai dengan tujuan? Untuk mengetahui apakah tujuan pendidikan
sudah tercapai perlu diadakan tes. Sebuah tes yang dapat baik sebagai alat
pengukur harus dianalisis terlebih dahulu. Dalam menganalisis butir soal dalam
tes harus memperhatikan daya serap, tingkat kesukaran, daya beda, fungsi
pengecoh, validitas dan reabilitas. Hal tersebut dilakukan agar tes yang
diberikan kepada siswa sesuai dengan daya serap siswa, tingkat kesukarannya,
dan soal yang diberikan pun harus valid. Sehingga, tujuan dari pembelajaran
dapat tercapai.
B. Rumusan Masalah
Rumusan masalah
dalam makalah ini, yaitu:
a. Apakah yang dimaksud dengan
analisis butir soal secara kualitatif dan kuantitatif?
b. Bagaimana cara mengaplikasikan analisis
butir soal secara kualitatif dan kuantitatif?
c. Apa manfaat dari menganalisis butir soal?
C. Tujuan
Tujuan dari
penyusunan makalah ini, yaitu:
a.
Mendeskripsikan pengertian analisis butir soal secara kualitatif dan
kuantitatif.
b. Mengaplikasikan analisis butir soal secara
kualitatif dan kuantitatif.
c. Mengetahui manfaat dari menganalisis butir
soal.
BAB
II
PEMBAHASAN
A.
Analisis
Butir Soal Secara Kualitatif dan Kuantitatif
Pada
prinsipnya analisis butir soal secara kualitatif dilaksanakan berdasarkan
kaidah penulisan soal (tes tertulis, perbuatan, dan sikap). Penelaahan ini
biasanya dilakukan sebelum soal digunakan atau diujikan. Aspek yang
diperhatikan di dalam penelaahan secara kualitatif ini adalah setiap soal
ditelaah dari segi materi, konstruksi, bahasa atau budaya, dan kunci jawaban
atau pedoman penskorannya.
Dalam
menganalisis butir soal, terdapat dua teknik. Yaitu teknik kualitatif dan
teknik kuantitatif.
1.
Teknik
Analisis Secara Kualitatif
Ada beberapa teknik yang dapat
digunakan untuk menganalisis butir soal secara kualitatif, diantaranya adalah
teknik moderator dan teknik panel. Teknik
moderator merupakan teknik berdiskusi yang di dalamnya terdapat satu orang
sebagai penengah. Berdasarkan teknik ini, setiap butir soal didiskusikan secara
bersama-sama dengan beberapa ahli seperti guru yang mengajarkan materi, ahli
materi, penyusun atau pengembang kurikulum, ahli penilaian, ahli bahasa,
berlatar belakang psikologi. Teknik ini sangat baik karena setiap butir soal
dilihat secara bersamasama berdasarkan kaidah penulisannya. Di samping itu,
para penelaah dipersilakan mengomentari berdasarkan kompetensinya
masing-masing. Setiap komentar atau masukan dari peserta diskusi dicatat.
Setiap butir soal dapat dituntaskan secara bersama-sama, perbaikannya seperti
apa. Namun, kelemahan teknik ini memiliki kelemahan karena memerlukan waktu
lama untuk rnendiskusikan setiap satu butir soal.
Teknik berikutnya adalah Teknik Panel yakni suatu teknik
menelaah butir soal berdasarkan kaidah penulisan butir soal. Kaidah itu diantaranya
materi, konstruksi, bahasa atau budaya, kebenaran kunci jawaban atau 4
|Analisis Butir Soal pedoman penskoran. Caranya beberapa penelaah diberikan
butir-butir soal yang akan ditelaah, format penelaahan, dan pedoman penilaian
atau penelaahan. Pada tahap awal, semua orang yang terlibat dalam kegiatan
penelaahan disamakan persepsinya, kemudian mereka berkerja sendirisendiri di
tempat berbeda. Para penelaah dipersilakan memperbaiki langsung pada teks soal
dan memberikan komentarnya serta memberikan nilai pada setiap butir soal dengan
kriteria: soal baik, perlu diperbaiki, atau diganti. Dalam menganalisis butir
soal secara kualitatif, penggunaan format penelaahan soal akan sangat membantu
dan mempermudah prosedur pelaksanaannya. Format penelaahan soal digunakan
sebagai dasar untuk menganalisis setiap butir soal. Format penelaahan soal yang
dimaksud adalah format penelaahan butir soal: uraian, pilihan ganda, tes
perbuatan dan instrumen non-tes. Berikut disajikan keempat format penelaahan
butir soal.
a. Format
Penelaahan Butir Soal Bentuk
Uraian
Mata
pelajaran :
Kelas/semester :
Penelaah :
b.
Format
Penelaahan Butir Soal Bentuk Pilihan Ganda
Mata pelajaran :
Kelas/semester :
Penelaah :
c.
Format
Penelaahan Untuk Instrument Perbuatan
Mata pelajaran :
Kelas/semester :
Penelaah :
d.
Format
Penelaahan Untuk Instrument Non-Tes
Mata
pelajaran :
Kelas/semester :
Penelaah :
CATATAN : SEMUA FORMAT DILAMPIRKAN
DIBAWAH.
2.
Analisis
Butir Soal Secara Kuantitatif
Penelaahan soal secara kuantitatif adalah penelaahan
butir soal didasarkan pada data empirik. Data empirik ini diperoleh dari soal
yang telah diujikan. Ada dua pendekatan dalam analisis secara kuantitatif,
yaitu pendekatan secara klasik dan modern. Analisis butir soal secara klasik
adalah proses penelaahan butir soal melalui informasi dari jawaban peserta
didik tes guna meningkatkan mutu butir soal yang bersangkutan dengan
menggunakan teori tes klasik. Kelebihan analisis butir soal secara klasik
adalah murah, sederhana, familiar, dapat dilaksanakan sehari-hari dengan cepat
menggunakan komputer, dan dapat menggunakan data dari beberapa peserta didik
atau sampel kecil (Millman dan Greene, 1993: 358). Analisis jenis butir ini
yang lazim digunakan dalam praktik di lapangan, terutama oleh guru disekolah.
Aspek yang perlu diperhatikan dalam analisis butir soal secara klasik adalah
setiap butir soal ditelaah dari segi: tingkat kesukaran butir, daya pembeda
butir, dan penyebaran pilihan jawaban (untuk soal bentuk obyektif) atau fungsi
pengecoh pada setiap pilihan jawaban, reliabilitas dan validitas soal.
1.
Tingkat
Kesukaran
Tingkat kesukaran soal adalah peluang untuk menjawab
benar suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam
bentuk indeks. Indeks tingkat kesukaran ini pada umumnya dinyatakan dalam
bentuk proporsi yang besarnya berkisar 0,00 - 1,00 (Aiken (1994: 66). Semakin
besar indeks tingkat kesukaran yang diperoleh dari hasil hitungan, berarti
semakin mudah soal itu. Suatu soal memiliki TK= 0,00 artinya bahwa tidak ada
siswa yang menjawab benar dan bila memiliki TK= 1,00 artinya bahwa siswa
menjawab benar. Perhitungan indeks tingkat kesukaran ini dilakukan untuk setiap
nomor soal. Pada prinsipnya, skor rata-rata yang diperoleh peserta didik pada
butir soal yang bersangkutan dinamakan tingkat kesukaran butir soal itu. Rumus
ini dipergunakan untuk soal selected response item, yaitu (Nitko, 1996: 310).

jumlah siswa yang mengikuti tes
Atau dengan menggunakan rumus:

N
P = proporsi (indeks kesukaran) B = jumlah siswa
yang menjawab benar N = jumlah peserta tes Tingkat kesukaran butir soal
biasanya dikaitkan dengan tujuan tes. Misalnya untuk keperluan ujian semester
digunakan butir soal yang memiliki tingkat kesukaran sedang, untuk keperluan
seleksi digunakan butir soal yang memiliki tingkat kesukaran tinggi atau sukar,
dan untuk keperluan diagnostik biasanya digunakan butir soal yang memiliki
tingkat kesukaran rendah atau mudah.
Klasifikasi tingkat kesulitan soal dapat menggunakan
kriteria berikut:
NO
|
RANGE
TINGKAT KESUKARAN
|
KATEGORI
|
KEPUTUSAN
|
1
|
0,7
– 1,0
|
Mudah
|
Ditolak/direvisi
|
2
|
0,3
– 0,7
|
Sedang
|
Diterima
|
3
|
0,0
– 0,3
|
Sulit
|
Ditolak/direvisi
|
Tingkat kesukaran butir soal memiliki 2 kegunaan,
yaitu kegunaan bagi guru dan kegunaan bagi pengujian dan pengajaran (Nitko,
1996: 310-313). Kegunaannya bagi guru adalah: (1) sebagai pengenalan konsep
terhadap pembelajaran ulang dan memberi masukan kepada siswa tentang hasil
belajar mereka, (2) memperoleh informasi tentang penekanan kurikulum atau
mencurigai terhadap butir soal yang bias. Adapun kegunaannya bagi pengujian dan
pengajaran adalah: (a) pengenalan konsep yang diperlukan untuk diajarkan ulang,
(b) tanda-tanda terhadap kelebihan dan kelemahan pada kurikulum sekolah, (c)
memberi masukan kepada siswa, (d) tanda-tanda kemungkinan adanya butir soal
yang bias, (e) merakit tes yang memiliki ketepatan data soal.
Contoh
:
Tes
formatif IPA, 10 soal bentuk pilihan ganda, option 4, dengan proporsi 2 soal
mudah, 6 soal sedang dan 2 soal sukar, jumlah siswa = 20 orang
No soal
|
Kemampuan yang diukur
|
Judgement P soal
|
Jumlah siswa yang menjawab benar
|
Indeks kesukaran
|
Indeks kesukaran
|
1
|
Pengetahuan
|
Mudah
|
18
|
0,90
|
Mudah
|
2
|
Pengetahuan
|
Mudah
|
12
|
0,60
|
Sedang
|
3
|
Pemahaman
|
Sedang
|
10
|
0,50
|
Sedang
|
4
|
Aplikasi
|
Sedang
|
12
|
0,60
|
Sedang
|
5
|
Aplikasi
|
Sedang
|
9
|
0,45
|
Sedang
|
6
|
Pemahaman
|
Sedang
|
20
|
1,00
|
Mudah
|
7
|
Analisa
|
Sedang
|
6
|
0,30
|
Sukar
|
8
|
Pemahaman
|
Sedang
|
10
|
0,50
|
Sedang
|
9
|
Sintesa
|
Sukar
|
4
|
0,20
|
Sukar
|
10
|
Sintesa
|
Sukar
|
9
|
0,45
|
Sedang
|
Dalam
mencari indeks kesukaran menggunakan rumus yang telah ditulis di atas
:
P = B/N = 18/20 P = 0,90
Dari
contoh di atas diperoleh hasil, yaitu : soal nomor 1, 3, 4, 5, 8 dan 9,
terdapat kesesuaian antara judgement dengan hasil analisa, soal nomor 2 yang di
judgement mudah ternyata termasuk soal sedang, soal nomor 6 yang di judgement
sedang ternyata termasuk soal mudah, soal nomor 7 yang dijudgement sedang,
ternyata termasuk sukar dan soal nomor 10 yang dijudgement sukar, ternyata
termasuk soal sedang. Atas dasar hasil di atas, soal yang harus diperbaiki
adalah:
Soal
nomor 2, diturunkan ke dalam kategori mudah,
Soal
nomor 6, dinaikkan ke dalam kategori sedang,
Soal
nomor 7 diturunkan ke dalam kategori sedang,
Soal nomor 10, dinaikkan ke dalam kategori sukar.
2.
Daya
Pembeda
Daya Pembeda
Daya pembeda soal adalah kemampuan suatu butir soal dapat membedakan antara
siswa yang menguasai materi yang ditanyakan dan siswa yang belum menguasai
materi yang diujikan. Daya pembeda butir soal memiliki manfaat berikut. Pertama
untuk meningkatkan mutu setiap butir soal melalui data empiriknya. Berdasarkan
indeks daya pembeda, setiap butir soal dapat diketahui apakah butir soal itu
baik, direvisi atau ditolak.
Kedua,
untuk mengetahui seberapa jauh masing-masing soal dapat mendeteksi atau
membedakan kemampuan siswa, yaitu siswa yang telah memahami atau belum memahami
materi yang diajarkan guru. Apabila suatu soal tidak dapat membedakan kedua
kemampuan siswa itu maka butir soal itu dapat dicurigai kemungkinannya: a)
Kunci jawaban butir soal itu tidak tepat. b) Butir soal itu memiliki 2 atau
lebih kunci jawaban yang benar. c) Kompetensi yang diukur tidak jelas.
d)Pengecoh tidak berfungsi. e)Materi yang ditanyakan terlalu sulit, sehingga banyak
siswa yang menebak dan f) Sebagian besar siswa yang memahami materi yang
ditanyakan berpikir ada yang salah informasi dalam butir soalnya.
Untuk menentukan daya pembeda dibedakan menjadi
kelompok kecil (kurang dari 100 orang) dan kelompok besar (100 orang ke atas).
a) Untuk
kelompok kecil
Seluruh
kelompok testee dibagi dua sama besar, 50% kelompok atas dan 50% kelompok
bawah.Daya pembeda soal adalah kemampuan suatu butir soal dapat membedakan
antara siswa yang menguasai materi yang ditanyakan dan siswa yang belum
menguasai materi yang diujikan. Daya pembeda butir soal memiliki manfaat
berikut. Pertama untuk meningkatkan mutu setiap butir soal melalui data
empiriknya. Berdasarkan indeks daya pembeda, setiap butir soal dapat diketahui
apakah butir soal itu baik, direvisi atau ditolak. Kedua, untuk mengetahui
seberapa jauh masing-masing soal dapat mendeteksi atau membedakan kemampuan
siswa, yaitu siswa yang telah memahami atau belum memahami materi yang
diajarkan guru. Apabila suatu soal tidak dapat membedakan kedua kemampuan siswa
itu maka butir soal itu dapat dicurigai kemungkinannya: a) Kunci jawaban butir
soal itu tidak tepat. b) Butir soal itu memiliki 2 atau lebih kunci jawaban
yang benar. c) Kompetensi yang diukur tidak jelas. d)Pengecoh tidak berfungsi.
e)Materi yang ditanyakan terlalu sulit, sehingga banyak siswa yang menebak dan
f) Sebagian besar siswa yang memahami materi yang ditanyakan berpikir ada yang
salah informasi dalam butir soalnya. Untuk menentukan daya pembeda dibedakan
menjadi kelompok kecil (kurang dari 100 orang) dan kelompok besar (100 orang ke
atas). a) Untuk kelompok kecil seluruh kelompok testee dibagi dua sama besar,
50% kelompok atas dan 50% kelompok bawah.
Contoh:
Siswa Skor

B 8
C 7 KELOMPOK
ATAS (JA)
D 7
E 6

G 5
H
4 KELOMPOK BAWAH (JB)
I
4
J 3
Seluruh
pengikut tes, dideretkan mulai dari skor teratas sampai terbawah, lalu dibagi
2.
b) Untuk
kelompok besar
Mengingat biaya dan waktu untuk menganalisis, maka
untuk kelompok besar biasanya hanya diambil kedua kutubnya saja, yaitu 27% skor
teratas sebagai kelompok atas (JA) dan 27% skor terbawah sebagai kelompok bawah
(JB).
JA = jumlah kelompok atas
JB = jumlah
kelompok bawah
3.
Fungsi
pengecoh (distracter function)
Pada saat membicarakan tes objektif bentuk multiple
choice item tersebut untuk setiap butir item yang dikeluarkan dalam tes hasil
belajar telah dilengkapi dengan beberapa kemungkinan jawab, atau yang sering
dikenal dengan istilah option atau alternatif. Option atau alternatif itu
jumlahnya berkisar antara 3 sampai dengan 5 buah, dan dari
kemungkinan-kemungkinan jawaban yang terpasang pada setiap butir item itu,
salah satu diantaranya adalah merupakan jawaban betul (kunci jawaban),
sedangkan sisanya adalah merupakan jawaban salah. Jawaban-jawaban salah itulah
yang biasa dikenal dengan istilah distractor (pengecoh). Fungsi pengecoh
dimaksudkan untuk mengetahui seberapa besar peserta yang tidak memiliki kunci
jawaban (option) pada bentuk soal pilihan ganda. Untuk soal pilihan ganda,
alternatif jawaban menurut kaidah harus homogen dan logis sehingga setiap
pilihan jawaban (opition) dapat berfungsi atau ada yang memilih. Setiap
pengecoh dapat dikatakan berfungsi apabila ada yang memilih. Setiap pengecoh dapat
dikatakan berfungsi apabila terpilih minimal sebanyak 5% dari jumlah
peserta.untuk menghitungnya dapat digunakan rumus sebagai berikut:

𝑗𝑢𝑚𝑙𝑎ℎ 𝑠𝑒𝑙𝑢𝑟𝑢ℎ 𝑝𝑒𝑠𝑒𝑟𝑡𝑎
𝑡𝑒𝑠
Menganalisis fungsi distraktor sering dikenal dengan
istilah lain, yaitu : menganalisis pola penyebaran jawaban item. Adapun yang
dimaksud dengan pola penyebaran jawaban item adalah suatu pola yang dapat
menggambarkan bagaimana testee menentukan pilihan jawabnya terhadap
kemungkinan-kemungkinan jawab yang telah dipasangkan pada setiap butir item.
Suatu kemungkinan dapat terjadi, yaitu bahwa dari keseluruhan alternatif yang
dipasang pada butir item tertentu, sama sekali tidak dipilih oleh testee.
Dengan kata lain, testee menyatakan ―blangko. Pernyataan blangko ini sering
dikenal dengan istilah omit dan biasa diberi lambang dengan huruf O. Sebagai
tindak lanjut atas hasil penganalisaan terhadap fungsi distraktor tersebut maka
distraktor yang sudah dapat menjalankan fungsinya dengan baik dapat dipakai
lagi pada tes-tes yang akan datang, sedangkan distraktor yang belum dapat
berfungsi dengan baik sebaiknya diperbaiki atau diganti dengan distraktor yang
lain (Anas, 2011:408).
4.
Reliabilitas
Skor Tes
Realibilitas
adalah tingkat atau derajat konsistensi dari suatu instrumen, reliabilitas tes
berkenaan dengan dengan pertanyaan, apakah suatu tes teliti dan dapat dipercaya
sesuai dengan kriteria yang telah ditetapkan. Suatu tes dapat dikatakan reliabel
jika selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama
pada waktu yang sama pada waktu atau kesempatan yang berbeda.
Menurut
Gronlun, ada empat faktor yang dapat mempengaruhi reliabilitas, yaitu :
1. Panjang
tes, yaitu banyaknya soal tes. Ada kecenderungan, semakin panjang suatu tes
akan lebih tinggi tingkat reliabilitas suatu tes, karena semakin banyak soal,
maka akan semakin banyak sampel yang diukur dan proporsi jawaban yang benar
semakin semakin banyak, sehingga faktor tebakan akan semakin rendah.
2. Sebaran skor, besarnya sebaran skor akan membuat
tingkat reliabilitas menjadi lebih tinggi, Karena koefesien reliabilitas yang
lebih besar diperoleh ketika peserta didik tetap pada posisi yang relative sama
dalam satu kelompok pengujian ke pengujian berikutnya. Dengan kata lain,
peluang selisih dari perubahan posisi dalam kelompok dapat memperbesar
koefesien reliabilitas.
3. Tingkat kesukaran, dalam penilaian yang
menggunakan pendekatan penilaian acuan norma, baik untuk soal yang mudah maupun
sukar, cenderung menghasilkan tingkat reliabilitas yang rendah. Hal ini
disebabkan antara hasil tes yang mudah dengan hasil tes yang sukar keduanya
dalam satu sebaran skor yang terbatas. Untuk tes yang mudah, skor akan berada
dibagian atas dan akhir dari skala penilaian. Bagi kedua tes (mudah dan sukar),
perbedaan antar peserta didik kecil sekali dan cenderung tidak dapat dipercaya.
Tingkat kesukaran soal yang ideal untuk meningkatkan koefesien reliabilitas
adalah soal yang menghasilkan sebaran skor berbentuk genta atau kurva normal.
4. Objektivitas, menunjukkan skor tes kemampuan yang
sama antara peserta didik yang satu dengan peserta didik lainnya. Peserta didik
memperoleh hasil yang sama dalam mengerjakan suatu tes. Jika peserta didik
memiliki tingkat kemampuan yang sama, maka akan memperoleh hasil tes yang sama
pada saat mengerjakan tes yang sama. Objektivitas prosedur tes yang tinggi akan
memperoleh reliabilitas hasil tes yang tidak dipengaruhi oleh prosedur
penskoran.
Konsep reliabilitas mendasari kesalahan pengukuran
yang mungkin terjadi pada suatu proses pengukuran atau pada nilai tunggal
tertentu, sehingga menimbulkan perubahan pada susunan kelompoknya. Misalnya,
guru mengetes peserta didik dengan instrumen tertentu dan mendapat nilai 70.
Kemudian pada kesempatan yang berbeda dengan instrumen yang sama, guru
melakukan tes kembali, ternyata peserta didik tersebut mendapat nilai 75.
Artinya, tes tersebut tidak reliabel, karena terjadi kesalahan pengukuran. Tes
yang reliabel adalah apabila koefesien reliabilitasnya tinggi dan kesalahan
baku pengukurannya rendah.
Menurut perhitungan product-moment dari Person, ada
tiga macam reliabilitas, yaitu koefesien stabilitas, koefesien ekuivalen dan
koefesien konsistensi internal.
a)
Koefesien
Stabilitas
Jenis reliabilitas yang menggunakan teknik test and
retest, yaitu memberikan tes kepada sekelompok individu, kemudian diadakan
pengulangan tes pada kelompok yang sama dengan waktu yang berbeda. Cara
memperoleh koefesien stabilitas adalah dengan mengorelasikan hasil tes pertama
dengan hasil tes kedua dari kelompok yang sama, tes yang sama, pada waktu yang
berbeda. Jika antara waktu tes pertama dengan tes yang kedua cukup lama,
kemudian diadakan latihan-latihan tambahan, maka bisa jadi nilai tes yang kedua
akan lebih besar daripada tes yang pertama. Sebaliknya, jika antara waktu tes
pertama dengan tes kedua relatif pendek, maka nilai tes kedua bisa jadi sama
atau lebih besar daripada tes pertama karena soal dan jawaban masih dapat
diingat. Kesalahan teknis ini dapat bersumber dari berbagai faktor, sehingga
menyebabkan peserta didik mempunyai skor yang berbeda pada saat dua kali
mengerjakan tes yang sama. Bisa saja perubahan skor yang terjadi bukan
disebabkan perubahan hal yang diukur, tetapi memang karena situasi yang berbeda
atau pengalaman dari peserta didik pada saat mengikuti tes yang pertama,
sehingga ketika mengerjakan tes yang kedua, peserta didik lebih berhati-hati
dan lebih baik hasilnya. Keunggulan teknik ini adalah dapat memperkecil
kemungkinan masuknya sumber kesalahan yang lain. Namun, patut juga
dipertimbangkan bahwa penggunaan kelompok yang sama dan tes yang sama dalam dua
kali tes akan mempengaruhi hasil tes yang kedua, karena responden sudah
memiliki pengalaman mengerjakan tes yang pertama. Hal ini sekaligus menunjukan
kelemahan teknik test and retest.
b)
Koefesien
ekuivalen
Jika mengorelasikan dua buah tes yang parallel pada
kelompok dan waktu yang sama. Metode yang digunakan untuk memperoleh koefesien
ekuivalen adalah metode dengan menggunakan dua buah bentuk tes parallel or
alternate-forms method. Syarat-syarat yang harus dipenuhi kedua tes parallel
adalah criteria yang dipakai pada kedua tes sama., masing-masing tes
dikonstruksikan tersendiri, jumlah item, isi, dan corak sama, tingkat kesukaran
sama, petunjuk waktu yang disediakan untuk mengerjakan tes dan contoh-contoh
juga sama. Kemungkinan kesalahan pada teknik ini bersumber dari derajat
keseimbangan antara dua tes tersebut, serta kondisi tempat yang mungkin berbeda
pada kelompok tes pertama dengan kelompok tes kedua, meskipun dilakukan pada
waktu yang sama.
c)
Koefesien
konsistensi internal
Reliabilitas yang didapat dengan jalan
mengorelasikan dua buah tes dari kelompok yang sama, tetapi diambil dari
butir-butir yang bernomor genap untuk tes yang pertama dan butir-butir bernomor
ganjil untuk tes yang kedua. Teknik ini sering disebut split-half method. Split
berarti membelah dan half berarti setengah atau separuh. Jadi, split-half
adalah tes yang dibagi menjadi dua bagian yang sama, kemudian mengorelasikan
butir soal yang bernomor ganjil dalam belahan pertama (X) dan yang bernomor
genap dalam belahan kedua (Y). untuk membagi tes menjadi dua bagian dapat juga
dilakukan dengan jalan mengambil nomor soal secara acak, tetapi jumlahnya tetap
harus sama untuk masing-masing kelompok. Disamping itu, pembagian tes dapat
juga dilakukan dengan cara setengah bagian pertama untuk kelompok pertama dan
setengah lagi untuk kelompok kedua. Untuk menghitung koefisien stabilitas,
koefisien ekuivalen dan koefisien konsistensi internal dapat digunakan analisis
korelasi seperti pada pengujian validitas. Khusus bagi perhitungan koefisien
konsistensi internal, korelasi tersebut baru sebagian dari seluruh tes. Untuk
memperoleh angka koefisien korelasi secara menyeluruh dari tes tersebut harus
dihitung dari nomor-nomor kedua tes itu dengan rumus Spearman Brown.

1+(𝑛−1)𝑟1.2
Keterangan :
r : korelasi
n : panjang tes yang selalu sama dengan 2 karena
seluruh tes = 2 x ½
5.
Validitas
tes
Validitas
merupakan syarat yang penting dalam suatu alat evaluasi. Validitas berasal dari
kata validity, dapat diartikan tepat atau shahih, yakni sejauh mana ketepatan
dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya.11 Beberapa
kriteria dipilih untuk memperlihatkan keefektifan terhadap peramalan
performance yang akan datang (yang akan terjadi), kriteria yang lain untuk
menunjukkan status yang muncul, kriteria yang lain lagi untuk menimbulkan
sifat- sifat yang representatif dari luasnya isi atau tingkah laku, dan
kriteria yang lain lagi untuk (melengkapi) penyediaan data atau untuk menunjang
atau menolak beberapa teori psikologis. Sebagaimana dikemukakan oleh Scarvia B.
Anderson dalam bukunya ―Encyclopedia of Educational Evaluation‖ disebutkan
bahwa ― A test is valid it measure what it purpose to measure‖ (sebuah tes
dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur).
Validitas suatu instrumen evaluasi, tidak lain adalah derajat yang menunjukkan
di mana suatu tes mengukur apa yang hendak diukur. Validitas suatu instrumen
evaluasi mempunyai beberapa makna penting di antaranya sebagai berikut:
1. Validitas
berhubungan dengan ketepatan interpretasi hasil tes atau instrumen
evaluasi
untuk grup individual dan bukan instrumen itu sendiri.
2. Validitas
diartikan sebagai derajat yang menunjukkan kategori yang bisa mencakup
kategori
rendah,menengah, dan tinggi.
3. Prinsip
suatu tes valid, tidak universal. Validitas suatu tes yang perlu diperhatikan
oleh para peneliti adalah bahwa ia hanya valid untuk suatu tujuan tertentu
saja. Tes valid untuk bidang studi metrologi industri belum tentu valid untuk
bidang yang lain misalnya bidang mekanika teknik.
Validitas suatu alat evaluasi, bukanlah merupakan
ciri yang absolut atau mutlak. Suatu tes dapat memiliki validitas yang tinggi ,
sedang, rendah, tergantung kepada tujuannya. Secara metodologis, validitas
suatu tes dapat dibedakan menjadi empat macam, yaitu validitas isi (content
validity), validitas konstruk (construct validity), validitas konkuren
(concurrent validity), dan validitas prediksi (predictive validity).
a.
Validitas
Isi
Validitas isi artinya ketepatan daripada suatu
tes dilihat dari segi isi tersebut. Suatu tes hasil belajar dikatakan valid,
apabila materi tes tersebut benar-benar merupakan bahan-bahan yang
representatif terhadap bahan-bahan pelajaran yang diberikan. Untuk mendapatkan
validitas isi memerlukan dua aspek penting, yaitu valid isi dam valid teknik
sampling. Valid isi mencakup khususnya, hal-hal yang berkaitan dengan apakah
item-item evaluasi menggambarkan pengukuran dalam cakupan yang ingin diukur.
Sedangkan valid teknik sampling pada umumnya berkaitan dengan bagaimanakah
baiknya suatu sample item tes mempresentasikan total cakupan isi. Oleh karena
materi yang diajarkan tertera dalam kurikulum maka validitas ini sering disebut
validitas kurikuler. Validitas isi dapat diusahakan tercapainya sejak
penyusunan dengan memerinci materi kurikulum atau materi buku pelajaran.
Misalnya untuk siswa kelas I SMU akan diberikan tes Matematika, maka item-itemnya
harus diambil dari materi pelajaran kelas I, apabila kita sisipkan dan
item-item yang diambil dari materi pelajaran kelas III maka tes tersebut sudah
tidak valid lagi. Validitas isi pada umumnya ditentukan melalui pertimbangan
para ahli. Tidak ada formula matematis untuk menghitung dan tidak ada cara
untuk menunjukkan secara pasti. Akan tetapi, untuk memberikan gambaran
bagaimana suatu tes divalidasi dengan menggunakan validitas isi, pertimbangan
ahli tersebut dilakukan dengan cara seperti berikut. Pertama, para ahli diminta
untuk mengamati secara cermat semua item dalam tes yang hendak divalidasi.
Kemudian mereka diminta untuk mengoreksi interpretasi item-item yang telah
dibuat. Pada akhir perbaikan, mereka juga diminta untuk memberikan
pertimbangapertimbangan tentang bagaimana baik interpretasi tes evaluasi
tersebut menggambarkan cakupan isi yang hendak diukur. Pertimbangan ahli
tersebut biasanya juga menyangkut, apakah semua aspek yang hendak diukur telah
dicakup melalui 32 |Analisis Butir Soal interpretasi item pertanyaan dalam tes.
Atau dengan kata lain perbandinga dibuat antara apa yang harus dimasukkan
dengan apa yang ingin diukur yang telah direfleksikan menjadi tujuan tes.
b.
Validitas
Konstruk
Validasi konstruk merupakan derajat yang menunjukkan
suatu tes mengukur sebuah konstruk sementara. Untuk menentukan adanya validitas
konstruk suatu tes dikorelasikan dengan suatu konsepsi atau teori, item-item
dalam tes itu harus sesuai dengan ciri-ciri yang disebutkan dalam konsepsi
tadi, yaitu konsepsi tentang obyek yang akan dites. Untuk mengetahui apakah
suatu tes memenuhi syarat-syarat validitas konstruksi atau tidak maka kita
harus membandingkan susunan tersebut telah memenuhi syarat-syarat penyusunan
tes maka berarti tes tersebut memenuhi syarat validitas konstruksi, apabila
tidak memenuhi syarat-syarat penyusunan tes berarti tidak memenuhi validitas
konstruksi. Proses melakukan validasi konstruk dapat dilakukan dengan cara
melibatkan hipotesis testing yang dideduksi dari teori yang menyangkut dengan konstruk
yang relevan. Misalnya jika suatu teori kecemasan menyatakan bahwa seseorang
yang memiliki kecemasan yang lebih tinggi akan bekerja lebih lama dalam
menyelesaikan suatu problem, dibanding dengan orang yang memiliki tingkat
kecemasan rendah. Jika terjadi orang yang cemasnya tinggi ternyata kemudian
bekerja sebaliknya yaitu lebih cepat, ini bukan berarti bahwa tes yang sudah
baku tadi berarti tidak mengukur kecemasan orang. Atau dengan kata lain
hipotesis yang berhubungan dengan tingkah laku seseorang dengan kecemasan
tinggi tidak benar. Dari kasus tersebut mengindikasikan bahwa konstruksi yang
berhubungan dengan orang yang memiliki kecemasan tinggi memerlukan kajian
ulang, guna mengadakan koreksi dan penyesuaian kembali.
c.
Validitas
Konkuren
Jika hasil suatu tes mempunyai korelasi yang tinggi
dengan hasil dari suatu alat pengukur lain terhadap bidang yang sama pada waktu
yang sama pula, maka tes itu dikatakan memiliki konkuren validity. Validitas
ini lebih umum dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki
validitas empiris jika hasilnya sesuai dengan pengalaman. Jika istilah ―sesuai
tentu ada dua hal yang dipasangkan dalam hal ini hasil tes dipasangkan dengan
hasil pengalaman. Pengalaman selalu mengenai hal yang telah lampau sehingga data
pengalaman tersebut sekarang sudah ada.
Cara-cara
membuat tes dengan validitas konkruen dapat dilakukan dengan beberapa langkah
seperti berikut.
1. Administrasi
tes yang baru yang dilakukan terhadap grup atau anggota
kelompok
2.
Catat tes baku yang ada termasuk berapa koefisien validitasnya jika ada
3.
Hubungkan atau korelasikan dua tes skor tersebut
Hasil yang dicapai atau koefisien validitas yang
muncul menunjukkan derajat hubungan validitas tes yang baru. jika koefisien
tinggi, berarti tes yang baru tersebut mempunyai validitas konkruen yang baik.
Sebaliknya, tes yang baru dikatakan mempunyai validitas konkruen yang jelek,
apabila koefisien yang dihasilkan rendah. Tes mental merupakan contoh nyata
terapan suatu tes pembeda (validitas konkruen yang melibatkan penentuan tes )
yang sering ditemui dalam kasus psikologi. Jika hasil skor suatu tes dapat
digunakan degan cara benar untu mengklarifikasi orang yang satu dengan orang
lainnya, maka validitas konkruen tes tersebut memiliki daya pembeda yang baik.
d.
Validitas
Prediksi
Memprediksi
artinya meramal, dan meramal selalu mengenai hal yang akan datang jadi sekarang
belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi apabila
mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan
mendatang. Jenis validitas ini menunjukkan kenyataan jika ujian yang dimaksud
dihubungkan dengan kriteria-kriteria tentang hasil karya atau kesuksesan di
masa depan. Demikianlah jika suatu tes bakat skolastik diberikan pada
siswa-siswa SMU dikorelasikan dengan prestasi mereka di perguruan tinggi, maka
kenyataan yang diperoleh itu akan menunjukkan validitas prediksi. Instrumen
validitas prediksi mungkin bervariasi bentuknya tergantung beberapa faktor
misalnya kurikulum yang digunakan, buku pegangan yang dipakai, intensitas
mengajar dan letak geografis atau daerah sekolah. Yang perlu diperhatikan saat
melakukan tes validasi ini yaitu perlu memperhatikan proses dan cara
membandingkan instrumen yang divalidasi dengan tes yang dibakukan. Perlu
disadari bahwa skor tes yang dihasilkan juga memiliki sifat ketidak sempurnaan.
Ketika kriteria telah diidentifikasi dan ditentukan, prosedur selanjutnya
adalah menentukan validitas prediksi suatu tes dengan cara seperti berikut.
a)
Buat item tes sesuai dengan tujuan yang hendak dicapai
b) Tentukan kelompok yang dijadikan subyek
dalam pilot Study
c) Identifikasi kriterion prediksi yang hendak
dicapai
d)
Tunggu sampai tingkah laku yang diprediksi atau variabel kriteria muncul dan
terpenuhi dalam kelompok yang telah
ditentukan
e)
Capai ukuran-ukuran kriteria tertentu
f)
Korelasikan dua set skor yang dihasilkan
Sebagai contoh, kita akan menyelenggarakan tes untuk
menentukan validitas prediksi tes pada mahasiswa yang mengikuti mata kuliah
matematika teknik. Langkah pertama yang harus dilakukan adalah membuat tes
item, kemudian memberikannya kepada kelompok mahasiswa potensi yang mengambil
mata kuliah tersebut. Kemudian kita menunggu selama satu semester penuh pada
kelompok mahasiswa yang hendak diprediksi pada mata kuliah yang sama dengan
mengukur melalui nilai ujian akhir. Hasil korelasi antara dua set nilai akan
menentukan validitas prediksi tes. Jika hasilnya menunjukkan koefisien korelasi
tinggi, berarti tes tersebut mempunyai validitas prediksi tinggi.
Analisis
butir secara modern yaitu penelaahan butir soal dengan
menggunakan Item Response Theory (IRT) atau teori jawaban butir soal. Teori ini
merupakan suatu teori yang menggunakan fungsi matematika untuk menghubungkan
antara peluang menjawab benar suatu scal dengan kemampuan siswa. Nama lain IRT
adalah latent trait theory (LTT), atau characteristics curve theory (ICC). Asal
mula IRT adalah kombinasi suatu versi hukum phi-gamma dengan suatu analisis
faktor butir soal (item factor analisis) kemudian bernama Teori Trait Latent
(Latent Trait Theory), kemudian sekarang secara umum dikenal menjadi teori
jawaban butir soal (Item Response Theory) (McDonald, 1999: 8).
- Manfaat
Analisis Butir Soal
Kegiatan analisis butir soal memiliki banyak
manfaat, diantaranya: (1) dapat membantu pengguna tes dalam mengevaluasi
kualitas tes yang digunakan, (2) relevan bagi penyusunan tes informal seperti
tes yang disiapkan guru untuk siswa di kelas, (3) mendukung penulisan butir
soal yang efektif, (4) secara materi dapat memperbaiki tes di kelas, (5)
meningkatkan validitas soal dan reliabilitas (Anastasi&Urbina, 1997:172).
Nitko (1996:308-309) juga menguraikan manfaat kegiatan analisis butir soal, di
antaranya untuk: (1) menentukan apakah suatu fungsi butir soal sesuai dengan yang
diharapkan, (2) memberi masukan kepada siswa tentang kemampuan dan sebagai
dasar untuk bahan diskusi di kelas, (3) memberi masukan kepada guru tentang
kesulitan siswa, (4) memberi masukan pada aspek tertentu untuk pengembangan
kurikulum, (5) merevisi materi yang diukur, (6) meningkatkan keterampilan
penulisan soal.
Dari uraian di atas menunjukkan analisis butir soal
memberikan manfaat: (1) menentukan soal-soal yang cacat atau tidak berfungsi
dengan baik; (2) meningkatkan butir soal melalui tiga komponen analisis yaitu
tingkat kesukaran, daya pembeda, dan pengecoh soal; (3) meningkatkan validitas
soal dan reliabilitas; (4) merevisi soal yang tidak relevan dengan materi yang
diajarkan, ditandai dengan banyaknya anak yang tidak dapat menjawab butir soal
tertentu.
BAB
III
PENUTUP
- Kesimpulan
·
Analisis butir soal secara kualitatif
dilaksanakan berdasarkan kaidah penulisan soal (tes tertulis, perbuatan, dan
sikap). Ada beberapa teknik yang dapat digunakan untuk menganalisis butir soal
secara kualitatif, diantaranya adalah teknik moderator dan teknik panel.
a)
Teknik moderator merupakan teknik berdiskusi yang di dalamnya terdapat satu
orang sebagai penengah.
b) Teknik Panel yakni suatu teknik menelaah
butir soal berdasarkan kaidah penulisan butir soal.
·
Analisis butir soal secara kuantitatif
adalah analisis butir soal didasarkan pada data empirik. Data empirik ini
diperoleh dari soal yang telah diujikan. Ada dua pendekatan dalam analisis
secara kuantitatif, yaitu:
1.
Analisis
butir soal secara klasik adalah proses penelaahan butir soal melalui
informasi dari jawaban peserta didik tes guna meningkatkan mutu butir soal yang
bersangkutan dengan menggunakan teori tes klasik. Aspek yang perlu diperhatikan
dalam analisis butir soal secara klasik adalah setiap butir soal ditelaah dari
segi: tingkat kesukaran butir, daya pembeda butir, dan penyebaran pilihan
jawaban (untuk soal bentuk obyektif) atau fungsi pengecoh pada setiap pilihan
jawaban, reliabilitas dan validitas soal.
2.
Analisis
butir secara modern yaitu penelaahan butir soal dengan menggunakan Item
Response Theory (IRT) atau teori jawaban butir soal. Teori ini merupakan suatu
teori yang menggunakan fungsi matematika untuk menghubungkan antara peluang
menjawab benar suatu scal dengan kemampuan siswa. Nama lain IRT adalah latent
trait theory (LTT), atau characteristics curve theory (ICC).
·
Manfaat menganalisis butir soal, yaitu:
1. Menentukan
soal-soal yang cacat atau tidak berfungsi dengan baik,
2. Meningkatkan
butir soal melalui tiga komponen analisis yaitu tingkat kesukaran, daya
pembeda, dan pengecoh soal,
3. Meningkatkan
validitas soal dan reliabilitas, dan
4. Merevisi
soal yang tidak relevan dengan materi yang diajarkan, ditandai dengan banyaknya
anak yang tidak dapat menjawab butir soal tertentu.
- Saran
Ketika kita menjadi pengajar dan pendidik, sebaiknya
dalam penyusunan instrument tes, seperti soal tes hendaknya disesuaikan dengan
kriteria penyusunan soal yang baik dan benar. Dimana, tingkat kesukarannya
diperhatikan, daya pembeda disesuaikan, pengecoh soal berfungsi dengan baik.
Dan juga ketika diuji dengan validitas maupun realibilitas sesuai dengan
kualitas dan metode pembelajaran yang menjunjung tinggi cita-cita guru
Indonesia untuk mencerdaskan kehidupan bangsa.
DAFTAR
PUSTAKA
1. Arifin,
Zaenal. 2009. EVALUASI PEMBELAJARAN. Bandung; PT.REMAJA ROSDAKARYA
2. Arikunto,
Suharsimi. 2003. DASAR-DASAR EVALUASI PENDIDIKAN. Jakarta; Bumi Aksara
3. Kusaeri dan Suprananto. 2012. Pengukuran dan
Penilaian Pendidikan. Jakarta; GRAHA ILMU
4. Sudaryono.
2012. Dasar-dasar Evaluasi Pembelajaran. Jakarta; GRAHA ILMU
5.
Rizky Dayu Utamifile:///C:/Users/personal/Downloads/Makalah_Analisis_Butir_Soal%20(2).pdf
diakses pada tanggal 23 november 2016 jam 13.00 wib
FORMAT PENELAAHAN SOAL PILILHAN GANDA
Mata
Pelajaran :
.................................
Kelas/semester
: .................................
Penelaah
: .................................
NO
|
ASPEK YANG DITELAAH
|
NOMOR SOAL
|
|||||||||
A.
|
MATERI
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
1.
|
Soal sesuai dengan indikator
(menuntut tes tertulis untuk bentuk pilihan ganda)
|
|
|
|
|
|
|
|
|
|
|
2.
|
Materi yang ditanyakan sesuai
dengan kompetensi (urgensi, relevasi, kontinyuitas, keterpakaian sehari-hari
tinggi)
|
|
|
|
|
|
|
|
|
|
|
3.
|
Pilihanjawaban homogeny danlogis
|
|
|
|
|
|
|
|
|
|
|
4.
|
Hanya ada satu kunci jawaban
|
|
|
|
|
|
|
|
|
|
|
B.
|
KONSTRUKSI
|
|
|
|
|
|
|
|
|
|
|
5.
|
Pokok
soal dirumuskan dengan singkat, jelas, dan tegas
|
|
|
|
|
|
|
|
|
|
|
6.
|
Rumusan
pokok soal dan pilihan jawaban merupakan pernyataan yang diperlukan saja
|
|
|
|
|
|
|
|
|
|
|
7.
|
Pokok
soal tidak member petunjuk kunci jawaban
|
|
|
|
|
|
|
|
|
|
|
8.
|
Pokok
soal bebas dan pernyataan yang bersifat negative ganda
|
|
|
|
|
|
|
|
|
|
|
9.
|
Pilihan
jawaban homogeny dan logis ditinjau dari segi materi
|
|
|
|
|
|
|
|
|
|
|
10.
|
Gambar,
grafik, tabel, diagram, atau sejenisnya jelas dan berfungsi
|
|
|
|
|
|
|
|
|
|
|
11.
|
Panjang
pilihan jawaban relative sama
|
|
|
|
|
|
|
|
|
|
|
12.
|
Pilihan
jawaban tidak menggunakan pernyataan“semua jawaban di atas salah/benar” dan
sejenisnya
|
|
|
|
|
|
|
|
|
|
|
13.
|
Butir
soal tidak bergantung pada jawaban soal sebelumnya
|
|
|
|
|
|
|
|
|
|
|
C
|
BAHASA DAN BUDAYA
|
|
|
|
|
|
|
|
|
|
|
14.
|
Menggunakan
bahasa yang sesuai dengan kaidah bahasa indonesia
|
|
|
|
|
|
|
|
|
|
|
15.
|
Menggunakan
bahasa yang komunikatif
|
|
|
|
|
|
|
|
|
|
|
16.
|
Tidak
mengunakan bahasa yang berlaku setempat/tabu
|
|
|
|
|
|
|
|
|
|
|
17.
|
Pilihan
jawaban tidak mengulang kata/kelompok kata yang sama, kecuali merupakan satu
kesatuan pengertian
|
|
|
|
|
|
|
|
|
|
|
Keterangan :Berilah tanda (√)bila tidak sesuai dengan aspek
yang ditelaah
FORMAT PENELAAHAN UNTUK INSTRUMEN
PERBUATAN
Mata
Pelajaran :
Kelas/Semester
:
Penelaah :
NO
|
ASPEK YANG DINILAI
|
NOMOR SOAL
|
|||||||||
A
|
MATERI
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
1.
|
Soal
sudah sesuai dengan indikator (menuntut tes perbuatan : kinerja, hasilkarya,
atau penugasan)
|
|
|
|
|
|
|
|
|
|
|
2.
|
Pertanyaan
dan jawaban yang diharapkan sudah sesuai
|
|
|
|
|
|
|
|
|
|
|
3.
|
Materi
sesuai dengan tuntutan kompetensi (urgensi, relevansi, kontinyuitas,
keterpakaian sehari-hari tinggi)
|
|
|
|
|
|
|
|
|
|
|
4.
|
Isi
materi yang ditanyakan sesuai dengan jenjang jenis sekolah atau tingkat kelas
|
|
|
|
|
|
|
|
|
|
|
B
|
KONSTRUKSI
|
|
|
|
|
|
|
|
|
|
|
5.
|
Menggunakan
kata Tanya atau perintah yang menuntut jawaban perbuatan/praktik
|
|
|
|
|
|
|
|
|
|
|
6.
|
Ada
petunjuk yang jelas tentang cara mengerjakan soal
|
|
|
|
|
|
|
|
|
|
|
7.
|
Ada
pedoman penskorannya
|
|
|
|
|
|
|
|
|
|
|
8.
|
Tabel,
peta, gambar, grafik, atau sejenisnya disajikan dengan jelas dan terbaca
|
|
|
|
|
|
|
|
|
|
|
C
|
BAHASA DAN BUDAYA
|
|
|
|
|
|
|
|
|
|
|
9.
|
Rumusan
soal komunikatif
|
|
|
|
|
|
|
|
|
|
|
10.
|
Butir
soal menggunakan bahasa Indonesia yang baku
|
|
|
|
|
|
|
|
|
|
|
11.
|
Tidak
menggunakan kata / ungkapan yng menimbulkan penafsiran ganda atau salah
pengertian
|
|
|
|
|
|
|
|
|
|
|
12.
|
Tidakmenggunakanbahasa
yang berlakusetempat/tabu
|
|
|
|
|
|
|
|
|
|
|
13.
|
Rumusan
soal tidak mengandung kata/ungkapn yang dapat menyinggung perasaan siswa
|
|
|
|
|
|
|
|
|
|
|
Keterangan :Berilah tanda (√)bila tidak sesuai dengan aspek
yang ditelaah
FORMAT PENELAAHAN UNTUK INSTRUMEN
NON-TES
Mata
Pelajaran :
Kelas/Semester
:
Penelaah :
NO
|
ASPEK YANG DINILAI
|
NOMOR SOAL
|
|||||||||
A
|
MATERI
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
1.
|
Pernyataan/soal
sudah sesuai dengan rumusan indicator dalam kisi
|
|
|
|
|
|
|
|
|
|
|
2.
|
Aspek
yang diukur pada setiap pernyataan sudah sesuai dengan tuntutan dalam
kisi-kisi (missal untuk tes sikap : aspek kognitif, afektif, atau
psikomotorik dan pernyataan positif atau negatif)
|
|
|
|
|
|
|
|
|
|
|
B
|
KONSTRUKSI
|
|
|
|
|
|
|
|
|
|
|
3.
|
Pernyataan
dirumuskan dengan singkat (tidak melebihi 20 kata) dan jelas
|
|
|
|
|
|
|
|
|
|
|
4.
|
Kalimatnya
bebas dari pernyataan yang tidak relevan objek yang dipersoalkan atau
kalimatnya merupakan pernyataan yang diperlukan saja
|
|
|
|
|
|
|
|
|
|
|
5.
|
Kalimatnya
bebas dari pernyataan yang bersifat negative ganda
|
|
|
|
|
|
|
|
|
|
|
6.
|
Kalimatnya
bebas dari pernyataan yang mengacuh pada masa lalu
|
|
|
|
|
|
|
|
|
|
|
7.
|
Kalimatnya
bebas dari pernyataan factual atau dapat di interprestasikan sebagai fakta
|
|
|
|
|
|
|
|
|
|
|
8.
|
Kalimatnya
bebas dari pernyataan yang mungkin disetujui atau dikosongkan oleh hampir
semua responden
|
|
|
|
|
|
|
|
|
|
|
9.
|
Setiap
pernyataan hanya berisi atau gagasan secara lengkap
|
|
|
|
|
|
|
|
|
|
|
10.
|
Kalimatnya
bebas dari pernyataan yang tidak pasti seperti semua, selalu, kadang-kadang,
tidak satupun, tidak pernah
|
|
|
|
|
|
|
|
|
|
|
11.
|
Jangan
banyak menggunakan kata hanya, sekedar, semata-mata
|
|
|
|
|
|
|
|
|
|
|
12.
|
Gunakan
seperlunya
|
|
|
|
|
|
|
|
|
|
|
C
|
BAHASA DAN BUDAYA
|
|
|
|
|
|
|
|
|
|
|
13.
|
Bahasa
soal harus komunikatif dan sesuai dengan jenjang pendidikan siswa atau
responden
|
|
|
|
|
|
|
|
|
|
|
14.
|
Soal
harus menggunkan bahasa Indonesia baku
|
|
|
|
|
|
|
|
|
|
|
15.
|
Soal
tidak menggunkan bahasa yang berlaku setempat/tabu
|
|
|
|
|
|
|
|
|
|
|
Keterangan :Berilah tanda (√)bila tidak sesuai dengan aspek
yang ditelaah
FORMAT PENELAAHAN SOAL URAIAN
Mata
Pelajaran :
Kelas/Semester
:
Penelaah :
NO
|
ASPEK YANG DINILAI
|
NOMOR SOAL
|
|||||||||
A
|
MATERI
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
1.
|
|
|
|
|
|
|
|
|
|
|
|
2.
|
Pertanyaan
dan jawaban yang diharapkan sudah sesuai
|
|
|
|
|
|
|
|
|
|
|
3.
|
Materi
sesuai dengan tuntutan kompetensi (urgensi, relevansi, kontinyuitas,
keterpakaian sehari-hari tinggi)
|
|
|
|
|
|
|
|
|
|
|
4.
|
Isi
materi yang ditanyakan sesuai dengan jenjang jenis sekolah atau tingka tkelas
|
|
|
|
|
|
|
|
|
|
|
B
|
KONSTRUKSI
|
|
|
|
|
|
|
|
|
|
|
5.
|
Menggunakan
kata Tanya atau perintah yang menuntut jawaban uraian
|
|
|
|
|
|
|
|
|
|
|
6.
|
Ada
petunjuk yang jelas tentang cara mengerjakan soal
|
|
|
|
|
|
|
|
|
|
|
7.
|
Ada
pedoman penskorannya
|
|
|
|
|
|
|
|
|
|
|
8.
|
Tabel,
peta, gambar, grafik, atau sejenisnya disajikan dengan jelas dan terbaca
|
|
|
|
|
|
|
|
|
|
|
C
|
BAHASA DAN BUDAYA
|
|
|
|
|
|
|
|
|
|
|
9.
|
Rumusan
soal komunikatif
|
|
|
|
|
|
|
|
|
|
|
10.
|
Butir
soal menggunakan bahasa Indonesia yang baku
|
|
|
|
|
|
|
|
|
|
|
11.
|
Tidak
menggunakan kata / ungkapan yng menimbulkan penafsiran ganda atau salah
pengertian
|
|
|
|
|
|
|
|
|
|
|
12.
|
Tidak
menggunakan bahasa yang berlaku setempat/tabu
|
|
|
|
|
|
|
|
|
|
|
13.
|
Rumusan
soal tidak mengandung kata/ungkapn yang dapat menyinggung perasaan siswa
|
|
|
|
|
|
|
|
|
|
|
Keterangan :Berilah tanda (√)bila tidak sesuai dengan aspek
yang ditelaah
Tidak ada komentar:
Posting Komentar