Penilaian dalam Matematika

Posted by Arif Ediyanto in -


I.             PENDAHULUAN
Untuk menilai kemajuan siswa dalam pembelajaran matematika dapat dilakukan melalui penilaian proses dan penilaian hasil. Hal tersebut dimaksudkan agar dalam menilai kemajuan belajar siswa dapat lebih komprehensif, berkesinambungan, dan menyentuh aspek-aspek yang telah ditentukan dalam standar kompetensi atau kompetensi dasar, sebagaimana dirumuskan pada Standar Isi Kurikulum Tingkat Satuan Pendidikan (KTSP).
Pada makalah ini, akan lebih ditekankan pada penilaian hasil pembelajaran khusunya jenis tes tertulis, mengingat jenis penilaian yang lain telah dibahas tersendiri. Pembagian mengenai jenis penilaian dapat juga didasarkan atas tujuan dari penilaian. Penilaian yang digunakan untuk menentukan karakteristik pembelajaran dari siswa secara individu, apakah mereka memiliki pengetahuan atau keterampilan prasyarat, penguasaan objek-objek matematika dan sebab-sebab utama kesulitan belajar disebut penilaian diagnostik. Sementara itu, penilaian formatif digunakan ketika siswa sedang belajar atau mempelajari materi yang baru dan digunakan untuk menemukan pola kesalahan-kesalahan siswa, untuk memberikan informasi kepada siswa terhadap kemajuan mereka, menyarankan sejauh mana perlu dilakukan remediasi dengan segera dan dengan demikian berikutnya pembelajaran dapat lebih efektif. Penilaian sumatif dilakukan setelah siswa menyelesaikan pembelajaran suatu topik atau unit tertentu dan digunakan untuk menerangkan pembelajaran siswa, memutuskan keefektifan pembelajaran, dan menilai metode pembelajaran dan kurikulum matematika. 

II.          CIRI-CIRI INSTRUMEN PENILAIAN YANG BAIK DAN BENTUK-BENTUK INSTRUMEN PENILAIAN DALAM  PEMBELAJARAN MATEMATIKA

Penilaian seringkali mendasarkan diri pada hasil pengukuran. Oleh karena itu, pengukuran merupakan bagian terpenting dari penilaian. Meskipun pengukuran bukanlah satu-satunya bagian dari penilaian, tetapi prinsip-prinsip pengukuran mempengaruhi instrumen penilaian. Instrumen penilaian adalah alat yang digunakan dalam suatu kegiatan penilaian untuk mengumpulkan informasi tentang sesuatu. Dalam kegiatan pembelajaran, instrumen penilaian yang digunakan disebut alat ukur (instrumen); yang disusun, dilaksanakan, dan diolah berdasarkan aturan yang berlaku dalam pengukuran.
Instrumen memegang peranan yang sangat penting dalam menentukan mutu informasi suatu penilaian. Instrumen berfungsi mengungkapkan fakta menjadi data, sehingga jika kualitas instrumen yang digunakan baik, maka data yang diperoleh sesuai dengan fakta sesungguhnya.

1.    Ciri-Ciri Instrumen Penilaian yang Baik
Ciri-ciri  instrumen yang baik antara lain adalah: (1) sahih (valid), artinya instrumen itu mengukur apa yang seharusnya diukur dan (2) konsisten (reliable), artinya hasil pengukuran selalu konsisten bila dilaksanakan pada siswa yang sama dalam waktu dan kondisi yang berlainan, atau dengan instrumen yang paralel pada subjek dan waktu yang sama, akan memberikan hasil yang tetap, konsisten, “ajeg” selama aspek yang diukur belum berubah. Selain valid dan reliabel, ada juga yang dilengkapi dengan analisis butir guna mengetahui tingkat kesukaran dan indeks diskriminasi setiap butir, khususnya untuk instrumen jenis tes.
a.         Validitas
Konsep validitas mengacu pada interpretasi yang diperoleh melalui hasil, disimpulkan dari fakta dan dinyatakan dalam tingkatan tinggi, sedang, dan rendah. Validitas dapat dibedakan menjadi: validitas isi (content validity), validitas konstruk (construct validity), dan validitas kriteria (criterion validity).
Tidak setiap instrumen harus memiliki keempat validitas tersebut. Jenis validitas yang dituntut sesuai dengan jenis dan tujuan pengukuran dengan menggunakan instrumen yang dimaksud. Sebagai contoh untuk jenis alat ukur yang berupa tes untuk mengukur prestasi belajar siswa, validitas yang sangat dituntut adalah validitas isi. Untuk mengukur suatu konstruk, misalnya sikap terhadap matematika, validitas yang dituntut adalah validitas konstruk. Validitas yang dituntut pada tes potensi akademik (TPA), adalah validitas kriteria, yakni validitas dibandingkan dengan tes standar yang ada sekarang.  Tes masuk SMP, jika dimaksudkan untuk menjaring calon siswa yang dapat lulus dengan baik (bukan semata-mata untuk membatasi jumlah pendaftar), diperlukan validitas prediktif.


b.    Reliabilitas
Reliabilitas sering diterjemahkan dengan keterpercayaan, keterandalan, keajegan (stability) atau kemantapan (consistency). Pada  hakekatnya reliabilitas adalah sejauh mana hasil suatu pengukuran dapat dipercaya, artinya beberapa kali seperangkat instrumen diujikan kepada subjek yang sama dalam kurun waktu yang berbeda atau instrumen yang paralel pada subjek dan waktu yang sama, akan memberikan hasil yang “tetap”, “ajeg” selama aspek yang diukur belum berubah.
“Tetap” mengandung arti kapanpun instrumen penilaian tersebut digunakan akan memberikan hasil yang relatif sama. Adapun “ajeg” berarti hasil pengukuran saat ini menunjukkan kesamaan hasil bila diberikan pada waktu berlainan terhadap siswa yang sama. Dengan kata lain, instrumen penilaian yang reliabel memperoleh hasil yang sama bila diteskan dua kali atau lebih dalam periode yang singkat, di mana siswa yang memperoleh skor tinggi pada pengukuran pertama akan memperoleh skor yang tinggi pula pada pengukuran kedua. 

2.    Bentuk-Bentuk Instrumen Penilaian
Ada beberapa bentuk instrumen yang biasa digunakan untuk mengumpulkan informasi dalam pelaksanaan penilaian terhadap kemajuan siswa dalam pembelajaran matematika. Untuk mengukur kemajuan siswa baik dari segi proses maupun hasil, instrumen yang dapat digunakan dapat berupa tes, tugas-tugas asesmen performansi, observasi, presentasi dan proyek, portofolio dan jurnal, interview, un-obstrusive tekchnique (teknik pengukuran yang tidak membutuhkan kerja sama siswa dalam merespons, misalnya catatan sekolah, daftar hadir, hasil kerja siswa, bukti-bukti fisik, kesediaan dengan suka rela mengatur tempat duduk), dan kuesioner butir tertutup (misalnya: skala sikap).
Dari berbagai bentuk instrumen tersebut ada yang mengelompok-kan menjadi dua kelompok besar, yakni tes dan non-tes. Oleh karena itu, keliru apabila tes hasil belajar matematika dikatakan satu-satunya instrumen penilaian hasil belajar matematika. Dalam makalah ini, pembahasan dipilahkan berdasarkan pengelompokan tes dan non-tes.

Dalam makalah ini, pembahasan mengenai instrumen penilaian dan analisis terhadap kemajuan siswa dalam pembelajaran matematika, dipisahkan menjadi hasil belajar proses dan hasil belajar produk/perolehan. Hal ini dilakukan karena ada sedikit berbeda dalam teknik penskoran dan analisis/interpretasinya; dan lebih dari itu agar membuat pembaca memperoleh pemahaman yang lebih jelas. Namun perlu diingat bahwa, keduanya mempunyai peran yang penting dan tidak terpisah dalam rangka mengemban misi dan fungsi penilaian kemajuan siswa dalam pembelajaran matematika. Juga, dalam uraian berikut, tidak semua bentuk instrumen penilaian di atas dibahas secara rinci. Pembahasan lebih ditujukan kepada bentuk-bentuk instrumen penilaian yaitu berupa tes tertulis yang mudah, lazim, dan memungkinkan dipakai pada pembelajaran matematika.

III.       INSTRUMEN PENILAIAN BERBENTUK TES
Tes merupakan salah satu bentuk instrumen, terdiri dari sejumlah pertanyaan, atau butir-butir soal yang digunakan untuk memperoleh data atau informasi melalui jawaban peserta tes. Melalui hasil jawaban tersebut diperoleh suatu ukuran mengenai karakteristik peserta tes. Secara lebih rinci dapat dijelaskan bahwa: (1) tes adalah prosedur yang sistematik, artinya butir-butir soal disusun menurut cara dan aturan tertentu, prosedur administrasi tes dan pemberian skor terhadap hasilnya harus jelas dan dispesifikasikan secara rinci,  serta  setiap peserta tes harus mendapat butir soal yang sama dalam kondisi yang sebanding, (2) tes berisi sampel perilaku, artinya kelayakan suatu tes tergantung pada bagaimana butir-butir dalam tes mewakili secara representatif kawasan perilaku yang diukur, dan (3) tes mengukur perilaku, yakni butir-butir soal dalam tes harus mengukur apa yang diketahui dan dipelajari peserta.
Matematika sebagai salah satu mata pelajaran yang diberikan di sekolah menengah dalam proses pembelajarannya membutuhkan instrumen penilaian dalam bentuk tes hasil belajar (khususnya tes prestasi akademik). Tes hasil belajar matematika merupakan salah satu instrumen yang harus dibuat guru yang berisi sekumpulan pertanyaan yang digunakan untuk mengetahui bagaimana keberhasilan siswa dalam proses pembelajaran. Tes matematika yang dibuat guru juga dijadikan sebagai acuan dalam  mengevaluasi tingkat penguasaan siswa terhadap materi pelajaran matematika yang diberikan selama satu periode tertentu, seperti catur wulan atau semester.
Berdasarkan informasi yang diperoleh, guru matematika dapat memperbaiki kekurangan ataupun kelemahannya dalam memilih materi atau bahan ajar, metode, dan media pengajaran yang tepat. Selain itu, guru dapat meremidi atau menjelaskan kembali terhadap topik-topik matematika tertentu yang dirasakan sulit oleh siswa dan memberi pengayaan bagi siswa yang pandai. Oleh karena itu, tes matematika yang dibuat guru merupakan sumber data yang paling sahih bagi penilaian penguasaan matematika siswa.
Mengingat tes matematika merupakan salah satu tes hasil belajar yang paling sahih untuk menilai penguasaan siswa terhadap kompetensi yang ditetapkan, maka dalam penyusunannya perlu memperhatikan prinsip-prinsip sebagai berikut:
1.      Tes hasil belajar hendaknya mengukur secara jelas hasil belajar yang telah ditetapkan sesuai tujuan instruksional, artinya tes mengukur perilaku yang hendak diukur (valid). Oleh karena itu, tes hasil belajar harus dirumuskan secara jelas dan cermat, sehingga dapat mengukur tujuan instruksional yang diharapkan.
2.      Tes hasil belajar hendaknya dapat mengukur sampel yang representatif dari hasil belajar dan materi pelajaran yang tercakup dalam program pengajaran atau instruksional.
3.      Tes hasil belajar hendaknya mencakup jenis-jenis pertanyaan yang paling sesuai untuk mengukur hasil belajar yang diinginkan.
4.      Tes hasil belajar hendaknya direncanakan agar hasilnya sesuai dengan tujuan dan fungsinya, misalnya pre-test, tes formatif, tes diagnostik, maupun tes sumatif harus disusun sesuai dengan fungsinya masing-masing.
5.      Reliabilitas tes hasil belajar diusahakan setinggi mungkin dan hasil ukurnya harus ditafsirkan dengan hati-hati. 
Kelima prinsip di atas merupakan dasar atau pedoman bagi guru  dalam  menyusun  tes  hasil belajar matematika. Berpedoman pada kelima prinsip di atas, maka tujuan dan fungsi tes matematika makin jelas dan terarah. Diharapkan, tes tersebut akan memberikan hasil belajar matematika yang sesuai dengan kondisi siswa yang sebenarnya.
Ada dua tipe tes yakni: tes objektif dan tes uraian (essay). Tes objektif adalah tes yang telah disediakan pilihan jawabannya. Sedangkan tes uraian berupa soal yang masing-masing mengandung permasalahan dan menuntut penguraian sebagai jawaban. Berikut ini diberikan ciri-ciri tes objektif dan uraian.
1.            Ciri-ciri pokok tes objektif adalah:
a.             Siswa bekerja terhadap tugas-tugas yang sudah distruktur secara sempurna. Siswa tidak mempunyai kesempatan untuk mengorganisasikan jawabannya sendiri. Dari segi ini maka tes objektif sukar dipergunakan untuk menilai kecakapan mengorganisasikan dan menyusun ide-ide. Sebaliknya, keuntungannya adalah bahwa tes ini dapat mengujikan lebih banyak soal daripada yang diajukan oleh tes uraian.
b.            Siswa mencari jawaban dari pilihan yang telah disediakan. Siswa hanya perlu mengenal jawaban yang benar saja dan tidak perlu menghasilkan jawaban dengan usaha sendiri. Oleh karena itu, siswa dapat menjawab dengan hanya terkaan. Masalah ini terutama sekali mengenai bentuk pertanyaan yang hanya mengandung dua kemungkinan jawaban. Terkaan akan makin serius pada ujian yang pendek dengan pilihan jawaban yang sedikit. Masalah ini dapat dikurangi dengan menyusun ujian yang cukup panjang, dengan jumlah soal cukup banyak, dan memberikan waktu yang cukup untuk menyelesaikan ujian.
c.             Mencakup materi/bahan yang cukup luas. Soal-soal dapat disebarkan secara menyeluruh meliputi semua topik yang ingin diungkapkan dan dapat representatif mengenai seluruh bahan yang harus dipelajari.
d.            Tiap soal dilengkapi dengan kunci. Kunci-kunci itu ditetapkan sekaligus pada waktu soal ditulis. Akibatnya memeriksa jawaban ujian objektif adalah pekerjaan yang sangat mudah dan dapat dilakukan oleh siapa saja, hemat waktu, tetapi hendaknya diingat bahwa menulis soal-soal tes objektif yang benar-benar baik adalah pekerjaan yang amat sulit dan memerlukan waktu lama. Sekali kunci ditetapkan, maka benar atau salahnya suatu jawaban akan tetap sama siapa pun yang menjawab suatu soal dengan jawaban yang sama.



2.            Ciri-ciri pokok tes uraian (essay) adalah:
a.             Siswa mengorganisasikan sendiri jawaban. Ini merupakan keunggulan tes uraian. Siswa dituntut untuk benar-benar menghasilkan jawaban, tidak dimungkinkan jawaban yang dibuat dengan menerka saja.
b.            Jawaban berdasarkan pada kata-kata dan tulisan sendiri. Hal ini tergantung pada penguasaan kelancaran verbal dan kecakapan mengekspresikan pendapat. Siswa yang dapat menulis secara efektif seringkali memperoleh hasil yang tinggi.
c.             Tes uraian terbatas pada sejumlah kecil pertanyaan saja. Tes uraian tidak memungkinkan disajikannya sejumlah pertanyaan yang menyangkut materi/bahan yang amat luas.
d.            Penskoran yang subjektif, kekurangtelitian penilai dalam memeriksa jawaban menyebabkan penilai menilai kemampuan siswa secara subjektif.

Dari uraian di atas, kebaikan dan kelemahan tes objektif dan tes uraian dapat dilihat pada bagan  di bawah ini.
Tes
Kebaikan
Kelemahan
Objektif
1.      Lebih representatif mewakili isi dan banyaknya materi/ bahan
2.      Lebih objektif dalam penilaian


3.      Lebih mudah dan cepat memeriksanya
4.      Pemeriksaan hasil tes dapat dibantu oleh orang lain
1.      Dibutuhkan persiapan penyusunan tes yang relatif lebih sulit dibandingkan tes uraian
2.      Cenderung untuk mengungkapkan ingatan, kurang tepat untuk mengukur aspek yang lain
3.      Banyak kesempatan untuk untung-untungan
4.      Kerjasama siswa dalam menjawab tes lebih terbuka
Uraian (essay)
1.              Relatif lebih mudah penyusunannya

2.              Tidak memberi kesempatan siswa untuk berspekulasi
3.              Memberi motivasi siswa untuk mengemukakan pendapatnya dengan bahasanya sendiri
4.              Dapat mengetahui sejauh mana penguasaan siswa terhadap suatu materi
1.       Kurang representatif dalam mewakili materi pelajaran, karena hanya terdiri dari beberapa butir soal
2.       Validitas dan reliabilitas rendah, karena sukar diketahui aspek-aspek mana yang dinilai
3.       Dalam penilaian mudah dipengaruhi unsur subjek-tivitas dari penilai.
4.  Memeriksa hasil tes relatif sulit dan memerlukan waktu lebih lama
           
3.            Bentuk-bentuk tes objektif adalah:
a.             Butir Tes Benar Salah
Beberapa hal yang perlu diperhatikan dalam penyusunan butir tes benar salah adalah:
1)         Buatlah pernyataan secara jelas, benar atau salah. Butir tes benar salah ini harus dinyatakan secara jelas dan bebas dari pengertian ganda. Ungkapan yang samar-samar hanya akan mengecoh para siswa dan menimbulkan kebingungan.
2)         Hindarilah penentu-penentu yang bersifat spesifik, misalnya semua, selalu, tidak, tidak pernah, biasanya, kadang-kadang.
3)         Hindari pernyataan-pernyataan negatif ganda.
4)         Hindari petunjuk luar yang mengarah pada jawaban.
5)         Bila mengukur hubungan sebab akibat gunakan satu proposisi yang benar.
6)         Gunakan kalimat yang sederhana.
7)         Hal-hal yang bersifat teknis lainnya perlu juga diperhatikan: jumlah soal hendaknya cukup banyak, soal yang harus dijawab dengan benar dan yang harus dijawab dengan salah, jumlahnya hendaknya seimbang, dan urutan soal-soal yang harus dijawab dengan benar dan harus dijawab dengan salah hendaknya tidak merupakan pola yang tetap.

Kelebihan dan kelemahan Butir Tes Benar Salah disajikan pada bagan berikut:
Kelebihan Butir Tes Benar Salah
Kelemahan Butir Tes Benar Salah
1.      Soal ini baik untuk hasil-hasil dimana hanya ada dua alternatif jawaban
2.      Tuntutan kurang ditekankan pada kemampuan baca
3.      Sejumlah soal relatif dapat dijawab dalam tipe tes secara berkala
4.      Penilaian mudah, objektif dan dapat dipercaya.
1.      Sulit menuliskan soal di luar tingkat pengetahuan yang bebas dari maksud ganda
2.      Jawaban soal tidak memberikan bukti bahwa siswa mengetahui dengan baik
3.      Tidak ada informasi diagnostik dari jawaban yang salah
4.      Memungkinkan dan mendorong siswa untuk menerka-nerka.


b.            Butir Tes Pilihan Ganda (Multiple Choice)
Butir tes pilihan ganda mengacu pada butir yang diujikan di mana siswa harus memilih salah satu dari beberapa pilihan. Butir ini mempunyai dua bagian, yaitu:
1)            Batang tubuh, yaitu yang mengikutsertakan semua informasi yang diperlukan untuk memperkenalkan pertanyaan.
2)            Pilihan-pilihan, yang terdiri dari jawaban yang benar dan distraktor.
Ketentuan-ketentuan yang harus diperhatikan dalam menulis butir tes  pilihan ganda, adalah:
1)            Hindari mengulangi kata-kata kunci.
2)            Kalimat dalam tiap-tiap soal diusahakan dengan kalimat positif.
3)            Jika mempergunakan kalimat negatif, hendaknya diberi penjelasan atau digarisbawahi.
4)            Kalimat dari tiap-tiap butir soal harus jelas.
5)            Hindari hubungan soal berikutnya dengan soal sebelumnya.
6)            Selang-selinglah jawaban yang benar secara acak.
7)            Kontrol kesulitan dalam soal dengan merubah alternatif jawaban.
8)            Pastikan satu soal bebas dari pengaruh soal yang lain.
9)            Jumlah option jangan terlalu banyak.

Kelebihan dan kelemahan Butir Tes Pilihan Ganda sebagai berikut:
Kelebihan Butir Tes Pilihan Ganda
Kelemahan Butir Tes Pilihan Ganda
1.      Hasil belajar dari yang sederhana sampai yang komplek dapat diukur
2.      Terstruktur dan petunjuknya jelas
3.      Alternatif jawaban yang salah dapat memberikan informasi diagnostik
4.      Tidak dimungkinkan untuk menerka jawaban
5.      Penilaian mudah, objektif dan dapat dipercaya
1.      Menyusunnya membutuhkan waktu yang lama
2.      Sulit menemukan pengacau
3.      Kurang efektif mengukur beberapa tipe pemecahan masalah, kemam-puan untuk mengorganisir dan mengekspresikan ide
4.      Nilai dapat dipengaruhi dengan kemampuan baca yang baik





c.             Butir Tes Menjodohkan
Butir tes menjodohkan merupakan variasi dari butir tes pilihan ganda. Dengan mengubah ke dalam bentuk menjodohkan dapat dihindari pengulangan dari jawaban alternatif dan menyajikan soal-soal sama dalam bentuk yang lebih komplek. Butir tes menjodohkan terdiri dari serangkaian pernyataan yang disebut premis dan serangkaian jawaban alternatif yang disebut respons. Ini semua disusun dalam kolom dengan petunjuk-petunjuk yang mengatur aturan-aturan untuk memasangkan/menjodohkan.
Ketentuan-ketentuan yang harus diperhatikan dalam menulis butir tes menjodohkan, adalah:
1)            Diusahakan hanya materi-materi yang homogen dalam serangkaian soal.
2)            Diusahakan urutan-urutan soal singkat dan tempatkan jawaban secara singkat di sebelah kanan.
3)            Jumlah respon lebih banyak dari premis.
4)            Petunjuk harus jelas, apakah satu respon hanya dipakai satu kali atau lebih dari satu kali.
5)            Serangkaian soal menjodohkan ditulis dalam halaman yang sama.

Kelebihan dan kelemahan butir tes menjodohkan sebagai berikut:
Kelebihan Butir Tes Menjodohkan
Kelemahan Butir Tes Menjodohkan
1.      Suatu bentuk yang efisien diberikan di mana sekelompok respon sama menyesuaikan dengan rangkaian isi soal
2.      Waktu membaca dan merespon relatif singkat
3.      Mudah untuk dibuat
4.      Penilaian mudah, objektif dan dapat dipercaya
1.      Materi soal dibatasi oleh faktor ingatan/pengetahuan yang sederhana dan kurang dapat dipakai untuk mengukur penguasaan yang bersifat pengertian dan kemampuan membuat tafsiran
2.      Sulit menyusun soal yang mengandung sejumlah respons yang homogen
3.      Mudah terpengaruh dengan petunjuk yang tidak relevan





d.            Butir Tes Isian Singkat dan Jawaban Pendek
Butir tes bentuk isian singkat dan jawaban pendek keduanya hampir sama, hanya berbeda dalam bentuk persoalan yang disajikan. Jika masalah yang disajikan dalam bentuk pertanyaan, maka butir tes itu menjadi bentuk jawaban pendek, dan apabila disajikan dalam bentuk pernyataan yang belum selesai, maka butir tes itu menjadi bentuk isian singkat.
Dalam mempersiapkan soal-soal bentuk ini perlu diperhatikan hal-hal berikut:
a)            Hati-hati terhadap soal-soal isian yang terbuka. Jawaban yang diinginkan harus benar-benar dibatasi.
b)            Titik-titik lebih baik diletakkan pada ujung pernyataan dari pada di depan.
c)            Di dalam satu pernyataan janganlah terlalu banyak yang dikosongkan.
d)           Jika masalahnya memerlukan jawaban yang berupa angka, nyatakanlah satuan-satuan tertentu dari perhitungan itu.
Kelebihan dan kelemahan butir tes isian singkat/jawaban pendek sebagai berikut:
Kelebihan butir Tes Isian Singkat/Jawaban Pendek
Kelemahan Butir Tes Isian Singkat/Jawaban Pendek
1.      Mudah dalam pembuatan
2.      Kemungkinan menebak jawaban sangat sulit
3.      Cocok untuk soal-soal hitungan
4.      Hasil-hasil pengetahuan dapat diukur secara luas
1.      Sulit menyusun kata-kata yang jawabannya hanya satu
2.      Tidak cocok untuk mengukur hasil-hasil belajar yang komplek
3.      Penilaian menjemukan dan memakan waktu banyak

e.             Butir Tes Uraian
Butir tes uraian menghendaki agar siswa menyusun sendiri jawaban dan biasanya dalam beberapa ukuran panjang dan harus rinci. Butir tes uraian dianggap sebagai upaya pendekatan terbaik dalam mengukur kemampuan menulis, walau pun kemampuan tersebut bukan sasaran utama dalam tes. Butir tes uraian secara tidak langsung mengukur sikap-sikap siswa yang tidak dapat dicerminkan melalui butir tes tipe objektif. Siswa bebas memutuskan bagaimana melakukan pendekatan pada permasalahan, informasi faktual apa yang digunakan dan tingkat penekanan apa yang harus diberikan bagi tiap aspek. Jadi tes uraian berguna untuk mengukur kemampuan mengorganisasikan, melengkapi dan mengekspresikan ide-ide.
Butir tes uraian biasanya lebih mudah menyusunnya daripada tes objektif, tetapi pada saat pemberian nilai, butir tes uraian banyak menghabiskan waktu. Subjektivitas pemberian skor merupakan satu kerugian teknik dari butir tes uraian yang seringkali dianggap kelemahan tes uraian.
Penulisan tes uraian yang baik harus memperhatikan hal-hal berikut:
1)      Gunakan pertanyaan hanya untuk mengukur hasil belajar yang kompleks.
2)      Gunakan pertanyaan yang langsung dapat mengukur hasil belajar.
3)      Pertanyaan ditulis secara jelas.
4)      Memberikan contoh menjawab dan batas waktu/bobot nilai dalam tiap soal.
Beberapa langkah harus ditempuh untuk mengurangi subjektivitas pemeriksa, yakni:
1)      Sediakanlah terlebih dahulu contoh jawaban dan tunjukkanlah pokok-pokok apa yang diinginkan dan berapa angka yang diberikan untuk masing-masing pokok itu.
2)      Bacalah seluruh jawaban (untuk semua siswa) untuk satu pertanyaan tertentu sebelum melanjutkan membaca jawaban pertanyaan yang lain.
3)      Sedapat mungkin nilailah jawaban-jawaban itu tanpa mengingat siapa yang menjawab.
4)      Jika mungkin, pakailah dua orang untuk menilai. Keterandalan penilaian yang lebih besar dapat diperoleh dengan jalan merata-ratakan angka yang diberikan oleh beberapa orang penilai yang bekerja secara terpisah.

4.            Pengembangan Instrumen Penilaian Pembelajaran Aspek Kognitif  dalam
        Bentuk Tes

Penyusunan dan pengembangan tes dimaksudkan untuk memperoleh tes yang baku atau mewujudkan adanya bank soal. Untuk menyusun dan mengembangkan instrumen penilaian pembelajaran matematika dalam bentuk tes (tes prestasi), dilakukan dengan beberapa tahapan, yakni: 1) menetapkan tujuan tes, 2) analisis kurikulum /silabus, 3) membuat kisi-kisi, 4) menuliskan kompetensi atau indikator, 5) menyusun / membuat soal, 6) analisis kualitatif, 7) reproduksi terbatas, 8) ujicoba, 9) analisis kuantitatif, 10) revisi soal, 11) memilih/menentukan butir-butir soal yang baik, dan 12) memasukkan butir-butir yang baik ke bank soal.
Untuk memberikan penjelasan yang lebih lengkap, berikut ini akan dibahas untuk tiap tahapan tersebut.
1.      Menetapkan Tujuan Tes
Tes prestasi belajar dapat dibuat untuk bermacam-macam tujuan, antara lain:
a.       Diagnostik, untuk menentukan sebab-sebab terjadinya kesulitan belajar secara berulang. Butir-butir soal cenderung mudah untuk menunjukkan penyebab dari suatu kesalahan.
b.      Seleksi/penempatan, untuk menentukan penampilan awal pada objek mata pelajaran. Untuk tujuan seleksi dibutuhkan tes dengan butir-butir soal yang tingkat kesukarannya lebih tinggi terutama jika calon yang diseleksi cukup banyak. Biasanya di-ambil butir-butir soal yang tingkat kesukarannya di atas rerata.
c.       Formatif, untuk memberikan umpan balik kepada siswa dan guru, dilaksanakan selama proses pembelajaran. Butir soalnya memadukan kesulitan dari semua objek.
d.      Sumatif, dilaksanakan pada akhir pembelajaran, untuk kenaikan tingkat atau ujian lain yang sejenis, misalnya UAS, UAN atau UNAS. Butir-butir soal mewakili tingkat kesulitan siswa, artinya terdiri dari butir-butir soal dari yang mudah sampai yang sukar.
2.      Analisis Kurikulum atau Analisis Silabus
Analisis kurikulum bertujuan untuk menentukan bobot setiap kompetensi yang akan dijadikan sebagai dasar dalam menentukan jumlah butir untuk setiap kompetensi untuk soal tipe objektif atau bobot soal untuk tipe tes uraian, dalam membuat kisi-kisi tes. Penentuan bobot setiap kompetensi tersebut dilakukan berdasarkan jumlah jam pertemuan yang tercantum silabus.
3.      Membuat Kisi-kisi
Kisi-kisi adalah suatu format berupa matriks yang memuat pedoman untuk menulis soal atau merakit soal menjadi suatu tes. Istilah lain untuk kisi-kisi adalah blue print, lay-out, atau table of specification. Manfaat kisi-kisi adalah untuk menjamin sampel soal yang baik, dalam arti mencakup semua pokok bahasan secara proporsional. Sebuah kisi-kisi memuat jumlah butir yang harus dibuat untuk setiap bentuk soal, untuk setiap kompetensi/indikator (proses kognitif: mengingat, memahami, menggunakan, menganalisis, mengevaluasi, atau menciptakan; dan pengetahuan: faktual, konseptual, prosedural).
4.    Penulisan Kompetensi atau Indikator
Penulisan kompetensi atau indikator harus sesuai dengan ketentuan-ketentuan yang telah ditetapkan. Kompetensi atau indikator harus mencerminkan tingkah laku siswa, dan harus dirumuskan secara operasional. Indikator yang dirumuskan pada bagian ini harus mencerminkan keseluruhan kompetensi yang hendak dicapai dalam suatu kurun waktu proses kegiatan belajar-mengajar.
5.      Penulisan Butir-Butir Tes
Setelah kisi-kisi dalam bentuk tabel spesifikasi telah tersedia, maka prosedur berikutnya adalah menulis butir-butir tes. Banyaknya butir tes yang harus dibuat untuk setiap bentuk soal, untuk setiap standar kompetensi, kompetensi dasar/pokok bahasan dan untuk setiap aspek kemampuan (proses kognitif dan pengetahuan) harus disesuaikan dengan yang tercantum dalam kisi-kisi, dengan memperhatikan:  usia dari siswa yang akan diuji,  waktu yang tersedia, dan  tipe soal yang akan digunakan.
Terdapat rambu-rambu yang harus diperhatikan dalam membuat butir tes matematika, yaitu:
a.       Soal yang dibuat harus valid (validitas isi/content) dalam arti mampu mengukur kompetensi atau indikator yang dirumuskan dalam silabus. Oleh karena itu, kesesuaian antara soal tes dengan kompetensi atau indikator merupakan syarat penting untuk suatu soal yang valid.
b.      Soal matematika yang dibuat harus dapat dikerjakan dengan menggunakan suatu kemampuan spesifik, tanpa dipengaruhi oleh kemampuan lain yang tidak relevan. Oleh karena itu, soal matematika yang dibuat harus menggunakan bahasa yang sederhana dan mudah dimengerti, sehingga tidak menimbulkan salah tafsir.
c.       Kunci jawaban harus dibuat dengan langkah-langkah lengkap sebelum digunakan pada tes yang sesungguhnya. Untuk soal bentuk uraian, dari penyelesaian langkah-langkah lengkap tersebut dapat dikembangkan pedoman penilaian untuk setiap butir soal.
d.      Dalam membuat soal matematika, hindari kesalahan-kesalahan tanda atau kesalahan-kesalahan ketik, betapa pun kecilnya, karena akan mempengaruhi validitas soal.
e.       Tetapkan sejak awal aspek proses kognitif dan pengetahuan (kompetensi atau indikator) yang hendak diukur oleh setiap soal matematika yang dibuat.
f.       Petunjuk mengerjakan soal harus diberikan secara lengkap dan jelas untuk setiap bentuk soal matematika dalam suatu tes.
g.      Langkah terakhir dari penulisan soal ini adalah review soal, seleksi soal, dan merakit semua butir soal dalam suatu bentuk tes, dilengkapi dengan waktu yang tersedia untuk pengerjaan tes tersebut.

6.      Analisis Kualitatif
Telaah mutu soal atau analisis secara kualitatif terhadap butir soal pada dasarnya adalah penelaah butir soal ditinjau dari segi kaidah penulisan soal, yakni:
a.       Isi atau Materi
Soal ditelaah untuk mengetahui kesesuaian isi atau materi yang ditanyakan dengan tujuan yang telah ditetapkan.
b.      Konstruksi Soal
         Butir soal yang baik harus disusun berdasarkan kaidah-kaidah penulisan butir soal.
c.       Bahasa
Telaah bahasa untuk melihat apakah suatu soal sudah jelas dan komunikatif, mudah dimengerti siswa, dan tidak mengandung arti ganda.
Analisis kualitatif ini, dapat dilakukan oleh teman sejawat yang sebidang keahliannnya. 
7.      Reproduksi Tes Terbatas
Perangkat tes yang sudah jadi kemudian diperbanyak dalam jumlah yang cukup menurut jumlah siswa yang menjadi sampel sebagai responden yang akan mengerjakannya.



8.      Uji Coba
Perangkat tes yang sudah diperbanyak kemudian diujicobakan pada sampel yang telah ditentukan. Cara penentuan sampel mana yang dipakai bergantung kepada tujuan uji coba itu sendiri.
9.      Analisis Kuantitatif
Tes yang telah diujicobakan perlu dianalisis butir-butirnya (analisis butir). Tujuannya adalah untuk mengetahui baik buruknya suatu butir soal. Baik buruknya butir soal ditetapkan dengan melihat taraf kesukaran, daya beda, fungsi pengecoh (distraktor) serta penyebaran jawaban pada pengecoh dengan total kelompok, dan yang lebih penting adalah validitas internal (konsistensi internal) untuk melihat butir mana yang valid dan mana yang harus didrop.
Untuk mengukur taraf kesukaran butir dapat digunakan rumus:
                                
Keterangan:
pi         : proporsi menjawab benar pada butir soal tertentu
åB       : banyaknya peserta tes menjawab benar
n          : jumlah peserta tes.
Tingkat kesukaran dikategorikan menjadi tiga bagian, yaitu:
taraf kesukaran (p)
kategori soal
                            p > 0,70
mudah
0,30 £ p £ 0,70
sedang
                            p < 0,30
sukar

Untuk menghitung daya beda dapat dilakukan dengan mengkorelasikan antara skor setiap butir dengan skor totalnya. Cara ini lebih baik karena semua skor pada setiap butir tidak dipisahkan, artinya semua skor responden dimasukkan. Teknik analisis yang digunakan adalah teknik korelasi  product moment untuk data (yang bisa dianggap) interval atau korelasi point biserial (untuk data dikotomi). Untuk mengetahui butir tersebut layak atau tidak untuk dijadikan instrumen, maka nilai koefisien r dibandingkan dengan nilai r tabel product moment atau point biserial. Cara lain, adalah mentransformasikan nilai koefisien r dengan rumus t, dan hasilnya dibandingkan dengan nilai t tabel. Jika r hitung lebih besar r tabel atau t hitung lebih besar dari t tabel, untuk sejumlah sampel (n), maka butir tersebut signifikan dan layak untuk dijadikan instrumen.
Rumus korelasi product moment adalah:
                       
Keterangan:

       : angka indeks korelasi “r” product moment
n          : jumlah sampel
            : jumlah hasil perkalian antara skor butir X dan skor total Y
  : jumlah seluruh skor butir X
    : jumlah seluruh skor total Y.
Rumus korelasi point biserial adalah:
                             
Keterangan:
:
koefisien korelasi point biserial
:
rata-rata skor pada tes dari peserta tes yang memiliki jawaban benar pada butir ke–i
:
rata-rata skor total
:
standar deviasi skor total
p
:
proporsi peserta tes yang jawabannya benar pada butir ke-i
q
:
Proporsi peserta tes yang jawabannya salah pada butir ke-i, q = 1- p

Selanjutnya hasil perhitungan  atau  ditransformasikan ke harga  t dengan menggunakan rumus:   
dengan ri : nilai untuk butir ke-I, dan n : banyaknya sampel/ responden.
Untuk analisis butir secara kuantitatif dapat digunakan program-program komputer yang telah ada, seperti: Iteman, Excel, SPS, atau SPSS. 



10.  Revisi Soal
Apabila dari hasil analisis ada butir soal yang jelek, maka butir-butir soal itu perlu direvisi (diperbaiki) atau dibuang. Setelah direvisi, diujicobakan lagi, kemudian dianalisis lagi untuk melihat apakah butir benar-benar sudah baik atau belum.
11.   Menentukan Soal-soal yang Baik
Soal-soal yang telah diujicobakan dan dianalisis tingkat kesukaran, daya beda, fungsi pengecoh dan penyebaran jawaban pada pengecoh total kelompok, serta validitas internalnya dari setiap butir soal, diperoleh soal yang telah dibakukan melalui proses analisis soal.
12.  Memasukkan Butir Soal ke Bank Soal
Butir-butir soal yang dinilai baik melalui proses analisis soal kemudian dimasukkan dan disimpan dalam bank soal. Apabila dibutuhkan untuk dirakit menjadi tes, maka dipilih butir-butir soal yang memenuhi tujuan tes termaksud.

Prosedur di atas digambarkan ke dalam bagan berikut:

Penulisan soal
Telaah dan revisi soal

Perakitan tes

Uji coba tes













Analisis Soal









Soal jelek/ tidak berfungsi


Seleksi soal (Kualitatif dan kuantitatif)













Soal baik













Kalibrasi soal














Bank soal





IV.       PENGEMBANGAN INSTRUMEN PENILAIAN PEMBELAJARAN ASPEK NON-KOGNITIF  (RANAH AFEKTIF)

Ranah afektif berhubungan dengan minat, motivasi, sikap, penghargaan (apresiasi), kepercayaan diri, dan nilai-nilai. Prosedur pengembangan instrumen penilaian hasil belajar pada ranah afektif mirip dengan prosedur pengembangan instrumen penilaian pada ranah kognitif. Langkah-langkah penyusunan instrumen penilaian afektif (dengan menggunakan skala sikap) yang dapat dilakukan oleh para guru, antara lain:
1.      Memberikan batasan konstruk yang akan diukur (definisi konsep yang akan diukur).
         Definisi ini bisa diperoleh dari teori-teori yang ada di buku-buku teks. Untuk kepentingan praktis, guru bisa langsung mengambil dari penelitian-penelitian atau karya tulis ilmiah lain, seperti: jurnal, skripsi, tesis, atau disertasi.
         Contoh definisi konsep sikap: “sikap terhadap matematika adalah respons siswa terhadap berbagai aspek matematika (materi pelajaran, guru, buku, proses belajar-mengajar, pekerjaan rumah, tes, dan penerapan) yang didasarkan atas penilaian, keyakinan, pemahaman, perasaan (suka-tak suka, senang – tak senang), dan kecenderungan untuk melakukan/mengikuti.”

2.      Menyusun kisi-kisi berdasarkan indikator dari konstruk yang akan diukur.
Contoh:  Indikator Sikap terhadap Matematika dan Kisi-Kisi Instrumen Sikap terhadap Matematika
         Aspek Matematika

Dimensi  Sikap

 

Materi matematika


Guru matematika


PBM

Penerapan
Kognisi
(penilaian thdp ...)




Afeksi
(perasaan suka/ tak suka, senang/tak senang)




Konasi (kecenderungan utk mengikuti/mlkukn)





3.      Menyusun atau membuat sejumlah pernyataan sesuai dengan indikator dalam kisi-kisi (sekitar 30 - 40 pernyataan) dengan skala penskoran tertentu (misalnya dengan menggunakan skala Likert dengan 5 titik). Hal yang perlu diperhatikan dalam pembuatan pernyataan ini, jika menggunakan pernyataan-pernyataan negatif dan positif hendaknya dibuat berimbang. Untuk kepentingan praktis guru langsung dapat menggunakan instrumen yang sudah ada.
4.      Melakukan panel dengan teman sejawat, untuk mendapatkan butir-butir pernyataan yang baik (dari segi bahasa dan maksud butir pernyataan).
5.      Melakukan uji keterbacaan (wording try-out) kepada sejumlah siswa (sekitar 3-5 orang) dan dilakukan revisi seperlunya jika ada yang perlu direvisi.
6.      Uji-coba ke sejumlah siswa (sekitar 30-an orang)
Hal-hal yang perlu diperhatikan dalam pelaksanaan uji-coba ini adalah pengantar dan panduan agar responden/siswa mengisi atau merespon dengan sungguh-sungguh, sehingga mencerminkan karakteristik yang ingin diukur. Dengan keseriusan peresponan akan didapat karakteristik faktual. Jika hal ini tidak dilakukan bisa jadi yang didapatkan hanyalah “sampah.”
7.      Analisis Butir
Analisis yang dilakukan untuk mengetahui kesahihan butir, kesahihan instrumen, dan reliabilitas instrumen. Teknik analisis untuk kepentingan ini diberikan pada bagian akhir dari modul ini.
8.    Revisi atau Pengedropan
         Dari analisis yang dilakukan, maka akan diketahui mana butir-butir yang sahih dan mana butir-butir yang tidak sahih. Jika semua indikator sudah terwakili, maka butir-butir yang tidak sahih langsung bisa dibuang (didrop), sebaliknya jika ada indikator yang belum terwakili, maka butir-butir yang tidak sahih perlu diperbaiki.
9.    Penyeleksian dan Dokumentasi
         Dari butir-butir yang sahih dikumpulkan sehingga diperoleh suatu instrumen. Untuk melihat keandalan instrumen tersebut dilakukan uji reliabilitas. Untuk kepentingan uji ini, dibahas pada bahan pelatihan yang lain. Selanjutnya instrumen yang dihasilkan didokumentasikan untuk kepentingan penilaian.

DAFTAR PUSTAKA

…….. 2004. Materi Pelatihan Terintegrasi Buku 3. Jakarta : Departemen Pendidikan Nasional.

…….. 2007. Panduan Penulisan soal pilihan Ganda. Jakarta : Pusat Penilaian Pendidikan Balitbang Departemen Pendidikan Nasional.

Ainun Salim dan Nuraeni Ekaningrum. 2006. Tes Tertulis. Jakarta : Pusat Penilaian Pendidikan Balitbang Departemen Pendidikan Nasional.

Blogroll

Partners

About