Riset AI di Dunia Pendidikan, Mayoritas Jawaban ChatGPT Tak Terdeteksi oleh Penguji

material-symbols:fullscreenPerbesar

Ilustrasi kecerdasan buatan atau AI. Dok. Shutterstock

Baca berita dengan sedikit iklan, klik di sini

TEMPO.CO, Jakarta - Pengembangan teknologi kecerdasan buatan atau artificial intelligence (AI) semakin kencang. Pemanfaatannya pun meluas ke berbagai sektor untuk membantu manusia di level yang belum pernah terbayangkan. Namun demikian, di tengah seabreg sisi positifnya, AI telah meningkatkan kekhawatiran atas beragam bentuk penyimpangan dalam penggunaannya.

Baca berita dengan sedikit iklan, klik di sini

Penggunaan AI di dunia pendidikan termasuk yang menjadi perhatian banyak kalangan. AI telah meningkatkan risiko atas isu keaslian jawaban ataupun karya tulis peserta didik. Pada satu sisi, AI diyakini belum cukup mampu menggantikan manusia dalam hal gaya penalaran. Namun di sisi lain, manusia pada kenyataannya juga tak mudah mengidentifikasi hasil karya AI, termasuk jawaban ujian.

Baca berita dengan sedikit iklan, klik di sini

Hasil riset terbaru University of Reading, Inggris, membuktikannya. Penguji tak mendeteksi sekitar 94 persen dari tugas ujian universitas yang dibuat menggunakan ChatGPT. “Rata-rata, respons AI memperoleh nilai lebih tinggi dibandingkan respons siswa kami yang sebenarnya,” kata Peter Scarfe, Associate Professor pada Schol of Psychology and Clinical Language Sciences, University of Reading, seperti dikutip Tempo dari New Scientist, Selasa, 16 Juli 2024.

BACA JUGA

3 Cara Meningkatkan Kualitas Foto

Quora Perkenalkan Fitur Poe, Mirip ChatGPT

Hasilnya mencengangkan. Di semua modul, hanya 6 persen pekerjaan AI yang ditandai oleh penilai sebagai kemungkinan bukan karya asli mahasiswa. Beberapa modul bahkan sama sekali tak ada karya yang ditandai sebagai naskah mencurigakan.

Scarfe mengatakan, teknologi AI saat ini cenderung kesulitan pada aspek penalaran yang lebih abstrak dan terintegrasi ke dalam informasi. Namun, di antara 63 jawaban AI, ada peluang 83,4 persen bahwa karya kecerdasan buatan tersebut mengungguli karya siswa.

Para peneliti mengklaim bahwa riset mereka ini sebagai studi terbesar dan terkuat yang pernah dilakukan. Kendati hanya memeriksa karya pada program studi psikologi di University of Reading, Scarfe yakin hasil riset ini akan menjadi perhatian seluruh sektor akademis. "Saya tidak punya alasan untuk berpikir bahwa bidang studi lain tidak akan menghadapi masalah yang sama," kata Scarfe.

Menurut Scarfe, menangani permasalahan ini pada sumbernya hampir mustahil dilakukan. Artinya, kata dia, dunia pendidikan harus mempertimbangkan kembali bagaimana cara mereka menilai. "Saya pikir sektor tersebut secara keseluruhan harus mengakui fakta bahwa kita harus membangun AI ke dalam penilaian yang kita berikan kepada siswa kita," kata dia.

Thomas Lancaster, peneliti komputasi pada Imperial College London, Inggris, sudah bisa menebak hasil akhir riset ini. AI, kata dia, dapat menghasilkan respons yang terdengar masuk akal untuk pertanyaan tekstual yang sederhana dan terbatas. "Ini menunjukkan bahwa penilaian tanpa pengawasan termasuk jawaban singkat selalu rentan terhadap kecurangan," kata Lancaster yang dikenal sebagai pakar urusan integritas dan plagiarisme di dunia akademik.

Menurut Lancaster, beban kerja akademikus yang diharapkan untuk menilai pekerjaan para siswa juga tidak membantu kemampuan mereka untuk mendeteksi kecurangan AI. "Penilai pertanyaan jawaban singkat yang dibatasi waktu sangat tidak mungkin memunculkan kasus pelanggaran AI begitu saja," kata dia. "Saya yakin ini bukan satu-satunya institusi yang mengalami hal ini."

NEW SCIENTIST

Pilihan Editor: Perusahaan Konservasi Menang Gugatan atas Pencabutan Izin oleh KLHK

kecerdasan-buatan

artificial-intelligence