Analisis Matematis Metode Automatic Short Answer Scoring Bahasa Indonesia: Dataset, Tantangan, dan Arah Penelitian Masa Depan
Keywords:
Automatic Short Answer Scoring, Deep Learning, Natural Language Processing, Systematic Literature Review, TransformerAbstract
Automatic Short Answer Scoring (ASAS) merupakan salah satu penerapan Natural Language Processing (NLP) yang digunakan untuk melakukan penilaian otomatis terhadap jawaban uraian singkat. Pengembangan ASAS menjadi penting karena proses penilaian manual sering kali membutuhkan waktu yang lama dan rentan terhadap subjektivitas penilai. Meskipun penelitian ASAS Bahasa Indonesia telah berkembang dalam beberapa tahun terakhir, kajian yang mengintegrasikan analisis dataset, perkembangan metode, landasan matematis, tantangan, dan arah penelitian masa depan masih relatif terbatas. Oleh karena itu, penelitian ini bertujuan untuk melakukan Systematic Literature Review (SLR) terhadap perkembangan ASAS Bahasa Indonesia dengan fokus pada analisis matematis metode yang digunakan. Proses kajian dilakukan melalui pencarian dan seleksi literatur pada beberapa basis data ilmiah yang relevan dengan kriteria inklusi tertentu. Data yang diperoleh dianalisis secara deskriptif dan komparatif berdasarkan karakteristik dataset, metode yang digunakan, formulasi matematis, serta performa yang dilaporkan. Hasil kajian menunjukkan bahwa penelitian ASAS Bahasa Indonesia masih didominasi oleh penggunaan dataset UKARA, PISA Indonesia, Rahutomo, dan dataset domain khusus. Dari sisi metodologi, terjadi pergeseran dari pendekatan berbasis kemiripan teks seperti TF-IDF, Vector Space Model (VSM), Cosine Similarity, dan Latent Semantic Analysis (LSA) menuju pendekatan berbasis deep learning dan Transformer. Model berbasis BiLSTM dan FastText menunjukkan peningkatan performa dibandingkan metode konvensional, sedangkan pendekatan Transformer menghasilkan kemampuan pemahaman semantik yang lebih baik dan performa yang lebih stabil. Kajian ini juga mengidentifikasi tantangan utama berupa keterbatasan dataset, semantic noise, overfitting, dan variasi bahasa nonformal. Penelitian selanjutnya berpotensi mengembangkan model berbasis Large Language Models (LLM), pendekatan hibrida, dan sistem penilaian yang mampu memberikan umpan balik otomatis kepada peserta didik.
References
Arfandy, A., & Musdar, I. A. (2020). Automated Essay Scoring Menggunakan Cosine Similarity dan TF-IDF. Jurnal Karya Ilmiah, 22(2), 107-118. https://ejurnal.ubharajaya.ac.id/index.php/JKI/article/download/1684/1311
Ayu, R., & Nurjanah, D. (2025). Correlation Between Automatic Short Answer Scoring and Manual Scoring by Teacher on Indonesian Assessments. JTP - Jurnal Teknologi Pendidikan, 27(2), 751–764. https://journal.unj.ac.id/unj/index.php/jtp/article/view/48378/22108
Bojanowski, P., Grave, E., Joulin, A., & Mikolov, T. (2017). Enriching word vectors with subword information. Transactions of the Association for Computational Linguistics, 5, 135–146. https://doi.org/10.1162/tacl_a_00051
Fadilah, N., & Priyanta, S. (2022). Automatic Essay Scoring Using Data Augmentation in Bahasa Indonesia. IJCCS (Indonesian Journal of Computing and Cybernetics Systems), 16(4), 401–410. https://journal.ugm.ac.id/ijccs/article/view/76396
Fadilah, N., Putra, B. A., & Pratama, M. I. (2026). Optimasi Model BiLSTM Berbasis FastText pada Data Augmentasi Semantik IndoBERT untuk Klasifikasi Teks Bahasa Indonesia. PISCES: Journal of Progressive Information, Security, Computer and Embedded System, 4(1), 1-10. https://journal.diginus.id/PISCES/article/view/1249/525
Fateen, M., Wang, B., & Mine, T. (2024). Beyond Scores: A Modular RAG-Based System for Automatic Short Answer Scoring With Feedback. IEEE Access, 12, 1249-1260. https://ishikawalab.ynu.ac.jp/ieee/access/index.html
Febriyanto, F. (2019). Sistem Penilaian Otomatis Jawaban Esai Dengan Menggunakan Metode Vector Space Model Pada Beberapa Perkuliahan Di STMIC Indonesia Banjarmasin. Jurnal Teknologi Informasi, 14(1), 53-68. http://jurnal.stkippersada.ac.id/jurnal/index.php/jutech/article/view/1273/0
Hidayatulloh. (2018). UKARA: A Fast and Simple Automatic Short Answer Scoring System for Bahasa Indonesia. Proceedings of the International Conference on Educational Assessment and Policy (ICEAP), 2(1), 48–53. https://pdfs.semanticscholar.org/0edf/00084126dea1d286fdf928dea691887fab79.pdf
Prastowo, B. N., dkk. (2024). Stop-Word Exclusion and Reference Answer Comparison in Transformer-Based Automated Essay Scoring in Higher Education. Jurnal Nasional Teknologi dan Sistem Informasi (JANAPATI), 13(1), 103823. https://ejournal.undiksha.ac.id/index.php/janapati/article/view/103823
Sari, Y., dkk. (2019). A Platform View of Automatic Short Answer Scoring System. Proceedings of the International Conference on Educational Assessment and Policy (ICEAP), 3(1), 264-270. https://sinta.kemdiktisaintek.go.id/authors/profile/6021610/?view=googlescholar
Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, Ł., & Polosukhin, I. (2017). Attention is all you need. Advances in Neural Information Processing Systems, 30, 5998–6008.
Wei, J., & Zou, K. (2019). EDA: Easy data augmentation techniques for boosting performance on text classification tasks. Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing, 6383–6389. https://doi.org/10.18653/v1/D19-1670
Wicaksono, B., Rasim, & Wihardi, Y. (2024). Analisis Komparatif Pendekatan Direct Scoring dan Similarity-Based Scoring pada Automatic Short Answer Scoring Berbahasa Indonesia Menggunakan Dataset Rahutomo. Brilliance: Research of Artificial Intelligence, 4(1), 6275. https://itscience-indexing.com/jurnal/index.php/brilliance/article/view/6275




GAUSS: Journal of Mathematics, Statistics, and Mathematics Education licensed under a