Analisis Matematis Metode Automatic Short Answer Scoring Bahasa Indonesia: Dataset, Tantangan, dan Arah Penelitian Masa Depan

Nur Fadilah

Authors

Nur Fadilah Program Studi Matematika, Universitas Negeri Makassar https://orcid.org/0009-0006-9450-6046

Keywords:

Automatic Short Answer Scoring, Deep Learning, Natural Language Processing, Systematic Literature Review, Transformer

Abstract

Automatic Short Answer Scoring (ASAS) merupakan salah satu penerapan Natural Language Processing (NLP) yang digunakan untuk melakukan penilaian otomatis terhadap jawaban uraian singkat. Pengembangan ASAS menjadi penting karena proses penilaian manual sering kali membutuhkan waktu yang lama dan rentan terhadap subjektivitas penilai. Meskipun penelitian ASAS Bahasa Indonesia telah berkembang dalam beberapa tahun terakhir, kajian yang mengintegrasikan analisis dataset, perkembangan metode, landasan matematis, tantangan, dan arah penelitian masa depan masih relatif terbatas. Oleh karena itu, penelitian ini bertujuan untuk melakukan Systematic Literature Review (SLR) terhadap perkembangan ASAS Bahasa Indonesia dengan fokus pada analisis matematis metode yang digunakan. Proses kajian dilakukan melalui pencarian dan seleksi literatur pada beberapa basis data ilmiah yang relevan dengan kriteria inklusi tertentu. Data yang diperoleh dianalisis secara deskriptif dan komparatif berdasarkan karakteristik dataset, metode yang digunakan, formulasi matematis, serta performa yang dilaporkan. Hasil kajian menunjukkan bahwa penelitian ASAS Bahasa Indonesia masih didominasi oleh penggunaan dataset UKARA, PISA Indonesia, Rahutomo, dan dataset domain khusus. Dari sisi metodologi, terjadi pergeseran dari pendekatan berbasis kemiripan teks seperti TF-IDF, Vector Space Model (VSM), Cosine Similarity, dan Latent Semantic Analysis (LSA) menuju pendekatan berbasis deep learning dan Transformer. Model berbasis BiLSTM dan FastText menunjukkan peningkatan performa dibandingkan metode konvensional, sedangkan pendekatan Transformer menghasilkan kemampuan pemahaman semantik yang lebih baik dan performa yang lebih stabil. Kajian ini juga mengidentifikasi tantangan utama berupa keterbatasan dataset, semantic noise, overfitting, dan variasi bahasa nonformal. Penelitian selanjutnya berpotensi mengembangkan model berbasis Large Language Models (LLM), pendekatan hibrida, dan sistem penilaian yang mampu memberikan umpan balik otomatis kepada peserta didik.

References

Arfandy, A., & Musdar, I. A. (2020). Automated Essay Scoring Menggunakan Cosine Similarity dan TF-IDF. Jurnal Karya Ilmiah, 22(2), 107-118. https://ejurnal.ubharajaya.ac.id/index.php/JKI/article/download/1684/1311

Ayu, R., & Nurjanah, D. (2025). Correlation Between Automatic Short Answer Scoring and Manual Scoring by Teacher on Indonesian Assessments. JTP - Jurnal Teknologi Pendidikan, 27(2), 751–764. https://journal.unj.ac.id/unj/index.php/jtp/article/view/48378/22108

Bojanowski, P., Grave, E., Joulin, A., & Mikolov, T. (2017). Enriching word vectors with subword information. Transactions of the Association for Computational Linguistics, 5, 135–146. https://doi.org/10.1162/tacl_a_00051

Fadilah, N., & Priyanta, S. (2022). Automatic Essay Scoring Using Data Augmentation in Bahasa Indonesia. IJCCS (Indonesian Journal of Computing and Cybernetics Systems), 16(4), 401–410. https://journal.ugm.ac.id/ijccs/article/view/76396

Fadilah, N., Putra, B. A., & Pratama, M. I. (2026). Optimasi Model BiLSTM Berbasis FastText pada Data Augmentasi Semantik IndoBERT untuk Klasifikasi Teks Bahasa Indonesia. PISCES: Journal of Progressive Information, Security, Computer and Embedded System, 4(1), 1-10. https://journal.diginus.id/PISCES/article/view/1249/525

Fateen, M., Wang, B., & Mine, T. (2024). Beyond Scores: A Modular RAG-Based System for Automatic Short Answer Scoring With Feedback. IEEE Access, 12, 1249-1260. https://ishikawalab.ynu.ac.jp/ieee/access/index.html

Febriyanto, F. (2019). Sistem Penilaian Otomatis Jawaban Esai Dengan Menggunakan Metode Vector Space Model Pada Beberapa Perkuliahan Di STMIC Indonesia Banjarmasin. Jurnal Teknologi Informasi, 14(1), 53-68. http://jurnal.stkippersada.ac.id/jurnal/index.php/jutech/article/view/1273/0

Hidayatulloh. (2018). UKARA: A Fast and Simple Automatic Short Answer Scoring System for Bahasa Indonesia. Proceedings of the International Conference on Educational Assessment and Policy (ICEAP), 2(1), 48–53. https://pdfs.semanticscholar.org/0edf/00084126dea1d286fdf928dea691887fab79.pdf

Prastowo, B. N., dkk. (2024). Stop-Word Exclusion and Reference Answer Comparison in Transformer-Based Automated Essay Scoring in Higher Education. Jurnal Nasional Teknologi dan Sistem Informasi (JANAPATI), 13(1), 103823. https://ejournal.undiksha.ac.id/index.php/janapati/article/view/103823

Sari, Y., dkk. (2019). A Platform View of Automatic Short Answer Scoring System. Proceedings of the International Conference on Educational Assessment and Policy (ICEAP), 3(1), 264-270. https://sinta.kemdiktisaintek.go.id/authors/profile/6021610/?view=googlescholar

Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, Ł., & Polosukhin, I. (2017). Attention is all you need. Advances in Neural Information Processing Systems, 30, 5998–6008.

Wei, J., & Zou, K. (2019). EDA: Easy data augmentation techniques for boosting performance on text classification tasks. Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing, 6383–6389. https://doi.org/10.18653/v1/D19-1670

Wicaksono, B., Rasim, & Wihardi, Y. (2024). Analisis Komparatif Pendekatan Direct Scoring dan Similarity-Based Scoring pada Automatic Short Answer Scoring Berbahasa Indonesia Menggunakan Dataset Rahutomo. Brilliance: Research of Artificial Intelligence, 4(1), 6275. https://itscience-indexing.com/jurnal/index.php/brilliance/article/view/6275

Analisis Matematis Metode Automatic Short Answer Scoring Bahasa Indonesia: Dataset, Tantangan, dan Arah Penelitian Masa Depan

Authors

Keywords:

Abstract

References

Downloads

Published

How to Cite

Issue

Section

tools

TEMPLATE

ISSN

VISITORS

INDEXING

Information

auto