IMPLEMENTASI FINE-TUNING UNTUK PREDIKSI SOLUSI DARI KALIMAT MASALAH PADA ARTIKEL ILMIAH MENGGUNAKAN LARGE LANGUAGE MODELS (LLM)

Alfiyatu Nurinayah, Sam Farisa Chaerul Haviana

Abstract


Prediksi solusi kalimat masalah dalam artikel ilmiah merupakan suatu tantangan karena tidak semua kalimat masalah dalam artikel menyebutkan solusi secara eksplisit. Penelitian ini mengembangkan model berbasis fine-tuning Llama 3.2 1B Instruct untuk memprediksi solusi dari kalimat masalah. Model dilatih dengan 99 pasangan kalimat masalah-solusi untuk memahami pola hubungan keduanya. Evaluasi menggunakan ROUGE menunjukkan skor ROUGE-1 sebesar 0,611, ROUGE-2 sebesar 0,496, dan ROUGE-L sebesar 0,576. Selama pelatihan, loss menurun dari 0.4394 pada epoch pertama menjadi 0.0286 pada epoch kelima, menunjukkan peningkatan pemahaman model. Namun, model mengalami kesulitan dalam memprediksi solusi dari permasalahan di luar cakupan data latih dan hasilnya terkadang kurang relevan saat diterapkan dalam aplikasi, kemungkinan karena keterbatasan komputasi. Penelitian lebih lanjut diperlukan untuk meningkatkan akurasi dan stabilitas model pada sistem dengan sumber daya terbatas

References


D. Fatmalasari dan F. R. Lumbanraja, “Peringkasan Teks Artikel Ilmiah Berbahasa Indonesia dengan Metode Pembobotan Kalimat,” J. Pepadun, vol. 3, no. 3, hal. 314–322, 2022.

I. P. A. Peña dan J. C. Ortega-Castro, “Implementation and Evaluation of an Anti-Fraud Prototype Based on Generative Artificial Intelligence for the Ecuadorian Financial Sector,” Rev. Gestão Soc. e Ambient., vol. 18, no. 9, hal. e08601, 2024.

A. G. Pradana, D. R. I. M. Setiadi, dan A. R. Muslikh, “Fine tuning model Convolutional Neural Network EfficientNet-B4 dengan augmentasi data untuk klasifikasi penyakit kakao,” J. Inf. Syst. Appl. Dev., vol. 2, no. 1, hal. 01–11, 2024.

S. R, Y. Salim, dan M. Hasnawi, “Konversi Bahasa Indonesia ke Perintah Data Manipulation Language pada Structured Query Language menggunakan Natural Language Processing,” Bul. Sist. Inf. dan Teknol. Islam, vol. 3, no. 3, hal. 181–187, 2022.

M. R. J, K. VM, H. Warrier, dan Y. Gupta, “Fine Tuning LLM for Enterprise: Practical Guidelines and Recommendations,” 2024.

M. Mosbach, T. Pimentel, S. Ravfogel, D. Klakow, dan Y. Elazar, “Few-shot Fine-tuning vs. In-context Learning: A Fair Comparison and Evaluation,” Proc. Annu. Meet. Assoc. Comput. Linguist., no. 2022, hal. 12284–12314, 2023.

A. Agung, A. Daniswara, I. Kadek, dan D. Nuryana, “Data Preprocessing Pola Pada Penilaian Mahasiswa Program Profesi Guru,” J. Informatics Comput. Sci., vol. 05, hal. 97–100, 2023.

R. R. Salam, M. F. Jamil, Y. Ibrahim, R. Rahmaddeni, S. Soni, dan H. Herianto, “Analisis Sentimen Terhadap Bantuan Langsung Tunai (BLT) Bahan Bakar Minyak (BBM) Menggunakan Support Vector Machine,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 3, no. 1, hal. 27–35, 2023.

A. Susilo, V. Christanti, dan M. D. Lauro, “Penerjemah Bahasa Gaul menggunakan LoRA dan QLoRA Fine-Tuning LLaMA-2-Chat untuk ChatBot,” vol. 9, no. 2, hal. 248–260, 2024.




DOI: http://dx.doi.org/10.30659/ei.7.1.%25p

Refbacks

  • There are currently no refbacks.


Jurnal Transistor EI diterbitkan oleh Fakultas Teknologi Industri, Universitas Islam Sultan Agung, Semarang, Indonesia