Implementasi Few-Shot Learning Untuk Prediksi Kalimat Solusi Dari Masalah Pada Artikel Ilmiah Menggunakan Model Large Language Models (LLM)

Eka Nurul Azizah, Sam Farisa Chaerul Haviana

Abstract


Pesatnya pertumbuhan jumlah artikel ilmiah menghadirkan tantangan baru dalam mengekstraksi informasi yang relevan, khususnya dalam mengidentifikasi hubungan antara permasalahan dan solusinya. Penelitian ini bertujuan untuk mengembangkan model prediksi solusi menggunakan Large Language Models (LLM) dengan pendekatan Few-Shot Learning. Model yang diterapkan adalah Llama 3.2, yang telah disesuaikan dengan dataset hasil ekstraksi dari 100 artikel ilmiah, diklasifikasikan ke dalam empat kategori utama: Problem-Solution, Tantangan-Jawaban, Peluang-Jawaban, dan Kelemahan-Peningkatan. Proses pengolahan data mencakup tahapan pre-processing, seperti case folding, tokenizing, filtering, dan stemming, guna meningkatkan kualitas data sebelum model dilatih. Evaluasi model dilakukan menggunakan metrik ROUGE untuk menilai akurasi prediksi solusi yang dihasilkan. Hasil penelitian menunjukkan bahwa pendekatan Few-Shot Learning mampu mengenali pola hubungan masalah-solusi dengan lebih efektif dibandingkan metode konvensional. Selain itu, sistem berbasis website juga dikembangkan untuk mempermudah akses dan pemanfaatan model oleh mahasiswa dalam menyelesaikan tugas akhir. Walaupun model menunjukkan kinerja yang baik, tantangan dalam menangani pertanyaan yang berbeda jauh dari contoh yang diberikan masih menjadi kendala yang perlu disempurnakan dalam penelitian mendatang.


References


L. Bornmann dan R. Mutz, “Growth rates of modern science: A bibliometric analysis based on the number of publications and cited references,” J. Assoc. Inf. Sci. Technol., vol. 66, no. 11, hal. 2215–2222, 2015, doi: 10.1002/asi.23329.

D. Samuel, J. Barnes, R. Kurtz, S. Oepen, L. Øvrelid, dan E. Velldal, “Direct parsing to sentiment graphs,” Proc. Annu. Meet. Assoc. Comput. Linguist., vol. 2, hal. 470–478, 2022, doi: 10.18653/v1/2022.acl-short.51.

Y. Chen, R. Zhong, S. Zha, G. Karypis, dan H. He, “Meta-learning via Language Model In-context Tuning,” Proc. Annu. Meet. Assoc. Comput. Linguist., vol. 1, hal. 719–730, 2022, doi: 10.18653/v1/2022.acl-long.53.

P. Liu, W. Yuan, J. Fu, Z. Jiang, H. Hayashi, dan G. Neubig, “Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing,” ACM Comput. Surv., vol. 55, no. 9, hal. 1–46, 2023, doi: 10.1145/3560815.

P. Keicher, “Machine Learning in Top Physics in the ATLAS and CMS Collaborations,” hal. 4–9, 2023, [Daring]. Tersedia pada: http://arxiv.org/abs/2301.09534

X. V. Lin dkk., “Few-shot Learning with Multilingual Generative Language Models,” Proc. 2022 Conf. Empir. Methods Nat. Lang. Process. EMNLP 2022, hal. 9019–9052, 2022, doi: 10.18653/v1/2022.emnlp-main.616.

Y. Liu dkk., “RoBERTa: A Robustly Optimized BERT Pretraining Approach,” no. 1, 2019, [Daring]. Tersedia pada: http://arxiv.org/abs/1907.11692

R. Dale, B. L. Iverson, P. B. Dervan, dan M. R. F. Hadi, “Natural Language Processing menggunakan Metode Fuzzy String Matching pada Chatbot berbasis Web pada Aplikasi Whatsapp,” Handb. Nat. Lang. Process. Second Ed., hal. 7823–7830, 2010, [Daring]. Tersedia pada: http://digilib.uinsby.ac.id/id/eprint/51730%0Ahttp://digilib.uinsby.ac.id/51730/2/Muhammad Rifqy Fakhrul Hadi_ H06217015.pdf

F. Rizki, A. Sutiyo, N. S. Harahap, S. Agustian, dan R. M. Candra, “KLIK: Kajian Ilmiah Informatika dan Komputer Implementasi Question Answering Berbasis Chatbot Telegram Pada Tafsir Al-Jalalain Menggunakan Langchain dan LLM,” Media Online, vol. 4, no. 5, hal. 2464–2472, 2024, doi: 10.30865/klik.v4i5.1784.

Q. Qi, A. Ahmad, dan W. Ke, “Image classification based on few-shot learning algorithms: a review,” Indones. J. Electr. Eng. Comput. Sci., vol. 35, no. 2, hal. 933–943, 2024, doi: 10.11591/ijeecs.v35.i2.pp933-943.

Y. Wan dkk., “Deep Learning for Code Intelligence: Survey, Benchmark and Toolkit,” ACM Comput. Surv., vol. 1, no. 1, 2024, doi: 10.1145/3664597.

R. R. Salam, M. F. Jamil, Y. Ibrahim, R. Rahmaddeni, S. Soni, dan H. Herianto, “Analisis Sentimen Terhadap Bantuan Langsung Tunai (BLT) Bahan Bakar Minyak (BBM) Menggunakan Support Vector Machine,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 3, no. 1, hal. 27–35, 2023, doi: 10.57152/malcom.v3i1.590.

A. Ariansyah dan U. Indahyanti, “Fitur Ekstraksi pada Pemodelan Topik Menggunakan Metode Latent Dirichlet Allocation pada Peristiwa Kebocoran Data,” no. 2, hal. 1–24, 2024.

E. Yuniar, D. S. Utsalinah, dan D. Wahyuningsih, “Implementasi Scrapping Data Untuk Sentiment Analysis Pengguna Dompet Digital dengan Menggunakan Algoritma Machine Learning,” J. Janitra Inform. dan Sist. Inf., vol. 2, no. 1, hal. 35–42, 2022, doi: 10.25008/janitra.v2i1.145.




DOI: http://dx.doi.org/10.30659/ei.7.2.%25p

Refbacks

  • There are currently no refbacks.


Jurnal Transistor EI diterbitkan oleh Fakultas Teknologi Industri, Universitas Islam Sultan Agung, Semarang, Indonesia