Pengembangan Kerangka Kerja Anotasi Berbasis Large Language Models (LLMS) untuk Normalisasi Konsep Medis dalam Bahasa Indonesia

Universitas Gadjah Mada, 15 Juli 2025 – Di Indonesia, literasi kesehatan fungsional masih sangat rendah, dengan sepertiga pasien yang menderita penyakit kronis menunjukkan tingkat literasi yang bermasalah. Pernahkah Anda merasa bingung ketika dokter menjelaskan kondisi medis menggunakan istilah-istilah yang sulit dipahami? Masalah ini menimbulkan tantangan signifikan di sektor kesehatan, karena pasien sering kesulitan memahami terminologi medis, yang mengarah pada kesalahpahaman dan perawatan yang tidak memadai. Keterbatasan data beranotasi berkualitas tinggi dalam Bahasa Indonesia menjadi hambatan utama dalam pengembangan model entity linking untuk terminologi medis. Entity linking adalah suatu task yang menghubungkan kata-kata atau frasa dalam bahasa sehari-hari dengan istilah formal yang tepat dalam database medis, misalnya, menghubungkan keluhan “sakit kepala berkepanjangan” dengan istilah medis “migrain kronis”.

Untuk mengatasi masalah ini, tim peneliti dari Program Studi Manajemen Informasi Kesehatan dan Program Studi Ilmu Komputer Universitas Gadjah Mada (UGM) yang dipimpin oleh Dr.techn. Annisa Maulida Ningtyas, S.Kom., M.Eng telah memulai studi inovatif yang bertujuan mengembangkan korpus medis beranotasi dalam Bahasa Indonesia sebagai fondasi untuk melatih model entity linking yang akurat. Inisiatif ini bertujuan untuk menciptakan model entity linking yang kuat yang menghubungkan bahasa medis sehari-hari dengan terminologi formal, sehingga meningkatkan pemahaman konsep medis di kalangan masyarakat umum. Metode yang diusulkan melibatkan kerangka kerja anotasi semi-otomatis berbasis Large Language Models (LLMs). Pendekatan inovatif ini memungkinkan anotator non-pakar untuk menghasilkan data dengan kualitas setara hasil pakar, secara signifikan mengurangi biaya dan waktu yang terkait dengan proses anotasi.

Dengan memanfaatkan kemampuan LLMs, tim peneliti dapat mempercepat proses anotasi sambil mempertahankan kualitas data yang tinggi. Penelitian ini diharapkan memberikan beberapa manfaat penting. Pertama, pengembangan korpus beranotasi yang komprehensif akan menjadi sumber daya berharga bagi para profesional kesehatan, peneliti, dan pendidik. Ini akan memfasilitasi komunikasi yang lebih baik antara pasien dan penyedia layanan kesehatan, yang pada akhirnya mengarah pada hasil kesehatan yang lebih baik. Kedua, proyek ini sejalan dengan Tujuan Pembangunan Berkelanjutan (SDG) nomor 3, yang menekankan pentingnya memastikan kehidupan yang sehat dan mempromosikan kesejahteraan bagi semua orang di segala usia.

Proyek ini melibatkan mahasiswa sebagai anotator, tim peneliti berharap dapat melibatkan generasi muda dalam proses penciptaan pengetahuan medis, sehingga memberdayakan mereka untuk mengambil peran aktif dalam kesehatan dan kesejahteraan komunitas. Pendekatan ini juga memberikan pengalaman praktis bagi mahasiswa untuk memahami terminologi medis sambil berkontribusi pada pengembangan sumber daya yang bermanfaat bagi masyarakat luas. Seiring dengan kemajuan proyek, para peneliti akan mengadakan pelatihan untuk membekali mahasiswa dengan keterampilan anotasi, sehingga mereka dapat berkontribusi secara optimal dalam pengembangan korpus medis.

Lebih jauh lagi, tim peneliti berencana untuk menyebarluaskan temuan dan sumber daya yang dihasilkan dari proyek ini melalui berbagai saluran, termasuk publikasi akademis, program outreach komunitas, dan platform online. Dengan membuat korpus beranotasi tersedia secara luas, tim bertujuan untuk memaksimalkan dampaknya dan menjangkau audiens yang beragam.

 

Leave A Comment

Your email address will not be published. Required fields are marked *

*