NECTEC Mengembangkan “Pathumma LLM,” Model AI Thailand yang Berspesialisasi dalam Bahasa, Data, dan Konteks Lokal.
Bangkok, Suarathailand- Di tengah meningkatnya popularitas teknologi Large Language Model (LLM)—model AI canggih yang mampu melakukan pemrosesan dan komunikasi bahasa seperti manusia—Pusat Teknologi Elektronik dan Komputer Nasional (NECTEC) di bawah Badan Pengembangan Sains dan Teknologi Nasional (NSTDA) Thailand telah mengembangkan Pathumma LLM, Model Bahasa Besar Thailand, untuk mendukung kemajuan layanan AI di negara tersebut.
Sarawut Kongyang, seorang peneliti di Kelompok Penelitian Kecerdasan Buatan di NECTEC-NSTDA, menjelaskan LLM dapat dikategorikan menjadi dua jenis: model tertutup, tempat pengembang tidak mengizinkan akses publik untuk pengembangan lebih lanjut—seperti ChatGPT, Gemini, dan Claude—dan model terbuka, yang tersedia untuk umum untuk pengembangan lebih lanjut—seperti Gemma, Sea Lion, Typhoon, dan THaLLE.
Pathumma LLM dikembangkan sebagai model terbuka untuk mengatasi keterbatasan model tertutup, yang mungkin kurang fleksibel, khususnya bagi organisasi yang memerlukan kerahasiaan data, seperti bank, lembaga kesehatan, dan pengadilan. Model ini juga melayani aplikasi khusus Thailand, seperti penyusunan dokumen resmi pemerintah dan komunikasi dalam dialek daerah Thailand.
"Tim peneliti memanfaatkan keahliannya dalam pengembangan model AI bersama infrastruktur NSTDA yang diakui secara internasional, termasuk superkomputer LANTA, untuk membangun Pathumma LLM. Versi pertama, 1.0.0, kini tersedia untuk uji coba di situs web AI For Thai.
Pengguna yang tertarik dapat mengaksesnya dalam tiga format:
APP – Aplikasi web untuk pengguna umum.
API – Untuk pengembang yang ingin mengintegrasikannya ke situs web mereka.
Model – Untuk pengembang yang ingin mengunduh dan mengembangkan model lebih lanjut."
Fitur utama Pathumma LLM adalah kemampuan Multi-Modal Generative AI-nya, yang mendukung tiga jenis pemrosesan data:
Text LLM – Model yang dirancang untuk memproses kueri dan perintah berbasis teks, yang disesuaikan untuk pengambilan informasi dan penalaran logis. Hal ini membuatnya ideal untuk aplikasi khusus perusahaan. Misalnya, Departemen Pendapatan dapat menggunakannya untuk mengembangkan chatbot yang menjawab pertanyaan terkait pajak untuk publik, sementara lembaga penelitian dapat menggunakannya untuk membuat chatbot guna mencari dan meringkas data penelitian organisasi.
Audio LLM – Model yang dioptimalkan untuk memproses data audio. Model ini dapat menyalin ucapan dalam bahasa Thailand dan Inggris, menghasilkan deskripsi suara lingkungan, mendeteksi emosi dan jenis kelamin pembicara, serta menjawab pertanyaan atau memberikan wawasan berdasarkan konten klip audio.
Vision LLM – Model yang dirancang untuk memproses data berbasis gambar. Model ini disesuaikan untuk menghasilkan deskripsi gambar, mengekstrak teks dari gambar, serta menjawab pertanyaan atau memberikan wawasan terkait gambar.
Namun, peningkatan efisiensi dan kapabilitas LLM memerlukan banyak faktor, khususnya volume, kualitas, dan relevansi data, serta infrastruktur yang kuat, seperti sistem komputasi awan untuk pemrosesan AI. Untuk mengatasi hal ini, tim peneliti berencana untuk berkolaborasi dengan mitra sektor publik dan swasta di Thailand guna mengembangkan model dasar yang lebih besar yang disesuaikan untuk negara tersebut. Inisiatif ini bertujuan untuk memperluas kapasitas model dalam menangani lebih banyak data dan parameter untuk pelatihan AI, dengan implementasi yang diharapkan akan dimulai pada Februari 2025.
Tim peneliti juga berencana untuk meminta data yang tersedia untuk umum dari lembaga pemerintah Thailand dan organisasi swasta untuk melatih AI. Ini akan membantu Pathumma LLM membangun basis pengetahuan yang kuat, menjadikannya model terbuka dengan keahlian dalam bahasa, informasi, dan konteks Thailand. Selain itu, model ini diharapkan dapat berkontribusi pada Tata Kelola AI, meningkatkan efisiensi layanan pemerintah melalui solusi yang digerakkan oleh AI di masa mendatang.
"Tujuan pengembangan kami berikutnya untuk Pathumma LLM bukan hanya untuk memperkuat kemampuan data dan fungsi Generative AI, tetapi juga untuk memajukannya menjadi Agentic AI—AI yang mampu melakukan penalaran dan pengambilan keputusan secara otonom. Misalnya, ia dapat berfungsi sebagai asisten AI pribadi yang menganalisis tren pasar dan mengeksekusi perdagangan saham berdasarkan kondisi yang telah ditetapkan sebelumnya, atau sebagai chatbot pintar yang merekomendasikan layanan yang disesuaikan dengan preferensi pengguna sambil melacak status tugas secara otomatis. Pergeseran ke arah Agentic AI merupakan tren teknologi global utama, dan tim kami berkomitmen untuk mendorong Pathumma LLM ke arah ini."