Kepakaran Domain LLM: Penalaan, Gabungan & Keupayaan Baru
Menyesuaikan Model Bahasa Besar (LLM) seperti Llama dan Mistral untuk domain teknikal melalui penalaan halus (CPT, SFT, DPO/ORPO) dan penggabungan model (SLERP). Strategi ini bertujuan untuk menerapkan kepakaran khusus dan memupuk keupayaan baharu yang tidak dijangka, mengatasi batasan model umum dalam bidang sains dan kejuruteraan.