डोमेन विशेषज्ञता: LLM में फाइन-ट्यूनिंग और मर्जिंग
बड़े भाषा मॉडल (LLMs) को तकनीकी क्षेत्रों के लिए अनुकूलित करने की चुनौती। फाइन-ट्यूनिंग (CPT, SFT, DPO, ORPO) और मॉडल मर्जिंग (SLERP) रणनीतियों का अन्वेषण। Llama, Mistral, और SmolLM पर प्रयोगों से पता चलता है कि SLERP विलय से कैसे नई क्षमताएं उभर सकती हैं।