Экспертиза LLM: дообучение, слияние и возможности
Адаптация больших языковых моделей (LLM), таких как Llama и Mistral, для специализированных областей науки и техники. Исследование методов дообучения (CPT, SFT, DPO, ORPO) и слияния моделей (SLERP) для повышения экспертизы и раскрытия новых возможностей, особенно в моделях большого масштаба. Анализ синергетических эффектов и влияния масштаба модели.