Улучшение серии Granite: целенаправленная функциональность, уменьшенный размер
Модели Granite 3.2 от IBM представляют собой продолжение стратегии компании по разработке моделей меньшего размера. Эти модели предназначены для предоставления определенных возможностей без предъявления чрезмерных требований к вычислительным ресурсам. Такой подход соответствует практическим потребностям многих предприятий, которым требуются решения ИИ, которые являются одновременно мощными и экономичными.
Эти модели находятся в открытом доступе под лицензией Apache 2.0 на Hugging Face. Отдельные версии также доступны через собственную платформу IBM watsonx.ai, а также Ollama, Replicate и LM Studio. Эта широкая доступность еще больше усиливается планами по интеграции этих моделей в Red Hat Enterprise Linux AI 1.5 в ближайшие месяцы, что укрепляет приверженность IBM ИИ с открытым исходным кодом.
Революция в обработке документов: модель Granite Vision
Отличительной особенностью этого выпуска является новая модель визуального языка, специально разработанная для задач понимания документов. Эта модель представляет собой значительный прогресс в том, как предприятия могут взаимодействовать с документами и извлекать из них информацию. Согласно внутренним тестам IBM, эта новая модель работает наравне с гораздо более крупными моделями конкурентов или даже превосходит их в тестах, специально разработанных для отражения рабочих нагрузок корпоративного уровня.
Разработка этой возможности включала использование инструментария Docling с открытым исходным кодом от IBM. Этот инструментарий использовался для обработки ошеломляющих 85 миллионов PDF-документов, генерируя 26 миллионов синтетических пар вопросов-ответов. Эта обширная подготовка гарантирует, что модель хорошо оснащена для обработки рабочих процессов с большим количеством документов, которые характерны для многих корпоративных сред, включая финансы, здравоохранение и юридические услуги.
Ключевые статистические данные подчеркивают масштаб и эффективность:
- 85 миллионов: количество PDF-документов, обработанных с использованием инструментария Docling от IBM для обучения новой визуальной модели. Этот массивный набор данных подчеркивает готовность модели к реальным задачам обработки документов.
- 30%: сокращение размера, достигнутое в моделях безопасности Granite Guardian при сохранении уровня производительности. Это демонстрирует приверженность IBM оптимизации эффективности без ущерба для безопасности.
- 2 года: максимальный диапазон прогноза моделей TinyTimeMixers от IBM, несмотря на то, что они имеют менее 10 миллионов параметров. Это демонстрирует замечательные возможности этих специализированных моделей для долгосрочного прогнозирования.
Улучшенные рассуждения: цепочка мыслей и масштабирование вывода
IBM также включила рассуждения ‘цепочки мыслей’ в версии Granite 3.2 с 2B и 8B параметрами. Эта функция позволяет моделям подходить к проблемам структурированно, методично, разбивая их на шаги, которые отражают процессы человеческого мышления. Это повышает способность моделей решать сложные задачи, требующие логического вывода.
Важно отметить, что пользователи имеют возможность активировать или деактивировать эту возможность в зависимости от сложности задачи. Эта адаптивность является ключевым отличием, позволяющим организациям оптимизировать использование ресурсов в зависимости от их конкретных потребностей. Для более простых задач рассуждения по цепочке мыслей можно отключить, чтобы сэкономить вычислительную мощность, а для более сложных проблем их можно включить, чтобы использовать весь потенциал рассуждений модели.
Эти улучшения привели к значительному повышению производительности модели 8B в тестах на следование инструкциям, превзойдя предыдущие версии. Благодаря инновационным методам ‘масштабирования вывода’ IBM продемонстрировала, что даже эта относительно небольшая модель может эффективно конкурировать с гораздо более крупными системами в тестах на математические рассуждения. Это подчеркивает потенциал меньших, оптимизированных моделей для обеспечения впечатляющей производительности в определенных областях.
Безопасность и нюансы: обновления Granite Guardian
Модели безопасности Granite Guardian, предназначенные для мониторинга и снижения потенциальных рисков, связанных с контентом, созданным ИИ, также претерпели значительные обновления. Эти модели были уменьшены в размере на 30%, сохранив при этом уровень производительности. Эта оптимизация способствует повышению эффективности и снижению потребления ресурсов.
Кроме того, эти модели теперь включают функцию, называемую ‘вербализованной уверенностью’. Эта функция обеспечивает более тонкую оценку риска, признавая степень неопределенности в мониторинге безопасности. Вместо того, чтобы просто предоставлять бинарную классификацию ‘безопасно/небезопасно’, модели могут выражать различные уровни уверенности в своих оценках, предоставляя пользователям более информативную и прозрачную оценку.
TinyTimeMixers: долгосрочное прогнозирование для стратегического планирования
В дополнение к обновлениям Granite, IBM также выпустила следующее поколение своих моделей TinyTimeMixers. Эти модели удивительно малы, содержат менее 10 миллионов параметров – это доля размера многих других моделей в отрасли. Несмотря на свой компактный размер, эти специализированные модели способны прогнозировать данные временных рядов на срок до двух лет вперед.
Эта возможность особенно ценна для ряда бизнес-приложений, в том числе:
- Анализ финансовых тенденций: прогнозирование движений рынка и выявление инвестиционных возможностей.
- Планирование цепочки поставок: оптимизация уровня запасов и прогнозирование колебаний спроса.
- Управление запасами в розничной торговле: обеспечение достаточного уровня запасов для удовлетворения спроса клиентов при минимизации отходов.
Все эти приложения полагаются на способность принимать обоснованные решения на основе долгосрочных прогнозов, что делает модели TinyTimeMixers мощным инструментом для стратегического бизнес-планирования.
Решение реальных бизнес-ограничений
Возможность переключения возможностей рассуждений в моделях Granite напрямую решает практическую проблему внедрения ИИ. Пошаговые подходы к рассуждению, хотя и являются мощными, требуют значительной вычислительной мощности, которая не всегда необходима. Сделав эту функцию необязательной, IBM позволяет организациям снизить вычислительные затраты на более простые задачи, сохраняя при этом возможность расширенного рассуждения для более сложных проблем.
Этот подход отражает глубокое понимание реальных бизнес-ограничений, где эффективность и экономичность часто так же важны, как и чистая производительность. Ориентация IBM на предоставление практических решений, которые могут быть адаптированы к конкретным потребностям бизнеса, является ключевым отличием на все более переполненном рынке ИИ.
Набирая обороты: свидетельство практического воздействия
Стратегия IBM по разработке меньших, специализированных моделей, похоже, находит отклик на рынке. Предыдущая модель Granite 3.1 8B недавно достигла высоких показателей в тесте Salesforce LLM Benchmark for Customer Relationship Management (CRM). Этот тест специально разработан для оценки производительности LLM в задачах, связанных с CRM, таких как анализ взаимодействия с клиентами и создание персонализированного контента.
Высокая производительность модели Granite 3.1 8B в этом тесте предполагает, что меньшие, специализированные модели действительно могут эффективно удовлетворять конкретные потребности бизнеса. Это предоставляет дополнительные доказательства того, что подход IBM не только теоретически обоснован, но и практически жизнеспособен.
Ориентация на эффективность, интеграцию и реальное воздействие
Шрирам Рагхаван, вице-президент IBM AI Research, лаконично резюмирует философию компании: ‘Следующая эра ИИ — это эффективность, интеграция и реальное воздействие, когда предприятия могут достигать мощных результатов без чрезмерных затрат на вычисления. Последние разработки IBM Granite, ориентированные на открытые решения, демонстрируют еще один шаг вперед в том, чтобы сделать ИИ более доступным, экономичным и ценным для современных предприятий’.
Это заявление отражает приверженность IBM разработке решений ИИ, которые не только технологически продвинуты, но и практичны, доступны и соответствуют реальным потребностям бизнеса. Ориентация на открытые решения еще больше подчеркивает приверженность IBM содействию сотрудничеству и инновациям в сообществе ИИ. Акцент смещается с простого создания самых больших моделей на создание инструментов ИИ, которые обеспечивают ощутимую ценность и позволяют предприятиям достигать своих стратегических целей.