IBM с по-малки AI модели

Усъвършенстване на серията Granite: Фокусирана способност, намален отпечатък

Моделите Granite 3.2 на IBM представляват продължение на стратегията на компанията за разработване на по-малки модели. Тези модели са проектирани да предоставят специфични възможности, без да налагат прекомерни изисквания към изчислителните ресурси. Този подход е в съответствие с практическите нужди на много предприятия, които изискват AI решения, които са едновременно мощни и рентабилни.

Тези модели са свободно достъпни под лиценза Apache 2.0 в Hugging Face. Избрани версии са достъпни и чрез собствената платформа на IBM watsonx.ai, както и Ollama, Replicate и LM Studio. Тази широка достъпност е допълнително подсилена от плановете за интегриране на тези модели в Red Hat Enterprise Linux AI 1.5 през следващите месеци, затвърждавайки ангажимента на IBM към AI с отворен код.

Революционизиране на обработката на документи: Моделът Granite Vision

Отличителна черта на тази версия е нов модел за визуален език, специално проектиран за задачи за разбиране на документи. Този модел представлява значителен напредък в начина, по който предприятията могат да взаимодействат с и да извличат информация от документи. Според вътрешните тестове за сравнение на IBM, този нов модел се представя наравно с, или дори надминава, много по-големи конкурентни модели на тестове, специално проектирани да отразяват натоварванията на ниво предприятие.

Разработването на тази способност включва използването на инструментариума с отворен код Docling на IBM. Този инструментариум е използван за обработка на зашеметяващите 85 милиона PDF документа, генерирайки 26 милиона синтетични двойки въпрос-отговор. Тази обширна подготовка гарантира, че моделът е добре подготвен да се справи с интензивните работни потоци с документи, които са характерни за много корпоративни среди, включително финанси, здравеопазване и правни услуги.

Ключови статистически данни подчертават мащаба и ефективността:

  • 85 милиона: Броят на PDF документите, обработени с помощта на инструментариума Docling на IBM за обучение на новия визуален модел. Този огромен набор от данни подчертава готовността на модела за предизвикателствата при обработката на документи в реалния свят.
  • 30%: Намаляването на размера, постигнато в моделите за безопасност Granite Guardian, като същевременно се поддържат нивата на производителност. Това демонстрира ангажимента на IBM за оптимизиране на ефективността, без да се жертва безопасността.
  • 2 години: Максималният обхват на прогнозата на моделите TinyTimeMixers на IBM, въпреки че имат по-малко от 10 милиона параметъра. Това показва забележителната способност на тези специализирани модели за дългосрочно прогнозиране.

Подобрено разсъждение: Верига на мисълта и мащабиране на изводите

IBM също така е включила разсъждения тип „верига на мисълта“ във версиите с 2B и 8B параметъра на Granite 3.2. Тази функция позволява на моделите да подхождат към проблемите по структуриран, методичен начин, като ги разбиват на стъпки, които отразяват човешките мисловни процеси. Това подобрява способността на моделите да се справят със сложни задачи, които изискват логическа дедукция.

От решаващо значение е, че потребителите имат гъвкавостта да активират или деактивират тази възможност в зависимост от сложността на задачата. Тази адаптивност е ключов отличителен белег, позволяващ на организациите да оптимизират използването на ресурсите въз основа на техните специфични нужди. За по-прости задачи разсъжденията по веригата на мисълта могат да бъдат деактивирани, за да се спести изчислителна мощност, докато за по-сложни проблеми могат да бъдат активирани, за да се използва пълният потенциал за разсъждение на модела.

Тези подобрения доведоха до значителни подобрения в производителността на модела 8B на бенчмаркове за следване на инструкции, надминавайки предишните версии. Чрез иновативни методи за „мащабиране на изводите“, IBM демонстрира, че дори този сравнително малък модел може ефективно да се конкурира с много по-големи системи на бенчмаркове за математически разсъждения. Това подчертава потенциала на по-малките, оптимизирани модели да предоставят впечатляваща производителност в определени области.

Безопасност и нюанси: Актуализации на Granite Guardian

Моделите за безопасност Granite Guardian, предназначени да наблюдават и смекчават потенциалните рискове, свързани със съдържание, генерирано от AI, също са претърпели значителни актуализации. Тези модели са намалени по размер с 30%, като същевременно поддържат нивата си на производителност. Тази оптимизация допринася за по-голяма ефективност и намалена консумация на ресурси.

Освен това тези модели вече включват функция, наречена „вербализирана увереност“. Тази функция осигурява по-нюансирана оценка на риска, като признава степени на несигурност при наблюдението на безопасността. Вместо просто да предоставят двоична класификация безопасно/небезопасно, моделите могат да изразяват различни нива на увереност в своите оценки, предоставяйки на потребителите по-информативна и прозрачна оценка.

TinyTimeMixers: Дългосрочно прогнозиране за стратегическо планиране

В допълнение към актуализациите на Granite, IBM пусна и следващото поколение свои модели TinyTimeMixers. Тези модели са забележително малки, съдържайки по-малко от 10 милиона параметъра – част от размера на много други модели в индустрията. Въпреки компактния си размер, тези специализирани модели са способни да прогнозират данни от времеви редове до две години в бъдещето.

Тази способност е особено ценна за редица бизнес приложения, включително:

  • Анализ на финансови тенденции: Прогнозиране на движенията на пазара и идентифициране на инвестиционни възможности.
  • Планиране на веригата за доставки: Оптимизиране на нивата на запасите и предвиждане на колебанията в търсенето.
  • Управление на инвентара на дребно: Осигуряване на адекватни нива на запасите, за да се отговори на търсенето на клиентите, като същевременно се минимизират отпадъците.

Всички тези приложения разчитат на способността да се вземат информирани решения въз основа на дългосрочни прогнози, което прави моделите TinyTimeMixers мощен инструмент за стратегическо бизнес планиране.

Справяне с реалните бизнес ограничения

Възможността за превключване на възможностите за разсъждение в моделите Granite директно се справя с практическо предизвикателство при внедряването на AI. Подходите за разсъждение стъпка по стъпка, макар и мощни, изискват значителна изчислителна мощност, която не винаги е необходима. Правейки тази функция незадължителна, IBM дава възможност на организациите да намалят изчислителните разходи за по-прости задачи, като същевременно запазват опцията за разширени разсъждения за по-сложни проблеми.

Този подход отразява дълбоко разбиране на реалните бизнес ограничения, където ефективността и рентабилността често са също толкова важни, колкото и суровата производителност. Фокусът на IBM върху предоставянето на практически решения, които могат да бъдат съобразени със специфичните бизнес нужди, е ключов отличителен белег на все по-пренаселения AI пазар.

Набиране на скорост: Доказателства за практическо въздействие

Стратегията на IBM за разработване на по-малки, специализирани модели изглежда резонира с пазара. Предишният модел Granite 3.1 8B наскоро постигна силна производителност на Salesforce LLM Benchmark за управление на взаимоотношенията с клиенти (CRM). Този бенчмарк е специално проектиран да оценява производителността на LLM при задачи, свързани с CRM, като анализ на взаимодействието с клиентите и генериране на персонализирано съдържание.

Силното представяне на модела Granite 3.1 8B на този бенчмарк предполага, че по-малките, специализирани модели наистина могат да отговорят ефективно на специфичните бизнес нужди. Това предоставя допълнителни доказателства, че подходът на IBM е не само теоретично обоснован, но и практически жизнеспособен.

Фокус върху ефективността, интеграцията и въздействието в реалния свят

Шрирам Рагаван, вицепрезидент на IBM AI Research, обобщава накратко философията на компанията: „Следващата ера на AI е свързана с ефективност, интеграция и въздействие в реалния свят – където предприятията могат да постигнат мощни резултати без прекомерни разходи за изчисления. Най-новите разработки на Granite на IBM се фокусират върху отворени решения, демонстрират още една стъпка напред в превръщането на AI в по-достъпен, рентабилен и ценен за съвременните предприятия.“

Това изявление капсулира ангажимента на IBM да разработва AI решения, които са не само технологично напреднали, но и практични, достъпни и съобразени с реалните нужди на бизнеса. Фокусът върху отворените решения допълнително подчертава отдадеността на IBM за насърчаване на сътрудничеството и иновациите в рамките на AI общността. Акцентът се измества от простото изграждане на най-големите модели към създаването на AI инструменти, които предоставят осезаема стойност и дават възможност на бизнеса да постигне своите стратегически цели.