OpenAI пуска GPT-4.5

Стъпка напред, а не гигантски скок

GPT-4.5 се предоставя на потребителите на ChatGPT Pro като предварителен преглед за изследвания. OpenAI го рекламира като техния “най-информиран модел досега”, но първоначалните съобщения предупреждават, че може да не съответства на производителността на модели като o1 или o3-mini. Това предполага фокус върху усъвършенстването и ефективността, а не върху новаторски постижения.

Подобрени възможности, изискано взаимодействие

Какво могат да очакват потребителите от GPT-4.5? OpenAI подчертава подобрения в няколко ключови области:

  • Умения за писане: Моделът е проектиран да бъде по-способен асистент за писане.
  • Разширени познания за света: GPT-4.5 притежава по-широко разбиране на концепциите и информацията от реалния свят.
  • ‘Изискана индивидуалност’: OpenAI твърди, че взаимодействията с този модел ще се усещат по-естествени и интуитивни.

Компанията подчертава способността на GPT-4.5 да разпознава модели и да прави връзки, което го прави особено подходящ за задачи като писане, програмиране и справяне с практически проблеми.

Не е Frontier модел: Разбиране на разликата

Въпреки тези подобрения, OpenAI е ясно, че GPT-4.5 не представлява скок към изцяло нови възможности. Изтекъл документ, по-късно преработен, предостави допълнителен контекст:

“GPT-4.5 не е frontier модел, но е най-големият LLM на OpenAI, подобрявайки изчислителната ефективност на GPT-4 с повече от 10 пъти”, се посочва в документа. “Той не въвежда 7 нови frontier възможности в сравнение с предишните версии за разсъждение и неговата производителност е под тази на o1, o3-mini и задълбочените изследвания на повечето оценки за готовност.”

Това разграничение е важно. То предполага, че докато GPT-4.5 е значително подобрение по отношение на мащаба и ефективността, той не разширява границите на възможностите на AI по същия начин, както би направил един “frontier” модел.

Обучение и развитие

Докладите показват, че OpenAI е използвал своя модел за разсъждение o1 (с кодово име Strawberry) и синтетични данни, за да обучи GPT-4.5. Компанията потвърждава комбинация от нови техники за надзор и установени методи:

  • Supervised Fine-Tuning (SFT)
  • Reinforcement Learning from Human Feedback (RLHF)

Те са подобни на подходите, използвани при разработването на GPT-4o.

Справяне с халюцинациите и подобряване на сътрудничеството

Едно забележително подобрение е намаляването на халюцинациите. Според OpenAI, GPT-4.5 халюцинира по-рядко от GPT-4o и дори малко по-малко от модела o1.

Рафаел Гонтихо Лопес, изследовател в OpenAI, подчерта фокуса върху сътрудничеството: “Ние настроихме GPT-4.5 да бъде по-добър сътрудник, правейки разговорите да се усещат по-топли, по-интуитивни и емоционално нюансирани.” Той отбеляза, че хората тестери са оценили GPT-4.5 по-високо от GPT-4o в различни категории.

Гледната точка на главния изпълнителен директор: Признаване на ограниченията

Главният изпълнителен директор на OpenAI, Сам Алтман, в публикация в X, призна естеството на GPT-4.5: “огромен, скъп модел”, който “няма да разбие бенчмарковете”. Тази откровена оценка подсилва идеята, че това издание е за постепенно развитие, а не за революционни пробиви.

План за пускане

Пускането на GPT-4.5 следва поетапен подход:

  1. Pro потребители: Незабавен достъп като предварителен преглед за изследвания.
  2. Plus и Team потребители: Очаква се наличност следващата седмица.
  3. Enterprise и Edu потребители: Достъпът ще последва след Plus и Team потребителите.

Моделът е достъпен и чрез платформата Azure AI Foundry на Microsoft, заедно с предложения от Stability, Cohere и самата Microsoft.

Точност и намалени халюцинации

OpenAI подчертава подобрената точност на GPT-4.5, твърдейки, че генерира по-точни отговори и халюцинира по-малко в сравнение с другите им модели. Това е решаваща стъпка напред, тъй като халюцинациите (генериране на невярна или безсмислена информация) са постоянен проблем при големите езикови модели.

Поглед напред: GPT-5 и пътят към AGI

Предишни доклади предполагаха график за изданията на OpenAI: GPT-4.5 до края на февруари и GPT-5 още в края на май. Алтман описа GPT-5 като “система, която интегрира много от нашите технологии”. Очаква се той да включва новия модел за разсъждение o3 на OpenAI, който беше загатнат по време на “12-те дни на Коледа” на компанията през декември.

Докато o3-mini беше пуснат по-рано, пълният модел o3 се запазва за системата GPT-5. Това е в съответствие с по-широката визия на OpenAI за комбиниране на техните големи езикови модели, за да се създаде по-способна система, потенциално доближаваща се до сферата на изкуствения общ интелект (AGI).

По-задълбочено в архитектурата на GPT-4.5

Въпреки че OpenAI не е публикувал изчерпателни технически подробности, могат да се направят няколко извода за архитектурата на GPT-4.5 въз основа на наличната информация:

  • По-голям брой параметри: Описан като “най-големият LLM” на OpenAI, разумно е да се предположи, че GPT-4.5 може да се похвали със значително по-голям брой параметри от своите предшественици. Този увеличен капацитет вероятно допринася за подобрената му база от знания и способности за разсъждение.

  • Оптимизирана изчислителна ефективност: Изтеклият документ споменава “повече от 10 пъти” подобрение в изчислителната ефективност в сравнение с GPT-4. Това предполага архитектурни подобрения, които позволяват на модела да обработва информацията по-ефективно, което потенциално води до по-бързо време за реакция и намалена консумация на енергия.

  • Подобрени механизми за внимание: Като се има предвид акцентът върху разпознаването на модели и правенето на връзки, вероятно е GPT-4.5 да включва подобрения в механизмите за внимание. Тези механизми позволяват на модела да се фокусира върху най-подходящите части от входния текст, което води до по-последователни и контекстуално подходящи отговори.

  • Рафинирани данни за обучение: Използването на “нови техники за надзор” подсказва за подобрения в качеството и разнообразието на данните за обучение. Това може да включва включване на по-специализирани набори от данни, използване на генериране на синтетични данни или използване на по-сложни методи за филтриране и почистване на съществуващи данни.

Ролята на синтетичните данни

Съобщеното използване на синтетични данни при обучението на GPT-4.5 е особено забележително. Синтетичните данни, генерирани от самите AI модели, предлагат няколко потенциални предимства:

  • Преодоляване на недостига на данни: Може да се използва за увеличаване на съществуващите набори от данни, особено в области, където данните от реалния свят са ограничени или трудни за получаване.

  • Справяне с пристрастията: Синтетичните данни могат да бъдат внимателно изработени, за да се смекчат пристрастията, присъстващи в наборите от данни от реалния свят, което води до по-справедливи и безпристрастни AI модели.

  • Изследване на хипотетични сценарии: Позволява на изследователите да обучават модели на сценарии, които може да са редки или невъзможни за наблюдение в реалния свят, подобрявайки способността им да се справят с неочаквани ситуации.

Използването на синтетични данни обаче също поражда опасения:

  • Потенциал за усилване на пристрастията: Ако не се контролират внимателно, синтетичните данни могат неволно да усилят съществуващите пристрастия или да въведат нови.

  • Риск от пренастройване: Моделите, обучени предимно на синтетични данни, може да се представят добре на подобни синтетични данни, но да се затрудняват да се обобщят до входове от реалния свят.

Подходът на OpenAI към използването на синтетични данни вероятно включва внимателна проверка и тестване, за да се смекчат тези рискове.

‘Изисканата индивидуалност’: По-отблизо

Твърдението на OpenAI, че GPT-4.5 има “изискана индивидуалност”, е интригуващо. Това предполага усилия да се направят взаимодействията на модела по-ангажиращи, естествени и емоционално интелигентни. Това може да включва няколко техники:

  • Фина настройка на разговорни данни: Обучение на модела на големи набори от данни от човешки разговори, за да се разберат по-добре нюансите на езика, тона и социалните сигнали.

  • Включване на модели за емоционална интелигентност: Интегриране на специализирани модели, предназначени да разпознават и реагират на човешките емоции, позволявайки на GPT-4.5 да адаптира своя стил на комуникация по съответния начин.

  • Обучение с подсилване с обратна връзка от човека: Използване на обратна връзка от човека за възнаграждаване на отговори, които се възприемат като по-естествени, ангажиращи и съпричастни.

Целта е да се създаде по-човешко разговорно изживяване, преминавайки отвъд чисто функционалните взаимодействия, за да се насърчи чувството за връзка и разбирателство.

Последици за различните групи потребители

Поетапното пускане на GPT-4.5 предполага различни последици за различните групи потребители:

  • Pro потребители: Като ранни осиновители, Pro потребителите ще имат възможността да експериментират с възможностите на модела и да предоставят обратна връзка на OpenAI. Тази обратна връзка ще бъде от решаващо значение за оформянето на по-нататъшното развитие на модела.

  • Plus и Team потребители: Тези потребители вероятно ще се възползват от подобрената производителност и изискания стил на взаимодействие на GPT-4.5 в ежедневните си задачи, като писане, кодиране и изследвания.

  • Enterprise и Edu потребители: За тези потребители подобрената точност и намалените халюцинации могат да бъдат особено ценни, осигурявайки по-надеждни и достоверни резултати в професионални и образователни среди.

  • Microsoft Azure AI Foundry потребители: Наличието на GPT-4.5 на тази платформа разширява достъпа до модела за разработчици и изследователи, насърчавайки иновациите и създаването на нови приложения, задвижвани от AI.

По-широкият контекст: Стратегията на OpenAI

Пускането на GPT-4.5, макар и да не е frontier модел, се вписва в по-широката стратегия на OpenAI за итеративно развитие и постепенен напредък към AGI. Чрез пускане на постепенни подобрения, OpenAI може:

  • Да събира обратна връзка от потребителите: Непрекъснато да усъвършенства своите модели въз основа на реалната употреба и обратна връзка.

  • Да управлява очакванията: Да избягва прекомерното рекламиране и да поставя реалистични очаквания за всяко издание.

  • Да поддържа конкурентно предимство: Да остане пред кривата в бързо развиващата се област на AI.

  • Да се подготви за бъдещи пробиви: Да постави основите за по-значителни постижения, като GPT-5.

Този подход контрастира с “големите” издания на някои други AI компании, което предполага по-предпазлив и премерен подход към разработването и внедряването на все по-мощни AI системи. Фокусът е не само върху разширяването на границите на възможното, но и върху осигуряването на безопасност, надеждност и удовлетвореност на потребителите.
Разработването и внедряването на модели като GPT-4.5 повдигат много въпроси:

  • Как можем да измерим дали моделът има “изискана индивидуалност”?
  • Какви са последиците от модел, който халюцинира по-малко?
  • Какво е значението на пускането на модел, който не е frontier модел?

Това са всички добри въпроси и няма окончателни отговори.