GPT-4.5: Подобрение, а не революция
OpenAI наскоро направи GPT-4.5 достъпен за потребителите на ChatGPT Pro, като Plus, Team, корпоративни и образователни акаунти ще последват. Вътрешно известен като ‘Orion’, този модел се гордее с “по-добро разбиране на човешките намерения, интерпретирайки фини сигнали и имплицитни очаквания с по-голям нюанс и емоционална интелигентност”, според OpenAI. Той използва нови техники за надзор заедно с традиционното фино настройване и обучение с подсилване от човешка обратна връзка, отразявайки процеса на разработка на GPT-4o. GPT-4.5 предлага възможности за търсене в реално време, поддържа качване на файлове и изображения и се интегрира с платно за писане и кодиране. Въпреки това, понастоящем му липсват мултимодалните функции като гласов режим, видео или споделяне на екрана, налични в ChatGPT.
OpenAI подчертава, че обучението без надзор повишава точността и интуицията на модела. Този подход е движеща сила зад напредъка в модели като GPT-3.5, GPT-4, а сега и GPT-4.5. Отделно, мащабирането на разсъжденията обучава моделите да обработват информация систематично, генерирайки верига от мисли, преди да отговорят. Този методичен подход подобрява способността им да се справят със сложни STEM и логически предизвикателства, както е демонстрирано от модели като OpenAI o1 и OpenAI o3-mini. GPT-4.5 е представен като отличен пример за мащабиране на обучението без надзор, използвайки увеличена изчислителна мощ, по-големи набори от данни и архитектурни иновации. Обучен на суперкомпютри Microsoft Azure AI, той се твърди, че притежава по-широки познания и по-дълбоко разбиране на света, намалявайки халюцинациите и повишавайки надеждността.
Въпреки този напредък, GPT-4.5 не генерира значителен ентусиазъм. Той се възприема като постепенно подобрение, а не като революционен скок. Докато OpenAI изтъква подобрена емоционална интелигентност, нюанс и креативност, много потребители не са забелязали съществена разлика в сравнение с GPT-4o. Липсата на мултимодални подобрения, ключова характеристика на GPT-4o, допълнително допринася за това възприятие.
Освен това, GPT-4.5 демонстрира тенденция да произвежда безсмислени резултати. Вътрешният инструмент за бенчмаркинг на фактите на OpenAI, SimpleQA, разкрива, че GPT-4.5 халюцинира (представя измислици като факти с увереност) 37,1% от времето. Това е значителен проблем, дори в сравнение с GPT-4o, друг усъвършенстван модел за “разсъждение”, който халюцинира 61,8% от времето на същия бенчмарк. По-малкият, по-евтин модел o3-mini показва още по-висок процент на халюцинации от 80,3%.
Настоящият AI пейзаж, включващ конкуренти като Anthropic с Claude 3.7 и напредъка на Google с Gemini, повиши очакванията за значителни подобрения. Потребителите търсят пробиви, а не просто усъвършенствания, и GPT-4.5, в сегашния си вид, изглежда не отговаря на тези очаквания.
Възходът на моделите за разсъждение и доверието на инвеститорите
Илон Мъск наскоро предположи в X, че изкуственият общ интелект (AGI) е на хоризонта. Това изявление идва на фона на трескава надпревара между технологични гиганти като OpenAI, Google, Meta,Microsoft, DeepSeek, Anthropic и собствената компания на Мъск xAI за разработване на модели за разсъждение – AI системи, предназначени да емулират човешкото мислене.
Инвеститорите ясно показват ентусиазъм за това начинание. Малко след пускането на Claude 3.7 Sonnet с хибридно разсъждение, Anthropic си осигури значителен кръг от финансиране от серия E в размер на 3,5 милиарда долара. Това утрои оценката му до 61,5 милиарда долара, затвърждавайки позицията му на основен конкурент на OpenAI. Инвестицията, водена от Lightspeed Venture Partners и включваща Salesforce Ventures, Cisco, Fidelity, Jane Street и други, ще бъде използвана за разширяване на изчислителната мощ за AI разработка, подобряване на изследванията за безопасност и ускоряване на глобалния растеж.
Разширяване на границите на разсъжденията: Бенчмаркът BBEH
Големите езикови модели (LLMs) все повече се интегрират в ежедневните приложения, изисквайки стабилни възможности за разсъждение в различни области. Съществуващите бенчмаркове обаче често дават приоритет на математиката и кодирането, пренебрегвайки други важни видове разсъждения. Докато наборът от данни BIG-Bench е широко използван за оценка на LLMs при сложни задачи за разсъждение, моделите са постигнали такъв значителен напредък, че сега постигат почти перфектни резултати както на BIG-Bench, така и на по-предизвикателния му вариант, BIG-Bench Hard (BBH). Това насищане прави тези бенчмаркове по-малко ефективни за измерване на по-нататъшния напредък.
За да се справят с това ограничение, изследователите са въвели BIG-Bench Extra Hard (BBEH). Този нов бенчмарк заменя всяка задача в BBH със значително по-трудна версия, като същевременно оценява подобни умения за разсъждение. Тестовете на BBEH разкриват, че дори най-добрите модели с общо предназначение постигат само 9,8% резултат, докато най-добрият модел, специално проектиран за разсъждение, достига 44,8%. Тези резултати подчертават продължаващите предизвикателства, пред които са изправени LLMs при сложни разсъждения, което показва значително място за подобрение. Пълният изследователски документ предоставя допълнителни подробности за този нов бенчмарк.
AI-задвижвани сателити: Нова ера в изследването и операциите в космоса
TakeMe2Space, базиран в Хайдерабад космически стартъп, наскоро осигури 5,5 крори рупии в кръг на предварително финансиране, воден от Seafund, с участието на Blume Ventures, Artha Venture Fund, AC Ventures и други ангелски инвеститори. Това финансиране, макар и скромно, означава значителна стъпка към създаването на първата AI лаборатория в Индия в космоса. TakeMe2Space планира да използва средствата за разработване на MOI-1 (My Orbital Infrastructure–Technology Demonstrator), платформа, която ще позволи на потребителите да качват AI модели за наблюдение на Земята или други космически експерименти директно на орбитален сателит чрез уеб конзола, наречена Orbitlab. Потребителите ще плащат само за времето за използване на сателита, на цена от 2 долара на минута.
Съобщава се, че платформата MOI-TD на компанията е демонстрирала способността да качва големи AI модели от наземна станция, да изпълнява външен код на сателита и сигурно да изтегля кодирани и криптирани резултати. Това представлява движение към по-автономни и ефективни сателитни операции.
TakeMe2Space не е сам в това начинание. Организации като ESA (с OPS-SAT) и Globalstar също са пионери в реалните приложения на AI-задвижвана сателитна технология, вариращи от сигурна IoT комуникация до изпълнение на AI модели в орбита. Тъй като технологиите продължават да напредват, AI-задвижваните сателити са готови да станат все по-автономни, което води до по-ефективни космически операции и отваря нови възможности за изследвания, сигурност и глобална свързаност.
Традиционно сателитите разчитат в голяма степен на наземни станции за обработка на данни, вземане на решения и изпълнение на команди. Данните трябваше да бъдат изтеглени, анализирани на Земята и след това обработените прозрения бяха качени обратно на сателита – процес, който беше едновременно отнемащ време и изискващ голяма честотна лента. Въпреки това, напредъкът в AI и edge computing (обработка на данни на самото устройство, а не в облака) сега позволява на сателитите да обработват данни на борда, да вземат автономни решения и сигурно да предават само най-важните прозрения. Това води до по-бързи, по-интелигентни и по-ефективни операции.
Работата на съвременните AI-задвижвани сателити обикновено включва три ключови стъпки:
- Качване на AI алгоритми: AI алгоритмите се предават от наземни станции към сателитите, осигурявайки им усъвършенствани възможности за обработка на данни.
- Анализ на данни на борда: AI моделите анализират изображения, данни от сензори и други входове директно в орбита, минимизирайки необходимостта от постоянна наземна намеса.
- Сигурно изтегляне на прозрения: Вместо да предават необработени данни, сателитите изпращат криптирани прозрения, спестявайки честотна лента и повишавайки сигурността.
Този AI-задвижван подход предлага няколко предимства. Той значително намалява латентността, като позволява на сателитите да обработват данни в космоса, което позволява по-бързи реакции на условията в реално време, без да се чакат инструкции от наземни станции. Използването на честотната лента е оптимизирано, тъй като се предават само най-подходящите прозрения вместо големи обеми необработени данни. Сигурността също се подобрява чрез криптирана комуникация, намалявайки риска от кибер заплахи и пробиви в данните. Тези предимства са особено ценни в приложения като реагиране при бедствия, военни операции и изследване на космоса.
Реалните приложения на AI-задвижваните сателити са разнообразни и въздействащи:
- Управление на бедствия: Сателитите, оборудвани с AI, могат да откриват горски пожари, наводнения и урагани в реално време, което позволява бързи действия от екипите за реагиране при извънредни ситуации.
- Прецизно земеделие: AI моделите анализират здравето на културите и почвените условия, за да подобрят практиките за прецизно земеделие.
- Мониторинг на околната среда: Агенциите за опазване на околната среда използват сателитни данни за проследяване на нивата на замърсяване на въздуха и водата.
- Автономна навигация и космически операции: AI подобрява избягването на сблъсъци чрез предсказване и реагиране на потенциални заплахи, гарантирайки безопасността на сателитите. Той също така улеснява координацията на сателитните съзвездия, подобрявайки покритието и ефективността. Освен това AI играе решаваща роля в проследяването и предсказването на движенията на орбиталните отломки, намалявайки риска от повреда на космическата инфраструктура.
- Отбрана и сигурност: AI-задвижваните системи за наблюдение откриват неразрешени дейности и военни движения с повишена точност.
- Телекомуникации и IoT: AI-задвижваните сателити допринасят за по-интелигентно маршрутизиране на трафика, подобрявайки сателитната интернет свързаност и осигурявайки безпроблемна глобална комуникация.
- Изследване на космоса: AI повишава ефективността на космическите телескопи при откриването на астероиди и екзопланети, значително напредвайки усилията за откриване на космоса.
Въпреки многобройните предимства, остават предизвикателства при разработването и внедряването на AI-задвижвани сателити:
- Ограничена изчислителна мощ: Сателитите трябва да работят с чипове с ниска мощност, устойчиви на радиация, което ограничава AI възможностите.
- Сурова космическа среда: Излагането на радиация представлява риск от неизправности на хардуера.
- Заплахи за сигурността: Качването и изпълнението на външен код в космоса изискват внимателно управление, за да се предотвратят кибератаки.
- Разходи и време за разработка: Изграждането, тестването и валидирането на AI-съвместим сателитен хардуер е скъп и отнемащ време процес.
- Изисквания за адаптивност: AI моделите, разположени в орбита, трябва да бъдат изключително адаптивни, функционирайки с минимални актуализации и автономно адаптирайки се към нови сценарии.
AI отключен: Елиминиране на повтарящи се фрази в ChatGPT
AI може да бъде ценен инструмент в създаването на съдържание, подпомагайки писането, брейнсторминга, подобрявайки яснотата, усъвършенствайки структурата и повишавайки цялостната четимост. Често срещан проблем с генерирания от AI текст обаче е неговата склонност към формулиран език поради повтарящи се избори на думи. Вместо да предоставя свежи, въздействащи съобщения, AI често разчита на познати модели, намалявайки ефективността и оригиналността.
Прекомерно използваните думи и фрази, като “delve,” “tapestry,” “vibrant,” “landscape,” “realm,” “embark,” “excels,” “It’s important to note…,” и “A testament to…,” могат значително да влошат качеството на генерираното от AI съдържание. За продуктовите маркетолози това повторение може да направи съобщенията по-малко убедителни, да намали ангажираността на аудиторията, да отслаби диференциацията на марката и да попречи на прозренията и стратегическите съобщения да се откроят на пренаселения пазар.
Чрез използване на функцията за памет на ChatGPT е възможно да се смекчи този проблем и да се елиминират прекомерно използваните думи и фрази. Ето как ефективно да използвате тази функция:
Достъп: ChatGPT може да бъде достъпен чрез неговия уебсайт или мобилно приложение.
Предимства:
- Подобрена оригиналност: Гарантира, че генерираното от AI съдържание се чувства по-малко роботизирано и по-човешко.
- Подобрено брандиране: Избягва общите фрази, които отслабват диференциацията на марката.
- Повишена ангажираност: Насърчава по-ефективната комуникация чрез намаляване на излишъка.
Пример: Генериране на съдържание за продуктов маркетинг
Представете си продуктов маркетолог, натоварен със задачата да изготви съдържание за пускането на нов продукт. Първоначална заявка към ChatGPT може да доведе до отговор, изпълнен с повтарящи се и общи фрази като “delving into an intricate landscape of innovation…,” което прави съобщението да се чувства невдъхновено.
За да създаде по-убедително и уникално съдържание, маркетологът може да следва тези стъпки:
- Настройване на подканата: Маркетологът изрично инструктира ChatGPT: “Please avoid the following words: delve, tapestry, vibrant, landscape, realm, embark, excels. Commit this to memory.” Това инструктира ChatGPT активно да филтрира тези термини в своите отговори.
- Използване на постоянна памет: Фразата “Commit this to memory” гарантира, че ChatGPT запазва тези специфични инструкции при множество взаимодействия. Това позволява постоянно избягване на посочените думи и фрази. ChatGPT ще провери паметта си, преди да генерира текст и ще се придържа към инструкциите, за да избегне определените термини.
- Ръчен преглед: След генериране на отговора, маркетологът преглежда съдържанието за остатъчен излишък и фино настройва езика за яснота и въздействие.
Ефективност:
- Персонализиране на подканата: Специфичните инструкции помагат за оформянето на изхода на AI.
- Запазване на паметта: ChatGPT може да съхранява и следва правила за избягване на думи в разговорите.
- Ръчно усъвършенстване: Окончателна човешка редакция гарантира яснота и автентичност.
Забележка: Инструментите и анализът, представени в този раздел, се основават на вътрешно тестване и демонстрират ясна стойност. Препоръките са независими и не са повлияни от създателите на инструментите.
Допълнителни AI новини и разработки
AI-задвижвани смартфони в подем: Deutsche Telekom обяви планове на Mobile World Congress 2025 в Барселона да пусне AI-задвижван смартфон с асистент Perplexity. Този асистент е предназначен да опрости ежедневните задачи като поръчване на таксита, резервиране на маси, превод на езици в реално време и отговаряне на потребителски запитвания. Компанията предвижда това като виртуален асистент, който ще поддържа милиони клиенти, като пише имейли, инициира обаждания, обобщава текстове и управлява календари. AI Phone ще интегрира Google Cloud AI, ElevenLabs и Picsart, за да подобри своята функционалност, и е планиран да стартира по-късно тази година. Glance, подразделение на InMobi, и Google Cloud също обявиха сътрудничество за използване на AI моделите на Google за разработване на ориентирани към потребителите AI приложения за подобряване на потребителското изживяване на заключените екрани на смартфони и екраните на телевизори. Glance в момента захранва над 450 милиона смартфона, базирани на Android, по целия свят.
Правителствените сектори отбелязват спад в критичните кибер инциденти: Правителствените и развойните индустрии претърпяха значителен спад в инцидентите с висока степен на тежест, включващи пряко човешко участие през 2024 г., според последния доклад на анализатора на Kaspersky Managed Detection and Response (MDR). Въпреки това, хранителният, IT, телекомуникационният и индустриалният сектор показаха увеличение на такива инциденти.
OpenAI планира да интегрира Sora в ChatGPT: OpenAI работи по интегрирането на своя инструмент за генериране на AI видео, Sora, директно в ChatGPT. В момента Sora е достъпен само чрез специално уеб приложение, което позволява на потребителите да генерират кинематографични клипове с продължителност до 20 секунди. OpenAI също така разработва AI генератор на изображения, задвижван от Sora.