GPT-4.5 OpenAI: Drogi AI i wątpliwy zysk

Przyrostowe ulepszenia, astronomiczne koszty

GPT-4.5 szczyci się udoskonaleniami w kilku kluczowych obszarach. OpenAI twierdzi, że poprawiono dokładność, zmniejszono tendencję do ‘halucynacji’ (generowania fałszywych informacji) i zwiększono zdolność do perswazji. Jednak te ulepszenia wiążą się z wysokimi kosztami. Struktura cenowa korzystania z GPT-4.5 wynosi 75 USD za milion tokenów wejściowych i aż 150 USD za milion tokenów wyjściowych. Te ceny wywołały gorącą debatę w społeczności AI, a eksperci są podzieleni co do tego, czy przyrostowe ulepszenia uzasadniają tak znaczny wydatek finansowy.

Kluczowe pytanie dotyczy rzeczywistej propozycji wartości GPT-4.5. Chociaż płynniejsze konwersacje i nieco lepsza dokładność są mile widziane, pozostaje fundamentalne pytanie: czy stanowi to znaczący krok naprzód w możliwościach AI, czy jest to jedynie kosztowne udoskonalenie istniejącej technologii?

Testy w świecie rzeczywistym: Rozbieżność z twierdzeniami OpenAI?

Niezależne oceny GPT-4.5 jeszcze bardziej podsyciły debatę. Andrej Karpathy, wybitna postać w dziedzinie AI, przeprowadził eksperyment porównawczy, w którym GPT-4 zmierzył się z GPT-4.5. Użytkownikom przedstawiono pięć zadań z zakresu kreatywnego pisania, a następnie poproszono ich o ocenę jakości wyników. Co zaskakujące, wyniki faworyzowały starszy model GPT-4 w czterech z pięciu zadań. Ten wynik bezpośrednio podważa pogląd, że GPT-4.5 stanowi uniwersalnie lepszą iterację.

Oceny techniczne dr. Raja Dandekera przyniosły podobnie niepokojące wyniki. Jego testy koncentrowały się na obszarach, w których OpenAI wyraźnie deklarowało ulepszenia, takich jak rozumowanie matematyczne i logiczna dedukcja. Jednak GPT-4.5 podobno miał problemy w tych obszarach, wykazując niewielką lub żadną przewagę nad swoim poprzednikiem. Te ustalenia są sprzeczne z twierdzeniami OpenAI i rodzą poważne pytania dotyczące przejrzystości i dokładności marketingowych deklaracji firmy.

Reakcje mediów i branży: Spektrum opinii

Reakcja mediów na GPT-4.5 odzwierciedla podzielone opinie w społeczności AI. Magazyn Wired, znaczący głos w dziennikarstwie technologicznym, przedstawił krytyczną perspektywę, kwestionując nieustanne dążenie OpenAI do Artificial General Intelligence (AGI) i charakteryzując GPT-4.5 jako drogie ulepszenie z jedynie marginalnymi korzyściami. Futurism, inna wpływowa publikacja, zauważyła spadek początkowego szumu wokół premiery, sugerując rosnący sceptycyzm co do prawdziwego potencjału tej technologii.

Jednak nie wszystkie reakcje były negatywne. Jacob Rintamaki, związany z Uniwersytetem Stanforda, przedstawił bardziej pozytywną ocenę, szczególnie chwaląc ulepszone poczucie humoru GPT-4.5. Argumentował, że stanowi to znaczący krok naprzód w zdolności AI do rozumienia i angażowania się w interakcje społeczne. To podkreśla potencjalną niszę dla GPT-4.5: wyróżnianie się w obszarach, w których najważniejsza jest zniuansowana komunikacja i poczucie humoru.

Konkurencja zabiera głos

Nawet konkurencyjne modele AI, w pewnym sensie, ‘skomentowały’ premierę GPT-4.5. Grok xAI, konkurencyjny model językowy, przyznał, że GPT-4.5 poprawił swoje zdolności konwersacyjne, ale zwrócił również uwagę na jego zasobochłonność. To podkreśla kluczową obawę: ogromną moc obliczeniową wymaganą do uruchomienia GPT-4.5, co przekłada się bezpośrednio na wyższe koszty operacyjne i większy ślad węglowy.

Sam ChatGPT, po zapytaniu, podkreślił ulepszoną retencję kontekstu, kreatywność i dokładność GPT-4.5. Przyznał jednak również, że model nadal wykazuje wady, szczególnie w dłuższych rozmowach, gdzie czasami może stracić wątek trwającego dialogu lub generować niespójne odpowiedzi. Ta samoocena, choć pozornie obiektywna, dodatkowo wzmacnia przekonanie, że GPT-4.5, pomimo swoich postępów, pozostaje niedoskonałą technologią.

Zagłębiając się w szczegóły

Aby zrozumieć mieszany odbiór, należy szczegółowo przeanalizować konkretne twierdzenia i kontrargumenty dotyczące GPT-4.5.

1. Twierdzenie o zwiększonej dokładności:

OpenAI twierdzi, że GPT-4.5 jest dokładniejszy niż jego poprzednik. Chociaż może to być prawdą w pewnych, wąsko zdefiniowanych zadaniach, niezależne testy przeprowadzone przez Karpathy’ego i Dandekera podają w wątpliwość uogólnienie tego twierdzenia. Wydaje się, że poprawa dokładności nie jest jednolita we wszystkich dziedzinach i może być mniej znacząca, niż początkowo reklamowano.

2. Obietnica zmniejszenia halucynacji:

‘Halucynacje’, czyli tendencja modeli językowych do generowania fałszywych lub bezsensownych informacji, stanowią stałe wyzwanie w tej dziedzinie. OpenAI twierdzi, że GPT-4.5 poczynił postępy w łagodzeniu tego problemu. Jednak raporty użytkowników i niepotwierdzone dowody sugerują, że halucynacje, choć być może rzadsze, nadal stanowią problem. Model nadal może generować pewnie sformułowane nieścisłości, szczególnie w przypadku złożonych lub zniuansowanych tematów.

3. Sztuka perswazji:

OpenAI podkreśla zwiększone możliwości perswazyjne GPT-4.5. To budzi obawy etyczne, ponieważ bardziej przekonująca sztuczna inteligencja może być wykorzystywana do celów manipulacyjnych, takich jak rozpowszechnianie dezinformacji lub wpływanie na opinie w niepożądany sposób. To, w jakim stopniu perswazyjność GPT-4.5 stanowi prawdziwą poprawę lub potencjalne zagrożenie, pozostaje przedmiotem toczącej się debaty.

4. Przewaga konwersacyjna:

GPT-4.5 jest niewątpliwie bardziej płynnym i angażującym rozmówcą niż GPT-4. Jest to być może jego najbardziej znacząca i łatwo zauważalna poprawa. Model generuje tekst, który płynie bardziej naturalnie, skuteczniej naśladuje ludzkie wzorce mowy i wykazuje większe zrozumienie niuansów konwersacyjnych. To sprawia, że lepiej nadaje się do zastosowań takich jak chatboty, wirtualni asystenci i narzędzia do kreatywnego pisania.

5. Deficyt rozumowania:

Pomimo ulepszeń konwersacyjnych, brak znaczącego postępu w zdolnościach rozumowania jest głównym punktem spornym dla wielu krytyków. GPT-4.5 nadal ma problemy z zadaniami wymagającymi logicznej dedukcji, rozumowania matematycznego i zdrowego rozsądku. To ograniczenie utrudnia jego zastosowanie w dziedzinach wymagających precyzyjnego, analitycznego myślenia, takich jak badania naukowe, modelowanie finansowe i analiza prawna.

6. Czynnik kosztów:

Zaporowy koszt korzystania z GPT-4.5 jest znaczącą barierą wejścia dla wielu potencjalnych użytkowników. Struktura cenowa, oparta na tokenach wejściowych i wyjściowych, sprawia, że jest on nieopłacalny dla aplikacji na dużą skalę lub długotrwałego użytkowania. To budzi obawy dotyczące dostępności i równości, ponieważ tylko dobrze finansowane organizacje i osoby prywatne mogą sobie pozwolić na korzystanie z tej technologii.

7. Etykieta ‘Research Preview’:

Decyzja OpenAI o wydaniu GPT-4.5 jako ‘research preview’ jest godna uwagi. Sugeruje to, że model jest nadal w fazie rozwoju i może zostać poddany dalszym udoskonaleniom. Oznacza to również, że OpenAI jest świadome ograniczeń i szuka opinii użytkowników, aby ukierunkować przyszłe ulepszenia. Jednak etykieta ‘research preview’ nie usprawiedliwia w pełni wysokich kosztów ani rozbieżności między twierdzeniami OpenAI a rzeczywistą wydajnością modelu.

Szerszy kontekst: Wyścig zbrojeń AI

Premiera GPT-4.5 musi być rozumiana w szerszym kontekście trwającego ‘wyścigu zbrojeń AI’. Firmy takie jak OpenAI, Google i Anthropic są zaangażowane w zaciętą rywalizację o opracowanie najbardziej zaawansowanych i wydajnych modeli AI. Ta presja konkurencyjna może prowadzić do pośpiesznych premier, przesadnych twierdzeń i skupienia się na przyrostowych ulepszeniach, a nie na fundamentalnych przełomach.

Dążenie do AGI, hipotetycznej sztucznej inteligencji o ludzkiej inteligencji i ogólnych zdolnościach rozwiązywania problemów, pozostaje siłą napędową wielu badań i rozwoju w tej dziedzinie. Jednak GPT-4.5, pomimo swoich postępów, nie spełnia tego ambitnego celu. Służy jako przypomnienie, że droga do AGI będzie prawdopodobnie długa i żmudna, a prawdziwe przełomy są rzadkie i trudne do osiągnięcia.

Przyszłość GPT-4.5

Ostateczny los GPT-4.5 pozostaje niepewny. Jako ‘research preview’, prawdopodobnie będzie ewoluował z czasem. OpenAI może odnieść się do krytyki i poprawić zdolności rozumowania modelu, obniżyć jego koszt lub udoskonalić jego wydajność w określonych dziedzinach.

Jednak mieszany odbiór GPT-4.5 podkreśla znaczenie krytycznej oceny i niezależnych testów w dziedzinie AI. Podkreśla również potrzebę większej przejrzystości ze strony firm takich jak OpenAI, szczególnie w odniesieniu do możliwości i ograniczeń ich modeli.

Na razie GPT-4.5 jest świadectwem ciągłego postępu w dziedzinie AI, ale także przestrogą przed niebezpieczeństwami szumu medialnego, wyzwaniami związanymi z osiąganiem prawdziwych przełomów oraz znaczeniem równoważenia innowacji z względami etycznymi i praktycznymi realiami. Wysoka cena, w połączeniu z wątpliwym zwrotem z inwestycji, sprawia, że jest to luksus, na który niewielu może sobie pozwolić, a jeszcze mniej może uzasadnić. Służy jako mocne przypomnienie, że postęp w AI nie zawsze jest liniowy, a większe, droższe modele nie zawsze są lepsze.