Qwen3 od Alibaba: Nowa fala AI!

Krajobraz sztucznej inteligencji nieustannie ewoluuje, a nowe modele i postępy pojawiają się w szybkim tempie. Wśród ostatnich wydarzeń, udostępnienie przez Alibabę w trybie open-source modelu Tongyi Qianwen nowej generacji, Qwen3, zyskało znaczną uwagę. Chwaląc się mniejszym rozmiarem parametrów, obniżonymi kosztami i zwiększoną wydajnością w porównaniu z innymi wiodącymi modelami, Qwen3 pozycjonuje się jako silny konkurent na globalnej arenie AI.

Qwen3 wyróżnia się jako pionierski model rozumowania hybrydowego w Chinach, oferujący atrakcyjne połączenie lepszej wydajności i obniżonych kosztów. Przy łącznej liczbie 235 miliardów parametrów wymaga znacznie mniej zasobów do wdrożenia w porównaniu z innymi modelami o podobnych możliwościach. Ta efektywność kosztowa sprawia, że Qwen3 jest atrakcyjną opcją dla organizacji, które chcą wykorzystać moc dużych modeli językowych bez nadwyrężania budżetu.

Umożliwianie agentom i aplikacjom AI

Jednym z kluczowych aspektów Qwen3 jest jego potencjał do przyspieszenia rozwoju i wdrażania agentów AI i aplikacji wykorzystujących duże modele językowe. W ocenach możliwości agentów modelowych Qwen3 osiągnął imponujące wyniki, przewyższając inne modele z najwyższej półki. Sugeruje to, że Qwen3 może obniżyć barierę wejścia dla rozwoju i wdrażania agentów AI, potencjalnie prowadząc do wzrostu innowacyjnych aplikacji.

Rosnące zapotrzebowanie na możliwości wywoływania narzędzi w agentach AI

Agenci AI są coraz częściej wykorzystywani do automatyzacji złożonych zadań i interakcji z rzeczywistym światem. Możliwości wymagane od agenta AI zależą od złożoności i autonomii zadań, do których ma być przeznaczony.

Solidny system agentów AI zazwyczaj wymaga od bazowego modelu następujących możliwości:

  • Podstawowe rozumienie i generowanie języka: Zdolność do dokładnego interpretowania instrukcji, rozumienia kontekstu i generowania odpowiedzi w języku naturalnym.

  • Wykorzystywanie i wywoływanie narzędzi: Zdolność do rozumienia i wykorzystywania narzędzi zewnętrznych, w tym interfejsów API, do wykonywania konkretnych zadań.

  • Rozumowanie i planowanie: Zdolność do rozkładania złożonych celów na mniejsze podzadania i wykonywania ich w logicznej kolejności.

Qwen3 odpowiada na krytyczną potrzebę poprawy możliwości wywoływania narzędzi w agentach AI. Może precyzyjnie integrować narzędzia zewnętrzne, zarówno w trybie myślenia, jak i bez myślenia, co czyni go wiodącym modelem open-source do złożonych zadań opartych na agentach.

W ocenach możliwości agentów modelowych Qwen3 osiągnął wysoki wynik, przewyższając inne modele z najwyższej półki. Oznacza to znaczące obniżenie barier wejścia dla rozwoju i wdrażania agentów AI.

Qwen3 natywnie obsługuje protokół MCP i posiada solidne możliwości wywoływania narzędzi. W połączeniu z frameworkiem Qwen-Agent, który hermetyzuje szablony wywoływania narzędzi i parsery, upraszcza proces rozwoju i umożliwia wydajne operacje agentów na urządzeniach mobilnych i komputerach. Programiści mogą definiować dostępne narzędzia na podstawie plików konfiguracyjnych MCP i integrować je za pomocą frameworka Qwen-Agent lub innych niestandardowych narzędzi. Pozwala to na szybki rozwój inteligentnych agentów z bazami wiedzy i możliwościami wykorzystywania narzędzi.

Ponadto, Qwen3 wykazuje dobre wyniki w zakresie podstawowego rozumienia i generowania języka, jak również umiejętności rozumowania.

Oznacza to, że przy równoważnych możliwościach modelu koszt wywoływania modeli dla agentów i branż aplikacji AI jest niższy, a wywoływanie jest wygodniejsze, co nieuchronnie sprzyja pojawianiu się nowych agentów i aplikacji AI.

Zaangażowanie w Open Source

Alibaba potwierdziła swoje zaangażowanie w społeczność open-source, oferując różnorodną gamę modeli Qwen3. Obejmuje to dwa modele Mixture-of-Experts (MoE) z 30 miliardami i 235 miliardami parametrów, a także sześć gęstych modeli o różnej wielkości.

Model MoE z 30 miliardami parametrów osiąga znaczny wzrost wydajności, zapewniając wydajność porównywalną z modelem Qwen2.5-32B poprzedniej generacji. Gęste modele również wykazują poprawę wydajności, a nawet mniejsze modele osiągają imponujące wyniki.

Ponieważ wszystkie modele Qwen3 są modelami rozumowania hybrydowego, interfejsy API można skonfigurować w razie potrzeby, aby ustawić ‘budżety myślenia’ (tj. oczekiwaną maksymalną liczbę tokenów do dogłębnego myślenia), aby wykonywać różne stopnie myślenia i elastycznie zaspokajać różnorodne potrzeby aplikacji AI i różnych scenariuszy w zakresie wydajności i kosztów. Małe i średnie przedsiębiorstwa oraz twórcy AI mogą elastycznie wybierać modele w zależności od swoich potrzeb, co nieuchronnie obniży próg i koszt korzystania z dużych modeli. Zespoły te, dysponujące bardzo ograniczonymi funduszami i personelem, mogą przeznaczyć więcej zasobów i energii na rynek i wydobycie potrzeb i problemów użytkowników, aby mogły opracowywać bardziej innowacyjne aplikacje.

Fundament Technologiczny Alibaby

Po 16 latach rozwoju Alibaba kompleksowo zrekonstruowała pełny stos architektury technologicznej, od bazowego sprzętu po platformy obliczeniowe, pamięci masowej, sieciowe, przetwarzania danych, trenowania modeli i rozumowania, co czyni ją wiodącą platformą przetwarzania w chmurze w regionie Azji i Pacyfiku. Alibaba jest również jedną z pierwszych firm technologicznych na świecie, które zainwestowały w badania nad dużymi modelami.

Wcześniej Zhou Jingren stwierdził w wywiadzie dla mediów, że rozwój dużych modeli jest nierozerwalnie związany ze wsparciem systemu chmurowego. Niezależnie od tego, czy chodzi o trenowanie, czy rozumowanie, każdy przełom w dużych modelach, na powierzchni, jest ewolucją możliwości modelu, ale za nim kryje się kompleksowa współpraca i modernizacja całej platformy przetwarzania w chmurze oraz danych i inżynierii. Multimodalność jest również ważnym sposobem na AGI.

Międzynarodowe Uznanie

Wydanie Qwen3 zyskało uwagę na skalę globalną. Po wydaniu Qwen 3 Alibaby, Elon Musk stwierdził na platformie społecznościowej X, że wczesna wersja beta Grok 3.5 zostanie udostępniona subskrybentom SuperGrok w przyszłym tygodniu, twierdząc, że jest to pierwsza AI, która może dokładnie odpowiadać na pytania dotyczące silników rakietowych lub technologii elektrochemicznej.

Napędzanie Innowacji i Dostępności

Sun Maosong, wiceprezes wykonawczy Instytutu Sztucznej Inteligencji na Uniwersytecie Tsinghua i zagraniczny akademicki Europejskiej Akademii Nauk Humanistycznych i Przyrodniczych, stwierdził, że w ostatnich latach Chiny wnoszą znaczący wkład w rozwój sztucznej inteligencji, szczególnie w dziedzinie dużych modeli. Pojawienie się DeepSeek i serii produktów open-source od Tongyi Qianwen znacznie promowały otwartą drogę krajowych dużych modeli, co niewątpliwie ma ogromne znaczenie dla łagodzenia monopoli technologicznych, promowania równości technologicznej i zwiększania inkluzywności sztucznej inteligencji.

Obecnie liczba modeli pochodnych Qwen w społecznościach open-source w kraju i za granicą przekroczyła 100 000, przewyższając serię modeli pochodnych Llama, a Tongyi Qianwen Qwen plasuje się jako największa na świecie grupa generatywnych modeli językowych. Według najnowszej globalnej listy modeli open-source opublikowanej przez Huggingface 10 lutego 2025 roku, dziesięć najlepszych modeli open-source to wszystkie modele pochodne oparte na modelach open-source Tongyi Qianwen Qwen.

Sun Maosong uważa, że oznacza to, że chińska kultura dużych modeli została uznana na arenie międzynarodowej, co jest zmianą kulturową. Jest to bardzo cenne i reprezentuje uznanie rozwoju i technologii chińskich dużych modeli.