Manus: Nowe podejście do agentów AI

Pojawienie się Manusa i jego możliwości

Szybko rozwijająca się dziedzina agentów AI odnotowała ostatnio wzmożoną aktywność, przypominającą fenomen DeepSeek. Nowy startup z Shenzhen w Chinach, o nazwie Manus, wprowadził coś, co określa mianem „uniwersalnego agenta AI”, wywołując spore dyskusje i podekscytowanie w społeczności AI.

Twór Manusa został zaprojektowany do działania jako wszechstronny agent AI, zdolny do autonomicznego planowania, wykonywania i dostarczania kompleksowych wyników. Agent ten wchodzi w interakcje ze stronami internetowymi w czasie rzeczywistym, przetwarza różne typy danych i wykorzystuje zestaw narzędzi do osiągnięcia swoich celów.

Pomimo tego, że jest w fazie dostępnej tylko na zaproszenie, Manus szybko zyskał uwagę dzięki swoim imponującym możliwościom. Deedy Das, dyrektor w Menlo Ventures, chwalił Manusa, stwierdzając: „Manus, nowy produkt AI, o którym wszyscy mówią, jest wart szumu. To jest agent AI, którego nam obiecano”. Das podkreślił zdolność agenta do skondensowania tego, co zwykle zajęłoby dwa tygodnie profesjonalnej pracy, do około jednej godziny.

Andrew Wilkinson, współzałożyciel holdingu technologicznego Tiny, wyraził podobny sentyment, zauważając: „Czuję się, jakbym właśnie przeniósł się w czasie o sześć miesięcy w przyszłość”. Wilkinson podzielił się nawet tym, że zlecił Manusowi opracowanie i zastąpienie rozwiązania programowego, na które jego firma wydaje obecnie 6000 dolarów rocznie.

Manus zaprezentował szeroki wachlarz funkcjonalności, w tym:

  • Szczegółowe tworzenie planów podróży: Generowanie kompleksowych planów podróży.
  • Dogłębna analiza danych: Przeprowadzanie dokładnej analizy akcji i firm.
  • Generowanie raportów badawczych: Tworzenie raportów na różne tematy.
  • Projektowanie gier: Konceptualizacja i projektowanie gier.
  • Interaktywne kursy edukacyjne: Opracowywanie angażujących doświadczeń edukacyjnych.

Użytkownicy opisali Manusa jako wieloaspektowe narzędzie, łączące możliwości dogłębnych badań, autonomiczną pracę, funkcjonalność korzystania z komputera oraz agenta kodującego wyposażonego w pamięć.

Doświadczenie użytkownika i testy wydajności

Poza swoimi „oszałamiającymi” możliwościami agentowymi, jak to niektórzy określili, Manus został również doceniony za swoje doświadczenie użytkownika (UX). Victor Mustar, szef produktu w Hugging Face, zauważył: „UX jest tym, co tak wielu innych obiecywało, ale tym razem to po prostu działa”. Projekt Manusa obejmuje również nadzór człowieka, wymagając zatwierdzeń i uprawnień do różnych działań.

Manus został również przetestowany na benchmarku GAIA, który ocenia ogólnych asystentów AI pod kątem ich zdolności do rozwiązywania rzeczywistych problemów. Według opublikowanych wyników, Manus wykazał się lepszą wydajnością w porównaniu do Deep Research OpenAI.

Debata o „Wrapperze” i wartość Manusa

Kilka dni po początkowej fali ekscytacji, niektórzy użytkownicy na X (dawniej Twitter) odkryli, że Manus działał na modelu Claude Sonnet firmy Anthropic, wraz z innymi narzędziami, takimi jak Browser Use. To odkrycie doprowadziło do pewnych wyrazów rozczarowania, a niektórzy krytycy sugerowali, że Manusowi brakuje unikalnej „fosy” lub przewagi konkurencyjnej.

Rzeczywistość jest taka, że Manus, aby osiągnąć swoje imponujące możliwości, działa jako „wrapper” wokół jednych z najbardziej zaawansowanych dostępnych modeli AI. Takie podejście spotkało się jednak czasami z dziwnie negatywnym odbiorem w mediach społecznościowych. Ostatecznie Manus wykazał sukces w tworzeniu dobrze zaprojektowanego interfejsu, który skutecznie wykorzystuje agentowy potencjał fundamentalnego modelu AI.

Aidan McLaughlin, profesjonalista w OpenAI, skomentował na X, że aspekt „wrappera” nie był istotnym problemem. Podkreślił: „Jeśli stworzył wartość, zasługuje na mój szacunek. Liczą się możliwości, a nie architektura”.

Co więcej, wstępne recenzje Manusa podkreślają niewykorzystany potencjał obecnych modeli AI, możliwości, których nawet laboratoria je opracowujące nie w pełni zrealizowały. Richardson Dackam, założyciel GitGlance.co, stwierdził: „Manus nie tylko nałożył API na model. Zbudowali autonomiczny system, który może wykonywać dogłębne badania, dogłębne myślenie i wieloetapowe zadania w sposób, w jaki żaden inny AI tego nie robił”.

To rodzi intrygujące pytanie: jeśli Manus jest zbudowany na istniejących modelach ze Stanów Zjednoczonych, dlaczego twórcy tych modeli nie byli w stanie sami dostarczyć podobnych możliwości? Dean W Ball, badacz AI, zasugerował: „Zakładam, że każde amerykańskie laboratorium ma te możliwości lub lepsze za kulisami i nie udostępnia ich ze względu na awersję do ryzyka, z których część wynika z ryzyka regulacyjnego”.

Aspiracje Open Source i pojawienie się OpenManus

Fakt, że Manus jest zbudowany na istniejących LLM, sugeruje, że jego możliwości mogłyby potencjalnie zostać odtworzone. Ta świadomość wywołała falę oczekiwania wśród wielu użytkowników na X, a niektórzy wyrazili nadzieję na wersję open-source.

Te nadzieje wydają się zostać spełnione stosunkowo szybko. Grupa programistów na GitHubie stworzyła już alternatywę open-source dla Manusa, trafnie nazwaną „OpenManus”. Ten projekt jest teraz publicznie dostępny na GitHubie.

Krytyka i wyzwania, przed którymi stoi Manus

Pomimo pozytywnego odbioru, Manus spotkał się również z krytyką. Niektórzy użytkownicy zgłaszali, że Manus potrzebował nadmiernej ilości czasu na wykonanie zadań, a w niektórych przypadkach w ogóle ich nie ukończył. Derya Unutmaz, naukowiec biomedyczny, porównał Manusa do Deep Research OpenAI, zauważając, że podczas gdy ten ostatni ukończył zadanie w 15 minut, Manus AI zawiódł po 50 minutach, utknąwszy na kroku 18 z 20.

Simon Smith, EVP ds. generatywnej AI w Klick Health, przypisał te problemy możliwości, że model bazowy Manusa może nie być tak solidny jak Deep Research OpenAI. Zasugerował ponadto, że ponieważ Manus wykorzystuje wiele modeli, może potrzebować więcej czasu niż Deep Research, aby wygenerować kompletny raport.

Inny użytkownik podkreślił, że Manus czasami utyka podczas wyszukiwania w sieci, doświadcza „przerw” z powodu problemów z kontekstem w zadaniach opartych na kodzie i wykazuje ogólną powolność.

Niektórzy krytycy zwrócili również uwagę na podejście Manusa do dostępu tylko na zaproszenie, sugerując, że zaproszenia były dystrybuowane głównie do influencerów w mediach społecznościowych w celu wygenerowania szumu.

Przyszłość Manusa i szerszy krajobraz AI

Należy przyznać, że Manus jest wciąż na wczesnym etapie rozwoju i prawdopodobnie będzie podlegał dalszym udoskonaleniom i ulepszeniom. Pozostaje jednak kluczowe pytanie: jak długo potrwa, zanim główni gracze, tacy jak OpenAI, Anthropic, a nawet Google, wprowadzą bardziej powszechnie dostępną wersję tego, co obecnie oferuje Manus? Pojawienie się Manusa służy jako przekonująca demonstracja potencjału agentów AI i wartości tworzenia przyjaznych dla użytkownika interfejsów w celu odblokowania możliwości istniejących modeli AI. Chociaż istnieją wyzwania i krytyka, Manus stanowi znaczący krok naprzód w ewolucji narzędzi opartych na AI i ich zdolności do radzenia sobie ze złożonymi, rzeczywistymi zadaniami. Rozwój OpenManus dodatkowo podkreśla zainteresowanie społeczności eksploracją i rozszerzaniem możliwości oferowanych przez to nowe podejście do agentów AI. Przyszłość prawdopodobnie przyniesie ciągłe innowacje i konkurencję w tej przestrzeni, napędzając rozwój jeszcze bardziej wyrafinowanych i dostępnych agentów AI.