W San Francisco zakończył się LlamaCon Hackathon, globalne wydarzenie AI, które zgromadziło twórców z całego świata. To pierwsze tego typu wydarzenie przyciągnęło ponad 600 rejestrujących się, z których 238 utalentowanych deweloperów i innowatorów wzięło udział w jednodniowym budowaniu projektów. Wyzwaniem było stworzenie demonstracyjnego projektu w ciągu zaledwie 24 godzin, wykorzystując Llama API, Llama 4 Scout lub Llama 4 Maverick – albo dowolną kombinację tych najnowocześniejszych narzędzi.
Pula nagród była imponująca i wyniosła 35 000 USD w nagrodach pieniężnych, w tym nagrody za pierwsze, drugie i trzecie miejsce, a także nagroda za najlepsze wykorzystanie Llama API. Jury złożone z przedstawicieli Meta i partnerów sponsorskich starannie oceniło 44 zgłoszone projekty.
Jesteśmy niezmiernie wdzięczni naszym partnerom: Groq, Crew AI, Tavus, Lambda, Nebius i SambaNova za ich bezcenne wsparcie podczas całego hackathonu. Każdy sponsor zapewnił dostęp do kredytów, warsztaty prowadzone przez ekspertów, mentoring, stoiska z pytaniami i odpowiedziami na miejscu, sędziów i zdalne wsparcie na kanale Discord.
Ogłoszenie Zwycięzców
Po dwóch rundach oceny wyłoniliśmy sześć najlepszych projektów z 44 zgłoszeń, ostatecznie wyłaniając zdobywców pierwszego, drugiego i trzeciego miejsca oraz nagrody za najlepsze wykorzystanie Llama API.
OrgLens – Pierwsze Miejsce
OrgLens to system dopasowywania ekspertów oparty na sztucznej inteligencji, który łączy Cię z odpowiednimi profesjonalistami w organizacji. Analizując dane z różnych źródeł, w tym zadań Jira, kodu i problemów GitHub, dokumentacji wewnętrznej i życiorysów, OrgLens tworzy kompleksowe grafy wiedzy i szczegółowe profile dla każdego współtwórcy. Umożliwia to wyszukiwanie ekspertów za pomocą zaawansowanej funkcji wyszukiwania opartej na sztucznej inteligencji, a nawet interakcję z cyfrowym bliźniakiem danej osoby, aby zadać pytania przed nawiązaniem kontaktu. Aby zademonstrować swoją funkcjonalność, zbudowano demonstracyjną aplikację internetową przy użyciu React, Tailwind i Django, wykorzystując GitHub API i Llama API do przetwarzania i przechowywania danych. OrgLens usprawnia dopasowywanie ekspertów, ułatwiając znalezienie odpowiedniej osoby do danego zadania.
Zagłębiając się w innowacyjność OrgLens, staje się jasne, że jest to coś więcej niż tylko system dopasowywania ekspertów; jest to akcelerator dzielenia się wiedzą i współpracy w ramach przedsiębiorstwa. Sprytnie wykorzystuje moc sztucznej inteligencji, aby przełamać silosy informacyjne i połączyć wiedzę fachową ukrytą w każdym zakątku organizacji. Wyobraź sobie, że gdy napotkasz trudność w złożonym projekcie, nie musisz już bezcelowo przeszukiwać wewnętrznych e-maili i dokumentów, ale dzięki OrgLens możesz szybko znaleźć kolegę z odpowiednim doświadczeniem i umiejętnościami oraz bezpośrednio komunikować się z ich "cyfrowym bliźniakiem", aby zadać wstępne pytania. Bez wątpienia znacznie zwiększa to wydajność pracy i szybkość rozwiązywania problemów. Kluczową zaletą OrgLens jest zdolność do głębokiego wydobywania i analizy danych. Może nie tylko przechwytywać dane z platform takich jak Jira i GitHub, ale także analizować dokumentację wewnętrzną i życiorysy, tworząc w ten sposób kompleksowy graf wiedzy. Ten graf wiedzy zawiera nie tylko umiejętności i doświadczenie pracowników, ale także rejestruje ich wkład i interakcje w różnych projektach. Dzięki temu grafowi wiedzy OrgLens może dokładnie zidentyfikować eksperta, który najlepiej pasuje do konkretnego zadania, i polecić ich osobom potrzebującym pomocy. Ponadto OrgLens koncentruje się na doświadczeniu użytkownika. Oferuje intuicyjny i łatwy w obsłudze interfejs internetowy, w którym użytkownicy mogą wyszukiwać za pomocą słów kluczowych lub używać zaawansowanych filtrów, aby znaleźć odpowiedniego eksperta. Co więcej, funkcja "cyfrowy bliźniak" umożliwia użytkownikom zadawanie wstępnych pytań i uzyskiwanie szybkich odpowiedzi, oszczędzając czas zarówno eksperta, jak i poszukującego. Integrując sztuczną inteligencję z procesem dopasowywania ekspertów, OrgLens ma potencjał, aby zrewolucjonizować sposób, w jaki firmy zarządzają i wykorzystują swoje wewnętrzne zasoby talentów, prowadząc do lepszej współpracy, innowacji i ogólnej wydajności.
Sukces OrgLens polega na rozwiązaniu powszechnego problemu zarządzania wiedzą w przedsiębiorstwach. Wiele firm stoi w obliczu problemu rozproszenia umiejętności pracowników i trudnościami w uzyskaniu dostępu do informacji, co prowadzi do marnotrawstwa zasobów i braku wydajności. OrgLens skutecznie rozwiązuje ten problem, automatyzując proces dopasowywania ekspertów i przynosząc firmom następujące istotne korzyści:
- Zwiększenie produktywności: Pracownicy mogą szybciej znaleźć potrzebną im pomoc, co przyspiesza postęp projektu.
- Promowanie innowacji: Poprzez łączenie ekspertów z różnych dziedzin, można stymulować nowe pomysły i rozwiązania.
- Optymalizacja wykorzystania zasobów: Unika się powielania wysiłków i marnotrawstwa zasobów, co poprawia ogólną wydajność.
- Wzmocnienie zaangażowania pracowników: Ułatwienie pracownikom dzielenia się wiedzą i doświadczeniem, co zwiększa ich zaangażowanie i poczucie przynależności.
Compliance Wizards – Drugie Miejsce
Compliance Wizards stworzyli analizator transakcji oparty na sztucznej inteligencji, który wykrywa oszustwa i ostrzega użytkowników na podstawie niestandardowych algorytmów oceny ryzyka. Użytkownikom wysyłane są powiadomienia e-mail z prośbą o zgłoszenie lub zatwierdzenie transakcji. Użytkownik może następnie zgłaszać i zatwierdzać transakcje za pomocą asystenta głosowego AI. Korzystając z multimodalności Llama API, osoba oceniająca oszustwa może przesyłać informacje o klientach i przeszukiwać powiązane wiadomości o swoich klientach, aby pomóc w ustaleniu, czy klient jest zaangażowany w jakiekolwiek godne uwagi działania przestępcze.
Compliance Wizards stworzyli analizator transakcji oparty na sztucznej inteligencji, zaprojektowany do identyfikowania podejrzanych działań i ostrzegania użytkowników za pomocą wyrafinowanych algorytmów oceny ryzyka. System ten działa poprzez wysyłanie użytkownikom powiadomień e-mail, które nakłaniają użytkowników do przeglądu i potwierdzenia niektórych transakcji. Użytkownicy mogą następnie wchodzić w interakcje z asystentem głosowym obsługiwanym przez sztuczną inteligencję, aby zgłaszać transakcje lub potwierdzać ich legalność. Wykorzystując multimodalne możliwości Llama API, osoby oceniające oszustwa mogą przesyłać informacje o klientach i przeszukiwać pertinentne wiadomości, aby pomóc w ustaleniu, czy klient jest zaangażowany w jakiekolwiek godne uwagi działania przestępcze.
Sercem Compliance Wizards jest potężny silnik AI, który jest w stanie dogłębnie analizować dane transakcyjne, aby zidentyfikować potencjalne wzorce oszustw. Silnik ten może nie tylko wykrywać tradycyjne zachowania związane z oszustwami, ale także przeprowadzać spersonalizowane oceny ryzyka w oparciu o konkretne profile ryzyka klientów, poprawiając w ten sposób dokładność wykrywania oszustw. Ponadto Compliance Wizards integruje funkcję przeszukiwania wiadomości, pozwalającą fraud assessors to quickly gather relevant information about their clients, such as media mentions and legal records. This contextual information can be crucial in assessing the overall risk profile of the client and identifying potential red flags.
The AI-powered voice assistant is another key component of Compliance Wizards. It provides users with a convenient and efficient way to report and acknowledge transactions, especially when they are on the go. The voice assistant can also answer questions about the transactions and provide guidance on how to comply with relevant regulations.
Główne zalety Compliance Wizards to jego wielowarstwowe podejście do bezpieczeństwa:
- Zaawansowana ocena ryzyka: Dokładniej identyfikuje potencjalne oszustwa dzięki dostosowanym algorytmom oceny ryzyka.
- Analiza transakcji w czasie rzeczywistym: Monitoruje na żywo wszystkie transakcje, aby szybko wykryć podejrzane działania.
- Świadomość kontekstowa: Potrafi pozyskiwać informacje z wiadomości, aby holistycznie ocenić profil ryzyka klienta.
- Wygodne reporting: Upraszcza proces raportowania i potwierdzania dzięki asystentowi głosowemu.
Compliance Wizards to coś więcej niż tylko narzędzie, to kompleksowe rozwiązanie zgodności, które pomaga firmom zminimalizować ryzyko oszustw i przestrzegać odpowiednich przepisów.
Llama CCTV Operator – Trzecie Miejsce
Zespół kierowany przez Agajana Torayeva zbudował Llama CCTV AI Control Room Operator, który automatycznie identyfikuje niestandardowe zdarzenia wideo z monitoringu bez konieczności dostrajania żadnego modelu. Operator jest w stanie zdefiniować zdarzenia wideo prostym językiem. Wykorzystując wielomodalne rozumienie obrazu Llama 4, system przechwytuje i wykrywa ruch co pięć klatek, aby ocenić te wstępnie zdefiniowane zdarzenia i zgłosić je operatorowi.
Ideą stojącą za Llama CCTV Operator jest nadanie systemom monitoringu inteligencji, umożliwiającej im proaktywne identyfikowanie anomalnych zdarzeń, zamiast jedynie pasywnego rejestrowania wideo. System ten wykorzystuje potężne możliwości rozumienia obrazu Llama 4, allowing to analyze video feeds in real-time and detect a wide range of predetermined events, such as suspicious activity, unauthorized access, or safety hazards. The operator can define these events using simple language, without requiring any specialized knowledge of machine learning or computer vision.
The system works by capturing and analyzing motion every five frames, and then using Llama 4’s multimodal capabilities to assess whether the captured motion matches any of the predefined events. If a match is found, the system will immediately report the event to the operator, along with relevant contextual information.
Główne zalety Llama CCTV Operator to:
- Brak konieczności strojenia: Eliminuje potrzebę jakiegokolwiek strojenia modelu, znacznie upraszczając proces wdrażania i konserwacji.
- Wykrywanie niestandardowych zdarzeń: Operatorzy mogą definiować niestandardowe zdarzenia monitoringu stosując prosty język, spełniając w ten sposób specyficzne wymagania bezpieczeństwa.
- Analiza w czasie rzeczywistym: System może analizować strumienie wideo w czasie rzeczywistym, umożliwiając jak najszybsze wykrywanie podejrzanych działań.
- Automatyczny reporting: System automatycznie raportuje wykryte zdarzenia do operatorów, redukując potrzebę ręcznego monitoringu.
Geo-ML – Najlepsze Wykorzystanie Llama API
Geolog William Davis użył Llama 4 Maverick i GemPy do wygenerowania potencjalnych miejsc wydobycia, map topograficznych i trójwymiarowych modeli geologicznych złóż mineralnych. Geo-ML działa poprzez przetwarzanie 400-stronicowych raportów geologicznych, konsolidowanie informacji w ustrukturyzowany język specyficzny dla dziedziny geologicznej, a następnie wykorzystywanie go do generowania trójwymiarowych reprezentacji podziemnej geologii.
"To jest po raz pierwszy, kiedy tak naprawdę użyłem LLM API do wyodrębniania ultradługich tekstów i obrazów z długich publikacji geologicznych, więc skorzystałem z ultradługiego okna kontekstowego Llama Maverick oraz możliwości multimodalnych tekstu i obrazu, aby wyodrębnić tekst i przekonwertować go na język specyficzny dla domeny, dając skompresowaną wersję tego, co jest przechowywane w dokumencie" – powiedział Davis. "Większość czasu spędzam na czytaniu dokumentów geologicznych. Posiadanie LLM, który może to zrobić za mnie w tle, byłoby niesamowite".
Geolog William Davis sprytnie wykorzystał Llama 4 Maverick i GemPy, aby zapoczątkować zupełnie nowe podejście do modelowania geologicznego. Celem Geo-ML jest wykorzystanie mocy sztucznej inteligencji do wyodrębnienia ukrytych informacji z dużych ilości raportów geologicznych i przekształcenia ich w użyteczne i łatwe do zrozumienia modele 3D.
The system works by processing long geological research papers, often 400 pages or more, and consolidating the information into a structured geology domain-specific language. This language captures the key geological features, structures, and mineral deposits described in the reports. Then, the system wykorzystuje ten język do generowania trójwymiarowych reprezentacji podziemnej geologii, pomagając geologom w łatwiejszej wizualizacji i analizie środowiska podziemnego.
Davis himself emphasized the importance of Llama 4 Maverick’s long context window and multimodal capabilities in making Geo-ML possible. The long context window allows the system to process entire research papers at once, while the multimodal capabilities enable it to extract both text and images from the documents.
Główne zalety Geo-ML to jego zdolność do:
- Automatyzacja modelowania geologicznego: Automatyzuje proces modelowania geologicznego, skracając czas i wysiłek włożony w analizę ręczną.
- Wyodrębnianie ukrytych informacji: Wyodrębnia ukryte informacje z dużych raportów geologicznych, pomagając geologom w odkrywaniu potencjalnych miejsc wydobycia i złóż mineralnych.
- Generowanie modeli 3D: Generuje trójwymiarowe reprezentacje podziemnej geologii, pomagając geologom w łatwiejszej wizualizacji i analizie środowiska podziemnego.
- Przyspieszenie badań geologicznych: Przyspieszenie badań geologicznych poprzez przyspieszenie procesu modelowania geologicznego.
Specjalne Wyróżnienie: Zespół Concierge
Jeden z finalistów o nazwie Concierge wyróżniał się na tle konkurencji, przywożąc na zawody własne GPU.
"Uważamy, że najlepszym aspektem Llama 4 Maverick jest natura rzadkiej mieszanki ekspertów i dostępność open source, co pozwala na strojenie" – powiedział zespół. "Meta niedawno udostępniła doskonałe narzędzie do strojenia, czyli narzędzie na GitHubie. Korzystając z Llama API, skompilowaliśmy dane z wielu źródeł, aby utworzyć zbiory danych QA i dostroić model Llama 4 Maverick. Planujemy przesłać je do otwartych testów porównawczych, ponieważ obecnie brakuje nam kodera Llama 4, a dzięki oknu kontekstowemu 1M spodziewamy się, że będzie wyjątkiem".
Concierge’s unique approach lies in its focus on fine-tuning the Llama 4 Maverick model to enhance its performance on specific tasks. The team believed that the sparse mixture of experts nature of Llama 4 Maverick, combined with its open source availability, made it an ideal candidate for fine-tuning.
To fine-tune the model, the team compiled data from multiple sources to create QA datasets. Then, they used Meta’s fine-tuning tool to train the model. The team planuje to submit the fine-tuned model to open benchmarks to evaluate its performance.
Obejrzyj Prezentacje Finalistów
Możesz obejrzeć prezentacje finalistów na YouTube.
Dołącz do Następnego Hackathonu Llama
Deweloperzy mogą aplikować do następnego hackathonu Llama, który odbędzie się w Nowym Jorku w dniach 31 maja – 1 czerwca 2025 roku.
```