LlamaCon Hackathon : Les Lauréats Révélés

Le LlamaCon Hackathon, une manifestation d’IA qui a réuni des développeurs du monde entier, s’est conclu avec succès à San Francisco. L’événement a attiré plus de 600 inscrits, et 238 développeurs et innovateurs talentueux se sont finalement réunis pour une journée de création de projets. Le défi consistait à créer un projet démontrable en seulement 24 heures, en utilisant Llama API, Llama 4 Scout ou Llama 4 Maverick (ou toute combinaison de ces outils de pointe).

Le concours offrait des prix intéressants, avec un total de 35 000 $ en prix en espèces, comprenant des prix de première, deuxième et troisième places, ainsi que le prix de la meilleure utilisation de Llama API. Un jury composé de membres de Meta et de partenaires sponsors a évalué avec soin les 44 projets soumis.

Nous tenons à remercier chaleureusement nos partenaires Groq, Crew AI, Tavus, Lambda, Nebius et SambaNova, qui ont fourni un soutien précieux tout au long du hackathon. Chaque sponsor a offert une utilisation de crédit, des ateliers animés par des conférenciers experts, du mentorat, des stands de questions-réponses sur place, des évaluateurs et un soutien à distance sur Discord.

Liste des gagnants

Après deux tours d’évaluation, nous avons sélectionné les six meilleurs projets parmi les 44 soumissions, qui ont finalement abouti à la détermination du premier, deuxième et troisième prix, ainsi que du prix de la meilleure utilisation de Llama API.

OrgLens – Premier prix

OrgLens a créé un système de jumelage d’experts alimenté par l’IA, qui vous met en contact avec les bons professionnels au sein de votre organisation. En analysant les données provenant de diverses sources, notamment les tâches Jira, le code et les problèmes GitHub, la documentation interne et les CV, OrgLens crée des graphiques de connaissances complets et des profils détaillés pour chaque contributeur. Cela vous permet d’utiliser des fonctions de recherche avancées basées sur l’IA pour rechercher des experts et même d’interagir avec le jumeau numérique d’une personne pour poser des questions avant de la contacter. Afin de démontrer ses capacités, une application Web de démonstration a été construite en utilisant React, Tailwind et Django, en tirant parti de l’API GitHub et de Llama API pour traiter et stocker les données. OrgLens simplifie le jumelage d’experts, ce qui facilite la recherche des bonnes personnes pour le poste.

Plongez au cœur de l’innovation d’OrgLens, qui transcende la simple fonction de système de jumelage d’experts pour devenir un véritable accélérateur de partage des connaissances et de collaboration au sein de l’entreprise. Cet outil utilise avec brio la puissance de l’intelligence artificielle pour abattre les silos d’information et connecter les expertises dissimulées aux quatre coins de l’organisation. Imaginez : face à un problème complexe sur un projet, vous n’avez plus à errer sans but dans les courriels et les documents internes. OrgLens vous permet de trouver rapidement les collègues possédant l’expérience et les compétences nécessaires, et d’entamer une première communication avec leur « jumeau numérique ». Un gain d’efficacité et de résolution de problèmes indéniable! L’atout majeur d’OrgLens réside dans sa capacité d’extraction et d’analyse de données en profondeur. Le système ne se contente pas de récupérer les données des plateformes comme Jira et GitHub, il analyse également les documents internes et les CV pour construire un graphe de connaissances exhaustif. Ce graphe ne se limite pas aux compétences et à l’expérience des employés : il enregistre également leurs contributions et interactions dans différents projets. Grâce à ce graphe, OrgLens est capable d’identifier avec précision les experts les plus pertinents pour une tâche donnée, et de les recommander aux personnes ayant besoin d’aide. OrgLens accorde également une grande importance à l’expérience utilisateur. Il propose une interface web intuitive et facile à utiliser, permettant aux utilisateurs de rechercher des experts avec des mots-clés ou d’utiliser des filtres avancés. De plus, la fonctionnalité de "jumeau numérique" permet aux utilisateurs de poser des questions préliminaires et d’obtenir des réponses rapides, ce qui permet de gagner du temps pour l’expert et le demandeur. En intégrant l’intelligence artificielle au processus de jumelage d’experts, OrgLens a le potentiel de révolutionner la façon dont les entreprises gèrent et utilisent leurs ressources de talents internes, ce qui entraîne une amélioration de la collaboration, de l’innovation et de la performance globale.

Le succès d’OrgLens réside dans sa capacité à résoudre le problème omniprésent de la gestion des connaissances au sein des entreprises. De nombreuses entreprises sont confrontées à la dispersion des compétences des employés et à la difficulté d’accès à l’information, ce qui entraîne un gaspillage de ressources et une inefficacité. En automatisant le processus de jumelage d’experts, OrgLens résout efficacement ce problème et apporte les avantages significatifs suivants aux entreprises :

  • Amélioration de la productivité : Les employés peuvent trouver plus rapidement l’aide dont ils ont besoin, ce qui accélère l’avancement des projets.
  • Promotion de l’innovation : En connectant des experts de différents domaines, de nouvelles idées et solutions peuvent être stimulées.
  • Optimisation de l’utilisation des ressources : Le chevauchement des efforts et le gaspillage des ressources sont évités, ce qui améliore l’efficacité globale.
  • Engagement accru des employés : Il est plus facile pour les employés de partager leurs connaissances et leur expérience, ce qui renforce leur sentiment d’engagement et d’appartenance.

Compliance Wizards – Deuxième prix

Compliance Wizards a créé un analyseur de transactions basé sur l’IA pour détecter les fraudes et alerter les utilisateurs en fonction d’un algorithme personnalisé d’évaluation des risques. Des notifications par e-mail sont envoyées aux utilisateurs, les invitant à signaler ou à confirmer les transactions. Les utilisateurs peuvent ensuite discuter avec un assistant vocal alimenté par l’IA pour signaler et confirmer. En utilisant la multimodalité de Llama API, les évaluateurs de la fraude peuvent télécharger les informations sur les clients et rechercher des informations pertinentes sur leurs clients pour déterminer si les clients sont impliqués dans toute activité criminelle notable.

Les magiciens de la conformité ont créé un analyseur de transactions alimenté par l’intelligence artificielle, conçu pour identifier les activités suspectes et alerter les utilisateurs au moyen d’algorithmes complexes d’évaluation des risques. Ce système fonctionne en envoyant des notifications par e-mail aux utilisateurs, les invitant à examiner et à confirmer certaines transactions. Les utilisateurs peuvent ensuite interagir avec un assistant vocal alimenté par l’IA pour signaler les transactions ou confirmer leur légitimité. En tirant parti des capacités multimodales de Llama API, les évaluateurs de la fraude peuvent téléverser des informations sur les clients et rechercher des nouvelles pertinentes pour aider à déterminer si les clients sont impliqués dans des activités criminelles notables.

Le cœur de Compliance Wizards est son puissant moteur d’IA, capable d’analyser en profondeur les données transactionnelles et d’identifier les schémas de fraude potentiels. Ce moteur est non seulement capable de détecter les comportements frauduleux traditionnels, mais aussi d’effectuer des évaluations de risque personnalisées en fonction du profil de risque spécifique du client, améliorant ainsi la précision de la détection de la fraude. En outre, Compliance Wizards intègre une fonction de recherche de nouvelles, permettant aux évaluateurs de la fraude de recueillir rapidement des informations pertinentes sur leurs clients, telles que les mentions dans les médias et les dossiers juridiques. Ces informations contextuelles peuvent être cruciales pour évaluer le profil de risque global du client et identifier les signaux d’alarme potentiels.

L’assistant vocal alimenté par l’IA est un autre élément clé de Compliance Wizards. Il offre aux utilisateurs un moyen pratique et efficace de signaler et de reconnaître les transactions, en particulier lorsqu’ils sont en déplacement. L’assistant vocal peut également répondre aux questions sur les transactions et fournir des conseils sur la façon de se conformer aux réglementations pertinentes.

Les principaux avantages de Compliance Wizards résident dans son approche de sécurité à plusieurs niveaux :

  • Évaluation avancée des risques : Grâce à des algorithmes d’évaluation des risques personnalisés, il est possible d’identifier plus précisément les comportements frauduleux potentiels.
  • Analyse des transactions en temps réel : Toutes les transactions sont surveillées en temps réel pour détecter rapidement les activités suspectes.
  • Conscience du contexte : La possibilité d’extraire des informations médiatiques permet une évaluation complète du profil de risque du client.
  • Rapports simplifiés : Un assistant vocal simplifie le processus de signalement et de confirmation.

Compliance Wizards est plus qu’un simple outil, c’est une solution de conformité complète qui aide les entreprises à minimiser leurs risques de fraude et à respecter les réglementations en vigueur.

Llama CCTV Operator – Troisième prix

Une équipe dirigée par Agajan Torayev a construit un opérateur de salle de contrôle Llama CCTV AI qui automatise l’identification des événements vidéo de surveillance personnalisés sans nécessiter de réglage fin du modèle. L’opérateur est capable de définir les événements vidéo en langage simple. En utilisant la compréhension d’image multimodale de Llama 4, le système capture et détecte le mouvement toutes les cinq images pour évaluer ces événements prédéfinis et les signaler à l’opérateur.

L’idée derrière Llama CCTV Operator est de doter les systèmes de surveillance d’intelligence, de leur permettre d’identifier de manière proactive les événements anormaux, au lieu de simplement enregistrer passivement des vidéos. Le système utilise les puissantes capacités de compréhension d’image de Llama 4, lui permettant d’analyser les flux vidéo en temps réel et de détecter un large éventail d’événements prédéterminés, tels que des activités suspectes, un accès non autorisé ou des risques pour la sécurité. L’opérateur peut définir ces événements en utilisant un langage simple, sans nécessiter de connaissances spécialisées en apprentissage automatique ou en vision par ordinateur.

Le système fonctionne en capturant et en analysant le mouvement toutes les cinq images, puis en utilisant les capacités multimodales de Llama 4 pour évaluer si le mouvement capturé correspond à l’un des événements prédéfinis. Si une correspondance est trouvée, le système сигнализирует immédiatement l’événement à l’opérateur, ainsi que des informations contextuelles pertinentes.

Les principaux avantages de Llama CCTV Operator sont les suivants :

  • Pas de réglage fin requis : Pas besoin de régler finement le modèle, ce qui simplifie grandement le processus de déploiement et de maintenance.
  • Détection d’événements personnalisés : L’opérateur peut définir des événements de surveillance personnalisés dans un langage simple, afin de répondre à des besoins de sécurité spécifiques.
  • Analyse en temps réel : Le système est capable d’analyser les flux vidéo en temps réel, en détectant ainsi les activités suspectes le plus rapidement possible.
  • Rapports automatisés : Le système сигнализирует автоматически les événements détectés à l’opérateur, ce qui réduit le besoin de surveillance manuelle.

Geo-ML – Meilleure utilisation de Llama API

Le géologue William Davis a utilisé Llama 4 Maverick et GemPy pour générer des sites miniers potentiels, des cartes topographiques et des modèles géologiques 3D des gisements minéraux. Geo-ML fonctionne en traitant 400 pages de rapports géologiques, en consolidant les informations dans un langage structuré spécifique au domaine géologique, puis en l’utilisant pour générer une représentation 3D de la géologie souterraine.

"C’est la première fois que j’utilise réellement l’API LLM pour extraire du texte et des images ultra-longs à partir d’articles de recherche géologique de longue haleine, j’ai donc utilisé la fenêtre de contexte ultra-longue de Llama Maverick ainsi que ses fonctionnalités multimodales textuelles et image pour extraire le texte et le traduire dans un langage propre au domaine pour donner une version condensée de tout ce qui est stocké dans le document ", a déclaré Davis. "J’ai passé la plupart de mon temps à lire des documents géologiques. Il serait formidable d’avoir un LLM qui puisse faire cela en arrière-plan pour moi."

Le géologue William Davis a ingénieusement utilisé Llama 4 Maverick et GemPy, inaugurant une toute nouvelle approche de la modélisation géologique. L’objectif de Geo-ML est d’exploiter la puissance de l’intelligence artificielle pour extraire des informations cachées de vastes rapports géologiques et de les transformer en modèles 3D utiles et faciles à comprendre.

Le système fonctionne en traitant de longs articles de recherche géologique, souvent de 400 pages ou plus, et en consolidant les informations dans un langage structuré spécifique au domaine de la géologie. Ce langage capture les principales caractéristiques géologiques, les structures et les gisements de minéraux décrits dans les rapports. Ensuite, le système используетce langage pour générer une représentation 3D de la géologie souterraine, ce qui aide les géologues à visualiser et à analyser plus facilement l’environnement souterrain.

Davis lui-même a souligné l’importance de la longue fenêtre de contexte de Llama 4 Maverick et de ses capacités multimodales pour rendre Geo-ML possible. La longue fenêtre de contexte permet au système de traiter des articles de recherche entiers simultanément, tandis que les capacités multimodales lui permettent d’extraire à la fois du texte et des images des documents.

Les principaux avantages de Geo-ML résident dans sa capacité à :

  • Automatiser la modélisation géologique : Automatise le processus de modélisation géologique, réduisant ainsi le temps et les efforts consacrés à l’analyse manuelle.
  • Extraire des informations cachées : Extraire des informations cachées d’une grande quantité de rapports géologiques, ce qui aide les géologues à découvrir des sites miniers et des gisements minéraux potentiels.
  • Générer des modèles 3D : Générer une représentation 3D de la géologie souterraine, ce qui aide les géologues à visualiser et à analyser plus facilement l’environnement souterrain.
  • Accélérer la recherche géologique : En accélérant le processus de modélisation géologique, on accélère ainsi le processus de recherche géologique.

Mention spéciale : Team Concierge

Un finaliste appelé Concierge s’est démarqué de la concurrence en apportant ses propres GPU au concours.

"Nous pensons que le meilleur aspect de Llama 4 Maverick est sa nature d’expert éparpillé et sa disponibilité en open source, ce qui permet un réglage fin", a déclaré l’équipe. "Meta a publié récemment un excellent outil de réglage fin, à savoir un outil sur GitHub. En utilisant Llama API, nous avons compilé des données de plusieurs sources pour créer des ensembles de données QA et affiner le modèle Llama 4 Maverick. Nous prévoyons de le soumettre à des tests de référence ouverts, car il nous manque actuellement un encodeur Llama 4 et, avec une fenêtre de contexte de 1M, il devrait faire exception."

L’approche unique de Concierge réside dans son attention à l’affinement du modèle Llama 4 Maverick afin d’améliorer ses performances dans des tâches spécifiques. L’équipe estime que la nature d’expert éparpillé de Llama 4 Maverick, combinée à sa disponibilité en open source, en fait un candidat idéal pour l’affinement.

Pour affiner le modèle, l’équipe a compilé des données provenant de plusieurs sources pour créer des ensembles de données QA. Ensuite, ils ont utilisé l’outil d’affinage de Meta pour entraîner le modèle. L’équipe планирует de soumettre le modèle affiné à des tests de référence ouverts pour évaluer ses performances.

Regarder les démos des finalistes

Vous pouvez regarder les démos des finalistes sur YouTube.

Joignez-vous au prochain Llama Hackathon

Les développeurs peuvent s’inscrire au prochain Llama Hackathon qui se tiendra à New York du 31 mai au 1er juin 2025.