LlamaConハッカソン:受賞者発表!

サンフランシスコで開催されたLlamaCon Hackathonの第1回大会が成功裏に終了しました。このイベントは、世界中の開発者が集まるAIの祭典となりました。600人以上が登録し、最終的には238人の才能ある開発者とイノベーターが集まり、1日かけてプロジェクトを構築しました。課題は、わずか24時間以内に、Llama API、Llama 4 Scout、またはLlama 4 Maverick(あるいはこれらの最先端ツールを任意に組み合わせたもの)を使用して、デモンストレーション可能なプロジェクトを作成することでした。

競技には総額35,000ドルの賞金が授与され、1位、2位、3位の賞金のほか、Llama APIの最優秀使用賞が含まれていました。Metaおよびスポンサーパートナーからの審査員は、提出された44のプロジェクトを注意深く評価しました。

Groq、Crew AI、Tavus、Lambda、Nebius、SambaNovaの各パートナーには、ハッカソン全体を通じて貴重なサポートを提供していただき、心から感謝申し上げます。各スポンサーは、クレジットの利用、専門家による講演者によるワークショップ、指導、ライブQ&Aブース、審査員、およびDiscordでのリモートサポートを提供しました。

受賞者リスト

2回の審査を経て、44件の応募の中から上位6件が選ばれ、最終的に1位、2位、3位、Llama APIの最優秀使用賞が決定されました。

OrgLens – 一等賞

OrgLensは、組織内の適切な専門家とつながることができるAI対応のエキスパートマッチングシステムを作成しました。Jiraタスク、GitHubコードと問題、内部ドキュメント、履歴書など、さまざまなソースからのデータを分析することにより、OrgLensは各コントリビューターの包括的なナレッジグラフと詳細なプロファイルを作成します。これにより、高度なAI対応の検索機能を使用して専門家を検索したり、個人のデジタルツインと対話して、連絡を取る前に質問したりすることができます。その機能を示すために、React、Tailwind、Djangoを使用してデモWebアプリケーションが構築され、GitHub APIとLlama APIを利用してデータの処理と保存を行いました。OrgLensは、専門家とのマッチングを効率化し、仕事に適した人材を簡単に見つけられるようにします。

OrgLensの革新的な側面について深く掘り下げてみましょう。これは単なる専門家マッチングシステムではなく、企業内の知識共有とコラボレーションの加速器なのです。人工知能の力を巧みに活用し、情報の孤立を打破し、組織の隅々に隠された専門知識を結びつけます。複雑なプロジェクトで難題に直面したとき、内部メールやドキュメントを漫然と検索する必要はなく、OrgLensを通じて、関連する経験やスキルを持つ同僚を迅速に見つけ、彼らの「デジタルツイン」と最初の情報を交換できることを想像してみてください。これにより、作業効率と問題解決のスピードが飛躍的に向上します。OrgLensのコアな強みは、データの詳細なマイニングと分析能力です。JiraやGitHubなどのプラットフォームからデータを取得できるだけでなく、内部ドキュメントや履歴書も分析できるため、包括的なナレッジグラフを構築できます。このナレッジグラフには、従業員のスキルと経験だけでなく、さまざまなプロジェクトでの貢献度ややり取りも記録されます。このナレッジグラフを通じて、OrgLensは特定のタスクに最適な専門家を正確に識別し、支援を必要とするユーザーに推奨できます。さらに、OrgLensはユーザーエクスペリエンスにも重点を置いています。直感的で使いやすいWebインターフェイスを提供し、ユーザーはキーワード検索を使用하거나、高度なフィルターを使用して適切な専門家を見つけることができます。さらに、「デジタルツイン」機能を使用すると、ユーザーは予備的な質問をしたり、すぐに回答を得たりできるため、専門家と検索者の両方の時間を節約できます。人工知能をエキスパートマッチングプロセスに統合することで、OrgLensは企業が社内の人材リソースを管理および活用する方法に革命を起こし、コラボレーション、イノベーション、および全体的なパフォーマンスの向上につながる可能性を秘めています。

OrgLensの成功の鍵は、企業内部で普遍的に存在する知識管理の問題を解決したことです。多くの企業が従業員のスキルの分散や情報へのアクセスの困難さに直面しており、リソースの無駄や非効率につながっています。OrgLensは、専門家とのマッチングプロセスを自動化することにより、この問題を効果的に解決し、企業に次のような顕著なメリットをもたらします。

  • 生産性の向上: 従業員は必要な支援をより迅速に見つけ、プロジェクトの進捗を加速できます。
  • イノベーションの促進: さまざまな分野の専門家をつなぐことで、新しいアイデアや解決策を刺激できます。
  • リソースの最適化: 重複した作業やリソースの無駄を回避し、全体的な効率を向上させます。
  • 従業員のエンゲージメントの強化: 従業員が知識や経験を共有しやすくすることで、エンゲージメントと所属意識を高めます。

Compliance Wizards – 二等賞

Compliance Wizardsは、詐欺を検出し、カスタムリスク評価アルゴリズムに基づいてユーザーに警告するために、AI対応のトランザクションアナライザーを作成しました。電子メール通知がユーザーに送信され、トランザクションの報告または確認を求めるプロンプトが表示されます。その後、ユーザーはAI音声アシスタントと対話して、報告と確認を行うことができます。Llama APIのマルチモーダルを使用すると、詐欺評価者は顧客情報をアップロードし、顧客に関する関連ニュースを検索して、顧客が注目すべき犯罪活動に関与しているかどうかを判断できます。

コンプライアンス規制当局は、複雑なリスク評価アルゴリズムを通じて疑わしい活動を特定し、ユーザーに警告するように設計されたAI対応のトランザクションアナライザーを作成しました。このシステムは、特定のトランザクションのレビューと確認を求めるプロンプトとともに、電子メール通知をユーザーに送信することによって機能します。その後、ユーザーはAI駆動の音声アシスタントと対話して、トランザクションを報告したり、その正当性を確認したりできます。Llama APIのマルチモーダル機能を活用することで、詐欺評価者は顧客情報をアップロードし、関連ニュースを検索して、顧客が注目すべき犯罪活動に関与しているかどうかを判断できます。

Compliance Wizardsの中核は、トランザクションデータを深く分析し、潜在的な不正パターンを識別できる強力なAIエンジンにあります。このエンジンは、従来の不正行為を検出できるだけでなく、顧客の特定のリスク状況に基づいてカスタマイズされたリスク評価を実行できるため、不正検出の精度が向上します。さらに、Compliance Wizardsはニュース検索機能も統合しており、 fraud assessors to quickly gather relevant information about their clients, such as media mentions and legal records. This contextual information can be crucial in assessing the overall risk profile of the client and identifying potential red flags.

The AI-powered voice assistant is another key component of Compliance Wizards. It provides users with a convenient and efficient way to report and acknowledge transactions, especially when they are on the go. The voice assistant can also answer questions about the transactions and provide guidance on how to comply with relevant regulations.

Compliance Wizardsの主な利点は、多層的なセキュリティアプローチにあります。

  • 高度なリスク評価: カスタマイズされたリスク評価アルゴリズムを通じて、潜在的な不正行為をより正確に識別できます。
  • リアルタイムトランザクション分析: すべてのトランザクションをリアルタイムで監視し、疑わしいアクティビティをタイムリーに検出します。
  • 状況認識: ニュース情報を取得して、顧客のリスク状況を包括的に評価できます。
  • 便利なreporting: 音声アシスタントを提供し、報告および確認プロセスを簡素化します。

Compliance Wizardsは単なるツールではなく、企業が不正リスクを最小限に抑え、関連する規制を遵守できるようにする包括的なコンプライアンスソリューションです。

Llama CCTV Operator – 三等賞

Agajan Torayevが率いるチームは、モデルの微調整を必要とせずに、カスタム監視ビデオイベントを自動的に識別するLlama CCTV AIコントロールルームオペレーターを構築しました。オペレーターは、簡単な言語でビデオイベントを定義できます。Llama 4のマルチモーダル画像理解を使用すると、システムは5フレームごとにモーションをキャプチャして検出し、これらの事前定義されたイベントを評価してオペレーターに報告します。

Llama CCTV Operatorの背後にあるコンセプトは、監視システムにインテリジェンスを与え、単にビデオを受動的に記録するのではなく、異常なイベントを積極的に識別できるようにすることです。このシステムは、Llama 4の強力な画像理解能力を利用して、 to analyze video feeds in real-time and detect a wide range of predetermined events, such as suspicious activity, unauthorized access, or safety hazards. The operator can define these events using simple language, without requiring any specialized knowledge of machine learning or computer vision.

The system works by capturing and analyzing motion every five frames, and then using Llama 4’s multimodal capabilities to assess whether the captured motion matches any of the predefined events. If a match is found, the system will immediately report the event to the operator, along with relevant contextual information.

Llama CCTV Operatorの主な利点は次のとおりです。

  • 微調整不要: モデルの微調整が不要であるため、デプロイとメンテナンスのプロセスが大幅に簡素化されます。
  • カスタムイベント検出: オペレーターは簡単な言語を使用してカスタム監視イベントを定義できるため、特定のセキュリティニーズに対応できます。
  • リアルタイム分析: システムはビデオフィードをリアルタイムで分析できるため、疑わしいアクティビティをできるだけ早く検出できます。
  • 自動報告: システムは検出されたイベントをオペレーターに自動的に報告するため、手動監視の必要性が軽減されます。

Geo-ML – Llama API のベスト活用

地質学者のWilliam Davisは、Llama 4 MaverickとGemPyを使用して、採掘場所、地形図、鉱床の可能性のある3D地質モデルを生成しました。Geo-MLは、400ページに及ぶ地質報告書を処理し、情報を構造化された地質分野固有の言語に統合し、それを使用して地下地質の3D表現を生成するという仕組みです。

「これは、LLM APIを使用して長編の地質研究論文から超長文のテキストや画像を抽出する初めての試みでした。そのため、Llama Maverickの超長文のコンテキストウィンドウと、テキストおよび画像のマルチモーダル機能を使用してテキストを抽出し、ドメイン固有の言語に変換しました。これにより、ドキュメントに保存されているすべてのコンテンツの圧縮バージョンが得られます」とDavis氏は述べています。「私はほとんどの時間を地質ドキュメントの読解に費やしています。バックグラウンドでこの作業を代わりに行ってくれるLLMがあれば、非常に素晴らしいでしょう。」

地質学者のウィリアム・デイビス(William Davis)は、Llama 4 MaverickとGemPyを巧みに活用し、地質モデリングのまったく新しい方法を切り開きました。Geo-MLの目標は、人工知能の力を利用して、大量の地質報告書から隠された情報を抽出し、有用でわかりやすい3Dモデルに変換することです。

The system works by processing long geological research papers, often 400 pages or more, and consolidating the information into a structured geology domain-specific language. This language captures the key geological features, structures, and mineral deposits described in the reports. Then, the Система 使用这种语言来生成地下地质的 3D 表示,帮助地质学家更容易地 visualizar 和 análisis 地下环境。

Davis himself emphasized the importance of Llama 4 Maverick’s long context window and multimodal capabilities in making Geo-ML possible. The long context window allows the system to process entire research papers at once, while the multimodal capabilities enable it to extract both text and images from the documents.

Geo-MLの主な利点は、次のことができることです。

  • 地質モデリングの自動化: 地質モデリングプロセスを自動化し、手動分析の時間と労力を削減します。
  • 隠された情報の抽出: 大量の地質報告書から隠された情報を抽出し、地質学者が採掘場所や鉱床の可能性を発見するのを支援します。
  • 3Dモデルの生成: 地下地質の3D表現を生成し、地質学者が地下環境をより簡単に視覚化して分析するのを支援します。
  • 地質研究の加速: 地質モデリングプロセスを加速することで、地質研究のプロセスを加速します。

特別表彰:チームコンシェルジュ

Conciergeという名前の決勝進出者の1人は、独自のGPUを持参して競技に参加し、競争の中で際立っていました。

「Llama 4 Maverickの一番良い点は、その疎な専門家の混合性質と、オープンソースで利用できるため微調整が可能になることだと考えています」と同チームは述べています。「Metaは最近、優れた微調整ツール、つまりGitHubのツールをリリースしました。Llama APIを使用して、複数のソースからデータをコンパイルしてQAデータセットを作成し、Llama 4 Maverickモデルを微調整しました。現在Llama 4エンコーダがないため、オープンベンチマークに提出する予定です。1Mのコンテキストウィンドウがあれば、例外となることが期待されます。」

Conciergeの独自のアプローチは、特定のタスクでのパフォーマンスを向上させるために、Llama 4 Maverickモデルの微調整に焦点を当てていることです. The team believed that the sparse mixture of experts nature of Llama 4 Maverick, combined with its open source availability, made it an ideal candidate for fine-tuning.

To fine-tune the model, the team compiled data from multiple sources to create QA datasets. Then, they used Meta’s fine-tuning tool to train the model. The team планирует to submit the fine-tuned model to open benchmarks to evaluate its performance.

決勝進出者のデモを見る

決勝進出者のデモはYouTubeで見ることができます。

次のLlamaハッカソンに参加する

開発者は、2025年5月31日から6月1日までニューヨーク市で開催される次のLlamaハッカソンに申し込むことができます。
```