LlamaCon Hackathon, một sự kiện AI quy tụ các nhà phát triển từ khắp nơi trên thế giới, đã kết thúc thành công rực rỡ tại San Francisco. Sự kiện này đã thu hút hơn 600 người đăng ký, và cuối cùng có 238 nhà phát triển và nhà sáng tạo tài năng đã cùng nhau tham gia xây dựng dự án trong một ngày. Thử thách đặt ra là trong vòng 24 giờ ngắn ngủi, các đội phải sử dụng Llama API, Llama 4 Scout hoặc Llama 4 Maverick (hoặc bất kỳ sự kết hợp nào của các công cụ tiên tiến này) để tạo ra một dự án có thể trình diễn.
Giải thưởng của cuộc thi rất hấp dẫn, với tổng giá trị tiền mặt lên tới 35.000 đô la Mỹ, bao gồm giải nhất, giải nhì và giải ba, cũng như giải thưởng dành cho dự án sử dụng Llama API tốt nhất. Hội đồng giám khảo đến từ Meta và các đối tác tài trợ đã đánh giá cẩn thận 44 dự án được gửi.
Chúng tôi xin chân thành cảm ơn các đối tác Groq, Crew AI, Tavus, Lambda, Nebius và SambaNova vì sự hỗ trợ quý báu của họ trong suốt cuộc thi hackathon. Mỗi nhà tài trợ đã cung cấp tín dụng sử dụng, hội thảo từ các diễn giả chuyên gia, hướng dẫn, gian hàng hỏi đáp trực tiếp, ban giám khảo và hỗ trợ từ xa trên Discord.
Danh sách người chiến thắng
Sau hai vòng đánh giá, chúng tôi đã chọn ra sáu dự án hàng đầu từ 44 dự án được gửi, và cuối cùng đã quyết định người chiến thắng ở vị trí thứ nhất, thứ hai, thứ ba và giải thưởng cho dự án sử dụng Llama API tốt nhất.
OrgLens – Giải nhất
OrgLens tạo ra một hệ thống kết nối chuyên gia hỗ trợ bởi AI, có thể kết nối bạn với các chuyên gia phù hợp trong tổ chức của bạn. Bằng cách phân tích dữ liệu từ nhiều nguồn khác nhau, bao gồm các nhiệm vụ Jira, mã và vấn đề GitHub, tài liệu nội bộ và sơ yếu lý lịch, OrgLens tạo ra đồ thị tri thức toàn diện và hồ sơ chi tiết cho từng người đóng góp. Điều này cho phép bạn sử dụng các chức năng tìm kiếm hỗ trợ bởi AI tiên tiến để tìm kiếm các chuyên gia, thậm chí tương tác với bản sao kỹ thuật số của một cá nhân để đặt câu hỏi trước khi liên hệ. Để giới thiệu các chức năng của mình, OrgLens đã xây dựng một ứng dụng web demo bằng cách sử dụng React, Tailwind và Django, tận dụng GitHub API và Llama API để xử lý và lưu trữ dữ liệu. OrgLens đơn giản hóa việc kết nối chuyên gia, giúp bạn dễ dàng tìm được người phù hợp cho công việc.
Tìm hiểu sâu hơn về sự đổi mới của OrgLens, nó không chỉ là một hệ thống kết nối chuyên gia, mà còn là một công cụ tăng tốc khả năng chia sẻ kiến thức và cộng tác trong doanh nghiệp. Nó khéo léo sử dụng sức mạnh của trí tuệ nhân tạo, phá vỡ các silo thông tin và kết nối các chuyên môn ẩn chứa trong mọi ngóc ngách của tổ chức. Hãy tưởng tượng rằng khi bạn gặp khó khăn trong một dự án phức tạp, bạn không còn cần phải tìm kiếm một cách vô vọng trong các email và tài liệu nội bộ, mà thông qua OrgLens, bạn có thể nhanh chóng tìm thấy những đồng nghiệp có kinh nghiệm và kỹ năng liên quan, đồng thời trực tiếp tương tác với "bản sao kỹ thuật số" của họ để có được giao tiếp sơ bộ. Điều này chắc chắn sẽ cải thiện đáng kể hiệu quả công việc và tốc độ giải quyết vấn đề. Ưu điểm cốt lõi của OrgLens nằm ở khả năng khai thác và phân tích dữ liệu chuyên sâu. Nó không chỉ có thể thu thập dữ liệu từ các nền tảng như Jira, GitHub, mà còn có thể phân tích các tài liệu nội bộ và sơ yếu lý lịch, để xây dựng một đồ thị tri thức toàn diện. Đồ thị tri thức này không chỉ chứa các kỹ năng và kinh nghiệm của nhân viên, mà còn ghi lại những đóng góp và tương tác của họ trong các dự án khác nhau. Thông qua đồ thị tri thức này, OrgLens có thể xác định chính xác các chuyên gia phù hợp nhất cho một nhiệm vụ cụ thể và đề xuất họ cho những người cần giúp đỡ. Ngoài ra, OrgLens còn chú trọng đến trải nghiệm người dùng. Nó cung cấp giao diện web trực quan và dễ sử dụng, người dùng có thể tìm kiếm bằng các từ khóa hoặc sử dụng các bộ lọc nâng cao để tìm chuyên gia phù hợp. Hơn nữa, tính năng "bản sao kỹ thuật số" cho phép người dùng đặt câu hỏi sơ bộ và nhận câu trả lời nhanh chóng, tiết kiệm thời gian cho cả chuyên gia và người tìm kiếm. Bằng cách tích hợp trí tuệ nhân tạo vào quy trình kết nối chuyên gia, OrgLens có tiềm năng cách mạng hóa cách các công ty quản lý và sử dụng tài nguyên nhân tài nội bộ của họ, dẫn đến sự hợp tác, đổi mới và hiệu suất tổng thể được cải thiện.
Sự thành công của OrgLens nằm ở việc nó giải quyết vấn đề quản lý tri thức phổ biến trong các doanh nghiệp. Nhiều công ty phải đối mặt với vấn đề kỹ năng của nhân viên bị phân tán, và thông tin khó tiếp cận, dẫn đến lãng phí tài nguyên và hiệu quả thấp. Bằng cách tự động hóa quy trình kết nối chuyên gia, OrgLens giải quyết hiệu quả vấn đề này, mang lại những lợi ích đáng kể sau cho doanh nghiệp:
- Cải thiện năng suất: Nhân viên có thể tìm thấy sự giúp đỡ cần thiết nhanh hơn, do đó đẩy nhanh tiến độ dự án.
- Thúc đẩy sự đổi mới: Bằng cách kết nối các chuyên gia từ các lĩnh vực khác nhau, có thể kích thích những ý tưởng và giải pháp mới.
- Tối ưu hóa việc sử dụng tài nguyên: Tránh sự trùng lặp trong công việc và lãng phí tài nguyên, cải thiện hiệu quả tổng thể.
- Tăng cường sự tham gia của nhân viên: Giúp nhân viên dễ dàng chia sẻ kiến thức và kinh nghiệm, do đó tăng cường cảm giác tham gia và thuộc về của họ.
Compliance Wizards – Giải nhì
Compliance Wizards tạo ra một công cụ phân tích giao dịch hỗ trợ bởi AI, được sử dụng để phát hiện gian lận và cảnh báo người dùng dựa trên các thuật toán đánh giá rủi ro tùy chỉnh. Thông báo qua email sẽ được gửi cho người dùng, nhắc nhở họ báo cáo hoặc xác nhận giao dịch. Sau đó, người dùng có thể thực hiện báo cáo và xác nhận bằng trợ lý giọng nói AI. Sử dụng đa phương thức của Llama API, người đánh giá gian lận có thể tải lên thông tin khách hàng và tìm kiếm tin tức liên quan về khách hàng của họ để giúp xác định xem khách hàng có tham gia vào bất kỳ hoạt động tội phạm đáng chú ý nào hay không.
Compliance Wizards tạo ra một công cụ phân tích giao dịch hỗ trợ bởi trí tuệ nhân tạo, được thiết kế để xác định các hoạt động đáng ngờ và gửi cảnh báo cho người dùng thông qua các thuật toán đánh giá rủi ro phức tạp. Hệ thống này hoạt động bằng cách gửi thông báo qua email cho người dùng, nhắc nhở người dùng xem xét và xác nhận một số giao dịch nhất định. Sau đó, người dùng có thể tương tác với trợ lý giọng nói được hỗ trợ bởi AI để báo cáo các giao dịch hoặc xác nhận tính hợp pháp của chúng. Bằng cách tận dụng các chức năng đa phương thức của Llama API, người đánh giá gian lận có thể tải lên thông tin khách hàng và tìm kiếm tin tức liên quan để giúp xác định xem khách hàng có tham gia vào bất kỳ hoạt động tội phạm đáng chú ý nào hay không.
Trọng tâm của Compliance Wizards nằm ở công cụ AI mạnh mẽ, có khả năng phân tích sâu dữ liệu giao dịch và xác định các mô hình gian lận tiềm ẩn. Công cụ này không chỉ có thể phát hiện các hành vi gian lận truyền thống, mà còn có thể thực hiện đánh giá rủi ro tùy chỉnh dựa trên tình trạng rủi ro cụ thể của khách hàng, do đó cải thiện tính chính xác của việc phát hiện gian lận. Ngoài ra, Compliance Wizards còn tích hợp chức năng tìm kiếm tin tức, cho phép fraud assessors to quickly gather relevant information about their clients, such as media mentions and legal records. This contextual information can be crucial in assessing the overall risk profile of the client and identifying potential red flags.
The AI-powered voice assistant is another key component of Compliance Wizards. It provides users with a convenient and efficient way to report and acknowledge transactions, especially when they are on the go. The voice assistant can also answer questions about the transactions and provide guidance on how to comply with relevant regulations.
Ưu điểm chính của Compliance Wizards nằm ở phương pháp bảo mật đa lớp:
- Đánh giá rủi ro nâng cao: Thông qua các thuật toán đánh giá rủi ro tùy chỉnh, có thể xác định chính xác hơn các hành vi gian lận tiềm ẩn.
- Phân tích giao dịch theo thời gian thực: Giám sát tất cả các giao dịch theo thời gian thực, phát hiện kịp thời các hoạt động đáng ngờ.
- Nhận biết ngữ cảnh: Có thể thu thập thông tin báo chí để đánh giá toàn diện tình trạng rủi ro của khách hàng.
- Báo cáo tiện lợi: Cung cấp trợ lý giọng nói, đơn giản hóa quy trình báo cáo và xác nhận.
Compliance Wizards không chỉ là một công cụ, mà là một giải pháp tuân thủ toàn diện, có thể giúp các công ty giảm thiểu rủi ro gian lận và tuân thủ các quy định liên quan.
Llama CCTV Operator – Giải ba
Một nhóm do Agajan Torayev dẫn đầu đã xây dựng một Llama CCTV AI Control Room Operator, có thể tự động nhận dạng các sự kiện video giám sát tùy chỉnh mà không cần tinh chỉnh mô hình. Người vận hành có thể xác định các sự kiện video bằng ngôn ngữ đơn giản. Sử dụng khả năng hiểu hình ảnh đa phương thức của Llama 4, hệ thống chụp và phát hiện chuyển động cứ sau năm khung hình để đánh giá các sự kiện được xác định trước này và báo cáo chúng cho người vận hành.
Ý tưởng đằng sau Llama CCTV Operator là trao quyền cho hệ thống giám sát, cho phép nó chủ động xác định các sự kiện bất thường, thay vì chỉ thụ động ghi lại video. Hệ thống này sử dụng khả năng hiểu hình ảnh mạnh mẽ của Llama 4, позволяющее to analyze video feeds in real-time and detect a wide range of predetermined events, such as suspicious activity, unauthorized access, or safety hazards. The operator can define these events using simple language, without requiring any specialized knowledge of machine learning or computer vision.
The system works by capturing and analyzing motion every five frames, and then using Llama 4’s multimodal capabilities to assess whether the captured motion matches any of the predefined events. If a match is found, the system will immediately report the event to the operator, along with relevant contextual information.
Ưu điểm chính của Llama CCTV Operator bao gồm:
- Không cần tinh chỉnh: Không cần thực hiện bất kỳ tinh chỉnh nào cho mô hình, giúp đơn giản hóa đáng kể quy trình triển khai và bảo trì.
- Phát hiện sự kiện tùy chỉnh: Người vận hành có thể sử dụng ngôn ngữ đơn giản để xác định các sự kiện giám sát tùy chỉnh, do đó đáp ứng các nhu cầu bảo mật cụ thể.
- Phân tích theo thời gian thực: Hệ thống có thể phân tích luồng video theo thời gian thực, do đó phát hiện hoạt động đáng ngờ càng sớm càng tốt.
- Báo cáo tự động: Hệ thống sẽ tự động báo cáo các sự kiện được phát hiện cho người vận hành, do đó giảm nhu cầu giám sát thủ công.
Geo-ML – Sử dụng tốt nhất Llama API
Nhà địa chất học William Davis đã sử dụng Llama 4 Maverick và GemPy để tạo ra các địa điểm khai thác tiềm năng, bản đồ địa hình và mô hình địa chất 3D của các mỏ khoáng sản. Geo-ML hoạt động bằng cách xử lý 400 trang báo cáo địa chất, tích hợp thông tin vào một ngôn ngữ cụ thể cho lĩnh vực địa chất có cấu trúc, sau đó sử dụng nó để tạo ra biểu diễn 3D về địa chất ngầm.
"Đây là lần đầu tiên tôi thực sự sử dụng LLM API để trích xuất văn bản và hình ảnh siêu dài từ các bài nghiên cứu địa chất dài, vì vậy tôi đã sử dụng cửa sổ ngữ cảnh siêu dài của Llama Maverick cũng như các tính năng đa phương thức văn bản và hình ảnh để trích xuất văn bản và chuyển đổi nó thành một ngôn ngữ cụ thể cho miền, từ đó đưa ra một phiên bản nén của tất cả những gì được lưu trữ trong tài liệu," Davis nói. "Tôi dành phần lớn thời gian để đọc tài liệu địa chất. Sẽ rất tuyệt nếu có một LLM có thể hoàn thành công việc này cho tôi ở chế độ nền."
Nhà địa chất học William Davis đã khéo léo sử dụng Llama 4 Maverick và GemPy, mở ra một phương pháp lập mô hình địa chất hoàn toàn mới. Mục tiêu của Geo-ML là sử dụng sức mạnh của trí tuệ nhân tạo, để trích xuất thông tin ẩn từ một lượng lớn các báo cáo địa chất và chuyển đổi nó thành các mô hình 3D hữu ích và dễ hiểu.
The system works by processing long geological research papers, often 400 pages or more, and consolidating the information into a structured geology domain-specific language. This language captures the key geological features, structures, and mineral deposits described in the reports. Then, the система 使用这种语言来生成地下地质的 3D 表示,帮助地质学家更容易地可视化和分析地下环境。
Davis himself emphasized the importance of Llama 4 Maverick’s long context window and multimodal capabilities in making Geo-ML possible. The long context window allows the system to process entire research papers at once, while the multimodal capabilities enable it to extract both text and images from the documents.
Ưu điểm chính của Geo-ML nằm ở khả năng:
- Tự động hóa lập mô hình địa chất: Tự động hóa quy trình lập mô hình địa chất, giảm thời gian và công sức phân tích thủ công.
- Trích xuất thông tin ẩn: Trích xuất thông tin ẩn từ một lượng lớn các báo cáo địa chất, giúp các nhà địa chất học khám phá các địa điểm khai thác và mỏ khoáng sản tiềm năng.
- Tạo mô hình 3D: Tạo biểu diễn 3D về địa chất ngầm, giúp các nhà địa chất học dễ dàng hình dung và phân tích môi trường ngầm.
- Đẩy nhanh nghiên cứu địa chất: Bằng cách đẩy nhanh quy trình lập mô hình địa chất, do đó đẩy nhanh tiến trình nghiên cứu địa chất.
Khen thưởng đặc biệt: Đội Concierge
Một trong những thí sinh lọt vào vòng chung kết, có tên Concierge, đã mang theo GPU của riêng họ để tham gia cuộc thi, điều này đã giúp họ nổi bật trong cuộc cạnh tranh.
"Chúng tôi tin rằng khía cạnh tốt nhất của Llama 4 Maverick là bản chất hỗn hợp chuyên gia thưa thớt và khả năng sử dụng nguồn mở, cho phép tinh chỉnh," nhóm nghiên cứu cho biết. "Meta gần đây đã phát hành một công cụ tinh chỉnh tuyệt vời, đó là công cụ trên GitHub. Với Llama API, chúng tôi đã biên dịch dữ liệu từ nhiều nguồn để tạo bộ dữ liệu QA và tinh chỉnh mô hình Llama 4 Maverick. Chúng tôi dự định gửi nó đến các tiêu chuẩn mở vì hiện tại chúng tôi đang thiếu bộ mã hóa Llama 4 và với cửa sổ ngữ cảnh 1M, nó được kỳ vọng sẽ là một ngoại lệ."
Concierge’s unique approach在于 it focuses on fine-tuning Llama 4 Maverick models, to improve their performance on specific tasks. The team believed that the sparse mixture of experts nature of Llama 4 Maverick, combined with its open source availability, made it an ideal candidate for fine-tuning.
To fine-tune the model, the team compiled data from multiple sources to create QA datasets. Then, they used Meta’s fine-tuning tool to train the model. The team планирует to submit the fine-tuned model to open benchmarks to evaluate its performance.
Xem bản trình diễn của những người lọt vào vòng chung kết
Bạn có thể xem bản trình diễn của những người lọt vào vòng chung kết trên YouTube.
Tham gia cuộc thi hackathon Llama tiếp theo của chúng tôi
Các nhà phát triển có thể đăng ký tham gia cuộc thi hackathon Llama tiếp theo, sẽ được tổ chức tại Thành phố New York từ ngày 31 tháng 5 đến ngày 1 tháng 6 năm 2025.