El LlamaCon Hackathon, un evento cúspide de IA que reunió a desarrolladores de todo el mundo, concluyó exitosamente en San Francisco. Este evento atrajo a más de 600 inscritos, culminando con 238 desarrolladores e innovadores talentosos que convergieron para un día intenso de creación de proyectos. El desafío consistió en construir un proyecto demostrable en tan solo 24 horas, utilizando Llama API, Llama 4 Scout o Llama 4 Maverick, o cualquier combinación de estas herramientas de vanguardia.
La competencia ofreció sustanciosos premios, con un total de $35,000 en recompensas en efectivo, incluyendo premios de primer, segundo y tercer lugar, así como un premio a la Mejor Utilización de Llama API. Un panel de jueces de Meta y socios patrocinadores evaluó minuciosamente los 44 proyectos presentados.
Extendemos nuestro sincero agradecimiento a nuestros socios Groq, Crew AI, Tavus, Lambda, Nebius y SambaNova por su valioso apoyo durante todo el hackathon. Cada patrocinador proporcionó créditos de uso, talleres de oradores expertos, tutoría, stands de preguntas y respuestas en el sitio, jueces y soporte remoto en Discord.
Lista de Ganadores
Después de dos rondas de juicio, seleccionamos los seis mejores proyectos de las 44 presentaciones, culminando con la selección del primero, segundo y tercer lugar, así como el premio a la Mejor Utilización de Llama API.
OrgLens – Primer Premio
OrgLens ha creado un sistema de coincidencia de expertos impulsado por IA que lo conecta con el profesional adecuado dentro de su organización. Al analizar información de una variedad de fuentes, incluidas tareas de Jira, código y problemas de GitHub, documentación interna y currículums, OrgLens crea un gráfico de conocimiento integral y perfiles detallados para cada contribuyente. Esto le permite buscar expertos con capacidades avanzadas impulsadas por IA e incluso interactuar con gemelos digitales de individuos para hacer preguntas antes de comunicarse. Para demostrar su funcionalidad, se construyó una aplicación web de demostración utilizando React, Tailwind y Django, aprovechando GitHub API y Llama API para procesar y almacenar datos. OrgLens simplifica la coincidencia de expertos, haciendo que encontrar a las personas adecuadas para el trabajo sea más fácil que nunca.
Profundizando en la innovación de OrgLens, se revela que es mucho más que un simple sistema de emparejamiento de expertos; es un acelerador del intercambio de conocimientos y la colaboración dentro de una empresa. Utiliza ingeniosamente el poder de la inteligencia artificial para romper los silos de información, conectando la experiencia que se encuentra oculta en cada rincón de la organización. Imagina que cuando te enfrentas a un problema en un proyecto complejo, ya no necesitas buscar sin rumbo en correos electrónicos y documentos internos, sino que, a través de OrgLens, puedes encontrar rápidamente a colegas que tengan la experiencia y las habilidades relevantes, e incluso interactuar directamente con su “gemelo digital” para una comunicación preliminar. Sin duda, esto aumentará enormemente la eficiencia del trabajo y la velocidad de resolución de problemas. La principal ventaja de OrgLens radica en su capacidad para profundizar en los datos y analizarlos. No solo puede extraer datos de plataformas como Jira y GitHub, sino que también puede analizar documentos internos y currículums para construir un gráfico de conocimiento completo. Este gráfico de conocimiento no solo contiene las habilidades y la experiencia de los empleados, sino que también registra sus contribuciones e interacciones en diferentes proyectos. A través de este gráfico de conocimiento, OrgLens puede identificar con precisión al experto más adecuado para una tarea específica y recomendarlo a las personas que necesiten ayuda. Además, OrgLens también se centra en la experiencia del usuario. Proporciona una interfaz web intuitiva y fácil de usar, donde los usuarios pueden buscar por palabras clave o utilizar filtros avanzados para encontrar al experto adecuado. Además, la función de “gemelo digital” permite a los usuarios hacer preguntas preliminares y obtener respuestas rápidas, ahorrando tiempo tanto al experto como al solicitante. Al integrar la inteligencia artificial en el proceso de emparejamiento de expertos, OrgLens tiene el potencial de revolucionar la forma en que las empresas gestionan y utilizan sus recursos de talento interno, lo que conduce a una mejor colaboración, innovación y rendimiento general.
El éxito de OrgLens radica en su solución a los problemas universales de gestión del conocimiento dentro de las empresas. Muchas empresas se enfrentan al problema de la dispersión de las habilidades de los empleados y la dificultad para acceder a la información, lo que provoca un desperdicio de recursos y una baja eficiencia. Al automatizar el proceso de emparejamiento de expertos, OrgLens resuelve eficazmente este problema y aporta importantes ventajas a las empresas:
- Aumenta la productividad: Los empleados pueden encontrar la ayuda que necesitan más rápidamente, lo que acelera el progreso del proyecto.
- Fomenta la innovación: Al conectar a expertos de diferentes campos, puede generar nuevas ideas y soluciones.
- Optimiza la utilización de los recursos: Evita la duplicación del trabajo y el desperdicio de recursos, aumentando la eficiencia general.
- Mejora el compromiso de los empleados: Facilita a los empleados compartir conocimientos y experiencia, lo que mejora su compromiso y sentido de pertenencia.
Compliance Wizards – Segundo Premio
Compliance Wizards creó un analizador de transacciones impulsado por IA para detectar fraudes y alertar a los usuarios según los algoritmos de evaluación de riesgos personalizados. Las notificaciones por correo electrónico se envían a los usuarios para que informen o confirmen las transacciones. Luego, los usuarios pueden informar y confirmar con un asistente de voz de IA. Usando la multimodalidad de Llama API, los evaluadores de fraude pueden cargar información del cliente y buscar noticias relevantes sobre sus clientes para ayudar a determinar si un cliente está involucrado en alguna actividad criminal digna de mención.
Compliance Wizards creó un analizador de transacciones impulsado por inteligencia artificial diseñado para identificar actividades sospechosas y alertar a los usuarios mediante algoritmos complejos de evaluación de riesgos. Este sistema funciona enviando notificaciones por correo electrónico a los usuarios, instándolos a revisar y confirmar ciertas transacciones. Luego, los usuarios pueden interactuar con un asistente de voz impulsado por IA para informar las transacciones o confirmar su legitimidad. Al aprovechar las capacidades multimodo de Llama API, los evaluadores de fraude pueden cargar información del cliente y buscar noticias relevantes para ayudar a determinar si un cliente está involucrado en alguna actividad criminal digna de mención.
El núcleo de Compliance Wizards radica en su potente motor de IA, capaz de analizar profundamente los datos de las transacciones, identificando patrones de fraude potenciales. El motor no solo detecta las formas tradicionales de fraude, sino que también lleva a cabo evaluaciones de riesgo personalizadas basadas en el perfil de riesgo específico del cliente, lo que mejora la precisión de la detección de fraude. Además, Compliance Wizards incorpora una función de búsqueda de noticias, permitiendo a los evaluadores de fraude recopilar rápidamente información relevante sobre sus clientes, como menciones en los medios y registros legales. Esta información contextual puede ser crucial para evaluar el perfil de riesgo general del cliente e identificar posibles señales de alerta.
El asistente de voz impulsado por IA es otro componente clave de Compliance Wizards. Proporciona a los usuarios una forma cómoda y eficiente de informar y reconocer las transacciones, especialmente cuando están en movimiento. El asistente de voz también puede responder preguntas sobre las transacciones y proporcionar orientación sobre cómo cumplir con las normativas pertinentes.
Las principales ventajas de Compliance Wizards radican en su método de seguridad multicapa:
- Evaluación de riesgos avanzada: Los algoritmos de evaluación de riesgos personalizados permiten identificar con mayor precisión posibles fraudes.
- Análisis de transacciones en tiempo real: Supervisa todas las transacciones en tiempo real para detectar actividades sospechosas de forma oportuna.
- Conciencia del contexto: Puede extraer información de noticias para evaluar exhaustivamente el perfil de riesgo del cliente.
- Informes cómodos: Proporciona un asistente de voz que simplifica el proceso de presentación de informes y confirmación.
Compliance Wizards es más que una herramienta; es una solución de cumplimiento integral que ayuda a las empresas a minimizar el riesgo de fraude y a cumplir con las normativas pertinentes.
Llama CCTV Operator – Tercer Premio
Un equipo liderado por Agajan Torayev construyó un operador de sala de control de IA de CCTV de Llama que identifica automáticamente eventos de video de vigilancia personalizados sin necesidad de ajustar ningún modelo. El operador puede definir eventos de video en lenguaje sencillo. Utilizando la comprensión de imágenes multimodal de Llama 4, el sistema captura y detecta movimiento cada cinco fotogramas para evaluar estos eventos predefinidos e informarlos al operador.
La idea detrás de Llama CCTV Operator es dotar a los sistemas de vigilancia de inteligencia, permitiéndoles identificar de forma proactiva eventos anómalos, en lugar de simplemente grabar video de forma pasiva. El sistema utiliza las potentes capacidades de comprensión de imágenes de Llama 4, permitiendo analizar transmisiones de video en tiempo real y detectar una amplia gama de eventos predeterminados, como actividades sospechosas, acceso no autorizado o riesgos para la seguridad. El operador puede definir estos eventos utilizando un lenguaje sencillo, sin necesidad de conocimientos especializados sobre aprendizaje automático o visión por ordenador.
El sistema funciona capturando y analizando el movimiento cada cinco fotogramas, y luego utilizando las capacidades multimodales de Llama 4 para evaluar si el movimiento capturado coincide con alguno de los eventos predefinidos. Si se encuentra una coincidencia, el sistema informará inmediatamente del evento al operador, junto con información contextual relevante.
Las principales ventajas del operador de CCTV de Llama son:
- Sin necesidad de ajuste fino: No es necesario ajustar el modelo, lo que simplifica enormemente el proceso de despliegue y mantenimiento.
- Detección de eventos personalizados: El operador puede definir eventos de vigilancia personalizados utilizando un lenguaje sencillo, satisfaciendo así las necesidades de seguridad específicas.
- Análisis en tiempo real: El sistema puede analizar la alimentación de video en tiempo real, detectando así la actividad sospechosa lo antes posible.
- Informes automatizados: El sistema informa automáticamente de los eventos detectados al operador, reduciendo así la necesidad de supervisión manual.
Geo-ML – Mejor Uso de Llama API
El geólogo William Davis utiliza Llama 4 Maverick y GemPy para generar posibles sitios de excavación, mapas topográficos y modelos geológicos 3D de depósitos minerales. Geo-ML funciona procesando informes geológicos de 400 páginas, consolidando la información en un lenguaje específico del dominio geológico estructurado y luego usándolo para generar representaciones 3D de la geología subterránea.
“Esta es la primera vez que realmente uso una API de LLM para extraer texto e imágenes ultralargos de largos trabajos de investigación geológica, por lo que aproveché la ventana de contexto ultralarga de Llama Maverick, junto con las capacidades multimodales de texto e imagen para extraer texto y convertirlo en un lenguaje específico del dominio dando una versión comprimida de todo lo que está almacenado en el documento”, dijo Davis. “Paso la mayor parte de mi tiempo leyendo documentos geológicos. Sería genial tener un LLM que simplemente haga eso por mí en segundo plano”.
El geólogo William Davis utiliza hábilmente Llama 4 Maverick y GemPy, iniciando un método completamente nuevo de modelado geológico. El objetivo de Geo-ML es aprovechar el poder de la inteligencia artificial para extraer información oculta de extensos informes geológicos y transformarla en modelos 3D útiles y fáciles de entender.
El sistema funciona procesando extensos documentos de investigación geológica, a menudo de 400 páginas o más, y consolidando la información en un lenguaje estructurado específico del dominio de la geología. Este lenguaje captura las características geológicas clave, las estructuras y los depósitos minerales que se describen en los informes. A continuación, el sistema utiliza este lenguaje para generar representaciones 3D de la geología subterránea, ayudando a los geólogos a visualizar y analizar más fácilmente el entorno subterráneo.
Davis mismo enfatizó la importancia de la larga ventana de contexto y las capacidades multimodales de Llama 4 Maverick para hacer posible Geo-ML. La larga ventana de contexto permite al sistema procesar trabajos de investigación completos de una sola vez, mientras que las capacidades multimodales le permiten extraer tanto texto como imágenes de los documentos.
Las principales ventajas de Geo-ML son su capacidad para:
- Automatizar el modelado geológico: Automatiza el proceso de modelado geológico, reduciendo el tiempo y el esfuerzo de análisis manual.
- Extraer información oculta: Extrae información oculta de extensos informes geológicos, ayudando a los geólogos a descubrir posibles sitios de excavación y depósitos minerales.
- Generar modelos 3D: Genera representaciones 3D de la geología subterránea, ayudando a los geólogos a visualizar y analizar más fácilmente el entorno subterráneo.
- Acelerar la investigación geológica: Acelera el proceso de investigación geológica al acelerar el proceso de modelado geológico.
Mención Especial: Equipo Concierge
Un finalista llamado Concierge sobresale en la competencia por traer su propio GPU a la competencia.
“Creemos que lo mejor de Llama 4 Maverick es su naturaleza de mezcla dispersa de expertos y disponibilidad de código abierto, lo que permite el ajuste fino”, dijo el equipo. “Meta ha publicado recientemente una excelente herramienta de ajuste fino, que es una herramienta en GitHub. Usando Llama API, compilamos datos de múltiples fuentes para crear conjuntos de datos de control de calidad y ajustamos el modelo Llama 4 Maverick. Planeamos enviarlo a pruebas comparativas abiertas porque actualmente nos falta un codificador de Llama 4 y, con una ventana de contexto de 1M, esperamos que sea excepcional”.
El enfoque único de Concierge radica en su enfoque en el ajuste fino del modelo Llama 4 Maverick para mejorar su rendimiento en tareas específicas. El equipo creía que la dispersa mezcla de la naturaleza experta de Llama 4 Maverick, combinada con su disponibilidad de código abierto, lo convertía en un candidato ideal para el ajuste fino.
Para ajustar el modelo, el equipo compiló datos de múltiples fuentes para crear conjuntos de datos de control de calidad. Luego, usaron la herramienta de ajuste fino de Meta para entrenar el modelo. El equipo planea enviar el modelo ajustado a pruebas comparativas abiertas para evaluar su rendimiento.
Ver las demostraciones de los finalistas
Puede ver las demostraciones de los finalistas en YouTube.
Únase al próximo Hackathon de Llama
Los desarrolladores pueden postularse para el próximo Hackathon de Llama, que tendrá lugar del 31 de mayo al 1 de junio de 2025 en la ciudad de Nueva York.