Meta의 AI 무기고 확장: 멀티모달 Llama 모델

Meta는 최근 Llama 인공지능(AI) 모델의 최신 버전을 공개하며 AI 혁신에 대한 지속적인 의지를 보여주었습니다. 새로운 제품 중에는 단순한 텍스트를 넘어 다양한 형태의 미디어를 처리하고 상호 작용할 수 있는 능력을 강조한 “멀티모달 모델”인 Llama 4 Scout와 Llama 4 Maverick이 있습니다.

또한 Meta는 전 세계적으로 가장 지능적인 LLM 중 하나로 자리매김하고 새로 출시된 모델의 교사 역할을 할 Llama 4 Behemoth를 예고했습니다.

이번 발표는 지난 2년간 Meta가 AI에 상당한 투자를 해왔음을 보여줍니다. CEO Mark Zuckerberg는 회사의 AI 역량을 더욱 강화하기 위해 2025년에 최대 650억 달러를 할당할 계획이라고 공개적으로 밝혔습니다. Meta의 야망은 소셜 미디어 영역을 넘어 예약 및 비디오 제작과 같은 작업을 처리하기 위해 AI 어시스턴트인 Meta AI에 대한 프리미엄 구독을 모색하는 데까지 확장됩니다.

OpenAI의 오픈 소스 노력

이와 병행하여 OpenAI는 최근의 관행에서 벗어나 LLM의 오픈 소스 버전을 출시하는 것을 고려하고 있다고 합니다. 이 조치를 통해 사용자는 라이선스 비용 없이 모델을 사용, 수정 및 배포할 수 있습니다. OpenAI는 모델의 유용성을 최적화하기 위해 개발자, 연구원 및 일반 대중의 의견을 구합니다.

오픈 소스 모델은 몇 달 안에 출시될 것으로 예상됩니다. OpenAI가 오픈 소스 원칙을 채택한 마지막 시기는 2019년 GPT-2 LLM이었습니다. 가장 최근의 LLM은 GPT-4.5입니다. OpenAI는 Microsoft로부터 10억 달러를 투자받은 후 독점 모델로 전환하여 AI 모델 개발을 발전시키기 위해 긴밀한 제휴를 맺었습니다. Microsoft는 이후 OpenAI에 130억 달러 이상을 투자했으며 OpenAI의 모델은 Microsoft의 Azure 클라우드 서비스 고객에게만 제공됩니다.

Meta의 Llama, Mistral의 LLM, DeepSeek는 최근 인기를 얻고 있는 오픈 소스 모델 중 일부입니다. Zuckerberg는 Threads에서 Llama가 10억 회 다운로드되었다고 언급했습니다. Llama는 2023년에 출시되었습니다.

Meta의 “Behemoth” AI 모델 출시 지연

그러나 Meta는 원래 여름에 출시할 예정이었던 “Behemoth”의 출시를 지연하고 있으며, 가장 빠른 출시 시점은 가을로 예상됩니다. 소식통에 따르면 모델의 진행 상황이 6월 출시를 정당화할 만큼 “상당하지” 않았으며 Meta의 개발자 컨퍼런스 이후 지연된 것입니다.

이번 지연은 Meta의 대형 언어 모델인 Llama 주력 제품군 출시에 그림자를 드리우고 있습니다. 월스트리트 저널은 출시 속도에 대해 칭찬을 받았다고 말했습니다. Llama는 소규모 기업, 비영리 단체 및 학술 기관 내 개발자가 역량을 강화하는 데 중요한 역할을 해왔습니다. OpenAI, Google 및 Amazon과 같은 회사가 제공하는 폐쇄적인 독점 모델에 대한 대안입니다.

Behemoth의 지연이 대기업에 미치는 영향은 덜 두드러집니다. 왜냐하면 대기업은 클라우드 기반 독점 모델에 의존하는 경우가 많기 때문입니다. 소규모 기업은 오픈 소스 Llama 모델을 사용자 정의할 수 있지만 Meta가 제공하지 않는 추가 배포 서비스가 필요합니다. Meta의 Llama 사용은 자체 소셜 미디어 도구를 개선하는 데 중점을 두고 있으며, Zuckerberg는 AI 궤적을 유지할 수 있습니다.

지연의 중요한 요인은 모델이 공개 출시를 보장할 만큼 충분히 상당한 개선을 보여주는지 여부에 있습니다.

혁신의 중요성

빠르게 변화하는 기술 업계에서 새로운 릴리스는 도입을 정당화하기 위해 실질적인 발전을 보여주어야 합니다. LlamaCon에서 Meta는 각각 인상적인 기능을 갖춘 두 개의 작은 Llama 4 모델을 선보였습니다.

  • Maverick은 총 4000억 개의 매개변수와 100만 개의 토큰 컨텍스트 창(75만 단어)을 자랑합니다.
  • Scout는 1090억 개의 매개변수와 1000만 개의 토큰 컨텍스트 창(750만 단어)을 특징으로 합니다.

Behemoth는 원래 2조 개의 매개변수를 통합하여 동시에 출시될 예정이었습니다.

월스트리트 저널에 따르면 Meta는 Llama 4 팀의 지속적인 AI 투자로 인해 점점 더 초조해하고 있습니다. 2024년에 회사는 주로 AI 개발에 할당된 최대 720억 달러의 자본 지출을 할당했습니다.

커지는 우려

Zuckerberg와 다른 고위 경영진은 Behemoth의 최종 출시 날짜를 아직 발표하지 않았습니다. 내부자들은 Meta의 공개 성명에서 설정한 기대치를 충족하지 못할 수 있다고 우려합니다.

소식통은 Meta의 리더십이 Llama 4 모델을 개발하는 팀의 진행 상황에 대해 점점 더 불만을 느끼고 있음을 나타냅니다. 이로 인해 AI 제품 그룹 내에서 가능한 리더십 변경에 대한 논의가 있었습니다.

Meta는 Behemoth를 특정 벤치마크에서 OpenAI, Google 및 Anthropic과 같은 경쟁사보다 뛰어난 매우 유능한 시스템으로 선전했습니다. 내부 문제는 개발에 익숙한 사람들이 주장했듯이 효율성을 저해했습니다.

OpenAI도 지연을 겪었습니다. 다음 주요 모델인 GPT-5는 원래 2024년 중반에 출시될 예정이었습니다. 월스트리트 저널은 12월에 개발이 예정보다 늦어졌다고 보도했습니다.

2월에 OpenAI CEO Sam Altman은 중간 모델이 GPT-4.5일 것이고 GPT-5는 몇 달 더 걸릴 것이라고 말했습니다.

진행이 멈춘 원인

다음과 같은 여러 요인이 AI 모델 개발의 둔화에 기여할 수 있습니다.

고품질 데이터 감소

대규모 언어 모델은 방대한 인터넷처럼 방대한 양의 데이터를 학습해야 합니다. 저작권 관련 법적 책임에 직면하면서 공개적으로 사용 가능한 데이터 소스를 소진할 수 있습니다.

이로 인해 OpenAI, Google 및 Microsoft는 저작권이 있는 자료에 대해 학습할 권리를 보존할 것을 옹호하게 되었습니다.

OpenAI는 정부가 미국 AI 모델이 저작권이 있는 자료에서 학습할 수 있는 능력을 보존함으로써 미국인들이 AI에서 자유롭게 배울 수 있도록 하고 AI 리드를 PRC[중화인민공화국]에 몰수하지 않도록 할 수 있다고 언급했습니다.

알고리즘 장애물

모델 크기를 늘리고 더 많은 컴퓨팅을 사용하고 더 많은 데이터를 학습하면 주목할 만한 발전이 있을 것이라는 믿음은 틀린 것으로 입증되었습니다. Bloomberg는 규모 조정 법칙이 둔화되고 있다고 말하는 사람들이 있기 때문에 수익이 감소하고 있다고 말합니다.