Sarvam AI의 혁신적 LLM, Meta와 Google에 도전
인도 Sarvam AI가 Meta, Google에 필적하는 혁신적 LLM을 출시, 인도 AI 시장의 새로운 가능성을 열었습니다.
인도 Sarvam AI가 Meta, Google에 필적하는 혁신적 LLM을 출시, 인도 AI 시장의 새로운 가능성을 열었습니다.
SK텔레콤의 A.X 4.0 LLM 출시: 한국어 최적화, 성능 벤치마크, 향후 계획 및 기술 사양 심층 분석.
DMind가 Web3 앱에 특화된 오픈소스 LLM, DMind-1을 발표했습니다. 알리바바 Qwen3-32B 기반으로 9개 Web3 영역서 SOTA 성능을 달성했고, 추론 비용은 주류 LLM의 1/10입니다.
알리바바 그룹이 AI 모델 훈련 비용을 90% 절감하는 획기적인 ZEROSEARCH 프레임워크를 발표했습니다. API 호출 없이 검색을 시뮬레이션하여 AI 개발 경쟁 구도를 바꿀 잠재력을 보여줍니다.
상하이 퀀트 펀드가 획기적인 AI 훈련 기술을 발표하여 DeepSeek에 도전합니다. SASR 프레임워크는 SFT 및 RL의 한계를 극복하고, 중국 AI 발전을 보여줍니다.
Mistral AI의 Medium 3는 기업용으로 설계된 언어 모델입니다. 비용 효율성, 강력한 성능, 유연한 배포 옵션을 제공합니다.
NVIDIA의 최신 오픈 소스 LLM 및 ASR 기술인 Llama Nemotron Ultra와 Parakeet을 Joey Conway와의 인터뷰를 통해 심층적으로 알아봅니다.
Microsoft의 Phi-4 Reasoning Plus 모델은 강화 학습을 통해 획기적인 성능을 달성했습니다.
Google Gemma AI 모델이 1억 5천만 회 다운로드를 돌파했습니다. 이 모델의 인기 상승과 개발자 채택 증가를 분석하고, Llama와의 비교 및 라이선스 문제를 심층적으로 파악합니다.
Nemotron-Tool-N1은 강화 학습으로 LLM 도구 사용의 한계를 극복하고, BFCL 및 API-Bank 벤치마크에서 우수한 성능을 입증합니다.