SK텔레콤 A.X 4.0: 언어 모델 심층 분석
SK텔레콤의 A.X 4.0 LLM 출시: 한국어 최적화, 성능 벤치마크, 향후 계획 및 기술 사양 심층 분석.
SK텔레콤의 A.X 4.0 LLM 출시: 한국어 최적화, 성능 벤치마크, 향후 계획 및 기술 사양 심층 분석.
DMind가 Web3 앱에 특화된 오픈소스 LLM, DMind-1을 발표했습니다. 알리바바 Qwen3-32B 기반으로 9개 Web3 영역서 SOTA 성능을 달성했고, 추론 비용은 주류 LLM의 1/10입니다.
알리바바 그룹이 AI 모델 훈련 비용을 90% 절감하는 획기적인 ZEROSEARCH 프레임워크를 발표했습니다. API 호출 없이 검색을 시뮬레이션하여 AI 개발 경쟁 구도를 바꿀 잠재력을 보여줍니다.
상하이 퀀트 펀드가 획기적인 AI 훈련 기술을 발표하여 DeepSeek에 도전합니다. SASR 프레임워크는 SFT 및 RL의 한계를 극복하고, 중국 AI 발전을 보여줍니다.
Mistral AI의 Medium 3는 기업용으로 설계된 언어 모델입니다. 비용 효율성, 강력한 성능, 유연한 배포 옵션을 제공합니다.
NVIDIA의 최신 오픈 소스 LLM 및 ASR 기술인 Llama Nemotron Ultra와 Parakeet을 Joey Conway와의 인터뷰를 통해 심층적으로 알아봅니다.
Microsoft의 Phi-4 Reasoning Plus 모델은 강화 학습을 통해 획기적인 성능을 달성했습니다.
Google Gemma AI 모델이 1억 5천만 회 다운로드를 돌파했습니다. 이 모델의 인기 상승과 개발자 채택 증가를 분석하고, Llama와의 비교 및 라이선스 문제를 심층적으로 파악합니다.
Nemotron-Tool-N1은 강화 학습으로 LLM 도구 사용의 한계를 극복하고, BFCL 및 API-Bank 벤치마크에서 우수한 성능을 입증합니다.
딥시크 R1 LLM 등장으로 말레이시아 AI 생태계에 열린 기회, 오픈소스 AI 활용 및 로컬 LLM 개발 중요성 강조.