Tag: AIGC

마이크로소프트, 온디바이스 AI용 소형 파워하우스 Phi-4-multimodal 공개

Microsoft는 음성, 시각 및 텍스트를 장치에서 직접 처리하도록 설계된 새로운 AI 모델을 출시했으며, 이전 모델보다 계산 요구량이 현저히 감소했습니다. 이는 생성 AI 환경의 지속적인 변화를 나타냅니다.

마이크로소프트, 온디바이스 AI용 소형 파워하우스 Phi-4-multimodal 공개

마이크로소프트 Phi-4: 작지만 강력한 AI 모델

Microsoft의 Phi-4는 크기와 성능 사이의 균형을 재정의하는 혁신적인 AI 모델 제품군입니다. 텍스트, 이미지, 음성을 동시에 처리하면서도 훨씬 적은 컴퓨팅 성능을 요구하여 효율성을 극대화합니다. '크기가 클수록 좋다'는 통념에 도전하며, 작은 패키지에도 강력한 힘이 담길 수 있음을 증명합니다.

마이크로소프트 Phi-4: 작지만 강력한 AI 모델

오픈소스의 승리: RISC-V와 AI의 만남

DeepSeek의 등장은 AI 업계 뿐만 아니라 반도체 산업에도 큰 영향을 미쳤습니다. RISC-V는 고성능 컴퓨팅과 AI 분야에서 획기적인 발전을 이루며, '고성능 + AI' RISC-V 생태계 구축을 가속화하고 있습니다.

오픈소스의 승리: RISC-V와 AI의 만남

로키드의 AR 글래스: 중국 엔터프라이즈 AI의 미래를 엿보다

중국 AR 기기 제조업체 Rokid는 최첨단 AI 기반 글래스로 주목받고 있습니다. 단순한 미래 지향적 컨셉이 아닌, AI를 웨어러블 기술에 통합하여 실제 응용 분야에 적용하는 실질적인 진전을 보여줍니다. 알리바바의 Qwen LLM과의 통합은 주목할 만합니다.

로키드의 AR 글래스: 중국 엔터프라이즈 AI의 미래를 엿보다

Sopra Steria와 Mistral AI, 첨단 AI 솔루션 협력

Sopra Steria와 Mistral AI가 전략적 제휴를 맺고 유럽 기업 및 공공 기관에 맞춤형 생성형 AI 솔루션을 제공합니다. 데이터 주권과 산업화를 보장하는 혁신적인 접근 방식입니다.

Sopra Steria와 Mistral AI, 첨단 AI 솔루션 협력

Moonshot AI 뮤온과 문라이트 대규모 모델 훈련 최적화

Moonshot AI 연구진이 대규모 언어 모델 훈련을 효율적으로 최적화하는 새로운 기술인 뮤온(Muon)과 문라이트(Moonlight)를 소개합니다. 이 기술은 훈련 안정성과 샘플 효율성을 향상시켜 계산 비용을 절감합니다.

Moonshot AI 뮤온과 문라이트 대규모 모델 훈련 최적화

Kimi 오픈소스 문라이트 300억 1600억 파라미터 모델

Moonshot AI의 Kimi는 Muon 아키텍처 기반 300억/1600억 파라미터 하이브리드 전문가 모델 Moonlight를 공개 57조 토큰으로 학습하여 효율성을 극대화했습니다

Kimi 오픈소스 문라이트 300억 1600억 파라미터 모델

의료 역량 강화에 특화된 20T 토큰 학습 BaichuanM1

Baichuan-M1은 의료 전문성을 위해 20조 토큰으로 학습된 새로운 대규모 언어 모델 시리즈입니다 일반 및 의료 데이터로 균형 잡힌 학습을 통해 진단 및 치료 추천 등에서 뛰어난 성능을 보입니다

의료 역량 강화에 특화된 20T 토큰 학습 BaichuanM1

AI 모델, 세계사 이해도 부족 연구 결과

최근 연구에 따르면 OpenAI의 GPT-4, Meta의 Llama, Google의 Gemini와 같은 최첨단 AI 모델조차 세계사 질문에 대해 46%의 정답률만을 보이며 역사적 이해에 심각한 결함을 드러냈습니다. 이는 AI가 역사적 맥락을 제대로 파악하지 못하고 데이터 패턴에만 의존하는 경향 때문이며, 교육, 정책 결정, 문화 유산 등 다양한 분야에서 오해와 오류를 초래할 수 있습니다. AI의 역사적 이해를 개선하기 위해서는 데이터셋의 다양성 확대, 알고리즘 개선, 역사 전문가 참여가 필요하며, 비판적 사고와 미디어 리터러시 교육이 중요합니다.

AI 모델, 세계사 이해도 부족 연구 결과

확산 모델 추론 확장 새로운 패러다임

본 연구는 확산 모델 추론 시 계산량 증가가 생성 샘플 품질을 향상시키는 효과를 입증합니다. 검증자 피드백과 알고리즘을 통해 최적의 노이즈를 검색하는 프레임워크를 제시하며, 다양한 시나리오에서 효과적인 확장 가능성을 보여줍니다. 특히, 텍스트-이미지 생성 작업에서 다양한 검증자 조합과 검색 알고리즘을 탐색하여 모델 성능을 개선하고, 계산 효율성을 높이는 방법을 제시합니다.

확산 모델 추론 확장 새로운 패러다임