Mistral, PDF를 AI용 Markdown으로 변환하는 새 API 공개
Mistral이 복잡한 PDF 문서를 AI 모델이 처리하기 쉬운 텍스트 기반 Markdown 형식으로 변환하는 혁신적인 API, 'Mistral OCR'을 출시했습니다. 이 API는 텍스트뿐만 아니라 이미지도 인식하며, RAG 시스템과 결합하여 다양한 분야에서 활용될 수 있습니다.
Mistral이 복잡한 PDF 문서를 AI 모델이 처리하기 쉬운 텍스트 기반 Markdown 형식으로 변환하는 혁신적인 API, 'Mistral OCR'을 출시했습니다. 이 API는 텍스트뿐만 아니라 이미지도 인식하며, RAG 시스템과 결합하여 다양한 분야에서 활용될 수 있습니다.
OpenAI의 전 정책 연구원 Miles Brundage는 회사가 위험한 AI 시스템 배포에 대한 접근 방식을 '역사 다시 쓰기'한다고 비난하며 공개적으로 비판했습니다.
Microsoft의 Phi-4 시리즈는 멀티모달 처리와 효율적인 로컬 배포 분야에서 인공 지능의 발전을 보여줍니다. Phi-4 Mini Instruct 및 Phi-4 Multimodal 모델은 강력한 AI 기능을 클라우드 인프라에 국한되지 않고 사용할 수 있는 시대를 엽니다.
Planet Labs와 Anthropic이 Claude LLM을 통합하여 위성 이미지 분석을 혁신합니다. 정부 및 기업은 이 협력을 통해 지구 변화에 대한 실시간 통찰력을 얻을 수 있습니다.
Tech in Asia (TIA)는 단순한 미디어를 넘어, 뉴스, 채용, 기업/투자자 데이터베이스, 이벤트 정보를 제공하며 아시아 기술 커뮤니티를 연결하는 종합 플랫폼입니다.
텐센트가 훈위안 이미지-비디오 모델을 공개하며 생성 AI 분야에 큰 발전을 이루었습니다. 이 강력한 기술은 이제 더 많은 사용자가 접근할 수 있으며, 기업과 개인 개발자 모두 창의적인 잠재력을 탐색할 수 있습니다. API를 통해 Tencent Cloud에서 액세스하거나, 훈위안 AI 비디오 웹사이트를 이용할 수 있습니다. 또한 오픈 소스 모델은 GitHub 및 Hugging Face에서 다운로드하여 실험할 수 있습니다.
알리바바가 320억 개의 파라미터를 가진 Qwen-32B (QwQ-32B)를 오픈소스로 공개했습니다. 이 모델은 훨씬 더 큰 671억 파라미터의 DeepSeek-R1과 동등한 성능을 보여주며, 강화 학습 (RL) 기술의 확장 가능성을 입증합니다. QwQ-32B는 Hugging Face와 ModelScope에서 Apache 2.0 라이선스로 이용 가능합니다.
클라우드 컴퓨팅 환경이 변화하고 있습니다. 소규모 클라우드 제공업체는 단순 컴퓨팅 성능 제공을 넘어, 생성형 AI 접근성을 높이는 종합적인 'AI 제공 서비스'로 진화하고 있습니다.
Anthropic의 Claude Code는 터미널에서 작동하는 AI 어시스턴트로, DevOps 워크플로우를 혁신합니다. 코드 이해, 자동화된 Git 작업, 테스트 및 디버깅, 보안 연결을 통해 개발 생산성을 향상시킵니다.
중국 대규모 언어 모델(LLM) 개발사 Zhipu AI가 3개월 만에 두 번째 대규모 자금 조달에 성공했습니다. 항저우 청터우 산업 펀드와 상청 캐피탈로부터 10억 위안(1.37억 달러) 이상을 유치했으며, 새로운 오픈 소스 LLM 제품 출시를 예고했습니다.