香港大学、AI画像生成モデル評価報告
香港大学ビジネススクールは、主要なAIモデルの画像生成能力に関する包括的な評価レポートを発表しました。15のテキスト画像変換モデルと7つのマルチモーダルLLMを評価し、その長所と短所を明らかにします。
香港大学ビジネススクールは、主要なAIモデルの画像生成能力に関する包括的な評価レポートを発表しました。15のテキスト画像変換モデルと7つのマルチモーダルLLMを評価し、その長所と短所を明らかにします。
米欧関係の悪化は憂慮すべき事態だが、AI分野では仏の新興企業'Mistral'に追い風。地政学的緊張が高まる中、中立性を活かし、オープンソースと効率性を重視した独自のアプローチで、欧州AIエコシステムを育成し、グローバルリーダーを目指す。
Mistral AIがMistral OCRを発表。これは、ドキュメント理解の分野で新たな基準を打ち立てる、画期的な光学文字認識 (OCR) APIです。多様なドキュメントから情報を抽出・解釈する比類なき機能を提供します。
Mistral OCRは、PDFをAIモデルが利用しやすいMarkdown形式に変換する新しいAPIです。テキストだけでなく、画像も認識するマルチモーダルな機能と、RAGシステムとの連携により、ドキュメント処理を革新します。
OpenAIの元ポリシー責任者Miles Brundage氏が、同社のAI安全性に関する説明は'書き換えられた'ものであり、リスクの高いシステムの展開に対する過去のアプローチと矛盾すると批判。
MicrosoftのPhi-4シリーズは、特にマルチモーダル処理と効率的なローカル展開の分野で、AIの大きな進歩を示しています。Phi-4 Mini InstructとPhi-4 Multimodalモデルを特徴とするこのシリーズは、強力なAI機能が大規模なクラウドベースのインフラストラクチャに限定されない新しい時代を告げます。
Planet Labs PBCはAnthropicと提携し、高性能LLM'Claude'を統合。この提携により、地球の変化をより深く分析し、政府機関や企業など、さまざまなユーザーに新たな洞察を提供することを目指す。
Tech in Asia (TIA) は、ニュース、求人、企業・投資家データベース、イベント情報を網羅する、アジアのテクノロジーコミュニティを繋ぐ多角的プラットフォームです。
TencentがHunyuan画像生成動画モデルをオープンソース化。開発者コミュニティを強化し、API、Webサイト、GitHub、Hugging Faceを通じてアクセス可能。高品質な動画生成と多様なアプリケーションを実現。
AlibabaがQwen-32Bをオープンソース化。320億パラメータで、より大規模なDeepSeek-R1に匹敵する性能を、強化学習で実現。エッジデバイスでの利用も視野に。