Tag: Fine-Tuning

A.X 4.0 da SK Telecom: Imersão no Modelo de Linguagem

SK Telecom lança A.X 4.0, modelo de linguagem focado no coreano com otimizações e benchmarks impressionantes, superando até GPT-4o e DeepSeek R1.

A.X 4.0 da SK Telecom: Imersão no Modelo de Linguagem

DMind-1: LLM Open Source Web3

DMind anuncia DMind-1, um LLM open source para Web3, otimizado de Qwen3-32B, alcançando SOTA em blockchain, DeFi e NFTs. Custo de inferência 10x menor e variante leve DMind-1-mini disponível.

DMind-1: LLM Open Source Web3

ZEROSEARCH: IA com custo 90% menor

Alibaba anuncia ZEROSEARCH, reduzindo custos de treinamento de IA em 90%. Permite simular buscas sem APIs, melhorando qualidade e reduzindo custos.

ZEROSEARCH: IA com custo 90% menor

IA Chinesa Desafia DeepSeek com Treino Inovador?

Um fundo quantitativo de Xangai afirma ter uma técnica inovadora de treinamento de IA que pode desafiar abordagens estabelecidas de organizações como DeepSeek e OpenAI.

IA Chinesa Desafia DeepSeek com Treino Inovador?

Mistral AI Medium 3: Solução para Empresas

Mistral AI lança Medium 3, um modelo de linguagem feito para empresas, equilibrando custo, performance e opções de implantação, acessível via Mistral, Amazon SageMaker e em breve em IBM WatsonX, Azure AI, Google Cloud e NVIDIA NIM.

Mistral AI Medium 3: Solução para Empresas

Inovações NVIDIA: Llama Nemotron Ultra e Parakeet

Joey Conway da NVIDIA revela Llama Nemotron Ultra e Parakeet: modelos open-source avançados para linguagem e reconhecimento de fala.

Inovações NVIDIA: Llama Nemotron Ultra e Parakeet

Phi-4: RL Impulsiona a Razão na Microsoft

Microsoft Phi-4 Reasoning Plus demonstra o poder do RL, superando modelos maiores em benchmarks complexos. Refinamento com dados de alta qualidade e RL focado em precisão impulsionam o desempenho.

Phi-4: RL Impulsiona a Razão na Microsoft

Gemma AI: 150 Milhões de Downloads e Impacto

Modelos Gemma AI da Google atingem 150 milhões de downloads. Análise do crescimento, comparação com Llama, licenças e aplicações, como descoberta de fármacos.

Gemma AI: 150 Milhões de Downloads e Impacto

Nemotron-Tool-N1: RL para uso de ferramentas em LLMs

Nemotron-Tool-N1 usa aprendizado por reforço para revolucionar o uso de ferramentas em LLMs, superando as limitações da otimização supervisionada tradicional.

Nemotron-Tool-N1: RL para uso de ferramentas em LLMs

Oportunidade da Malásia: IA Open-Source da China

A Malásia pode capitalizar a revolução da IA open-source da China, impulsionando a inovação local, garantindo a autonomia de dados e adaptando modelos linguísticos às necessidades culturais e políticas do país.

Oportunidade da Malásia: IA Open-Source da China