DeepSeek-R1 superado num pacote 32B?
O QwQ da Alibaba, um modelo de 'raciocínio' de 32B, supera o DeepSeek R1 de 671B em benchmarks de matemática, codificação e chamadas de função, graças à aprendizagem por reforço e verificação.
O QwQ da Alibaba, um modelo de 'raciocínio' de 32B, supera o DeepSeek R1 de 671B em benchmarks de matemática, codificação e chamadas de função, graças à aprendizagem por reforço e verificação.
A AMD anunciou a venda de mais de 200.000 GPUs Radeon RX 9070 logo após o lançamento. A arquitetura RDNA 4 estreou no retalho, e a procura tem sido alta, apesar dos aumentos de preço dos parceiros AIB. A AMD foca-se em IA e computação de alto desempenho.
A AMD lançou benchmarks de desempenho de IA para o Ryzen AI Max+ 395, mostrando sua potência. Comparamos ele com o Intel Core Ultra 7 258V e, surpreendentemente, com o Apple M4 Pro. Os resultados revelam uma competição acirrada no espaço de chips de alta performance, especialmente em tarefas de IA com uso intensivo de GPU.
Baidu apresenta novos modelos de inteligência artificial, Ernie 4.5 e Ernie X1, alegando superar concorrentes como DeepSeek e OpenAI em testes de benchmark. A empresa destaca capacidades multimodais e preços competitivos, marcando uma mudança para o código aberto.
A equipa Doubao AI da ByteDance revelou o COMET, um framework open-source inovador para otimizar a abordagem Mixture of Experts (MoE), melhorando a eficiência do treino de modelos de linguagem de grande escala (LLM) e reduzindo custos. Esta tecnologia já poupou milhões de horas de computação GPU.
DeepSeek, um modelo de linguagem de código aberto, surge como um marco na evolução da IA. Ele promete eficiência, baixo custo e desempenho notável, democratizando o acesso à IA generativa e desafiando os modelos existentes.
A ascensão meteórica da DeepSeek na China, impulsionada pelo endosso de Xi Jinping, apresenta oportunidades e desafios. A rápida adoção da tecnologia de IA em vários setores levanta questões sobre escalabilidade, eficácia e implicações geopolíticas, enquanto a empresa enfrenta o escrutínio internacional e a intensa concorrência no cenário global de IA.
O Gemma 3 da Google promete capacidades aprimoradas de resolução de problemas e eficiência notável, operando com uma única GPU. Este avanço impulsiona a inovação em IA, tornando-a mais acessível e sustentável, com aplicações potenciais em diversas áreas, desde a descoberta de medicamentos até a modelagem climática.
O Gemma 3 da Google redefine a IA, lidando com desafios complexos com eficiência incomparável em uma única GPU. Este avanço promete acessibilidade, sustentabilidade e inovação acelerada em vários setores.
O modelo de linguagem grande e de código aberto da Meta, Llama, atingiu um marco monumental: ultrapassou um bilhão de downloads. Este feito ressalta a importância crescente da IA de código aberto e seu potencial para democratizar o acesso à tecnologia de ponta, capacitando uma gama diversificada de indivíduos e organizações.