Tag: AIGC

DeepSeek-R1 superado num pacote 32B?

O QwQ da Alibaba, um modelo de 'raciocínio' de 32B, supera o DeepSeek R1 de 671B em benchmarks de matemática, codificação e chamadas de função, graças à aprendizagem por reforço e verificação.

DeepSeek-R1 superado num pacote 32B?

AMD: +200.000 RX 9070 Vendidas

A AMD anunciou a venda de mais de 200.000 GPUs Radeon RX 9070 logo após o lançamento. A arquitetura RDNA 4 estreou no retalho, e a procura tem sido alta, apesar dos aumentos de preço dos parceiros AIB. A AMD foca-se em IA e computação de alto desempenho.

AMD: +200.000 RX 9070 Vendidas

Ryzen AI Max+ 395 vs. Apple M4 Pro

A AMD lançou benchmarks de desempenho de IA para o Ryzen AI Max+ 395, mostrando sua potência. Comparamos ele com o Intel Core Ultra 7 258V e, surpreendentemente, com o Apple M4 Pro. Os resultados revelam uma competição acirrada no espaço de chips de alta performance, especialmente em tarefas de IA com uso intensivo de GPU.

Ryzen AI Max+ 395 vs. Apple M4 Pro

Baidu Lança Novos Modelos de IA

Baidu apresenta novos modelos de inteligência artificial, Ernie 4.5 e Ernie X1, alegando superar concorrentes como DeepSeek e OpenAI em testes de benchmark. A empresa destaca capacidades multimodais e preços competitivos, marcando uma mudança para o código aberto.

Baidu Lança Novos Modelos de IA

COMET da ByteDance: Eficiência MoE

A equipa Doubao AI da ByteDance revelou o COMET, um framework open-source inovador para otimizar a abordagem Mixture of Experts (MoE), melhorando a eficiência do treino de modelos de linguagem de grande escala (LLM) e reduzindo custos. Esta tecnologia já poupou milhões de horas de computação GPU.

COMET da ByteDance: Eficiência MoE

DeepSeek: LLMs Mais Baratos e Rápidos?

DeepSeek, um modelo de linguagem de código aberto, surge como um marco na evolução da IA. Ele promete eficiência, baixo custo e desempenho notável, democratizando o acesso à IA generativa e desafiando os modelos existentes.

DeepSeek: LLMs Mais Baratos e Rápidos?

Ascensão da DeepSeek: Uma Faca de Dois Gumes?

A ascensão meteórica da DeepSeek na China, impulsionada pelo endosso de Xi Jinping, apresenta oportunidades e desafios. A rápida adoção da tecnologia de IA em vários setores levanta questões sobre escalabilidade, eficácia e implicações geopolíticas, enquanto a empresa enfrenta o escrutínio internacional e a intensa concorrência no cenário global de IA.

Ascensão da DeepSeek: Uma Faca de Dois Gumes?

Por Dentro do Modelo Gemma 3 da Google

O Gemma 3 da Google promete capacidades aprimoradas de resolução de problemas e eficiência notável, operando com uma única GPU. Este avanço impulsiona a inovação em IA, tornando-a mais acessível e sustentável, com aplicações potenciais em diversas áreas, desde a descoberta de medicamentos até a modelagem climática.

Por Dentro do Modelo Gemma 3 da Google

Dentro do Modelo Gemma 3 da Google

O Gemma 3 da Google redefine a IA, lidando com desafios complexos com eficiência incomparável em uma única GPU. Este avanço promete acessibilidade, sustentabilidade e inovação acelerada em vários setores.

Dentro do Modelo Gemma 3 da Google

Llama: Triunfo Open Source

O modelo de linguagem grande e de código aberto da Meta, Llama, atingiu um marco monumental: ultrapassou um bilhão de downloads. Este feito ressalta a importância crescente da IA de código aberto e seu potencial para democratizar o acesso à tecnologia de ponta, capacitando uma gama diversificada de indivíduos e organizações.

Llama: Triunfo Open Source