Tag: AIGC

DeepSeek-R1 w pakiecie 32B? Analiza QwQ Alibaby

Czy uczenie się przez wzmacnianie, wsparte dodatkową weryfikacją, może znacząco podnieść możliwości dużych modeli językowych (LLM)? Zespół Qwen Alibaby poszukuje odpowiedzi, tworząc QwQ – model 'rozumowania' o 32 miliardach parametrów, który, jak twierdzi Alibaba, przewyższa DeepSeek R1 w określonych benchmarkach.

DeepSeek-R1 w pakiecie 32B? Analiza QwQ Alibaby

Ponad 200 tys. RX 9070 sprzedanych

AMD ogłosiło sprzedaż ponad 200 000 kart graficznych Radeon RX 9070 z pierwszej partii. Firma zapowiada dalszy rozwój technologii RDNA 4 i nacisk na AI. Dostępność jest ograniczona, a ceny u partnerów AIB rosną.

Ponad 200 tys. RX 9070 sprzedanych

Ryzen AI Max+ 395 vs. Apple M4 Pro

Zaskakujące porównanie wydajności AI: AMD Ryzen AI Max+ 395 kontra Apple M4 Pro. Kto wygrywa w testach LLM i SLM? Analiza wyników i architektury x86 vs. Arm.

Ryzen AI Max+ 395 vs. Apple M4 Pro

Baidu: Nowe modele AI lepsze od GPT-4o

Baidu prezentuje nowe modele AI, Ernie 4.5 i Ernie X1, które, jak twierdzi firma, przewyższają GPT-4o OpenAI i DeepSeek w testach benchmarkowych. Ruch ten podkreśla rosnącą konkurencję w dziedzinie dużych modeli językowych (LLM) w Chinach.

Baidu: Nowe modele AI lepsze od GPT-4o

COMET ByteDance: Efektywne szkolenie LLM

Zespół Doubao AI firmy ByteDance udostępnił COMET, innowacyjne, otwarte oprogramowanie optymalizujące podejście Mixture of Experts (MoE), zwiększające wydajność szkolenia dużych modeli językowych (LLM) i obniżające koszty. Technologia ta, działająca w sieci ponad 10 000 klastrów GPU ByteDance, zaoszczędziła miliony godzin obliczeniowych GPU.

COMET ByteDance: Efektywne szkolenie LLM

DeepSeek: Tańsze, Lepsze, Szybsze LLM?

DeepSeek, chińska firma, wprowadza nowy, otwarty model językowy (LLM), który jest energooszczędny, tańszy w eksploatacji i wydajny. To demokratyzuje dostęp do generatywnej AI, oferując korzyści firmom i pracownikom.

DeepSeek: Tańsze, Lepsze, Szybsze LLM?

DeepSeek: Sukces i ryzyko w Chinach?

Chiński startup AI, DeepSeek, zyskał ogromne poparcie po spotkaniu założyciela z Xi Jinpingiem. Szybki rozwój firmy w Chinach, napędzany ambicjami technologicznymi, stwarza szanse, ale i wyzwania związane ze skalowaniem, regulacjami i geopolityką. Czy DeepSeek sprosta oczekiwaniom i stanie się globalnym graczem?

DeepSeek: Sukces i ryzyko w Chinach?

Wewnątrz modelu AI Gemma 3 Google

Nowy model AI Gemma 3 firmy Google obiecuje obsługę bardziej złożonych zadań przy zachowaniu wydajności, co jest znaczącym krokiem w dziedzinie sztucznej inteligencji. Działa na jednym GPU, zmniejszając zużycie energii i koszty. Gemma 3 ma potencjał do zrewolucjonizowania wielu branż, od opieki zdrowotnej po finanse.

Wewnątrz modelu AI Gemma 3 Google

Wewnątrz modelu AI Gemma 3 Google

Emilia David z VentureBeat omówiła z CBS News przełomowy model AI Gemma 3 firmy Google. Ten innowacyjny model, działający na pojedynczym GPU, ma zrewolucjonizować AI, radząc sobie ze złożonymi problemami z niespotykaną wydajnością.

Wewnątrz modelu AI Gemma 3 Google

Otwarty Triumf Llamy: Miliard Pobrań

Przełomowy, otwarty model językowy Llama firmy Meta osiągnął monumentalny kamień milowy: ponad miliard pobrań. To osiągnięcie podkreśla rosnące znaczenie otwartej AI i jej potencjał w demokratyzacji dostępu do najnowocześniejszych technologii, wzmacniając pozycję różnych osób i organizacji.

Otwarty Triumf Llamy: Miliard Pobrań