Tag: Gemma

Gemma 3: Mocny model AI od Google

Google prezentuje Gemma 3, 'otwarty' model AI działający na jednym GPU. Oferuje on zaawansowane możliwości przetwarzania tekstu, obrazów i wideo, przewyższając konkurencję. Gemma 3 kładzie nacisk na bezpieczeństwo i dostępność dla deweloperów, wspierając ponad 35 języków i integrując się z Google Cloud.

Gemma 3: Mocny model AI od Google

Tradutor: Przełomowy tłumacz AI dla europejskiego portugalskiego

Tradutor, nowatorski model tłumaczenia AI typu open-source, został zaprojektowany specjalnie dla europejskiego portugalskiego. Projekt ten rozwiązuje problem nierówności w tłumaczeniu maszynowym, gdzie brazylijski portugalski często dominuje nad europejskim wariantem. Wykorzystuje PTradutor, obszerny korpus równoległy, i dostrajanie LLM, aby osiągnąć imponującą wydajność.

Tradutor: Przełomowy tłumacz AI dla europejskiego portugalskiego

Skalowanie wnioskowania modeli dyfuzyjnych Nowy paradygmat

Badanie przeprowadzone przez Xie Saining na Uniwersytecie Nowojorskim wykazało, że skalowanie czasu wnioskowania jest skuteczne dla modeli dyfuzyjnych. Zwiększenie zasobów obliczeniowych podczas wnioskowania prowadzi do znaczącej poprawy jakości generowanych próbek. W ramach tego badania opracowano ogólne ramy wyszukiwania, które pozwalają na dostosowywanie kombinacji komponentów do różnych zastosowań. Badanie skupia się na dwóch głównych osiach projektowych: weryfikatorach, które dostarczają informacji zwrotnej podczas procesu wyszukiwania, oraz algorytmach, które pomagają w znalezieniu lepszych kandydatów na szum. Badano różne scenariusze weryfikatorów i algorytmów, w tym wyszukiwanie losowe, wyszukiwanie zerowego rzędu i wyszukiwanie ścieżki. Wyniki pokazują, że skalowanie czasu wnioskowania jest skuteczne również w zadaniach generowania tekstu na obraz, a w niektórych przypadkach mniejsze modele ze skalowaniem mogą przewyższyć większe modele bez skalowania.

Skalowanie wnioskowania modeli dyfuzyjnych Nowy paradygmat