Tag: LLM

От AI тигри към котенца: Китайските AI стартъпи

Китайските AI стартъпи, някога възхвалявани, намаляват амбициите си, фокусирайки се върху нишови пазари, след като опитите да се конкурират в разработката на големи езикови модели (LLM) се оказаха твърде скъпи.

От AI тигри към котенца: Китайските AI стартъпи

Революционен 1-битов AI модел на Microsoft

Microsoft представи BitNet b1.58 2B4T, 1-битов LLM с 2 милиарда параметри, обучен на 4 трилиона токена. Моделът работи ефикасно на CPU, отваряйки нови възможности за достъпност и енергийна ефективност.

Революционен 1-битов AI модел на Microsoft

Залогът на MiniMax на линейно внимание

Разговор със Zhong Yiran относно архитектурата на MiniMax-01, пионер в линейното внимание и големите езикови модели. Обсъжда се пътят от лабораторията до индустриалните модели, както и прозрения за архитектурата на моделите.

Залогът на MiniMax на линейно внимание

SISTA AI: Подкрепа за AI стартъпи, водени от жени

SISTA и AWS стартират 'SISTA AI' за подпомагане на AI стартъпи, основани от жени в Европа. Програмата предоставя ресурси, експертиза и финансиране, насърчавайки разнообразие и равенство в технологичния сектор.

SISTA AI: Подкрепа за AI стартъпи, водени от жени

Малки AI модели: Навлизане в бизнеса

Анализ на Gartner показва преминаване към по-малки, специализирани AI модели в предприятията. Те ще се използват три пъти по-често от големите езикови модели (LLM) поради оптимизация на ресурсите и намаляване на разходите. Това е ключова промяна в AI стратегиите.

Малки AI модели: Навлизане в бизнеса

Ренесанс на AI агенти: MCP, A2A, UnifAI

MCP, A2A и UnifAI се събират, за да създадат нова инфраструктура за AI агенти. Целта е да се подобрят възможностите им и да се стигне до функционални приложения и услуги. Това може да е началото на нова ера за AI агентите.

Ренесанс на AI агенти: MCP, A2A, UnifAI

DeepSeek: Китaйска AI заплаха и ролята на Nvidia

Доклад разкрива рисковете за сигурността от DeepSeek, китайска AI платформа, включваща изпращане на данни към ККП, манипулация на информация и използване на откраднати данни. Nvidia играе роля в предоставянето на чипове, въпреки експортните ограничения на САЩ.

DeepSeek: Китaйска AI заплаха и ролята на Nvidia

САЩ обмисля ограничения за DeepSeek

САЩ обмислят ограничения за DeepSeek заради достъпа ѝ до американски технологии и опасения за военни приложения на AI. Обсъждат се санкции и рестрикции за американски граждани.

САЩ обмисля ограничения за DeepSeek

Революция в AI агентите: MiniMax и дълъг контекст

Националната платформа за суперкомпютри пуска разширени мултимодални големи модели за AI агенти, разработени от Rare Stone Technology.

Революция в AI агентите: MiniMax и дълъг контекст

AI Революция: MCP и Oriental Supercomputing

Oriental Supercomputing се присъединява към AI революцията с MCP услуги, улесняващи глобална интеграция и иновации. Платформата 'Oriental Six Harmonies' отключва AI потенциала.

AI Революция: MCP и Oriental Supercomputing