NeuReality, пионер в преосмислянето на архитектурите за AI изводи, представи NR1, устройство с готови AI модели, като Llama, Mistral, Qwen и Granite, за частни AI облаци и локални клъстери. Този подход предоставя на предприятията и доставчиците на услуги бърз достъп до AI приложения, като същевременно значително намалява общите разходи за AI изводи.
NeuReality прекроява AI икономиката: Незабавен достъп до LLM направо от кутията, като същевременно намалява общите разходи за AI изводи
Предприятията и доставчиците на услуги внедряват AI приложения и агенти с рекордна скорост и се фокусират върху предоставянето на…
NeuReality, пионер в преосмислянето на архитектурите за AI изводи, за да отговори на нуждите на днешните AI модели и работни натоварвания, обяви, че нейното устройство за изводи NR1 вече е предварително заредено с популярни корпоративни AI модели, включително Llama, Mistral, Qwen, Granite 1, и поддържа частни генеративни AI облаци и локални клъстери. Стартирайки и работещо за по-малко от 30 минути, това готово за генеративен AI устройство и устройство за агенти предлага 3 пъти по-бърза реализация на стойността, което позволява на клиентите да правят иновации по-бързо. Текущите доказателства (PoC) показват, че извежда до 6,5 пъти повече токени в сравнение със сървърите за изводи, базирани на x86 CPU, в рамките на същите разходи и енергиен праг, което дава възможност на предприятия и правителства от всякакъв мащаб да имат по-достъпен достъп и да използват AI.
Отвътре чипът NR1® е първият истински AI-CPU, създаден за оркестрация на изводи – управление на данни, задачи и интеграции – с вграден софтуер, услуги и API. Той не само консолидира традиционните CPU и NIC архитектури в едно, но също така пакетира 6 пъти повече изчислителна мощ в чипа, за да продължи бързия напредък на GPU, като същевременно елиминира традиционните затруднения в CPU.
Сдвоен с всеки GPU или AI ускорител в устройството, чипът NR1 предлага пробив в разходите, енергията и ефективността на пространството, което е от съществено значение за широкото корпоративно приемане на AI. Например, сравнявайки същия модел Llama 3.3-70B и същата настройка на GPU или AI ускорител, устройството с AI-CPU на NeuReality постига по-ниска обща цена на милион AI токени от сървър, базиран на x86 CPU.
„Никой не поставя под съмнение огромния потенциал на AI. Предизвикателството е да се направи внедряването на AI изводи икономически изгодно“, каза Moshe Tanach, съосновател и главен изпълнителен директор на NeuReality. „Революционната AI-CPU технология на NeuReality елиминира затрудненията, което ни позволява да доставим допълнителната производителност, необходима за отключване на пълните възможности на GPU, като същевременно оркестрираме AI заявки и маркери за максимална производителност и възвръщаемост на инвестициите за тези скъпи AI системи.“
Tanach продължи: „Сега извеждаме лекотата на използване на ново ниво с нашето интегрирано AI устройство за изводи от силиций към софтуер. То е предварително заредено с AI модели и всички инструменти, които помагат на разработчиците на AI по-бързо, лесно и евтино от всякога да внедряват AI, което им позволява да прехвърлят ресурсите към прилагането на AI в техния бизнес, а не към интегриране и оптимизиране на инфраструктурата.“
Неотдавнашно проучване установи, че приблизително 70% от предприятията съобщават, че използват генеративен AI поне в една бизнес функция, което показва увеличено търсене. Въпреки това, само 25% от предприятията имат процеси, напълно активирани от AI, и постигат широко приемане, като само една трета са започнали да внедряват ограничени случаи на употреба на AI.
Днес затрудненията в производителността на CPU, които се наблюдават на сървъри, управляващи многомодални и големи езикови модели, са основен фактор, допринасящ за ниската средна степен на използване на GPU от 30-40%. Това води до скъпо загуба на силиций в внедряванията на AI, както и до underserved пазар, който все още е изправен пред сложност и бариери пред разходите.
„Предприятията и доставчиците на услуги внедряват AI приложения и агенти с рекордна скорост и са фокусирани върху икономичното предоставяне на производителност“, каза Rashid Attar, старши вицепрезидент по инженерството в Qualcomm Technologies, Inc. „Чрез интегрирането на ускорителя Qualcomm Cloud AI 100 Ultra с AI-CPU архитектурата на NeuReality, потребителите могат да постигнат нови нива на ефективност на разходите и AI производителност, без да жертват простотата за внедряване и мащабиране.“
Устройството NR1 на NeuReality е внедрено с клиенти в облака и финансовите услуги и е специално проектирано да ускори приемането на AI чрез своята икономичност, достъпност и пространствена ефективност, за опции за локален и облачен извод като услуга. В допълнение към новите предварително заредени генеративни и агентски AI модели, както и нови издания на всяко тримесечие, той също е напълно оптимизиран с предварително конфигурирани комплекти за разработка на софтуер и API за компютърно зрение, разговорен AI или поддръжка на персонализирани заявки за различни бизнес случаи на употреба и пазари (напр. финансови услуги, науки за живота, правителство, доставчици на облачни услуги).
Първото устройство NR1 обединява NR1® модул (PCIe карта) с ускорител Qualcomm® Cloud AI 100 Ultra.
NeuReality ще покаже на InnoVEX (съвместно с Computex) в Тайпе, Тайван на 20-23 май 2025 г. в израелския павилион, зала 2 щанд S0912 (близо до централната сцена). Компанията ще проведе демонстрация на живо на устройството за изводи NR1, включително мигриране на приложение за чат за минути, както и демонстрация на производителността на чипа NR1, работещ с Smooth Factory Models и DeepSeek-R1-Distill-Llama-8B.
NeuReality, основана през 2019 г., е пионер в специализирана архитектура за AI изводи, задвижвана от чипа NR1® – първият AI-CPU за оркестрация на изводи. Въз основа на отворена, базирана на стандарти архитектура, NR1 е напълно съвместим с всеки AI ускорител. Мисията на NeuReality е да направи AI достъпен и повсеместен чрез намаляване на бариерите, свързани с високите разходи, консумацията на енергия и сложността и да се възползва от своята революционна технология за разширяване на приемането на AI изводи. Компанията разполага с 80 служители в съоръжения в Израел, Полша и САЩ.
1 AI моделите, предварително заредени и оптимизирани за корпоративни клиенти, включват: Llama 3.3 70B, Llama 3.1 8B (очаква се семейството Llama 4 скоро); Mistral 7B, Mistral 8x7B и Mistral Small; Qwen 2.5, включително Coder (очаква се Qwen 3 скоро); DeepSeek R1**-**Distill-Llama 8B, R1 Distill-Llama 70b; и Granite 3, 3.1 8B (очаква се Granite 3.3 скоро).
AI революцията на NeuReality: Сливане на производителност, рентабилност и лекота на използване
Тъй като изкуственият интелект (AI) продължава да прониква в различни индустрии, предприятията са изправени пред предизвикателството да внедряват AI решения за изводи по икономически жизнеспособен и ефективен начин. NeuReality революционизира AI икономиката със своя иновативен подход, който се фокусира върху предоставянето на готов за употреба незабавен достъп до LLM (големи езикови модели), като същевременно значително намалява общите разходи за AI изводи. Водещото устройство за изводи NR1 на NeuReality, предоставя на предприятията безпрецедентна производителност, рентабилност и лекота на използване чрез оптимизиране на архитектурата на AI изводи и предварително зареждане на популярни корпоративни AI модели.
NR1 Inference Device: Промяна на правилата на играта
В основата на устройството за изводи NR1 лежи специално изграденият AI-CPU на NeuReality, който действа като централизиран център за контрол на данни, задачи и интеграции. За разлика от традиционните CPU и NIC архитектури, чипът NR1 интегрира тези компоненти в единна единица, намалявайки затрудненията и максимизирайки изчислителната мощност. Този интегриран подход позволява на чипа да продължи бързото развитие на GPU, като същевременно оптимизира AI заявките и токените за подобрена производителност и възвръщаемост на инвестициите.
AI готов за употреба: Опростяване на внедряването
За по-нататъшно подобряване на лекотата на използване, устройството за изводи NR1 се доставя предварително заредено с популярни корпоративни AI модели, включително Llama, Mistral, Qwen и Granite. Тази функция елиминира сложността на конфигурирането и оптимизирането, позволявайки на разработчиците на AI софтуер да се съсредоточат върху прилагането на AI в техния бизнес, а не върху прекарването на време за интегриране на инфраструктурата. Устройството може да бъде стартирано и работещо за по-малко от 30 минути, предоставяйки на клиентите бърза реализация на стойността.
Достъпен AI: Ускоряване на приемането
Технологията на NeuReality позволява на предприятията да имат по-достъпен достъп и да използват AI, като предлага по-ниска обща цена на милион AI токени от сървърите, базирани на x86 CPU. Тази рентабилност е от решаващо значение за предприятия и правителства от всякакъв мащаб, тъй като намалява бариерите пред внедряването на AI и дава възможност за по-широк кръг от приложения.
Партньорство с Qualcomm Technologies: Отключване на нови нива на производителност
Стратегическото партньорство между NeuReality и Qualcomm Technologies допълнително подобрява възможностите на устройството за изводи NR1. Чрез интегрирането на ускорителя Qualcomm Cloud AI 100 Ultra с AI-CPU архитектурата на NeuReality, потребителите могат да постигнат нови нива на ефективност на разходите и производителност на AI, без да жертват простотата за внедряване и мащабиране. Този подход на сътрудничество демонстрира ангажимента на NeuReality да използва авангардни технологии за оптимизиране на AI решенията за изводи.
Разрешаване на корпоративните AI предизвикателства: Подобряване на използването на GPU
NeuReality се занимава със значително предизвикателство, пред което са изправени предприятията: затрудненията в производителността на CPU на сървъри, които намаляват използването на GPU. Традиционно сървърите, управляващи многомодални и големи езикови модели на сървъри, имат средна степен на използване на GPU от едва 30-40%. Тази ниска степен на използване води до скъпа загуба на силиций в внедряванията на AI и ограничава приемането на AI в underserved пазарите. AI-CPU технологията на NeuReality решава този проблем чрез премахване на затрудненията в производителността, позволявайки на предприятията да използват напълно възможностите на своите GPU в AI приложения.
Посрещане на нуждите на генеративния AI: Увеличаване на използването
Решението на NeuReality позиционира добре за процъфтяващия пазар на генеративен AI. Неотдавнашни проучвания показват, че приблизително 70% от предприятията съобщават, че използват генеративен AI поне в една бизнес функция. Въпреки това, само 25% от предприятията имат напълно активирани от AI процеси и са постигнали широко приемане. Устройството за изводи NR1 на NeuReality дава възможност на предприятията да ускорят своите генеративни AI инициативи чрез намаляване на бариерите пред приемането чрез подобрена лекота на използване, рентабилност и производителност.
Лекота на използване: Намаляване на бариерите пред внедряването
В допълнение към производителността и рентабилността, лекотата на използване е ключов двигател на AI решенията на NeuReality. Устройството за изводи NR1 се предлага предварително заредено с AI модели и комплекти за разработка на софтуер, опростявайки процеса на внедряване и намалявайки нуждата от интегриране и оптимизиране на инфраструктурата. Тази лекота на използване позволява на разработчиците на AI софтуер да се съсредоточат върху изграждането и внедряването на иновативни AI приложения, а не върху прекарването на време за управление на сложна инфраструктура.
Широк спектър от приложения: Множество индустрии
Устройството за изводи NR1 на NeuReality е проектирано да поддържа широк спектър от бизнес случаи на употреба и пазари. Устройството е оптимизирано с предварително конфигурирани комплекти за разработка на софтуер и API за компютърно зрение, разговорен AI и персонализирани заявки. Тази гъвкавост прави устройството за изводи NR1 подходящо за различни индустрии, включително финансови услуги, науки за живота, правителство и доставчици на облачни услуги.
Ускоряване на приемането на AI: Достъпност, достъпност и ефективност на пространството
Устройството NR1 на NeuReality ускорява приемането на AI, като предоставя едновременно достъпност и достъпност, което го прави подходящо за локални и облачни инфраструктури. Много организации се борят да разширят своите AI инициативи поради високите разходи и сложност, но решението на NeuReality решава тези бариери чрез предоставяне на рентабилна платформа с отворени стандарти, която опростява разработването и внедряването на AI.
Акценти от демонстрацията
NeuReality ще покаже своя двигател за изводи NR1 на InnoVEX в Computex в Тайпе, Тайван, от 20 до 23 май 2025 г., демонстрирайки неговите възможности. По време на събитието компанията ще демонстрира колко лесно е да се мигрира приложение за чат за минути и ще представи производителността на чипа NR1, работещ с Smooth Factory Models и DeepSeek-R1-Distill-Llama-8B.
Постоянни иновации: Подготовка за бъдещето
NeuReality е посветена на непрекъснатото подобряване на възможностите на своето устройство за изводи NR1 чрез редовни издания на нови генеративни и агентски AI модели, както и оптимизирани комплекти за разработка на софтуер. Тези постоянни иновации позволяват на предприятията да бъдат в крак с най-новите AI технологии и да гарантират, че тяхната AI инфраструктура е оптимизирана за бъдещи работни натоварвания.
NeuReality: Даване на възможност на предприятията да усвоят потенциала на AI
Революционната AI-CPU технология на NeuReality предлага рентабилен начин за внедряване на изводи AI внедрявания, максимизиране на производителността на GPU, като същевременно оптимизира AI заявките и токените за максимална производителност и възвръщаемост на инвестициите. Тъй като NeuReality продължава да прави иновации и да разширява възможностите на своето устройство за изводи NR1, тя ще бъде ключов съюзник за предприятията, които искат да процъфтяват в процъфтяващия AI свят.
Чрез комбиниране на фокус върху производителност, рентабилност и лекота на използване с ангажимент към постоянни иновации, NeuReality е позиционирана да прекрои AI икономиката и да даде възможност на предприятията от всякакъв мащаб да усвоят потенциала на AI.