شرکت NeuReality، پیشگام در بازاندیشی معماری استنتاج AI برای برآوردن نیازهای مدلها و بارهای کاری AI امروزی، اعلام کرد که دستگاه استنتاج NR1 آن اکنون با مدلهای محبوب AI سازمانی از جمله Llama، Mistral، Qwen، Granite 1 از قبل بارگذاری شده است و از ابر AI تولیدی خصوصی و خوشههای محلی پشتیبانی میکند. این دستگاه آماده AI تولیدی و نمایندهای در کمتر از 30 دقیقه راهاندازی و اجرا میشود و 3 برابر سرعت ارزشگذاری را ارائه میدهد و به مشتریان امکان میدهد سریعتر نوآوری کنند. اثبات مفهوم فعلی (PoC) نشان میدهد که در مقایسه با سرورهای استنتاج مبتنی بر CPU x86، تا 6.5 برابر افزایش توان خروجی توکن در بردارهای هزینه و توان یکسان وجود دارد و دسترسی و استفاده از AI را مقرون به صرفهتر برای شرکتها و دولتها در هر اندازه فراهم میکند.
در داخل دستگاه، تراشه NR1® اولین CPU واقعی AI است که بهطور خاص برای ارکستراسیون استنتاج - مدیریت دادهها، وظایف و ادغامها - با نرمافزار، خدمات و API داخلی ساخته شده است. این تراشه نه تنها معماریهای سنتی CPU و NIC را در یک واحد ادغام میکند، بلکه 6 برابر قدرت پردازش را روی تراشه بسته بندی میکند تا با پیشرفتهای سریع GPU همگام شود و در عین حال گلوگاههای CPU سنتی را از بین ببرد.
تراشه NR1 که با هر GPU یا شتابدهنده AI در داخل دستگاه خود جفت میشود، کارایی بینظیری در هزینه، انرژی و املاک ارائه میدهد که برای پذیرش گسترده AI در سازمانها حیاتی است. به عنوان مثال، با مقایسه مدل Llama 3.3-70B یکسان و تنظیمات یکسان GPU یا شتابدهنده AI، دستگاه مبتنی بر AI-CPU NeuReality هزینه کلی کمتر در هر میلیون توکن AI را در مقایسه با سرورهای مبتنی بر CPU x86 دارد.
موشه تاناخ، بنیانگذار و مدیرعامل NeuReality، اظهار داشت: «هیچکس در مورد پتانسیل عظیم AI تردیدی ندارد. چالش این است که چگونه استقرار استنتاج AI را از نظر اقتصادی امکانپذیر کنیم. فناوری AI-CPU مخرب NeuReality گلوگاهها را از بین میبرد و ما را قادر میسازد تا عملکرد اضافی مورد نیاز برای باز کردن قفل قدرت کامل GPUها را ارائه دهیم، در حالی که پرسشها و توکنهای AI را هماهنگ میکنیم و در نتیجه عملکرد و بازده سرمایه را در این سیستمهای AI گرانقیمت به حداکثر میرسانیم.»
تاناخ در ادامه گفت: «اکنون با دستگاه استنتاج AI یکپارچه سیلیکونی به نرمافزاری خود، سهولت استفاده را به سطح جدیدی ارتقا دادهایم. با مدلهای AI و تمام ابزارهایی که از قبل نصب شدهاند، به توسعهدهندگان نرمافزار AI کمک میکند تا AI را سریعتر، آسانتر و ارزانتر از همیشه مستقر کنند و به آنها امکان میدهد منابع را به کاربرد AI در تجارت خود اختصاص دهند، نه یکپارچهسازی و بهینهسازی زیرساخت.»
مطالعهای اخیراً نشان داد که حدود 70٪ از شرکتها گزارش میدهند که از AI تولیدی در حداقل یک عملکرد تجاری استفاده میکنند که نشاندهنده افزایش تقاضا است. با این حال، تنها 25٪ از شرکتها فرآیندهایی دارند که بهطور کامل توسط AI فعال شدهاند و پذیرش گستردهای را محقق کردهاند و تنها یک سوم از شرکتها شروع به اجرای موارد استفاده محدود از AI کردهاند.
امروزه، گلوگاههای عملکرد CPU در مدیریت بارهای کاری چندوجهی و مدل زبان بزرگ در سرورها یک عامل اصلی است که منجر به کم شدن میانگین استفاده از GPU به 30-40٪ میشود. این امر منجر به هدر رفتن سیلیکون گرانقیمت در استقرارهای AI و همچنین بازاری میشود که همچنان با موانع پیچیدگی و هزینه روبرو است.
رشید عطار، معاون ارشد مهندسی در شرکت Qualcomm Technologies، گفت: «شرکتها و ارائهدهندگان خدمات در حال استقرار برنامهها و نمایندههای AI با سرعت بیسابقهای هستند و بر ارائه عملکرد بهطور اقتصادی تمرکز دارند. با ادغام شتابدهنده Qualcomm Cloud AI 100 Ultra با معماری AI-CPU NeuReality، کاربران میتوانند بدون به خطر انداختن سهولت استقرار و مقیاسبندی، به سطوح جدیدی از کارایی هزینه و عملکرد AI دست یابند.»
دستگاه NR1 NeuReality با مشتریان ابری و خدمات مالی مستقر شده است و بهطور خاص برای تسریع پذیرش AI از طریق مقرون به صرفگی، دردسترس بودن و کارایی فضایی آن، برای گزینههای استنتاج به عنوان یک سرویس در محل و ابری طراحی شده است. علاوه بر مدلهای جدید از پیش بارگذاری شده AI تولیدی و نمایندهای و نسخههای جدید هر سه ماه یکبار، به طور کامل برای کیتهای توسعه نرمافزار از پیش پیکربندی شده و API برای بینایی رایانهای، AI مکالمهای یا درخواستهای سفارشی که از طیف گستردهای از موارد استفاده تجاری و بازار پشتیبانی میکنند (به عنوان مثال، خدمات مالی، علوم زیستی، دولت، ارائهدهندگان خدمات ابری) بهینه شده است.
اولین دستگاه NR1 یک ماژول NR1® (کارت PCIe) را با شتابدهنده Qualcomm® Cloud AI 100 Ultra متحد میکند.
NeuReality از 20 تا 23 می 2025 در غرفه اسرائیل در InnoVEX (که با Computex برگزار میشود) در تایپه، تایوان، غرفه S0912 در سالن 2 (نزدیکترین نقطه به صحنه مرکزی) نمایش داده میشود. این شرکت نمایش زندهای از دستگاه استنتاج NR1، از جمله انتقال یک برنامه چت در عرض چند دقیقه و نمایش عملکرد تراشه NR1 در حال اجرای Smooth Factory Models و DeepSeek-R1-Distill-Llama-8B را برگزار میکند.
NeuReality که در سال 2019 تأسیس شد، یک پیشگام در معماری استنتاج AI اختصاصی است که توسط تراشه NR1® - اولین AI-CPU برای سازماندهی استنتاج - هدایت میشود. NR1 که بر اساس یک معماری باز و مبتنی بر استاندارد است، به طور کامل با هر شتابدهنده AI سازگار است. مأموریت NeuReality این است که با کاهش موانع مرتبط با هزینههای بالا، مصرف انرژی و پیچیدگی و با بهرهگیری از فناوری مخرب خود برای گسترش پذیرش استنتاج AI، دسترسی و فراگیری AI را ممکن سازد. این شرکت دارای 80 کارمند در سایتهایی در اسرائیل، لهستان و ایالات متحده است.
مدلهای AI 1 از پیش بارگذاری شده و بهینهشده برای مشتریان سازمانی عبارتند از: Llama 3.3 70B، Llama 3.1 8B (سری Llama 4 بهزودی عرضه میشود). Mistral 7B، Mistral 8x7B و Mistral Small. Qwen 2.5، از جمله Coder (Qwen 3 بهزودی عرضه میشود). DeepSeek R1**-**Distill-Llama 8B، R1 Distill-Llama 70b. و Granite 3، 3.1 8B (Granite 3.3 بهزودی عرضه میشود).
انقلاب AI با NeuReality: همگرایی عملکرد، مقرون به صرفه بودن و سهولت استفاده
با ادامه نفوذ هوش مصنوعی (AI) در صنایع مختلف، شرکتها با چالش استقرار راهکارهای استنتاج AI به روشی از نظر اقتصادی عملی و کارآمد روبرو هستند. NeuReality از طریق رویکرد ابتکاری خود که بر ارائه دسترسی فوری و آماده به LLM (مدلهای زبان بزرگ) و در عین حال کاهش چشمگیر هزینه کلی استنتاج AI متمرکز است، اقتصاد AI را مختل میکند. دستگاه استنتاج NR1، برجستهترین محصول NeuReality، با بهینهسازی معماری استنتاج AI و از پیش بارگذاری کردن مدلهای AI محبوب سازمانی، عملکرد، مقرون به صرفه بودن و سهولت غیرقابل مقایسهای را در اختیار شرکتها قرار میدهد.
دستگاه استنتاج NR1: تغییری بزرگ در قواعد بازی
هسته اصلی دستگاه استنتاج NR1، یک AI-CPU اختصاصی است که بهطور خاص توسط NeuReality ساخته شده است و بهعنوان یک مرکز کنترل متمرکز برای دادهها، وظایف و ادغامها عمل میکند. برخلاف معماریهای سنتی CPU و NIC، تراشه NR1 این اجزا را در یک واحد ادغام میکند، که باعث کاهش گلوگاهها و به حداکثر رساندن قدرت پردازش میشود. این روش ادغامشده تراشه را قادر میسازد تا همگام با پیشرفتهای سریع GPU باشد و در عین حال پرسشها و توکنهای AI را برای بهبود عملکرد و بازده سرمایه بهینه میکند.
AI آماده: سادهسازی استقرار
برای بهبود بیشتر سهولت استفاده، دستگاه استنتاج NR1 با مدلهای AI محبوب سازمانی از جمله Llama، Mistral، Qwen و Granite از قبل بارگذاری شده است. این ویژگی پیچیدگی پیکربندی و بهینهسازی را از بین میبرد و به توسعهدهندگان نرمافزار AI اجازه میدهد تا بهجای صرف زمان برای ادغام زیرساخت، بر کاربرد AI در کسبوکار خود تمرکز کنند. این دستگاه در کمتر از 30 دقیقه راهاندازی و اجرا میشود که سرعت ارزشگذاری سریعی را برای مشتریان فراهم میکند.
AI مقرون به صرفه: تسریع در پذیرش
فناوری NeuReality از طریق ارائه هزینه کلی کمتر در هر میلیون توکن AI در مقایسه با سرورهای مبتنی بر CPU x86، دسترسی و استفاده از AI را برای شرکتها مقرون به صرفهتر میکند. این مقرون به صرفه بودن برای شرکتها و دولتها در هر اندازهای حیاتی است، زیرا مانع استقرار AI را کاهش میدهد و امکان کاربردهای گستردهتری را فراهم میکند.
مشارکت با شرکت Qualcomm Technologies: باز کردن سطوح جدیدی از عملکرد
همکاری استراتژیک بین NeuReality و شرکت Qualcomm Technologies قابلیتهای دستگاه استنتاج NR1 را بیشتر بهبود میبخشد. با ادغام شتابدهنده Qualcomm Cloud AI 100 Ultra با معماری AI-CPU NeuReality، کاربران میتوانند بدون به خطر انداختن سهولت استقرار و مقیاسبندی، به سطوح جدیدی از کارایی هزینه و عملکرد AI دست یابند. این روش مشارکتی نشان میدهد که NeuReality به استفاده از فناوریهای پیشرفته برای بهینهسازی راهکارهای استنتاج AI اختصاص دارد.
پرداختن به چالشهای AI سازمانی: بهبود استفاده از GPU
NeuReality در حال پرداختن به یک چالش بزرگ پیش روی شرکتها است: گلوگاههای عملکرد CPU در سرورها که باعث کاهش استفاده از GPU میشوند. بهطور سنتی، سرورهایی که بارهای کاری چندوجهی و مدل زبان بزرگ را مدیریت میکنند، بهطور متوسط از GPU به میزان 30-40٪ استفاده میکنند. این میزان کم استفاده منجر به هدر رفتن سیلیکون گرانقیمت در استقرارهای AI میشود و پذیرش AI را برای بازارهایی که خدمات کافی دریافت نکردهاند محدود میکند. فناوری AI-CPU NeuReality با از بین بردن گلوگاههای عملکرد، این مشکل را برطرف میکند و به شرکتها امکان میدهد تا بهطور کامل از قدرت GPUهای خود در کاربردهای AI استفاده کنند.
برآوردن تقاضا برای AI تولیدی: افزایش بهرهوری
راهکار NeuReality با چشمانداز بازار در حال رشد سریع AI تولیدی سازگار است. تحقیقات اخیر نشان میدهد که حدود 70 درصد از شرکتها گزارش میدهند که از AI تولیدی در حداقل یک عملکرد تجاری استفاده میکنند. با این حال، تنها 25 درصد از شرکتها فرآیندهایی دارند که بهطور کامل توسط AI فعال شدهاند و پذیرش گستردهای را محقق کردهاند. دستگاه استنتاج NR1 NeuReality شرکتها را قادر میسازد تا برنامههای AI تولیدی خود را تسریع کنند، با کاهش موانع پذیرش از طریق بهبود سهولت استفاده، مقرون به صرفه بودن و عملکرد.
سهولت استفاده: کاهش موانع استقرار
علاوه بر عملکرد و مقرون به صرفه بودن، سهولت استفاده نیز یک محرک کلیدی در راهکارهای AI NeuReality است. دستگاه استنتاج NR1 با مدلهای AI و کیتهای توسعه نرمافزار از قبل بارگذاری شده، فرآیند استقرار را ساده میکند و نیاز به ادغام و بهینهسازی زیرساخت را کاهش میدهد. این سهولت استفاده به توسعهدهندگان نرمافزار AI اجازه میدهد تا بهجای صرف زمان برای مقابله با زیرساختهای پیچیده، بر ساخت و استقرار برنامههای AI ابتکاری تمرکز کنند.
کاربردهای گسترده: صنایع متعدد
دستگاه استنتاج NR1 NeuReality برای پشتیبانی از طیف گستردهای از موارد استفاده تجاری و بازار طراحی شده است. این دستگاه از طریق کیتهای توسعه نرمافزار و APIهای از پیش پیکربندی شده برای بینایی رایانهای، AI مکالمهای و درخواستهای سفارشی بهینه شده است. این تطبیقپذیری دستگاه استنتاج NR1 را برای صنایع مختلف، از جمله خدمات مالی، علوم زیستی، دولت و ارائهدهندگان خدمات ابری مناسب میسازد.
تسریع در پذیرش AI: مقرون به صرفه بودن، دسترسی و کارایی فضایی
دستگاه NR1 NeuReality با ارائه مقرون به صرفه بودن و دسترسی به طور همزمان، پذیرش AI را تسهیل میکند که آن را برای هر دو زیرساختهای محلی و ابری مناسب میسازد. بسیاری از سازمانها در تلاش برای مقیاسبندی برنامههای AI خود هستند، زیرا هزینههای بالا و پیچیدگی آن در کار است، اما راهکار NeuReality با ارائه یک پلتفرم مقرون به صرفه و مبتنی بر استانداردهای باز، این موانع را حل میکند و توسعه و استقرار AI را ساده میکند.
نکات برجسته نمایش
NeuReality موتور استنتاج NR1 خود را در InnoVEX در نمایشگاه کامپیوتر تایوان در تایپه، تایوان از 20 تا 23 می 2025 به نمایش خواهد گذاشت و قابلیتهای خود را به نمایش میگذارد. در این رویداد، این شرکت نحوه انتقال آسان یک برنامه چت در عرض چند دقیقه را نشان میدهد و عملکرد تراشه NR1 را در Smooth Factory Models و DeepSeek-R1-Distill-Llama-8B نشان میدهد.
نوآوری مستمر: آمادگی برای آینده
NeuReality متعهد است تا با انتشار منظم مدلهای AI تولیدی و نمایندهای جدید و همچنین کیتهای توسعه نرمافزار بهینهشده، قابلیتهای دستگاه استنتاج NR1 خود را بهبود بخشد. این نوآوری مستمر شرکتها را قادر میسازد تا از آخرین فناوریهای AI مطلع شوند و اطمینان حاصل کنند که زیرساخت AI آنها برای بارهای کاری آینده بهینه شده است.
NeuReality: توانمندسازی شرکتها برای در آغوش گرفتن پتانسیلهای AI
فناوری مخرب AI-CPU NeuReality راهی مقرون به صرفه برای استقرار استقرارهای AI استنتاج ارائه میدهد و در نتیجه عملکرد GPU را به حداکثر میرساند در حالی که پرسشها و توکنهای AI را برای حداکثر عملکرد و بازده سرمایه بهینه میکند. از آنجایی که NeuReality به نوآوری و گسترش قابلیتهای دستگاه استنتاج NR1 خود ادامه میدهد، به یک متحد کلیدی برای شرکتها برای شکوفایی در دنیای پررونق AI تبدیل میشود.
NeuReality با ترکیب تمرکز خود بر عملکرد، مقرون به صرفه بودن و سهولت استفاده با تعهد به نوآوری مستمر، در جایگاهی قرار دارد که اقتصاد AI را بازتعریف کند و شرکتها در همه اندازهها را قادر میسازد تا پتانسیلهای AI را در آغوش بگیرند.