NeuReality: تحول اقتصاد هوش مصنوعی

شرکت NeuReality، پیشگام در بازاندیشی معماری استنتاج AI برای برآوردن نیازهای مدل‌ها و بارهای کاری AI امروزی، اعلام کرد که دستگاه استنتاج NR1 آن اکنون با مدل‌های محبوب AI سازمانی از جمله Llama، Mistral، Qwen، Granite 1 از قبل بارگذاری شده است و از ابر AI تولیدی خصوصی و خوشه‌های محلی پشتیبانی می‌کند. این دستگاه آماده AI تولیدی و نماینده‌ای در کمتر از 30 دقیقه راه‌اندازی و اجرا می‌شود و 3 برابر سرعت ارزش‌گذاری را ارائه می‌دهد و به مشتریان امکان می‌دهد سریع‌تر نوآوری کنند. اثبات مفهوم فعلی (PoC) نشان می‌دهد که در مقایسه با سرورهای استنتاج مبتنی بر CPU x86، تا 6.5 برابر افزایش توان خروجی توکن در بردارهای هزینه و توان یکسان وجود دارد و دسترسی و استفاده از AI را مقرون به صرفه‌تر برای شرکت‌ها و دولت‌ها در هر اندازه فراهم می‌کند.

در داخل دستگاه، تراشه NR1® اولین CPU واقعی AI است که به‌طور خاص برای ارکستراسیون استنتاج - مدیریت داده‌ها، وظایف و ادغام‌ها - با نرم‌افزار، خدمات و API داخلی ساخته شده است. این تراشه نه تنها معماری‌های سنتی CPU و NIC را در یک واحد ادغام می‌کند، بلکه 6 برابر قدرت پردازش را روی تراشه بسته بندی می‌کند تا با پیشرفت‌های سریع GPU همگام شود و در عین حال گلوگاه‌های CPU سنتی را از بین ببرد.

تراشه NR1 که با هر GPU یا شتاب‌دهنده AI در داخل دستگاه خود جفت می‌شود، کارایی بی‌نظیری در هزینه، انرژی و املاک ارائه می‌دهد که برای پذیرش گسترده AI در سازمان‌ها حیاتی است. به عنوان مثال، با مقایسه مدل Llama 3.3-70B یکسان و تنظیمات یکسان GPU یا شتاب‌دهنده AI، دستگاه مبتنی بر AI-CPU NeuReality هزینه کلی کمتر در هر میلیون توکن AI را در مقایسه با سرورهای مبتنی بر CPU x86 دارد.

موشه تاناخ، بنیان‌گذار و مدیرعامل NeuReality، اظهار داشت: «هیچ‌کس در مورد پتانسیل عظیم AI تردیدی ندارد. چالش این است که چگونه استقرار استنتاج AI را از نظر اقتصادی امکان‌پذیر کنیم. فناوری AI-CPU مخرب NeuReality گلوگاه‌ها را از بین می‌برد و ما را قادر می‌سازد تا عملکرد اضافی مورد نیاز برای باز کردن قفل قدرت کامل GPUها را ارائه دهیم، در حالی که پرسش‌ها و توکن‌های AI را هماهنگ می‌کنیم و در نتیجه عملکرد و بازده سرمایه را در این سیستم‌های AI گران‌قیمت به حداکثر می‌رسانیم.»

تاناخ در ادامه گفت: «اکنون با دستگاه استنتاج AI یکپارچه سیلیکونی به نرم‌افزاری خود، سهولت استفاده را به سطح جدیدی ارتقا داده‌ایم. با مدل‌های AI و تمام ابزارهایی که از قبل نصب شده‌اند، به توسعه‌دهندگان نرم‌افزار AI کمک می‌کند تا AI را سریع‌تر، آسان‌تر و ارزان‌تر از همیشه مستقر کنند و به آنها امکان می‌دهد منابع را به کاربرد AI در تجارت خود اختصاص دهند، نه یکپارچه‌سازی و بهینه‌سازی زیرساخت.»

مطالعه‌ای اخیراً نشان داد که حدود 70٪ از شرکت‌ها گزارش می‌دهند که از AI تولیدی در حداقل یک عملکرد تجاری استفاده می‌کنند که نشان‌دهنده افزایش تقاضا است. با این حال، تنها 25٪ از شرکت‌ها فرآیندهایی دارند که به‌طور کامل توسط AI فعال شده‌اند و پذیرش گسترده‌ای را محقق کرده‌اند و تنها یک سوم از شرکت‌ها شروع به اجرای موارد استفاده محدود از AI کرده‌اند.

امروزه، گلوگاه‌های عملکرد CPU در مدیریت بارهای کاری چندوجهی و مدل زبان بزرگ در سرورها یک عامل اصلی است که منجر به کم شدن میانگین استفاده از GPU به 30-40٪ می‌شود. این امر منجر به هدر رفتن سیلیکون گران‌قیمت در استقرارهای AI و همچنین بازاری می‌شود که همچنان با موانع پیچیدگی و هزینه روبرو است.

رشید عطار، معاون ارشد مهندسی در شرکت Qualcomm Technologies، گفت: «شرکت‌ها و ارائه‌دهندگان خدمات در حال استقرار برنامه‌ها و نماینده‌های AI با سرعت بی‌سابقه‌ای هستند و بر ارائه عملکرد به‌طور اقتصادی تمرکز دارند. با ادغام شتاب‌دهنده Qualcomm Cloud AI 100 Ultra با معماری AI-CPU NeuReality، کاربران می‌توانند بدون به خطر انداختن سهولت استقرار و مقیاس‌بندی، به سطوح جدیدی از کارایی هزینه و عملکرد AI دست یابند.»

دستگاه NR1 NeuReality با مشتریان ابری و خدمات مالی مستقر شده است و به‌طور خاص برای تسریع پذیرش AI از طریق مقرون به صرفگی، دردسترس بودن و کارایی فضایی آن، برای گزینه‌های استنتاج به عنوان یک سرویس در محل و ابری طراحی شده است. علاوه بر مدل‌های جدید از پیش بارگذاری شده AI تولیدی و نماینده‌ای و نسخه‌های جدید هر سه ماه یکبار، به طور کامل برای کیت‌های توسعه نرم‌افزار از پیش پیکربندی شده و API برای بینایی رایانه‌ای، AI مکالمه‌ای یا درخواست‌های سفارشی که از طیف گسترده‌ای از موارد استفاده تجاری و بازار پشتیبانی می‌کنند (به عنوان مثال، خدمات مالی، علوم زیستی، دولت، ارائه‌دهندگان خدمات ابری) بهینه شده است.

اولین دستگاه NR1 یک ماژول NR1® (کارت PCIe) را با شتاب‌دهنده Qualcomm® Cloud AI 100 Ultra متحد می‌کند.

NeuReality از 20 تا 23 می 2025 در غرفه اسرائیل در InnoVEX (که با Computex برگزار می‌شود) در تایپه، تایوان، غرفه S0912 در سالن 2 (نزدیک‌ترین نقطه به صحنه مرکزی) نمایش داده می‌شود. این شرکت نمایش زنده‌ای از دستگاه استنتاج NR1، از جمله انتقال یک برنامه چت در عرض چند دقیقه و نمایش عملکرد تراشه NR1 در حال اجرای Smooth Factory Models و DeepSeek-R1-Distill-Llama-8B را برگزار می‌کند.

NeuReality که در سال 2019 تأسیس شد، یک پیشگام در معماری استنتاج AI اختصاصی است که توسط تراشه NR1® - اولین AI-CPU برای سازماندهی استنتاج - هدایت می‌شود. NR1 که بر اساس یک معماری باز و مبتنی بر استاندارد است، به طور کامل با هر شتاب‌دهنده AI سازگار است. مأموریت NeuReality این است که با کاهش موانع مرتبط با هزینه‌های بالا، مصرف انرژی و پیچیدگی و با بهره‌گیری از فناوری مخرب خود برای گسترش پذیرش استنتاج AI، دسترسی و فراگیری AI را ممکن سازد. این شرکت دارای 80 کارمند در سایت‌هایی در اسرائیل، لهستان و ایالات متحده است.

مدل‌های AI 1 از پیش بارگذاری شده و بهینه‌شده برای مشتریان سازمانی عبارتند از: Llama 3.3 70B، Llama 3.1 8B (سری Llama 4 به‌زودی عرضه می‌شود). Mistral 7B، Mistral 8x7B و Mistral Small. Qwen 2.5، از جمله Coder (Qwen 3 به‌زودی عرضه می‌شود). DeepSeek R1**-**Distill-Llama 8B، R1 Distill-Llama 70b. و Granite 3، 3.1 8B (Granite 3.3 به‌زودی عرضه می‌شود).

انقلاب AI با NeuReality: همگرایی عملکرد، مقرون به صرفه بودن و سهولت استفاده

با ادامه نفوذ هوش مصنوعی (AI) در صنایع مختلف، شرکت‌ها با چالش استقرار راهکارهای استنتاج AI به روشی از نظر اقتصادی عملی و کارآمد روبرو هستند. NeuReality از طریق رویکرد ابتکاری خود که بر ارائه دسترسی فوری و آماده به LLM (مدل‌های زبان بزرگ) و در عین حال کاهش چشمگیر هزینه کلی استنتاج AI متمرکز است، اقتصاد AI را مختل می‌کند. دستگاه استنتاج NR1، برجسته‌ترین محصول NeuReality، با بهینه‌سازی معماری استنتاج AI و از پیش بارگذاری کردن مدل‌های AI محبوب سازمانی، عملکرد، مقرون به صرفه بودن و سهولت غیرقابل مقایسه‌ای را در اختیار شرکت‌ها قرار می‌دهد.

دستگاه استنتاج NR1: تغییری بزرگ در قواعد بازی

هسته اصلی دستگاه استنتاج NR1، یک AI-CPU اختصاصی است که به‌طور خاص توسط NeuReality ساخته شده است و به‌عنوان یک مرکز کنترل متمرکز برای داده‌ها، وظایف و ادغام‌ها عمل می‌کند. برخلاف معماری‌های سنتی CPU و NIC، تراشه NR1 این اجزا را در یک واحد ادغام می‌کند، که باعث کاهش گلوگاه‌ها و به حداکثر رساندن قدرت پردازش می‌شود. این روش ادغام‌شده تراشه را قادر می‌سازد تا همگام با پیشرفت‌های سریع GPU باشد و در عین حال پرسش‌ها و توکن‌های AI را برای بهبود عملکرد و بازده سرمایه بهینه می‌کند.

AI آماده: ساده‌سازی استقرار

برای بهبود بیشتر سهولت استفاده، دستگاه استنتاج NR1 با مدل‌های AI محبوب سازمانی از جمله Llama، Mistral، Qwen و Granite از قبل بارگذاری شده است. این ویژگی پیچیدگی پیکربندی و بهینه‌سازی را از بین می‌برد و به توسعه‌دهندگان نرم‌افزار AI اجازه می‌دهد تا به‌جای صرف زمان برای ادغام زیرساخت، بر کاربرد AI در کسب‌وکار خود تمرکز کنند. این دستگاه در کمتر از 30 دقیقه راه‌اندازی و اجرا می‌شود که سرعت ارزش‌گذاری سریعی را برای مشتریان فراهم می‌کند.

AI مقرون به صرفه: تسریع در پذیرش

فناوری NeuReality از طریق ارائه هزینه کلی کمتر در هر میلیون توکن AI در مقایسه با سرورهای مبتنی بر CPU x86، دسترسی و استفاده از AI را برای شرکت‌ها مقرون به صرفه‌تر می‌کند. این مقرون به صرفه بودن برای شرکت‌ها و دولت‌ها در هر اندازه‌ای حیاتی است، زیرا مانع استقرار AI را کاهش می‌دهد و امکان کاربردهای گسترده‌تری را فراهم می‌کند.

مشارکت با شرکت Qualcomm Technologies: باز کردن سطوح جدیدی از عملکرد

همکاری استراتژیک بین NeuReality و شرکت Qualcomm Technologies قابلیت‌های دستگاه استنتاج NR1 را بیشتر بهبود می‌بخشد. با ادغام شتاب‌دهنده Qualcomm Cloud AI 100 Ultra با معماری AI-CPU NeuReality، کاربران می‌توانند بدون به خطر انداختن سهولت استقرار و مقیاس‌بندی، به سطوح جدیدی از کارایی هزینه و عملکرد AI دست یابند. این روش مشارکتی نشان می‌دهد که NeuReality به استفاده از فناوری‌های پیشرفته برای بهینه‌سازی راهکارهای استنتاج AI اختصاص دارد.

پرداختن به چالش‌های AI سازمانی: بهبود استفاده از GPU

NeuReality در حال پرداختن به یک چالش بزرگ پیش روی شرکت‌ها است: گلوگاه‌های عملکرد CPU در سرورها که باعث کاهش استفاده از GPU می‌شوند. به‌طور سنتی، سرورهایی که بارهای کاری چندوجهی و مدل زبان بزرگ را مدیریت می‌کنند، به‌طور متوسط ​​از GPU به میزان 30-40٪ استفاده می‌کنند. این میزان کم استفاده منجر به هدر رفتن سیلیکون گران‌قیمت در استقرارهای AI می‌شود و پذیرش AI را برای بازارهایی که خدمات کافی دریافت نکرده‌اند محدود می‌کند. فناوری AI-CPU NeuReality با از بین بردن گلوگاه‌های عملکرد، این مشکل را برطرف می‌کند و به شرکت‌ها امکان می‌دهد تا به‌طور کامل از قدرت GPUهای خود در کاربردهای AI استفاده کنند.

برآوردن تقاضا برای AI تولیدی: افزایش بهره‌وری

راهکار NeuReality با چشم‌انداز بازار در حال رشد سریع AI تولیدی سازگار است. تحقیقات اخیر نشان می‌دهد که حدود 70 درصد از شرکت‌ها گزارش می‌دهند که از AI تولیدی در حداقل یک عملکرد تجاری استفاده می‌کنند. با این حال، تنها 25 درصد از شرکت‌ها فرآیندهایی دارند که به‌طور کامل توسط AI فعال شده‌اند و پذیرش گسترده‌ای را محقق کرده‌اند. دستگاه استنتاج NR1 NeuReality شرکت‌ها را قادر می‌سازد تا برنامه‌های AI تولیدی خود را تسریع کنند، با کاهش موانع پذیرش از طریق بهبود سهولت استفاده، مقرون به صرفه بودن و عملکرد.

سهولت استفاده: کاهش موانع استقرار

علاوه بر عملکرد و مقرون به صرفه بودن، سهولت استفاده نیز یک محرک کلیدی در راهکارهای AI NeuReality است. دستگاه استنتاج NR1 با مدل‌های AI و کیت‌های توسعه نرم‌افزار از قبل بارگذاری شده، فرآیند استقرار را ساده می‌کند و نیاز به ادغام و بهینه‌سازی زیرساخت را کاهش می‌دهد. این سهولت استفاده به توسعه‌دهندگان نرم‌افزار AI اجازه می‌دهد تا به‌جای صرف زمان برای مقابله با زیرساخت‌های پیچیده، بر ساخت و استقرار برنامه‌های AI ابتکاری تمرکز کنند.

کاربردهای گسترده: صنایع متعدد

دستگاه استنتاج NR1 NeuReality برای پشتیبانی از طیف گسترده‌ای از موارد استفاده تجاری و بازار طراحی شده است. این دستگاه از طریق کیت‌های توسعه نرم‌افزار و APIهای از پیش پیکربندی شده برای بینایی رایانه‌ای، AI مکالمه‌ای و درخواست‌های سفارشی بهینه شده است. این تطبیق‌پذیری دستگاه استنتاج NR1 را برای صنایع مختلف، از جمله خدمات مالی، علوم زیستی، دولت و ارائه‌دهندگان خدمات ابری مناسب می‌سازد.

تسریع در پذیرش AI: مقرون به صرفه بودن، دسترسی و کارایی فضایی

دستگاه NR1 NeuReality با ارائه مقرون به صرفه بودن و دسترسی به طور همزمان، پذیرش AI را تسهیل می‌کند که آن را برای هر دو زیرساخت‌های محلی و ابری مناسب می‌سازد. بسیاری از سازمان‌ها در تلاش برای مقیاس‌بندی برنامه‌های AI خود هستند، زیرا هزینه‌های بالا و پیچیدگی آن در کار است، اما راهکار NeuReality با ارائه یک پلتفرم مقرون به صرفه و مبتنی بر استانداردهای باز، این موانع را حل می‌کند و توسعه و استقرار AI را ساده می‌کند.

نکات برجسته نمایش

NeuReality موتور استنتاج NR1 خود را در InnoVEX در نمایشگاه کامپیوتر تایوان در تایپه، تایوان از 20 تا 23 می 2025 به نمایش خواهد گذاشت و قابلیت‌های خود را به نمایش می‌گذارد. در این رویداد، این شرکت نحوه انتقال آسان یک برنامه چت در عرض چند دقیقه را نشان می‌دهد و عملکرد تراشه NR1 را در Smooth Factory Models و DeepSeek-R1-Distill-Llama-8B نشان می‌دهد.

نوآوری مستمر: آمادگی برای آینده

NeuReality متعهد است تا با انتشار منظم مدل‌های AI تولیدی و نماینده‌ای جدید و همچنین کیت‌های توسعه نرم‌افزار بهینه‌شده، قابلیت‌های دستگاه استنتاج NR1 خود را بهبود بخشد. این نوآوری مستمر شرکت‌ها را قادر می‌سازد تا از آخرین فناوری‌های AI مطلع شوند و اطمینان حاصل کنند که زیرساخت AI آنها برای بارهای کاری آینده بهینه شده است.

NeuReality: توانمندسازی شرکت‌ها برای در آغوش گرفتن پتانسیل‌های AI

فناوری مخرب AI-CPU NeuReality راهی مقرون به صرفه برای استقرار استقرارهای AI استنتاج ارائه می‌دهد و در نتیجه عملکرد GPU را به حداکثر می‌رساند در حالی که پرسش‌ها و توکن‌های AI را برای حداکثر عملکرد و بازده سرمایه بهینه می‌کند. از آنجایی که NeuReality به نوآوری و گسترش قابلیت‌های دستگاه استنتاج NR1 خود ادامه می‌دهد، به یک متحد کلیدی برای شرکت‌ها برای شکوفایی در دنیای پررونق AI تبدیل می‌شود.

NeuReality با ترکیب تمرکز خود بر عملکرد، مقرون به صرفه بودن و سهولت استفاده با تعهد به نوآوری مستمر، در جایگاهی قرار دارد که اقتصاد AI را بازتعریف کند و شرکت‌ها در همه اندازه‌ها را قادر می‌سازد تا پتانسیل‌های AI را در آغوش بگیرند.