NeuReality重塑AI經濟學 | zh-TW

企業和服務供應商正以創紀錄的速度部署AI應用程式和代理，並專注於提供……

NeuReality是一家在重新構想AI推理架構以滿足當今AI模型和工作負載需求的先驅，該公司宣布其NR1推理設備現在預裝了流行的企業AI模型，包括Llama、Mistral、Qwen、Granite 1，並支援私有生成AI雲和本地集群。該生成式和代理式AI就緒設備在不到30分鐘的時間內啟動並運行，提供了3倍的價值實現速度，從而使客戶能夠更快地進行創新。目前的PoC（概念驗證）表明，與基於x86 CPU的推理伺服器相比，在相同的成本和功率範圍內，token輸出量最多可提高6.5倍，從而使各種規模的企業和政府都能以更經濟實惠的方式訪問和使用AI。

在設備內部，NR1®芯片是首款真正的AI-CPU，專為推理編排而構建——數據、任務和集成的管理——具有內置的軟體、服務和API。它不僅將傳統的CPU和NIC架構整合為一個，而且還將6倍的處理能力封裝到芯片上，以跟上GPU的快速發展，同時消除了傳統的CPU瓶頸。

NR1芯片與其設備內的任何GPU或AI加速器配對，可提供突破性的成本、能源和房地產效率，這對於廣泛的企業AI採用至關重要。例如，比較相同的Llama 3.3-70B模型和相同的GPU或AI加速器設置，NeuReality的AI-CPU驅動設備實現了比基於x86 CPU的伺服器更低的每百萬AI token的總成本。

NeuReality的聯合創始人兼首席執行官Moshe Tanach表示：「沒有人會質疑AI的巨大潛力。挑戰在於如何使AI推理的部署在經濟上可行。NeuReality的顛覆性AI-CPU技術消除了瓶頸，使我們能夠提供所需的額外性能，以釋放GPU的全部功能，同時協調AI查詢和token，從而最大限度地提高這些昂貴AI系統的性能和投資回報率。」

Tanach繼續說道：「現在，我們通過集成的矽到軟體的AI推理設備將易用性提升到了一個新的水平。它預裝了AI模型和所有工具，可幫助AI軟體開發人員比以往更快、更容易、更便宜地部署AI，從而使他們能夠將資源轉移到在其業務中應用AI，而不是在基礎設施集成和優化方面。」

最近的一項研究發現，大約70%的企業報告說在至少一項業務功能中使用生成式AI，這表明需求增加了。但是，只有25%的企業擁有由AI完全啟用的流程，並且實現了廣泛採用，只有三分之一的企業開始實施有限的AI用例。

如今，伺服器上管理多模式和大型語言模型工作負載的CPU性能瓶頸是導致GPU平均利用率低至30-40%的主要因素。這導致AI部署中昂貴的矽浪費，以及仍然面臨複雜性和成本障礙的 underserved 市場。

高通技術公司工程高級副總裁Rashid Attar表示：「企業和服務提供商正以創紀錄的速度部署AI應用程式和代理，並且專注於以經濟的方式提供性能。通過將高通Cloud AI 100 Ultra加速器與NeuReality的AI-CPU架構集成，用戶可以實現新的成本效率和AI性能水平，而不會影響部署和擴展的簡便性。」

NeuReality的NR1設備已與雲和金融服務客戶一起部署，經過專門設計，可通過其經濟性、可訪問性和空間效率來加速AI的採用，適用於本地和雲推理即服務選項。除了新的預加載的生成式和代理式AI模型，以及每個季度的新版本外，它還完全優化了預配置的軟體開發工具包和API，用於計算機視覺、對話式AI或支援各種業務用例和市場的自定義請求（例如金融服務、生命科學、政府、雲服務提供商）。

首款NR1設備將NR1®模塊（PCIe卡）與高通® Cloud AI 100 Ultra加速器統一起來。

NeuReality將於2025年5月20日至23日在台北台灣舉行的InnoVEX（與Computex共同舉辦）的以色列館，2號館S0912展位（靠近中央舞台）展出。該公司將舉辦NR1推理設備的現場演示，包括在幾分鐘內遷移聊天應用程式以及NR1芯片運行Smooth Factory Models和DeepSeek-R1-Distill-Llama-8B的性能演示。

NeuReality成立于2019年，是一家由NR1®芯片（首款用於推理編排的AI-CPU）驅動的專用AI推理架構的先驅。基於開放的、基於標準的體系結構，NR1與任何AI加速器完全相容。NeuReality的使命是通過降低與高昂的成本、功耗和複雜性相關的障礙，並利用其顛覆性技術來擴大AI推理的採用範圍，從而使AI具有可訪問性和普遍性。該公司在以色列、波蘭和美國的工廠擁有80名員工。

預加載並針對企業客戶進行了優化的1 AI模型包括：Llama 3.3 70B、Llama 3.1 8B（Llama 4系列即將推出）；Mistral 7B、Mistral 8x7B和Mistral Small；Qwen 2.5，包括Coder（Qwen 3即將推出）；DeepSeek R1**-**Distill-Llama 8B、R1 Distill-Llama 70b；以及Granite 3、3.1 8B（Granite 3.3即將推出）。

NR1 推理设备：游戏规则改变者

NR1 推理设备的核心是 NeuReality 专门构建的 AI-CPU，它充当数据、任务和集成的集中式控制中心。与传统的 CPU 和 NIC 架构不同，NR1 芯片将这些组件集成到一个单元中，从而减少了瓶颈并最大限度地提高了处理能力。这种集成方法使该芯片能够跟上 GPU 的快速发展，同时优化 AI 查询和令牌，以提高性能和投资回报率。

开箱即用的AI：简化部署

为了进一步增强易用性，NR1 推理设备预装了流行的企业 AI 模型，包括 Llama、Mistral、Qwen 和 Granite。此功能消除了配置和優化的複雜性，允许 AI 软件开发人员专注于在业务中应用 AI，而不是花费时间进行基础设施集成。该设备可以在不到 30 分钟内启动并运行，从而为客户提供了快速的价值实现。

经济实惠的 AI：加速采用

NeuReality 的技术通过提供比基于 x86 CPU 的服务器更高的每百万 AI 令牌的总成本，使企业可以更经济地访问和使用 AI。这种成本效益对于各种规模的企业和政府来说至关重要，因为它可以降低 AI 部署的障碍，并使更广泛的应用成为可能。

与高通技术公司合作：解锁新性能水平

NeuReality 与高通技术公司之间的战略合作伙伴关系进一步增强了 NR1 推理设备的功能。通过将高通 Cloud AI 100 Ultra 加速器与 NeuReality 的 AI-CPU 架构集成，用户可以实现新的成本效率和 AI 性能水平，而不会影响部署和扩展的简便性。这种协作方法展示了 NeuReality 致力于利用尖端技术来优化 AI 推理解决方案。

解决企业 AI 挑战：提高 GPU 利用率

NeuReality 正解决企业面临的一个重大挑战：服务器上的 CPU 性能瓶颈，这些瓶颈会降低 GPU 利用率。传统上，管理多模式和大型语言模型工作负载的服务器的 GPU 平均利用率低至 30-40%。这种低利用率导致 AI 部署中昂贵的矽浪費，并限制了 underserved 市场的 AI 采用。NeuReality 的 AI-CPU 技术通过消除性能瓶颈来解决此问题，从而使企业能够在 AI 应用中充分利用其 GPU 的功能。

满足生成式 AI 的需求：利用率的增加

NeuReality 的解决方案与快速增长的生成式 AI 市场前景良好。最近的研究表明，大约 70% 的企业报告说在至少一项业务功能中使用生成式 AI。但是，只有 25% 的企业拥有由 AI 完全启用的流程，并且实现了广泛采用。NeuReality 的 NR1 推理设备使企业能够加速其生成式 AI 计划，通过提高易用性、成本效益和性能来消除采用的障碍。

易用性：降低部署障碍

除了性能和成本效益外，易用性也是 NeuReality AI 解决方案的关键驱动因素。 NR1 推理设备预装了 AI 模型和軟體開發工具包，从而简化了部署流程，并减少了基础设施集成和优化的需求。这种易用性使 AI 软件开发人员能够专注于构建和部署创新 AI 应用程序，而不是花费时间处理复杂的基础设施。

广泛的应用：多个行业

NeuReality 的 NR1 推理设备专为支持各种业务用例和市场而设计。该设备通过预配置的軟體開發工具包和API 优化了计算机视觉、对话式 AI 和自定义请求。这种多功能性使 NR1 推理设备适合各种行业，包括金融服务、生命科学、政府和云服务提供商。

加速AI的采用：经济适用性、可访问性和空间效率

NeuReality 的 NR1 设备通过同时提供经济适用性和可访问性来促进 AI 的采用，这使其适合本地和云基础架构。许多组织都在努力扩展其 AI 计划，因为其高昂的成本和复杂性，但 NeuReality 的解决方案通过提供成本有效的开放标准平台来解决这些障碍，从而简化了 AI 的开发和部署。

演示亮点

NeuReality 将在 2025 年 5 月 20 日至 23 日在台湾台北举行的台湾电脑展的 InnoVEX 上展示其 NR1 推理引擎，展示其功能。在活动中，该公司将演示如何在几分钟内轻松迁移聊天应用程序，并展示 NR1 芯片在 Smooth Factory Models 和 DeepSeek-R1-Distill-Llama-8B 中的性能。

持续创新：为未来做好准备

NeuReality 致力于通过定期发布新的生成式和代理 AI 模型以及优化后的軟體開發工具包，來提升其 NR1 推理设备的功能。这种持续创新使企业能够随时了解最新的 AI 技术，并确保其 AI 基础设施针对未来的工作负载进行了优化。

NeuReality：赋能企业掌握AI的潜力

NeuReality 的颠覆性 AI-CPU 技术提供经济高效的方式来部署推理 AI 部署，从而最大限度地发挥 GPU 的性能，同时优化 AI 查询和令牌，以实现最大的性能和投资回报率。随着 NeuReality 继续创新并扩大 NR1 推理设备的功能，它将成为企业在蓬勃发展的 AI 世界中蓬勃发展的关键盟友。

通过将对性能、成本效益和易用性的关注与致力于持续创新的承诺相结合，NeuReality 定位于重塑 AI 经济学，并使各种规模的企业都能掌握 AI 的潜力。

隨著人工智慧（AI）持續滲透到各個產業，企業面臨著在經濟上可行且高效地部署AI推理解決方案的挑戰。NeuReality 通過其創新方法顛覆了 AI 經濟學，該方法側重於提供開箱即用的即時 LLM（大型語言模型）訪問，同時顯著降低 AI 推理的總成本。NeuReality 的旗艦產品 NR1 推理設備通過優化 AI 推理架構以及預加載流行的企業 AI 模型，為企業提供了前所未有的性能、成本效益和易用性。

NR1 推理設備：遊戲規則改變者

NR1 推理設備的核心是 NeuReality 專門構建的 AI-CPU，它充當數據、任務和集成的集中式控制中心。與傳統的 CPU 和 NIC 架構不同，NR1 芯片將這些組件集成到一個單元中，從而減少了瓶頸並最大限度地提高了處理能力。這種集成方法使該芯片能夠跟上 GPU 的快速發展，同時優化 AI 查詢和令牌，以提高性能和投資回報率。

開箱即用的AI：簡化部署

為了進一步增強易用性，NR1 推理設備預裝了流行的企業 AI 模型，包括 Llama、Mistral、Qwen 和 Granite。此功能消除了配置和優化的複雜性，允許 AI 軟件開發人員專注於在業務中應用 AI，而不是花費時間進行基礎設施集成。該設備可以在不到 30 分鐘內啟動並運行，從而為客戶提供了快速的價值實現。

經濟實惠的 AI：加速採用

NeuReality 的技術通過提供比基於 x86 CPU 的伺服器更高的每百萬 AI 令牌的總成本，使企業可以更經濟地訪問和使用 AI。這種成本效益對於各種規模的企業和政府來說至關重要，因為它可以降低 AI 部署的障礙，並使更廣泛的應用成為可能。

與高通技術公司合作：解鎖新性能水平

NeuReality 與高通技術公司之間的戰略合作夥伴關係進一步增強了 NR1 推理設備的功能。通過將高通 Cloud AI 100 Ultra 加速器與 NeuReality 的 AI-CPU 架構集成，用戶可以實現新的成本效率和 AI 性能水平，而不會影響部署和擴展的簡便性。這種協作方法展示了 NeuReality 致力於利用尖端技術來優化 AI 推理解決方案。

解決企業 AI 挑戰：提高 GPU 利用率

NeuReality 正解決企業面臨的一個重大挑戰：伺服器上的 CPU 性能瓶頸，這些瓶頸會降低 GPU 利用率。傳統上，管理多模式和大型語言模型工作負載的伺服器的 GPU 平均利用率低至 30-40%。這種低利用率導致 AI 部署中昂貴的矽浪費，並限制了 underserved 市场的 AI 采用。NeuReality 的 AI-CPU 技術通過消除性能瓶頸來解決此問題，從而使企業能夠在 AI 應用中充分利用其 GPU 的功能。

滿足生成式 AI 的需求：利用率的增加

NeuReality 的解決方案與快速增長的生成式 AI 市場前景良好。最近的研究表明，大約 70% 的企業報告說在至少一項業務功能中使用生成式 AI。但是，只有 25% 的企業擁有由 AI 完全啟用的流程，並且實現了廣泛採用。NeuReality 的 NR1 推理設備使企業能夠加速其生成式 AI 計劃，通過提高易用性、成本效益和性能來消除採用的障礙。

易用性：降低部署障礙

除了性能和成本效益外，易用性也是 NeuReality AI 解決方案的關鍵驅動因素。 NR1 推理設備預裝了 AI 模型和軟體開發工具包，從而簡化了部署流程，並減少了基礎設施集成和優化的需求。這種易用性使 AI 軟件開發人員能夠專注於構建和部署創新 AI 應用程序，而不是花費時間處理複雜的基礎設施。

廣泛的應用：多個行業

NeuReality 的 NR1 推理設備專為支持各種業務用例和市場而設計。該設備通過預配置的軟體開發工具包和 API 優化了計算機視覺、對話式 AI 和自定義請求。這種多功能性使 NR1 推理設備適合各種行業，包括金融服務、生命科學、政府和雲服務提供商。

加速AI的採用：經濟適用性、可訪問性和空間效率

NeuReality 的 NR1 設備通過同時提供經濟適用性和可訪問性來促進 AI 的採用，這使其適合本地和雲基礎架構。許多組織都在努力擴展其 AI 計劃，因為其高昂的成本和複雜性，但 NeuReality 的解決方案通過提供成本有效的開放標準平台來解決這些障礙，從而簡化了 AI 的開發和部署。

演示亮點

NeuReality 將在 2025 年 5 月 20 日至 23 日在台灣台北舉行的台灣電腦展的 InnoVEX 上展示其 NR1 推理引擎，展示其功能。在活動中，該公司將演示如何在幾分鐘內輕鬆遷移聊天應用程序，並展示 NR1 芯片在 Smooth Factory Models 和 DeepSeek-R1-Distill-Llama-8B 中的性能。

持續創新：為未來做好準備

NeuReality 致力於通過定期發布新的生成式和代理 AI 模型以及優化後的軟體開發工具包，來提升其 NR1 推理设备的功能。這種持續創新使企業能夠隨時了解最新的 AI 技術，並確保其 AI 基礎設施針對未來的工作負載進行了優化。

NeuReality：賦能企業掌握AI的潛力

NeuReality 的顛覆性 AI-CPU 技術提供經濟高效的方式來部署推理 AI 部署，從而最大限度地發揮 GPU 的性能，同時優化 AI 查詢和令牌，以實現最大的性能和投資回報率。隨著 NeuReality 繼續創新並擴大 NR1 推理设备的功能，它將成為企業在蓬勃發展的 AI 世界中蓬勃發展的關鍵盟友。

通過將對性能、成本效益和易用性的關注與致力於持續創新的承諾相結合，NeuReality 定位於重塑 AI 經濟學，並使各種規模的企業都能掌握 AI 的潛力。

更新於 2025-05-16

# AI # LLM # Agent