NeuReality重塑AI經濟學

企業和服務供應商正以創紀錄的速度部署AI應用程式和代理,並專注於提供……

NeuReality是一家在重新構想AI推理架構以滿足當今AI模型和工作負載需求的先驅,該公司宣布其NR1推理設備現在預裝了流行的企業AI模型,包括Llama、Mistral、Qwen、Granite 1,並支援私有生成AI雲和本地集群。該生成式和代理式AI就緒設備在不到30分鐘的時間內啟動並運行,提供了3倍的價值實現速度,從而使客戶能夠更快地進行創新。目前的PoC(概念驗證)表明,與基於x86 CPU的推理伺服器相比,在相同的成本和功率範圍內,token輸出量最多可提高6.5倍,從而使各種規模的企業和政府都能以更經濟實惠的方式訪問和使用AI。

在設備內部,NR1®芯片是首款真正的AI-CPU,專為推理編排而構建——數據、任務和集成的管理——具有內置的軟體、服務和API。它不僅將傳統的CPU和NIC架構整合為一個,而且還將6倍的處理能力封裝到芯片上,以跟上GPU的快速發展,同時消除了傳統的CPU瓶頸。

NR1芯片與其設備內的任何GPU或AI加速器配對,可提供突破性的成本、能源和房地產效率,這對於廣泛的企業AI採用至關重要。例如,比較相同的Llama 3.3-70B模型和相同的GPU或AI加速器設置,NeuReality的AI-CPU驅動設備實現了比基於x86 CPU的伺服器更低的每百萬AI token的總成本。

NeuReality的聯合創始人兼首席執行官Moshe Tanach表示:「沒有人會質疑AI的巨大潛力。挑戰在於如何使AI推理的部署在經濟上可行。NeuReality的顛覆性AI-CPU技術消除了瓶頸,使我們能夠提供所需的額外性能,以釋放GPU的全部功能,同時協調AI查詢和token,從而最大限度地提高這些昂貴AI系統的性能和投資回報率。」

Tanach繼續說道:「現在,我們通過集成的矽到軟體的AI推理設備將易用性提升到了一個新的水平。它預裝了AI模型和所有工具,可幫助AI軟體開發人員比以往更快、更容易、更便宜地部署AI,從而使他們能夠將資源轉移到在其業務中應用AI,而不是在基礎設施集成和優化方面。」

最近的一項研究發現,大約70%的企業報告說在至少一項業務功能中使用生成式AI,這表明需求增加了。但是,只有25%的企業擁有由AI完全啟用的流程,並且實現了廣泛採用,只有三分之一的企業開始實施有限的AI用例。

如今,伺服器上管理多模式和大型語言模型工作負載的CPU性能瓶頸是導致GPU平均利用率低至30-40%的主要因素。這導致AI部署中昂貴的矽浪費,以及仍然面臨複雜性和成本障礙的 underserved 市場。

高通技術公司工程高級副總裁Rashid Attar表示:「企業和服務提供商正以創紀錄的速度部署AI應用程式和代理,並且專注於以經濟的方式提供性能。通過將高通Cloud AI 100 Ultra加速器與NeuReality的AI-CPU架構集成,用戶可以實現新的成本效率和AI性能水平,而不會影響部署和擴展的簡便性。」

NeuReality的NR1設備已與雲和金融服務客戶一起部署,經過專門設計,可通過其經濟性、可訪問性和空間效率來加速AI的採用,適用於本地和雲推理即服務選項。除了新的預加載的生成式和代理式AI模型,以及每個季度的新版本外,它還完全優化了預配置的軟體開發工具包和API,用於計算機視覺、對話式AI或支援各種業務用例和市場的自定義請求(例如金融服務、生命科學、政府、雲服務提供商)。

首款NR1設備將NR1®模塊(PCIe卡)與高通® Cloud AI 100 Ultra加速器統一起來。

NeuReality將於2025年5月20日至23日在台北台灣舉行的InnoVEX(與Computex共同舉辦)的以色列館,2號館S0912展位(靠近中央舞台)展出。該公司將舉辦NR1推理設備的現場演示,包括在幾分鐘內遷移聊天應用程式以及NR1芯片運行Smooth Factory Models和DeepSeek-R1-Distill-Llama-8B的性能演示。

NeuReality成立于2019年,是一家由NR1®芯片(首款用於推理編排的AI-CPU)驅動的專用AI推理架構的先驅。基於開放的、基於標準的體系結構,NR1與任何AI加速器完全相容。NeuReality的使命是通過降低與高昂的成本、功耗和複雜性相關的障礙,並利用其顛覆性技術來擴大AI推理的採用範圍,從而使AI具有可訪問性和普遍性。該公司在以色列、波蘭和美國的工廠擁有80名員工。

預加載並針對企業客戶進行了優化的1 AI模型包括:Llama 3.3 70B、Llama 3.1 8B(Llama 4系列即將推出);Mistral 7B、Mistral 8x7B和Mistral Small;Qwen 2.5,包括Coder(Qwen 3即將推出);DeepSeek R1**-**Distill-Llama 8B、R1 Distill-Llama 70b;以及Granite 3、3.1 8B(Granite 3.3即將推出)。

NR1 推理设备:游戏规则改变者

NR1 推理设备的核心是 NeuReality 专门构建的 AI-CPU,它充当数据、任务和集成的集中式控制中心。与传统的 CPU 和 NIC 架构不同,NR1 芯片将这些组件集成到一个单元中,从而减少了瓶颈并最大限度地提高了处理能力。这种集成方法使该芯片能够跟上 GPU 的快速发展,同时优化 AI 查询和令牌,以提高性能和投资回报率。

开箱即用的AI:简化部署

为了进一步增强易用性,NR1 推理设备预装了流行的企业 AI 模型,包括 Llama、Mistral、Qwen 和 Granite。 此功能消除了配置和優化的複雜性,允许 AI 软件开发人员专注于在业务中应用 AI,而不是花费时间进行基础设施集成。 该设备可以在不到 30 分钟内启动并运行,从而为客户提供了快速的价值实现。

经济实惠的 AI:加速采用

NeuReality 的技术通过提供比基于 x86 CPU 的服务器更高的每百万 AI 令牌的总成本,使企业可以更经济地访问和使用 AI。 这种成本效益对于各种规模的企业和政府来说至关重要,因为它可以降低 AI 部署的障碍,并使更广泛的应用成为可能。

与高通技术公司合作:解锁新性能水平

NeuReality 与高通技术公司之间的战略合作伙伴关系进一步增强了 NR1 推理设备的功能。通过将高通 Cloud AI 100 Ultra 加速器与 NeuReality 的 AI-CPU 架构集成,用户可以实现新的成本效率和 AI 性能水平,而不会影响部署和扩展的简便性。这种协作方法展示了 NeuReality 致力于利用尖端技术来优化 AI 推理解决方案。

解决企业 AI 挑战:提高 GPU 利用率

NeuReality 正解决企业面临的一个重大挑战:服务器上的 CPU 性能瓶颈,这些瓶颈会降低 GPU 利用率。传统上,管理多模式和大型语言模型工作负载的服务器的 GPU 平均利用率低至 30-40%。 这种低利用率导致 AI 部署中昂贵的矽浪費,并限制了 underserved 市场的 AI 采用。NeuReality 的 AI-CPU 技术通过消除性能瓶颈来解决此问题,从而使企业能够在 AI 应用中充分利用其 GPU 的功能。

满足生成式 AI 的需求:利用率的增加

NeuReality 的解决方案与快速增长的生成式 AI 市场前景良好。最近的研究表明,大约 70% 的企业报告说在至少一项业务功能中使用生成式 AI。 但是,只有 25% 的企业拥有由 AI 完全启用的流程,并且实现了广泛采用。NeuReality 的 NR1 推理设备使企业能够加速其生成式 AI 计划,通过提高易用性、成本效益和性能来消除采用的障碍。

易用性:降低部署障碍

除了性能和成本效益外,易用性也是 NeuReality AI 解决方案的关键驱动因素。 NR1 推理设备预装了 AI 模型和軟體開發工具包,从而简化了部署流程,并减少了基础设施集成和优化的需求。 这种易用性使 AI 软件开发人员能够专注于构建和部署创新 AI 应用程序,而不是花费时间处理复杂的基础设施。

广泛的应用:多个行业

NeuReality 的 NR1 推理设备专为支持各种业务用例和市场而设计。 该设备通过预配置的軟體開發工具包和API 优化了计算机视觉、对话式 AI 和自定义请求。 这种多功能性使 NR1 推理设备适合各种行业,包括金融服务、生命科学、政府和云服务提供商。

加速AI的采用:经济适用性、可访问性和空间效率

NeuReality 的 NR1 设备通过同时提供经济适用性和可访问性来促进 AI 的采用,这使其适合本地和云基础架构。 许多组织都在努力扩展其 AI 计划,因为其高昂的成本和复杂性,但 NeuReality 的解决方案通过提供成本有效的开放标准平台来解决这些障碍,从而简化了 AI 的开发和部署。

演示亮点

NeuReality 将在 2025 年 5 月 20 日至 23 日在台湾台北举行的台湾电脑展的 InnoVEX 上展示其 NR1 推理引擎,展示其功能。在活动中,该公司将演示如何在几分钟内轻松迁移聊天应用程序,并展示 NR1 芯片在 Smooth Factory Models 和 DeepSeek-R1-Distill-Llama-8B 中的性能。

持续创新:为未来做好准备

NeuReality 致力于通过定期发布新的生成式和代理 AI 模型以及优化后的軟體開發工具包,來提升其 NR1 推理设备的功能。这种持续创新使企业能够随时了解最新的 AI 技术,并确保其 AI 基础设施针对未来的工作负载进行了优化。

NeuReality:赋能企业掌握AI的潜力

NeuReality 的颠覆性 AI-CPU 技术提供经济高效的方式来部署推理 AI 部署,从而最大限度地发挥 GPU 的性能,同时优化 AI 查询和令牌,以实现最大的性能和投资回报率。随着 NeuReality 继续创新并扩大 NR1 推理设备的功能,它将成为企业在蓬勃发展的 AI 世界中蓬勃发展的关键盟友。

通过将对性能、成本效益和易用性的关注与致力于持续创新的承诺相结合,NeuReality 定位于重塑 AI 经济学,并使各种规模的企业都能掌握 AI 的潜力。

隨著人工智慧(AI)持續滲透到各個產業,企業面臨著在經濟上可行且高效地部署AI推理解決方案的挑戰。NeuReality 通過其創新方法顛覆了 AI 經濟學,該方法側重於提供開箱即用的即時 LLM(大型語言模型)訪問,同時顯著降低 AI 推理的總成本。NeuReality 的旗艦產品 NR1 推理設備通過優化 AI 推理架構以及預加載流行的企業 AI 模型,為企業提供了前所未有的性能、成本效益和易用性。

NR1 推理設備:遊戲規則改變者

NR1 推理設備的核心是 NeuReality 專門構建的 AI-CPU,它充當數據、任務和集成的集中式控制中心。與傳統的 CPU 和 NIC 架構不同,NR1 芯片將這些組件集成到一個單元中,從而減少了瓶頸並最大限度地提高了處理能力。這種集成方法使該芯片能夠跟上 GPU 的快速發展,同時優化 AI 查詢和令牌,以提高性能和投資回報率。

開箱即用的AI:簡化部署

為了進一步增強易用性,NR1 推理設備預裝了流行的企業 AI 模型,包括 Llama、Mistral、Qwen 和 Granite。 此功能消除了配置和優化的複雜性,允許 AI 軟件開發人員專注於在業務中應用 AI,而不是花費時間進行基礎設施集成。 該設備可以在不到 30 分鐘內啟動並運行,從而為客戶提供了快速的價值實現。

經濟實惠的 AI:加速採用

NeuReality 的技術通過提供比基於 x86 CPU 的伺服器更高的每百萬 AI 令牌的總成本,使企業可以更經濟地訪問和使用 AI。 這種成本效益對於各種規模的企業和政府來說至關重要,因為它可以降低 AI 部署的障礙,並使更廣泛的應用成為可能。

與高通技術公司合作:解鎖新性能水平

NeuReality 與高通技術公司之間的戰略合作夥伴關係進一步增強了 NR1 推理設備的功能。通過將高通 Cloud AI 100 Ultra 加速器與 NeuReality 的 AI-CPU 架構集成,用戶可以實現新的成本效率和 AI 性能水平,而不會影響部署和擴展的簡便性。這種協作方法展示了 NeuReality 致力於利用尖端技術來優化 AI 推理解決方案。

解決企業 AI 挑戰:提高 GPU 利用率

NeuReality 正解決企業面臨的一個重大挑戰:伺服器上的 CPU 性能瓶頸,這些瓶頸會降低 GPU 利用率。傳統上,管理多模式和大型語言模型工作負載的伺服器的 GPU 平均利用率低至 30-40%。 這種低利用率導致 AI 部署中昂貴的矽浪費,並限制了 underserved 市场的 AI 采用。NeuReality 的 AI-CPU 技術通過消除性能瓶頸來解決此問題,從而使企業能夠在 AI 應用中充分利用其 GPU 的功能。

滿足生成式 AI 的需求:利用率的增加

NeuReality 的解決方案與快速增長的生成式 AI 市場前景良好。最近的研究表明,大約 70% 的企業報告說在至少一項業務功能中使用生成式 AI。 但是,只有 25% 的企業擁有由 AI 完全啟用的流程,並且實現了廣泛採用。NeuReality 的 NR1 推理設備使企業能夠加速其生成式 AI 計劃,通過提高易用性、成本效益和性能來消除採用的障礙。

易用性:降低部署障礙

除了性能和成本效益外,易用性也是 NeuReality AI 解決方案的關鍵驅動因素。 NR1 推理設備預裝了 AI 模型和軟體開發工具包,從而簡化了部署流程,並減少了基礎設施集成和優化的需求。 這種易用性使 AI 軟件開發人員能夠專注於構建和部署創新 AI 應用程序,而不是花費時間處理複雜的基礎設施。

廣泛的應用:多個行業

NeuReality 的 NR1 推理設備專為支持各種業務用例和市場而設計。 該設備通過預配置的軟體開發工具包和 API 優化了計算機視覺、對話式 AI 和自定義請求。 這種多功能性使 NR1 推理設備適合各種行業,包括金融服務、生命科學、政府和雲服務提供商。

加速AI的採用:經濟適用性、可訪問性和空間效率

NeuReality 的 NR1 設備通過同時提供經濟適用性和可訪問性來促進 AI 的採用,這使其適合本地和雲基礎架構。 許多組織都在努力擴展其 AI 計劃,因為其高昂的成本和複雜性,但 NeuReality 的解決方案通過提供成本有效的開放標準平台來解決這些障礙,從而簡化了 AI 的開發和部署。

演示亮點

NeuReality 將在 2025 年 5 月 20 日至 23 日在台灣台北舉行的台灣電腦展的 InnoVEX 上展示其 NR1 推理引擎,展示其功能。在活動中,該公司將演示如何在幾分鐘內輕鬆遷移聊天應用程序,並展示 NR1 芯片在 Smooth Factory Models 和 DeepSeek-R1-Distill-Llama-8B 中的性能。

持續創新:為未來做好準備

NeuReality 致力於通過定期發布新的生成式和代理 AI 模型以及優化後的軟體開發工具包,來提升其 NR1 推理设备的功能。這種持續創新使企業能夠隨時了解最新的 AI 技術,並確保其 AI 基礎設施針對未來的工作負載進行了優化。

NeuReality:賦能企業掌握AI的潛力

NeuReality 的顛覆性 AI-CPU 技術提供經濟高效的方式來部署推理 AI 部署,從而最大限度地發揮 GPU 的性能,同時優化 AI 查詢和令牌,以實現最大的性能和投資回報率。隨著 NeuReality 繼續創新並擴大 NR1 推理设备的功能,它將成為企業在蓬勃發展的 AI 世界中蓬勃發展的關鍵盟友。

通過將對性能、成本效益和易用性的關注與致力於持續創新的承諾相結合,NeuReality 定位於重塑 AI 經濟學,並使各種規模的企業都能掌握 AI 的潛力。