Unternehmen und Dienstleister implementieren KI-Anwendungen und -Agenten in Rekordtempo und konzentrieren sich darauf, Leistung auf wirtschaftliche Weise bereitzustellen…
NeuReality, ein Pionier bei der Neugestaltung von KI-Inferenzarchitekturen zur Erfüllung der Anforderungen heutiger KI-Modelle und -Workloads, gab bekannt, dass sein NR1-Inferenzgerät jetzt mit gängigen Enterprise-KI-Modellen wie Llama, Mistral, Qwen, Granite vorinstalliert ist und private generative KI-Clouds und lokale Cluster unterstützt. Dieses generative und agentenbasierte KI-fähige Gerät ist in weniger als 30 Minuten einsatzbereit und bietet eine dreifach schnellere Wertschöpfung, sodass Kunden schneller innovieren können. Aktuelle PoCs (Proof of Concept) zeigen, dass der Token-Durchsatz im gleichen Kosten- und Leistungsbereich bis zu 6,5-mal höher ist als bei x86-CPU-basierten Inferenzservern, wodurch der Zugriff auf und die Verwendung von KI für Unternehmen und Regierungen aller Größen erschwinglicher werden.
Im Inneren des Geräts ist der NR1®-Chip die erste echte KI-CPU, die speziell für die Inferenzorchestrierung entwickelt wurde – die Verwaltung von Daten, Aufgaben und Integrationen – mit integrierter Software, Services und APIs. Es integriert nicht nur herkömmliche CPU- und NIC-Architekturen in einem, sondern verpackt auch die sechsfache Verarbeitungsleistung auf dem Chip, um mit dem rasanten Tempo von GPUs Schritt zu halten und gleichzeitig herkömmliche CPU-Engpässe zu beseitigen.
In Kombination mit einer beliebigen GPU oder einem KI-Beschleuniger im Gerät bietet der NR1-Chip eine bahnbrechende Kosten-, Energie- und Flächeneffizienz, die für eine breite Einführung von KI in Unternehmen unerlässlich ist. Vergleicht man beispielsweise das gleiche Llama 3.3-70B-Modell und die gleiche GPU- oder KI-Beschleunigerkonfiguration, erzielt das KI-CPU-gesteuerte Gerät von NeuReality niedrigere Gesamtbetriebskosten pro Million KI-Token als ein x86-CPU-basierter Server.
Moshe Tanach, Mitbegründer und CEO von NeuReality, sagte: "Niemand würde das enorme Potenzial von KI in Frage stellen. Die Herausforderung besteht darin, die Bereitstellung von KI-Inferenz wirtschaftlich tragfähig zu machen. Die bahnbrechende KI-CPU-Technologie von NeuReality beseitigt Engpässe und ermöglicht es uns, die zusätzliche Leistung bereitzustellen, die erforderlich ist, um die volle Leistung von GPUs freizusetzen und gleichzeitig KI-Abfragen und -Token zu orchestrieren, um die Leistung und den ROI dieser teuren KI-Systeme zu maximieren."
Tanach fuhr fort: "Jetzt heben wir die Benutzerfreundlichkeit mit unseren integrierten Silizium-zu-Software-KI-Inferenzgeräten auf ein neues Niveau. Es ist mit KI-Modellen und allen Tools vorinstalliert, die KI-Softwareentwicklern helfen, KI schneller, einfacher und kostengünstiger als je zuvor bereitzustellen, sodass sie Ressourcen von der Anwendung von KI in ihrem Geschäft auf die Infrastrukturintegration und -optimierung verlagern können."
Eine kürzlich durchgeführte Studie ergab, dass etwa 70 % der Unternehmen berichten, generative KI in mindestens einer Geschäftsfunktion einzusetzen, was auf eine gestiegene Nachfrage hindeutet. Allerdings haben nur 25 % der Unternehmen Prozesse, die vollständig von KI unterstützt werden, und eine breite Akzeptanz erreichen, und nur ein Drittel der Unternehmen hat mit der Implementierung begrenzter KI-Anwendungsfälle begonnen.
Heutzutage sind CPU-Leistungsengpässe auf Servern, die multimodale und große Sprachmodell-Workloads verwalten, ein Hauptgrund dafür, dass die durchschnittliche GPU-Auslastung nur 30–40 % beträgt. Dies führt zu teurer Siliziumverschwendung bei KI-Bereitstellungen sowie zu einem unterversorgten Markt, der immer noch mit Komplexität und Kostenbarrieren zu kämpfen hat.
Rashid Attar, Senior Vice President of Engineering bei Qualcomm Technologies, Inc., sagte: "Unternehmen und Dienstleister implementieren KI-Anwendungen und -Agenten in Rekordtempo und konzentrieren sich darauf, Leistung auf wirtschaftliche Weise bereitzustellen. Durch die Integration des Qualcomm Cloud AI 100 Ultra-Beschleunigers mit der KI-CPU-Architektur von NeuReality können Benutzer ein neues Niveau an Kosteneffizienz und KI-Leistung erreichen, ohne die einfache Bereitstellung und Skalierung zu beeinträchtigen."
Das NR1-Gerät von NeuReality wurde zusammen mit Cloud- und Finanzdienstleistungskunden eingesetzt und wurde speziell entwickelt, um die Einführung von KI durch seine Wirtschaftlichkeit, Zugänglichkeit und Raumeffizienz zu beschleunigen und ist sowohl für lokale als auch für Cloud-Inferenz-as-a-Service-Optionen geeignet. Neben den neuen vorinstallierten generativen und agentenbasierten KI-Modellen sowie neuen vierteljährlichen Versionen ist es vollständig optimiert mit vorkonfigurierten Software Development Kits und APIs für Computer Vision, konversationelle KI oder unterstützt kundenspezifische Anfragen für verschiedene Anwendungsfälle und Märkte (z. B. Finanzdienstleistungen, Biowissenschaften, Behörden, Cloud Service Provider).
Das erste NR1-Gerät vereint das NR1®-Modul (PCIe-Karte) mit dem Qualcomm® Cloud AI 100 Ultra-Beschleuniger.
NeuReality wird vom 20. bis 23. Mai 2025 auf der InnoVEX (zusammen mit der Computex) im israelischen Pavillon, Halle 2 Stand S0912 (in der Nähe der Hauptbühne) in Taipei, Taiwan, ausstellen. Das Unternehmen wird Live-Demos des NR1-Inferenzgeräts veranstalten, darunter die Migration einer Chat-Anwendung in wenigen Minuten sowie eine Leistungsdemonstration des NR1-Chips, der Smooth Factory Models und DeepSeek-R1-Distill-Llama-8B ausführt.
NeuReality wurde 2019 gegründet und ist ein Pionier für dedizierte KI-Inferenzarchitekturen, die von dem NR1®-Chip angetrieben werden – der ersten KI-CPU für die Inferenzorchestrierung. Basierend auf einer offenen, standardbasierten Architektur ist NR1 vollständig kompatibel mit jedem KI-Beschleuniger. Die Mission von NeuReality ist es, KI zugänglich und allgegenwärtig zu machen, indem die mit hohen Kosten, Stromverbrauch und Komplexität verbundenen Hürden durch den Einsatz seiner bahnbrechenden Technologie überwunden und die Akzeptanz von KI-Inferenz erweitert wird. Das Unternehmen beschäftigt 80 Mitarbeiter in seinen Niederlassungen in Israel, Polen und den USA.
Vorinstallierte und für Unternehmenskunden optimierte KI-Modelle sind: Llama 3.3 70B, Llama 3.1 8B (Llama 4-Serie folgt in Kürze); Mistral 7B, Mistral 8x7B und Mistral Small; Qwen 2.5, einschließlich Coder (Qwen 3 folgt in Kürze); DeepSeek R1**-**Distill-Llama 8B, R1 Distill-Llama 70b; und Granite 3, 3.1 8B (Granite 3.3 folgt in Kürze).
NeuRealitys KI-Revolution: Die Verschmelzung von Leistung, Kosteneffizienz und Benutzerfreundlichkeit
Da künstliche Intelligenz (KI) weiterhin in verschiedene Branchen eindringt, stehen Unternehmen vor der Herausforderung, KI-Inferenzlösungen wirtschaftlich tragfähig und effizient einzusetzen. NeuReality revolutioniert die KI-Wirtschaft mit seinem innovativen Ansatz, der sich auf die Bereitstellung von sofortigem und gebrauchsfertigem LLM-Zugriff (Large Language Model) konzentriert und gleichzeitig die Gesamtkosten für KI-Inferenz erheblich senkt. Das Flaggschiffprodukt von NeuReality, das NR1-Inferenzgerät, bietet Unternehmen beispiellose Leistung, Kosteneffizienz und Benutzerfreundlichkeit durch die Optimierung der KI-Inferenzarchitektur und die Vorinstallation gängiger Enterprise-KI-Modelle.
Das NR1-Inferenzgerät: Ein Game-Changer
Herzstück des NR1-Inferenzgeräts ist die speziell entwickelte KI-CPU von NeuReality, die als zentralisierte Steuerzentrale für Daten, Aufgaben und Integrationen fungiert. Im Gegensatz zu herkömmlichen CPU- und NIC-Architekturen integriert der NR1-Chip diese Komponenten in einer Einheit, wodurch Engpässe reduziert und die Verarbeitungsleistung maximiert werden. Dieser integrierte Ansatz ermöglicht es dem Chip, mit dem rasanten Tempo von GPUs Schritt zu halten und gleichzeitig KI-Abfragen und -Token für verbesserte Leistung und Kapitalrendite zu optimieren.
Gebrauchsfertige KI: Vereinfachung der Bereitstellung
Um die Benutzerfreundlichkeit weiter zu verbessern, ist das NR1-Inferenzgerät mit gängigen Enterprise-KI-Modellen wie Llama, Mistral, Qwen und Granite vorinstalliert. Diese Funktion macht komplexe Konfigurationen und Optimierungen überflüssig und ermöglicht es KI-Softwareentwicklern, sich auf die Anwendung von KI in ihren Unternehmen zu konzentrieren, anstatt Zeit mit der Infrastrukturintegration zu verbringen. Das Gerät kann in weniger als 30 Minuten eingerichtet und in Betrieb genommen werden und bietet Kunden eine schnelle Wertschöpfung.
Erschwingliche KI: Beschleunigung der Akzeptanz
Die Technologie von NeuReality ermöglicht es Unternehmen, KI wirtschaftlicher zu nutzen, indem sie niedrigere Gesamtbetriebskosten pro Million KI-Token bietet als x86-CPU-basierte Server. Diese Kosteneffizienz ist für Unternehmen und Regierungen aller Größen von entscheidender Bedeutung, da sie die Hürden für die KI-Bereitstellung senkt und ein breiteres Anwendungsspektrum ermöglicht.
Partnerschaft mit Qualcomm Technologies: Erschließung neuer Leistungsniveaus
Die strategische Partnerschaft zwischen NeuReality und Qualcomm Technologies verbessert die Fähigkeiten des NR1-Inferenzgeräts weiter. Durch die Integration des Qualcomm Cloud AI 100 Ultra-Beschleunigers mit der KI-CPU-Architektur von NeuReality können Benutzer ein neues Niveau an Kosteneffizienz und KI-Leistung erreichen, ohne die einfache Bereitstellung und Skalierung zu beeinträchtigen. Dieser kollaborative Ansatz zeigt das Engagement von NeuReality, Spitzentechnologie zur Optimierung von KI-Inferenzlösungen zu nutzen.
Bewältigung von KI-Herausforderungen für Unternehmen: Steigerung der GPU-Auslastung
NeuReality geht eine große Herausforderung für Unternehmen an: CPU-Leistungsengpässe auf Servern, die die GPU-Auslastung reduzieren. Traditionell haben Server, die Multimode- und große Sprachmodell-Workloads verwalten, eine durchschnittliche GPU-Auslastung von nur 30–40 %. Diese geringe Auslastung führt zu teurer Siliziumverschwendung bei KI-Bereitstellungen und schränkt die KI-Akzeptanz in unterversorgten Märkten ein. Die KI-CPU-Technologie von NeuReality behebt dieses Problem, indem sie Leistungsengpässe beseitigt und es Unternehmen ermöglicht, die Fähigkeiten ihrer GPUs in KI-Anwendungen voll auszuschöpfen.
Erfüllung der Anforderungen der generativen KI: Erhöhte Auslastung
Die Lösungen von NeuReality sind gut auf die schnell wachsende Nachfrage des generativen KI-Marktes ausgerichtet. Jüngste Studien haben gezeigt, dass rund 70 % der Unternehmen berichten, generative KI in mindestens einer Geschäftsfunktion einzusetzen. Allerdings haben nur 25 % der Unternehmen Prozesse, die vollständig von KI unterstützt werden, und haben eine breite Akzeptanz erreicht. Das NR1-Inferenzgerät von NeuReality ermöglicht es Unternehmen, ihre generativen KI-Initiativen zu beschleunigen, indem es die Adoptionshürden durch verbesserte Benutzerfreundlichkeit, Kosteneffizienz und Leistung beseitigt.
Benutzerfreundlichkeit: Reduzierung der Bereitstellungshürden
Neben Leistung und Kosteneffizienz ist die Benutzerfreundlichkeit ein wichtiger Faktor für die KI-Lösungen von NeuReality. Das NR1-Inferenzgerät wird mit vorinstallierten KI-Modellen und Software Development Kits geliefert, wodurch der Bereitstellungsprozess vereinfacht und der Bedarf an Infrastrukturintegration und -optimierung reduziert wird. Diese Benutzerfreundlichkeit ermöglicht es KI-Softwareentwicklern, sich auf das Erstellen und Bereitstellen innovativer KI-Anwendungen zu konzentrieren, anstatt Zeit mit komplexen Infrastrukturen zu verbringen.
BreiteAnwendungen: Mehrere Industrien
Das NR1-Inferenzgerät von NeuReality wurde entwickelt, um eine breite Palette von Anwendungsfällen und Märkten zu unterstützen. Das Gerät wurde durch vorkonfigurierte Software Development Kits und APIs für Computer Vision, konversationelle KI und kundenspezifische Anforderungen optimiert. Diese Vielseitigkeit macht das NR1-Inferenzgerät für verschiedene Branchen geeignet, darunter Finanzdienstleistungen, Biowissenschaften, Behörden und Cloud Service Provider.
Beschleunigung der KI-Einführung: Wirtschaftlichkeit, Zugänglichkeit und Raumeffizienz
Das NR1-Gerät von NeuReality fördert die KI-Einführung, indem es gleichzeitig Wirtschaftlichkeit und Zugänglichkeit bietet, was es für lokale und Cloud-Infrastrukturen geeignet macht. Viele Organisationen haben Schwierigkeiten, ihre KI-Initiativen zu erweitern, aufgrund der hohen Kosten und Komplexität, aber die Lösung von NeuReality geht diese Hürden an, indem sie eine kosteneffektive, offene Standardplattform bereitstellt, die die KI-Entwicklung und -Bereitstellung vereinfacht.
Demonstrations-Highlights
NeuReality wird seine NR1-Inferenzengine auf der InnoVEX auf der Computex in Taipei, Taiwan, vom 20. bis 23. Mai 2025 vorführen und seine Fähigkeiten demonstrieren. Auf der Veranstaltung wird das Unternehmen die einfache Migration einer Chat-Anwendung in nur wenigen Minuten demonstrieren und die Leistung des NR1-Chips bei der Ausführung von Smooth Factory Models und DeepSeek-R1-Distill-Llama-8B präsentieren.
Kontinuierliche Innovation: Für die Zukunft gerüstet
NeuReality hat sich verpflichtet, die Fähigkeiten seines NR1-Inferenzgeräts durch die regelmäßige Veröffentlichung neuer Generative und Agent KI-Modelle sowie optimierter Software Development Kits zu verbessern. Diese kontinuierliche Innovation ermöglicht es Unternehmen, über die neuesten KI-Technologien auf dem Laufenden zu bleiben und sicherzustellen, dass ihre KI-Infrastruktur für zukünftige Workloads optimiert ist.
NeuReality: Unternehmen befähigen, das Potenzial von KI zu nutzen
Die bahnbrechende KI-CPU-Technologie von NeuReality bietet Unternehmen eine kostengünstige Möglichkeit, KI-Inferenz bereitzustellen, die die GPU-Leistung maximiert und gleichzeitig KI-Abfragen und -Token für maximale Leistung und Kapitalrendite optimiert. Während NeuReality seine Innovationen fortsetzt und die Fähigkeiten des NR1-Inferenzgeräts erweitert, wird es zu einem wichtigen Verbündeten für Unternehmen, die in der florierenden KI-Welt erfolgreich sein wollen.
Durch die Kombination von Fokus auf Leistung, Kosteneffizienz und Benutzerfreundlichkeit mit einem Engagement für kontinuierliche Innovation ist NeuReality in der Lage, die KI-Wirtschaft neu zu gestalten und Unternehmen jeder Größe in die Lage zu versetzen, das Potenzial von KI zu nutzen.