Anpassung der KI für Unternehmen und darüber hinaus
Auf der GPU Technical Conference (GTC) 2025 skizzierte Jensen Huang, CEO von Nvidia, die Strategie des Unternehmens, seine beschleunigte Rechenleistung auf eine breite Palette von Anwendungen zuzuschneiden. Während die nächste Generation der ‘Blackwell’ B300-GPUs und die zukünftige ‘Rubin’-Familie von Beschleunigern im Rampenlicht standen, betonte Huang auch das Engagement des Unternehmens, die Bedürfnisse von Unternehmen, Edge Computing und dem Bereich der physischen KI zu erfüllen.
Huang betonte, dass Cloud-Service-Provider zwar von Nvidias Spitzentechnologie und dem Full-Stack-Ansatz angezogen werden, die breitere Akzeptanz von KI jedoch eine differenziertere Strategie erfordert. Er erklärte: “Beschleunigtes Rechnen dreht sich nicht nur um den Chip, es geht nicht einmal nur um den Chip und die Bibliotheken, das Programmiermodell. Es geht um den Chip, das Programmiermodell und eine ganze Reihe von Software, die darauf aufbaut.”
Die Evolution der KI: Von der Cloud zur Allgegenwart
Das anfängliche Momentum der KI mag in der Cloud entstanden sein, aber ihre Entwicklung geht eindeutig weit darüber hinaus. Da KI verschiedene Sektoren durchdringt, trifft sie auf unterschiedliche Systemkonfigurationen, Betriebsumgebungen, domänenspezifische Bibliotheken und Nutzungsmuster. Huang betonte diese Expansion und wies auf die besonderen Anforderungen von Unternehmens-IT, Fertigung, Robotik, selbstfahrenden Autos und sogar aufstrebenden GPU-Cloud-Anbietern hin.
Die grundlegende Natur des Rechnens wird durch KI und maschinelles Lernen neu gestaltet und beeinflusst alles von Prozessoren und Betriebssystemen bis hin zu Anwendungen und deren Orchestrierung. Unternehmens-Workflows entwickeln sich von einfachen Datenabfragen zu interaktiven Frage-Antwort-Interaktionen mit KI-Systemen.
Der Aufstieg von KI-Agenten und digitalen Mitarbeitern
Huang stellt sich eine Zukunft vor, in der KI-Agenten zu einem integralen Bestandteil der digitalen Belegschaft werden. Er prognostiziert, dass es neben der einen Milliarde Wissensarbeiter der Welt zehn Milliarden digitale Mitarbeiter geben wird, die nahtlos zusammenarbeiten. Diese allgegenwärtige Präsenz von KI-Agenten erfordert eine neue Art von Computern, die für ihre besonderen betrieblichen Anforderungen optimiert sind.
Einführung neuer Hardware für das KI-Zeitalter
Nvidia geht auf diesen Bedarf mit der Einführung von zwei persönlichen KI-Supercomputern ein: dem DGX Spark und der DGX Station. Diese Desktop-Systeme sind für Inferenz und andere Aufgaben konzipiert und bieten Flexibilität für den lokalen Betrieb oder die Integration mit Nvidias DGX Cloud und anderen beschleunigten Cloud-Umgebungen.
Der DGX Spark verfügt über den GB10 Grace Blackwell Superchip und bietet außergewöhnliche Leistung für KI-Feinabstimmung und Inferenz. Die DGX Station, ein leistungsstärkeres Desktop-System, verfügt über den GB300 Grace-Blackwell Ultra Desktop Superchip, der massive 784 GB kohärenten Speicher, Nvidias ConnectX-8 SuperNIC, die AI Enterprise Softwareplattform und Zugriff auf NIM AI-Microservices bietet.
Jenseits von Agenten: Der Beginn des KI-Reasonings
Diese neuen Systeme bieten Unternehmen nicht nur leistungsstarke Tools für KI-Workloads, sondern ebnen auch den Weg für die nächste Stufe der KI-Evolution: Reasoning-Modelle. Diese Modelle stellen einen bedeutenden Sprung über einfache KI-Agenten hinaus dar und sind in der Lage, komplexe Probleme zu lösen und Reasoning-Fähigkeiten zu zeigen, die weit über die Prompt-and-Reply-Natur aktueller KI-Chatbots hinausgehen.
Huang beschrieb diesen Fortschritt mit den Worten: “Wir haben jetzt KIs, die schlussfolgern können, was im Grunde bedeutet, ein Problem Schritt für Schritt zu zerlegen. Jetzt haben wir KIs, die Schritt für Schritt schlussfolgern können, indem sie … Technologien wie Chain of Thought, Best of N, Konsistenzprüfung, Pfadplanung und eine Vielzahl verschiedener Techniken verwenden.”
Nemotron-Modelle: Ermöglichung von KI-Reasoning
Aufbauend auf dem Fundament, das auf der Consumer Electronics Show mit der Vorstellung der Llama Nemotron- und Cosmos Nemotron-Modelle gelegt wurde, stellte Nvidia auf der GTC eine Familie offener Llama Nemotron-Modelle vor. Diese Modelle verfügen über verbesserte Reasoning-Fähigkeiten für mehrstufige Aufgaben in Mathematik, Codierung, Entscheidungsfindung und Befolgung von Anweisungen.
Kari Briski, Nvidias Vice President of Generative AI Software for the Enterprise, hob das Engagement des Unternehmens für die Unterstützung von Entwicklern hervor. Nvidia stellt Datensätze mit 60 Milliarden Token synthetisch generierter Daten und Techniken bereit, um die Einführung dieser Modelle zu erleichtern.
Briski erklärte: “Genau wie Menschen müssen Agenten den Kontext verstehen, um komplexe Anfragen zu zerlegen, die Absicht des Benutzers zu verstehen und sich in Echtzeit anzupassen.”
Die Nemotron-Modelle bieten unterschiedliche Reasoning-Fähigkeiten und sind in drei Größen erhältlich: Nano (optimiert für PCs und Edge-Geräte), Super (hohe Genauigkeit und Durchsatz auf einer einzelnen GPU) und Ultra (entwickelt für mehrere GPUs).
AI-Q Blueprint: Verbindung von Daten mit Reasoning-Agenten
Nvidias AI Enterprise Softwareplattform wird um AI-Q Blueprint erweitert, ein NIM-basiertes Angebot, das es Unternehmen ermöglicht, proprietäre Daten mit Reasoning-KI-Agenten zu verbinden. Diese offene Software lässt sich in Nvidias NeMo Retriever-Tool integrieren, ermöglicht die Abfrage verschiedener Datentypen (Text, Bilder, Videos) und erleichtert die Zusammenarbeit zwischen Nvidias beschleunigter Rechenleistung und Speicherplattformen und -software von Drittanbietern, einschließlich der Llama Nemotron-Modelle.
Briski betonte die Vorteile für Entwicklungsteams: “Für Teams von verbundenen Agenten bietet der Blueprint Beobachtbarkeit und Transparenz in Bezug auf die Agentenaktivität, sodass die Entwickler die Agenten im Laufe der Zeit verbessern können. Entwickler können die Agentengenauigkeit verbessern und die Erledigung dieser Aufgaben von Stunden auf Minuten reduzieren.”
AI Data Platform: Ein Referenzdesign für die Unternehmensinfrastruktur
Nvidias AI Data Platform dient als Referenzdesign für die Unternehmensinfrastruktur und beinhaltet KI-Abfrageagenten, die mit dem AI-Q Blueprint erstellt wurden.
Physische KI: Die Brücke zwischen digitaler und physischer Welt
Huang sprach auch das aufstrebende Feld der physischen KI an, bei dem KI in physische Systeme integriert wird, um Wahrnehmung und Interaktion in der realen Welt zu ermöglichen. Er prognostizierte, dass dieser Bereich zum größten Segment des KI-Marktes werden könnte.
“KI, die die physische Welt versteht, Dinge wie Reibung und Trägheit, Ursache und Wirkung, Objektpermanenz, diese Fähigkeit, die physische Welt, die dreidimensionale Welt, zu verstehen. Das wird eine neue Ära der physischen KI ermöglichen und die Robotik ermöglichen”, erklärte Huang.
Fortschritte in Robotik und autonomen Fahrzeugen
Mehrere Ankündigungen unterstrichen Nvidias Engagement für physische KI, darunter die Einführung des Nvidia AI Dataset, das speziell für Robotik und autonome Fahrzeuge entwickelt wurde. Dieser Datensatz ermöglicht es Entwicklern, Foundation Models vorzutrainieren, zu testen, zu validieren und zu verfeinern, wobei sowohl reale als auch synthetische Daten verwendet werden, die in Nvidias Cosmos-Weltmodellentwicklungsplattform, Drive AV-Software, Isaac AI-Roboterentwicklungsplattform und Metropolis-Framework für Smart Cities verwendet werden.
Die erste Iteration des Datensatzes ist auf Hugging Face verfügbar und bietet 15 Terabyte Daten für das Robotiktraining, wobei die Unterstützung für die Entwicklung autonomer Fahrzeuge für die nahe Zukunft geplant ist.
Darüber hinaus kündigte Nvidia den Isaac GROOT N1 an, ein Foundation Model für humanoide Roboter. Es wird mit realen und synthetischen Daten trainiert und stellt den Fortschritt von Project GROOT dar.
Erweiterung der KI-Horizonte
Nvidias strategische Initiativen zeigen eine klare Vision für die Zukunft der KI, die ihre Reichweite weit über die Grenzen der Cloud hinaus in das Herz des Unternehmens und der physischen Welt ausdehnt. Durch eine Kombination aus modernster Hardware, innovativen Softwareplattformen und einem Engagement für die Stärkung von Entwicklern positioniert sich Nvidia als treibende Kraft hinter der nächsten Welle der KI-Innovation. Die Einführung von Reasoning-Fähigkeiten, gepaart mit der Entwicklung von Tools und Datensätzen für physische KI, stellt einen bedeutenden Schritt in Richtung einer Zukunft dar, in der KI nahtlos in unser tägliches Leben integriert wird, Industrien transformiert und die Art und Weise, wie wir mit Technologie interagieren, neu definiert. Der Fokus auf Unternehmenslösungen, Edge Computing und Robotik unterstreicht Nvidias Verständnis für die vielfältigen und sich entwickelnden Bedürfnisse der KI-Landschaft und festigt seine Position als führendes Unternehmen in dieser transformativen technologischen Revolution.