KI-Analyse: GPT-4.5, KI im All, Zukunft

GPT-4.5: Eine Verfeinerung, keine Revolution

OpenAI hat kürzlich GPT-4.5 für ChatGPT Pro-Benutzer verfügbar gemacht, wobei Plus-, Team-, Unternehmens- und Bildungskonten folgen sollen. Intern als ‘Orion’ bekannt, verfügt dieses Modell laut OpenAI über ein “besseres Verständnis der menschlichen Absicht, indem es subtile Hinweise und implizite Erwartungen mit größerer Nuance und emotionaler Intelligenz interpretiert”. Es nutzt neue Überwachungstechniken neben traditionellem Fine-Tuning und Reinforcement Learning aus menschlichem Feedback, was den Entwicklungsprozess von GPT-4o widerspiegelt. GPT-4.5 bietet Echtzeit-Suchfunktionen, unterstützt Datei- und Bilduploads und lässt sich in eine Leinwand zum Schreiben und Programmieren integrieren. Allerdings fehlen ihm derzeit die multimodalen Funktionen wie Sprachmodus, Video oder Bildschirmfreigabe, die in ChatGPT zu finden sind.

OpenAI betont, dass unüberwachtes Lernen die Genauigkeit und Intuition eines Modells verbessert. Dieser Ansatz war eine treibende Kraft hinter den Fortschritten bei Modellen wie GPT-3.5, GPT-4 und jetzt GPT-4.5. Unabhängig davon trainiert das Skalieren des Denkens Modelle, um Informationen systematisch zu verarbeiten und eine Gedankenkette zu generieren, bevor sie antworten. Dieser methodische Ansatz verbessert ihre Fähigkeit, komplexe MINT- und Logikaufgaben zu bewältigen, wie Modelle wie OpenAI o1 und OpenAI o3-mini zeigen. GPT-4.5 wird als Paradebeispiel für die Skalierung von unüberwachtem Lernen präsentiert, das von erhöhter Rechenleistung, größeren Datensätzen und architektonischer Innovation profitiert. Es wurde auf Microsoft Azure AI-Supercomputern trainiert und verfügt angeblich über ein breiteres Wissen und ein tieferes Verständnis der Welt, wodurch Halluzinationen reduziert und die Zuverlässigkeit erhöht werden.

Trotz dieser Fortschritte hat GPT-4.5 keine große Begeisterung ausgelöst. Es wird eher als eine inkrementelle Verbesserung denn als ein bahnbrechender Sprung wahrgenommen. Während OpenAI verbesserte emotionale Intelligenz, Nuancen und Kreativität anpreist, haben viele Benutzer keinen wesentlichen Unterschied im Vergleich zu GPT-4o festgestellt. Das Fehlen multimodaler Fortschritte, ein Hauptmerkmal von GPT-4o, trägt weiter zu dieser Wahrnehmung bei.

Darüber hinaus hat GPT-4.5 eine Tendenz gezeigt, unsinnige Ergebnisse zu produzieren. Das interne Faktizitäts-Benchmarking-Tool von OpenAI, SimpleQA, zeigt, dass GPT-4.5 in 37,1 % der Fälle halluziniert (Fälschungen mit Zuversicht als Fakten präsentiert). Dies ist ein erhebliches Problem, selbst im Vergleich zu GPT-4o, einem anderen fortschrittlichen ‘Reasoning’-Modell, das im selben Benchmark in 61,8 % der Fälle halluziniert. Das kleinere, billigere o3-mini-Modell weist eine noch höhere Halluzinationsrate von 80,3 % auf.

Die aktuelle KI-Landschaft mit Konkurrenten wie Anthropic mit Claude 3.7 und Googles Fortschritten mit Gemini hat die Erwartungen an signifikante Upgrades erhöht. Benutzer suchen nach Durchbrüchen, nicht nur nach Verfeinerungen, und GPT-4.5 scheint in seiner jetzigen Form hinter dieser Marke zurückzubleiben.

Der Aufstieg der Reasoning Models und das Vertrauen der Investoren

Elon Musk deutete kürzlich auf X an, dass Artificial General Intelligence (AGI) am Horizont steht. Diese Aussage erfolgt inmitten eines hitzigen Wettlaufs zwischen Tech-Giganten wie OpenAI, Google, Meta, Microsoft, DeepSeek, Anthropic und Musks eigenem xAI, um Reasoning Models zu entwickeln – KI-Systeme, die menschenähnliches Denken nachahmen sollen.

Investoren zeigen deutlich Begeisterung für dieses Unterfangen. Kurz nach dem Start von Claude 3.7 Sonnet mit hybridem Reasoning sicherte sich Anthropic eine beträchtliche Finanzierungsrunde der Serie E in Höhe von 3,5 Milliarden US-Dollar. Dies verdreifachte seine Bewertung auf 61,5 Milliarden US-Dollar und festigte seine Position als wichtiger Konkurrent von OpenAI. Die Investition, die von Lightspeed Venture Partners angeführt wurde und Salesforce Ventures, Cisco, Fidelity, Jane Street und andere umfasste, wird verwendet, um die Rechenleistung für die KI-Entwicklung zu erweitern, die Sicherheitsforschung zu verbessern und das globale Wachstum zu beschleunigen.

Die Grenzen des Denkens verschieben: Der BBEH-Benchmark

Large Language Models (LLMs) werden zunehmend in alltägliche Anwendungen integriert und erfordern robuste Denkfähigkeiten in verschiedenen Bereichen. Bestehende Benchmarks priorisieren jedoch oft Mathematik und Programmierung und vernachlässigen andere wichtige Arten des Denkens. Während der BIG-Bench-Datensatz häufig verwendet wurde, um LLMs bei komplexen Denkaufgaben zu bewerten, haben Modelle so große Fortschritte gemacht, dass sie jetzt sowohl bei BIG-Bench als auch bei seiner anspruchsvolleren Variante, BIG-Bench Hard (BBH), nahezu perfekte Ergebnisse erzielen. Diese Sättigung macht diese Benchmarks weniger effektiv, um weitere Fortschritte zu messen.

Um diese Einschränkung zu beheben, haben Forscher BIG-Bench Extra Hard (BBEH) eingeführt. Dieser neue Benchmark ersetzt jede Aufgabe in BBH durch eine deutlich schwierigere Version, bewertet aber dennoch ähnliche Denkfähigkeiten. Tests auf BBEH zeigen, dass selbst die besten Allzweckmodelle nur eine Punktzahl von 9,8 % erreichen, während das Top-Modell, das speziell für das Denken entwickelt wurde, 44,8 % erreicht. Diese Ergebnisse unterstreichen die anhaltenden Herausforderungen, mit denen LLMs beim komplexen Denken konfrontiert sind, und zeigen erheblichen Raum für Verbesserungen auf. Das vollständige Forschungspapier enthält weitere Details zu diesem neuen Benchmark.

KI-gesteuerte Satelliten: Eine neue Ära in der Weltraumforschung und -operation

TakeMe2Space, ein in Hyderabad ansässiges Spacetech-Startup, sicherte sich kürzlich 5,5 Crore Rupien in einer Pre-Seed-Finanzierungsrunde, die von Seafund angeführt wurde, unter Beteiligung von Blume Ventures, Artha Venture Fund, AC Ventures und anderen Angel-Investoren. Diese Finanzierung, obwohl bescheiden, stellt einen bedeutenden Schritt zur Etablierung von Indiens erstem KI-Labor im Weltraum dar. TakeMe2Space plant, die Mittel zu verwenden, um MOI-1 (My Orbital Infrastructure–Technology Demonstrator) zu entwickeln, eine Plattform, die es Benutzern ermöglicht, KI-Modelle für die Erdbeobachtung oder andere Weltraumexperimente direkt über eine Webkonsole namens Orbitlab auf einen Orbitalsatelliten hochzuladen. Benutzer zahlen nur für die Satellitennutzungszeit, zu einem Preis von 2 US-Dollar pro Minute.

Die MOI-TD-Plattform des Unternehmens hat Berichten zufolge die Fähigkeit demonstriert, große KI-Modelle von einer Bodenstation hochzuladen, externen Code auf dem Satelliten auszuführen und codierte und verschlüsselte Ergebnisse sicher herunterzuladen. Dies stellt einen Schritt in Richtung autonomerer und effizienterer Satellitenoperationen dar.

TakeMe2Space ist nicht allein in diesem Unterfangen. Organisationen wie die ESA (mit OPS-SAT) und Globalstar sind ebenfalls Pioniere bei realen Anwendungen von KI-gestützter Satellitentechnologie, die von sicherer IoT-Kommunikation bis hin zur Ausführung von KI-Modellen im Orbit reichen. Mit dem Fortschritt der Technologie werden KI-gesteuerte Satelliten immer autonomer, was zu effizienteren Weltraumoperationen führt und neue Möglichkeiten für Forschung, Sicherheit und globale Konnektivität eröffnet.

Traditionell waren Satelliten stark auf Bodenstationen für die Datenverarbeitung, Entscheidungsfindung und Befehlsausführung angewiesen. Daten mussten heruntergeladen, auf der Erde analysiert und dann verarbeitete Erkenntnisse wieder auf den Satelliten hochgeladen werden – ein Prozess, der sowohl zeitaufwändig als auch bandbreitenintensiv war. Fortschritte in der KI und im Edge Computing (Verarbeitung von Daten auf dem Gerät selbst und nicht in der Cloud) ermöglichen es Satelliten nun jedoch, Daten an Bord zu verarbeiten, autonome Entscheidungen zu treffen und nur die wichtigsten Erkenntnisse sicher zu übertragen. Dies führt zu schnelleren, intelligenteren und effizienteren Operationen.

Der Betrieb moderner KI-gesteuerter Satelliten umfasst typischerweise drei Hauptschritte:

  1. Uplink von KI-Algorithmen: KI-Algorithmen werden von Bodenstationen zu den Satelliten übertragen und bieten ihnen fortschrittliche Datenverarbeitungsfähigkeiten.
  2. Onboard-Datenanalyse: KI-Modelle analysieren Bilder, Sensordaten und andere Eingaben direkt im Orbit, wodurch die Notwendigkeit ständiger Bodeninterventionen minimiert wird.
  3. Sicherer Downlink von Erkenntnissen: Anstatt Rohdaten zu übertragen, senden Satelliten verschlüsselte Erkenntnisse, wodurch Bandbreite gespart und die Sicherheit erhöht wird.

Dieser KI-gesteuerte Ansatz bietet mehrere Vorteile. Er reduziert die Latenz erheblich, indem er Satelliten ermöglicht, Daten im Weltraum zu verarbeiten, was schnellere Reaktionen auf Echtzeitbedingungen ermöglicht, ohne auf Anweisungen von Bodenstationen warten zu müssen. Die Bandbreitennutzung wird optimiert, da nur die relevantesten Erkenntnisse anstelle großer Mengen an Rohdaten übertragen werden. Die Sicherheit wird auch durch verschlüsselte Kommunikation verbessert, wodurch das Risiko von Cyberbedrohungen und Datenschutzverletzungen verringert wird. Diese Vorteile sind besonders wertvoll in Anwendungen wie Katastrophenschutz, Militäroperationen und Weltraumforschung.

Die realen Anwendungen von KI-gesteuerten Satelliten sind vielfältig und wirkungsvoll:

  • Katastrophenmanagement: Satelliten, die mit KI ausgestattet sind, können Waldbrände, Überschwemmungen und Hurrikane in Echtzeit erkennen und so ein schnelles Eingreifen von Notfallteams ermöglichen.
  • Präzisionslandwirtschaft: KI-Modelle analysieren den Zustand von Pflanzen und die Bodenbedingungen, um Präzisionslandwirtschaftspraktiken zu verbessern.
  • Umweltüberwachung: Umweltbehörden nutzen Satellitendaten, um die Luft- und Wasserverschmutzung zu überwachen.
  • Autonome Navigation und Weltraumoperationen: KI verbessert die Kollisionsvermeidung, indem sie potenzielle Bedrohungen vorhersagt und darauf reagiert, wodurch die Sicherheit von Satelliten gewährleistet wird. Sie erleichtert auch die Koordination von Satellitenkonstellationen und verbessert so die Abdeckung und Effizienz. Darüber hinaus spielt KI eine entscheidende Rolle bei der Verfolgung und Vorhersage von Bewegungen von Weltraummüll, wodurch das Risiko von Schäden an der Weltrauminfrastruktur verringert wird.
  • Verteidigung und Sicherheit: KI-gestützte Überwachungssysteme erkennen unbefugte Aktivitäten und militärische Bewegungen mit erhöhter Genauigkeit.
  • Telekommunikation und IoT: KI-gesteuerte Satelliten tragen zu einem intelligenteren Verkehrsrouting bei, verbessern die Satelliten-Internetverbindung und gewährleisten eine nahtlose globale Kommunikation.
  • Weltraumforschung: KI verbessert die Effizienz von Weltraumteleskopen bei der Erkennung von Asteroiden und Exoplaneten und treibt so die Weltraumforschung erheblich voran.

Trotz der zahlreichen Vorteile bleiben Herausforderungen bei der Entwicklung und dem Einsatz von KI-gesteuerten Satelliten bestehen:

  • Begrenzte Rechenleistung: Satelliten müssen mit stromsparenden, strahlungsgehärteten Chips betrieben werden, was die KI-Fähigkeiten einschränkt.
  • Raue Weltraumumgebung: Strahlungsexposition birgt das Risiko von Hardwarefehlfunktionen.
  • Sicherheitsbedrohungen: Das Hochladen und Ausführen von externem Code im Weltraum erfordert eine sorgfältige Verwaltung, um Cyberangriffe zu verhindern.
  • Kosten und Entwicklungszeit: Der Bau, das Testen und die Validierung von KI-kompatibler Satellitenhardware ist ein kostspieliger und zeitaufwändiger Prozess.
  • Anpassungsfähigkeitsanforderungen: KI-Modelle, die im Orbit eingesetzt werden, müssen hochgradig anpassungsfähig sein, mit minimalen Updates funktionieren und sich autonom an neue Szenarien anpassen.

KI entsperrt: Eliminierung repetitiver Phrasen in ChatGPT

KI kann ein wertvolles Werkzeug bei der Erstellung von Inhalten sein, das beim Schreiben, Brainstorming, Verbessern der Klarheit, Verfeinern der Struktur und Verbessern der allgemeinen Lesbarkeit hilft. Ein häufiges Problem bei KI-generiertem Text ist jedoch seine Tendenz zu formelhafter Sprache aufgrund repetitiver Wortwahlen. Anstatt frische, wirkungsvolle Botschaften zu liefern, verlässt sich KI oft auf vertraute Muster, was die Effektivität und Originalität verringert.

Übermäßig verwendete Wörter und Phrasen wie “delve”, “tapestry”, “vibrant”, “landscape”, “realm”, “embark”, “excels”, “It’s important to note…” und “A testament to…” können die Qualität von KI-generierten Inhalten erheblich beeinträchtigen. Für Produktvermarkter kann diese Wiederholung die Botschaft weniger überzeugend machen, das Engagement des Publikums verringern, die Markendifferenzierung schwächen und verhindern, dass sich Erkenntnisse und strategische Botschaften in einem überfüllten Markt abheben.

Durch die Nutzung der Speicherfunktion von ChatGPT ist es möglich, dieses Problem zu mildern und übermäßig verwendete Wörter und Phrasen zu eliminieren. So nutzen Sie diese Funktion effektiv:

Zugriff: Auf ChatGPT kann über die Website oder die mobile App zugegriffen werden.

Vorteile:

  • Verbesserte Originalität: Stellt sicher, dass sich KI-generierte Inhalte weniger roboterhaft und menschlicher anfühlen.
  • Verbesserte Markenbotschaft: Vermeidet generische Formulierungen, die die Markendifferenzierung schwächen.
  • Gesteigertes Engagement: Fördert eine effektivere Kommunikation durch Reduzierung von Redundanz.

Beispiel: Generierung von Produktmarketing-Inhalten

Stellen Sie sich einen Produktvermarkter vor, der mit dem Entwurf von Inhalten für eine neue Produkteinführung beauftragt ist. Eine erste Anfrage an ChatGPT könnte zu einer Antwort führen, die mit repetitiven und generischen Phrasen wie “delving into an intricate landscape of innovation…” gefüllt ist, wodurch die Botschaft uninspiriert wirkt.

Um überzeugendere und einzigartigere Inhalte zu erstellen, kann der Vermarkter die folgenden Schritte ausführen:

  1. Einrichten der Eingabeaufforderung: Der Vermarkter weist ChatGPT explizit an: “Bitte vermeiden Sie die folgenden Wörter: delve, tapestry, vibrant, landscape, realm, embark, excels. Merken Sie sich das.” Dies weist ChatGPT an, diese Begriffe in seinen Antworten aktiv herauszufiltern.
  2. Verwenden des persistenten Speichers: Der Satz “Merken Sie sich das” stellt sicher, dass ChatGPT diese spezifischen Anweisungen über mehrere Interaktionen hinweg beibehält. Dies ermöglicht eine dauerhafte Vermeidung der angegebenen Wörter und Phrasen. ChatGPT überprüft seinen Speicher, bevor es Text generiert, und hält sich an die Anweisungen, um die festgelegten Begriffe zu vermeiden.
  3. Manuelle Überprüfung: Nach dem Generieren der Antwort überprüft der Vermarkter den Inhalt auf verbleibende Redundanz und verfeinert die Sprache auf Klarheit und Wirkung.

Effektivität:

  • Anpassung der Eingabeaufforderung: Spezifische Anweisungen helfen, die Ausgabe der KI zu formen.
  • Speichererhaltung: ChatGPT kann Regeln zur Wortvermeidung über Gespräche hinweg speichern und befolgen.
  • Manuelle Verfeinerung: Eine abschließende menschliche Bearbeitung stellt Klarheit und Authentizität sicher.

Hinweis: Die in diesem Abschnitt vorgestellten Tools und Analysen basieren auf internen Tests und zeigen einen klaren Wert. Die Empfehlungen sind unabhängig und nicht von den Tool-Erstellern beeinflusst.

Zusätzliche KI-Nachrichten und -Entwicklungen

  • KI-gesteuerte Smartphones auf dem Vormarsch: Die Deutsche Telekom kündigte auf dem Mobile World Congress 2025 in Barcelona Pläne an, ein KI-gesteuertes Smartphone mit einem Perplexity-Assistenten auf den Markt zu bringen. Dieser Assistent soll alltägliche Aufgaben wie das Bestellen von Taxis, das Reservieren von Tischen, das Übersetzen von Sprachen in Echtzeit und das Beantworten von Benutzeranfragen vereinfachen. Das Unternehmen stellt sich dies als einen virtuellen Assistenten vor, der Millionen von Kunden unterstützen wird, indem er E-Mails schreibt, Anrufe initiiert, Texte zusammenfasst und Kalender verwaltet. Das KI-Telefon wird Google Cloud AI, ElevenLabs und Picsart integrieren, um seine Funktionalität zu verbessern, und es soll noch in diesem Jahr auf den Markt kommen. Glance, eine InMobi-Einheit, und Google Cloud kündigten ebenfalls eine Zusammenarbeit an, um die KI-Modelle von Google für die Entwicklung von verbraucherorientierten KI-Anwendungen zu nutzen, um die Benutzererfahrung auf Smartphone-Sperrbildschirmen und Ambient-TV-Bildschirmen zu verbessern. Glance betreibt derzeit über 450 Millionen Android-basierte Smartphones weltweit.

  • Regierungssektoren verzeichnen Rückgang kritischer Cybervorfälle: Laut dem neuesten Kaspersky Managed Detection and Response (MDR)-Analysebericht verzeichneten Regierungs- und Entwicklungsbranchen im Jahr 2024 einen deutlichen Rückgang von Vorfällen mit hohem Schweregrad, die eine direkte menschliche Beteiligung beinhalteten. Die Lebensmittel-, IT-, Telekommunikations- und Industriesektoren verzeichneten jedoch einen Anstieg solcher Vorfälle.

  • OpenAI plant die Integration von Sora in ChatGPT: OpenAI arbeitet daran, sein KI-Videogenerierungstool Sora direkt in ChatGPT zu integrieren. Derzeit ist Sora nur über eine dedizierte Web-App verfügbar, mit der Benutzer filmische Clips mit einer Länge von bis zu 20 Sekunden generieren können. OpenAI entwickelt auch einen KI-Bildgenerator, der von Sora angetrieben wird.