ChatGPT ist allgegenwärtig, aber was kann es und wie funktioniert es? Wir werden die Grundlagen aufschlüsseln und erklären, wie man mit der künstlichen Intelligenz beginnt.
Seit dem Debüt von ChatGPT im Jahr 2022 sind ein paar Jahre vergangen, und es ist wahrscheinlich, dass Sie sich noch in den Anfängen Ihrer KI-Reise befinden. Wir lernen jeden Tag mehr über KI, und das Verständnis dafür, wie diese Technologie funktioniert, kann Ihnen helfen, das Beste aus Ihren Konversationen herauszuholen.
Obwohl ChatGPT oberflächlich betrachtet einfach zu bedienen ist, finden im Hintergrund zahlreiche komplexe Berechnungen statt, die auf jeden Benutzer zugeschnitten sind. Große Sprachmodelle (Large Language Models, LLMs) basieren auf riesigen neuronalen Netzen der künstlichen Intelligenz, die menschenähnlichen Text verarbeiten und erzeugen, Bilder analysieren und sogar selbst sprechen können. Im Folgenden wird erläutert, wie es funktioniert.
Was steckt hinter der Technologie von ChatGPT?
Im einfachsten Sinne ist ChatGPT eine dialogorientierte Website oder mobile Anwendung, die Anfragen von Menschen entgegennimmt. Die Menschen haben viele kreative Verwendungsmöglichkeiten dafür gefunden, darunter das Verfassen von Artikeln und E-Mails, das Entwerfen von Websites, das Schreiben von Softwarecode und das Erledigen von Aufgaben durch KI-Agenten.
Obwohl ChatGPT heute der beliebteste KI-Chatbot ist, haben Sie vielleicht auch schon von anderen gehört, darunter Google Gemini, Perplexity und Claude von Anthropic. Sie alle wurden mit riesigen Datenmengen trainiert, was sie “lehrt”, wie sie auf überzeugende Weise mit Menschen interagieren können, so als wären sie selbst Menschen. Aber sie sind eher wie Aliens (oder Kleinkinder), die ständig versuchen zu lernen, wie man ein Erwachsener wird. Sie wollen auch beliebt sein; OpenAI musste kürzlich ein ChatGPT-Update zurückziehen, weil es zu anbiedernd geworden war.
Dieser Lernprozess wird erreicht, indem der Chatbot mit Daten gefüttert wird, die hauptsächlich aus dem Internet stammen (Wikipedia ist eine große Quelle), einschließlich urheberrechtlich geschützter Bücher, YouTube-Videos und anderer Originalmaterialien, was in einigen Fällen zu Klagen führt. Der Chatbot-Alien sehnt sich nach so vielen Informationen wie möglich, damit er sich ständig verbessern kann.
Das Modell lernt, indem es eine Textstelle aus den Daten nimmt (z. B. den Eröffnungssatz eines Wikipedia-Artikels) und versucht, das nächste Token in der Sequenz vorherzusagen. Anschließend vergleicht es seine Ausgabe mit dem tatsächlichen Text, der im Trainingskorpus vorhanden war, und passt seine Parameter an, um etwaige Fehler zu korrigieren. Indem es dies wiederholt über einen sehr großen Text (oder ein Bild oder eine Sprache) ausführt, kann es ein Sprachmodell entwickeln, das bei einer Eingabeaufforderung kohärente Textfolgen erzeugen kann.
Dieser Prozess stützt sich auf eine Softwarearchitektur, die als Deep Neural Network (DNN) bekannt ist, insbesondere auf Transformer-Netzwerke. Transformer-Netzwerke sind gut darin, Text in “Tokens” zu zerlegen, die im Wesentlichen Teile von Wörtern sind (“Wort” ist ein Token, “im Wesentlichen” sind zwei Tokens). Dann sagt es die wahrscheinlichste Sequenz voraus, die beim Benutzer Anklang findet, basierend auf seinen Interaktionen. Jede Berechnung ist anders, je nachdem, wer sie durchführt, was eine Menge Strom und Energie erfordert.
ChatGPT “erinnert” sich auch an Ihre vorherigen Gespräche, um maßgeschneiderte Antworten zu generieren. Je mehr Sie mit ihm sprechen, desto besser wird er darin, seine Interaktionen mit Ihnen zu verfeinern. Wenn Sie etwas wie “Das ist nicht richtig” sagen, wird das Modell dies zur Kenntnis nehmen und beim nächsten Mal einen anderen Ansatz versuchen. Dies wird als “Reinforcement Learning from Human Feedback” (RLHF) bezeichnet, und es ist der Grund, warum ChatGPT nützlicher ist als seine Vorgänger.
Wie kann man ChatGPT ausprobieren?
Sie können sich für ChatGPT auf der OpenAI-Website oder -App (iOS oder Android) anmelden, und Sie können die Basisversion auch ohne Konto nutzen. Die kostenlose Version reicht für gelegentliche Gespräche aus, schränkt aber die Anzahl der Interaktionen, die Sie täglich mit dem Flaggschiffmodell GPT-4o führen können, sowie die Anzahl der Fotos, die Sie hochladen können, ein.
Für eine ernsthafte, kontinuierliche Nutzung sollten Sie die kostenpflichtige Version ChatGPT Plus ausprobieren, die 20 US-Dollar pro Monat kostet. Sie bietet weniger Einschränkungen und zusätzliche Funktionen wie das Sora-Videoerstellungsmodell und benutzerdefinierte GPTs. Letztere sind winzige Modelle, die Sie für bestimmte Aufgaben wie die Sprachübersetzung verwenden können, während das Hauptmodell von ChatGPT eher ein Allround-Sportler ist.
OpenAI bietet auch andere Abonnementstufen an, wie z. B. das Pro-Modell für 200 US-Dollar pro Monat, das keine Einschränkungen hat und Aufgaben wie das Zusammenstellen von High-End-Forschungsberichten ausführen kann. Es gibt auch Team- und Unternehmenskonten, die sich an große Organisationen richten. Schließlich können Entwickler auch über die API von OpenAI auf ChatGPT zugreifen, wobei Sie nach der Anzahl der verwendeten Tokens bezahlen.
Was kann ich mit ChatGPT machen?
Mit den richtigen Anweisungen und dem richtigen Kontext kann ChatGPT sehr nützlich sein. Hier sind einige Dinge, die Sie mit ChatGPT tun können.
Schreiben
ChatGPT kann ein nützlicher Schreibassistent sein. Wenn Sie es auffordern, einen kompletten Artikel auf einmal zu schreiben, erhalten Sie gemischte Ergebnisse. Aber wenn Sie schrittweise mit ihm zusammenarbeiten, kann ChatGPT beeindruckende Dinge leisten. Sie können zum Beispiel mit einer Gliederung beginnen und jeden Abschnitt mit Hilfe des Chatbots von OpenAI ausarbeiten.
Bearbeiten
ChatGPT ist ein ausgezeichneter Bearbeitungsassistent; Sie können ihn für Korrekturlesen, Lektorieren, Umschreiben, Stilanpassung usw. verwenden.
Übersetzen
ChatGPT kann gut in mehrere Sprachen übersetzen. Wenn Sie in einem spezialisierten Bereich arbeiten, können Sie seine Übersetzungen verbessern, indem Sie Kontext liefern, z. B. Beispiele für Quell- und Zielsprachendokumente.
Zusammenfassen
ChatGPT kann Artikel, Reden und Aufsätze zusammenfassen. Er wird genauer, wenn Sie Richtlinien geben, z. B. welche Themen hervorgehoben werden sollen.
Brainstorming
ChatGPT kann hier auf vielfältige Weise helfen, von Vorschlägen für Diskussionspunkte für eine Präsentation bis hin zur Planung einer Reise.
Programmieren
ChatGPT ist ein guter Programmierassistent, der Funktionsbeschreibungen in funktionierenden Code in mehreren Programmier- und Skriptsprachen umwandeln kann.
Erstellen und Erklären von Bildern
Sie können Fotos hochladen und Fragen dazu stellen; Sie können zum Beispiel ein Foto eines Baumes hinzufügen und fragen: “Was ist das für eine Pflanze?” ChatGPT kann auch Screenshots erklären, wenn Sie Fragen haben, d. h. wenn Sie etwas auf Ihrem Telefon sehen können. Es kann auch Bilder mit seinem neuen internen Generator erstellen, der positive Kritiken erhalten hat.
Führen Sie mündliche Gespräche
Mit dem Sprachmodus müssen Sie nicht die perfekte Texteingabe erstellen. Sprechen Sie einfach in das Mikrofon und beginnen Sie einen Chat.
Erstellen Sie Filmclips
Der Sora-Videogenerator erstellt benutzerdefinierte Clips, die nur wenige Sekunden lang sind, keinen Ton haben und verwendet werden können, um größere Videoprojekte zu ergänzen oder als eigenständige Clips. Es ist für ChatGPT Plus- und Pro-Abonnenten verfügbar und mit eingeschränkter Funktionalität kostenlos über die Microsoft Bing-App verfügbar.
Wir raten davon ab, ChatGPT als Recherchetool einzusetzen, da es zu Halluzinationen oder dem Erfinden von Informationen neigt. LLMs wie ChatGPT können Text so zusammensetzen, dass er lexikalisch korrekt, aber faktisch falsch ist. Dies gilt auch für die Verwendung von ChatGPT zum Programmieren: Es kann nicht-funktionalen oder unsicheren Code erzeugen. Eine Faustregel ist, ChatGPT als Ausgangspunkt zu nehmen und die Richtigkeit seiner Ausgabe zu überprüfen, indem Sie auf die von ChatGPT bereitgestellten Quelllinks klicken oder eine separate Google-Suche durchführen. (Perplexity ist ein weiterer Chatbot, der sich auf Zitate konzentriert.)
Welche Alternativen gibt es zu ChatGPT?
Mehrere andere Unternehmen und Organisationen haben LLMs entwickelt, die mit ChatGPT konkurrieren.
- Google Gemini: Das KI-Modell von Google kann fast alles, was Sie mit ChatGPT tun können, und ist mit dem Ökosystem von Google verbunden, sodass Sie seine Ausgabe in Gmail, Google Sheets, Docs usw. exportieren können.
- Bing: Microsoft hat Milliarden von Dollar in OpenAI investiert und ChatGPT in seine Bing-Suchmaschine integriert. Es ist eine dialogorientierte Schnittstelle zum Suchen nach Wissen und zum Erledigen anderer Aufgaben, die Sie mit ChatGPT erledigen können. Es zitiert die Quellen für die generierten Informationen, sodass Sie die Informationsquellen überprüfen können.
- Claude: Anthropic, ein in San Francisco ansässiges KI-Labor, hat Claude auf den Markt gebracht, einen ChatGPT-Konkurrenten mit dem Ruf, gut im Schreiben und Programmieren zu sein.
- Perplexity: Viele Leute verwenden Perplexity als Google-Alternative für die Suche im Web. Es ist auf dem Vormarsch und wird die bevorzugte Suchplattform auf Motorolas neuen Razr-Handys sein. Berichten zufolge ist Samsung in Gesprächen, dasselbe zu tun.
- Open-Source-Modelle: Die Open-Source-Community hat LLMs veröffentlicht, die Sie auf Ihren eigenen Servern ausführen können. Diese LLMs können Ihnen helfen, die Kontrolle über Ihre Daten zu behalten und eine Anbieterbindung zu vermeiden. Open-Source-LLMs sind viel kleiner als ChatGPT und schwieriger einzurichten, aber sie können beeindruckende Ergebnisse erzielen, wenn Sie über die technischen Fähigkeiten verfügen. Die Llama-Modelle von Meta gehören zu den bekanntesten Modellen. Weitere Optionen sind Open Assistant, Alpaca, Vicuna und Dolly 2.