Künstliche Intelligenz (KI)-Chatbots entwickeln sich ständig weiter, und viele bieten jetzt "Tiefenforschungs"-Optionen an, mit denen sie für Sie bestimmte Themen recherchieren können. Diese Bots agieren als autonome KI-Agenten, die in Ihrem Namen im Internet suchen, relevante Online-Ressourcen finden und Ihnen dann einen detaillierten Bericht auf der Grundlage ihrer Ergebnisse liefern. Ziel ist es, Ihnen die Zeit zu ersparen, Hunderte oder Tausende von Websites selbst zu durchforsten.
Tiefenforschung entwickelt sich rasch zu einer leistungsstarken Funktion für verschiedene KIs. Sie finden sie in OpenAI’s ChatGPT, Google Gemini, Perplexity AI und sogar xAI’s Grok (die es DeepSearch nennen). Microsoft hat eine Art Tiefenforschung mit zwei KI-Agenten (Researcher und Analyst) eingeführt; diese erfordern jedoch eine Microsoft 365 Copilot-Lizenz und ein Enterprise- oder Business-Abonnement, sodass sie normalen Copilot-Benutzern noch nicht zur Verfügung stehen.
Das klingt natürlich nach einer nützlichen und hilfreichen Fähigkeit. Aber wie schneiden die verschiedenen KI-Dienste ab, wenn sie mit dieser Herausforderung konfrontiert werden? Um diese Frage zu beantworten, habe ich die Tiefenforschungsfunktionen von ChatGPT, Gemini, Perplexity AI und Grok ausprobiert. Ich habe in jedem Dienst dieselbe Anfrage eingereicht und sie gebeten, "die Darstellung von Zeitreisen in Filmen und im Fernsehen zu untersuchen und wie sie unsere Werte, Ängste und Wünsche widerspiegelt".
Im Folgenden wird erläutert, wie der Forschungsmodus der einzelnen KIs funktioniert und wie sie mein Thema behandelt haben.
ChatGPT
OpenAI’s ChatGPT bietet zwei verschiedene Tiefenforschungsmodi: Vollversion und Light-Version. Die Vollversion bietet detaillierte, tiefgehende Berichte, kann aber bis zu 30 Minuten dauern, um die besten Quellen zu finden und ihre Ergebnisse zu präsentieren. Die Light-Version bietet kürzere, weniger tiefgehende Berichte, ist aber in der Regel in wenigen Minuten fertig. Welchen Sie verwenden können und wie viele Anfragen Sie einreichen können, hängt von Ihrem Plan ab.
ChatGPT Plus-, Team- und Edu-Benutzer erhalten 25 Anfragen pro Monat (10 Vollversionen und 15 Light-Versionen), Enterprise-Benutzer erhalten 10 (alle Vollversionen), Pro-Benutzer erhalten 250 (125 Vollversionen und 125 Light-Versionen) und kostenlose Benutzer erhalten 5 (alle Light-Versionen). Sobald Sie Ihr Limit für die Vollversion der Tiefenforschung erreicht haben, werden Ihre Anfragen automatisch auf die Light-Version umgestellt.
Unabhängig davon, ob Sie die Vollversion oder die Light-Version verwenden, ist der Vorgang derselbe. Sie können auch die Desktop-App für Windows oder macOS verwenden. Geben Sie Ihre Anfrage ein oder sprechen Sie sie an der Eingabeaufforderung ein, wählen Sie die Schaltfläche "Tiefenforschung" und senden Sie Ihre Anfrage. Wenn die Vollversion aktiv ist, sollten Sie sich darauf einstellen, eine Weile auf eine Antwort zu warten. Wenn die Light-Version ausgeführt wird, müssen Sie nicht so lange warten.
Ich habe die Anfrage nach Zeitreisen in Filmen und im Fernsehen sowohl an die Vollversion der Tiefenforschung als auch an die Light-Version gestellt - im ersten Fall mit meinem Plus-Abonnement, im zweiten Fall mit einem kostenlosen Konto. Beide verwendeten das GPT-4o-Modell. Beide baten mich auch, die Art der Analyse zu präzisieren, die ich wünschte, z. B. ob ich mich für einen thematischen oder eher historischen Ansatz entscheiden sollte und ob ich nur klassische Filme und Fernsehsendungen oder moderne Filme und Fernsehsendungen einbeziehen sollte.
Die Vollversion brauchte etwa 17 Minuten, um das Internet zu durchsuchen und die Ergebnisse zusammenzustellen, lieferte aber einen detaillierten, tiefgehenden Bericht mit mehreren Beispielen und einer nützlichen Tabelle mit Fernsehsendungen und Filmen. Die Light-Version dauerte von Anfang bis Ende nur etwa 8 Minuten, lieferte aber einen kürzeren, weniger tiefgehenden Bericht - eine Cliff’s Notes-Version des vollständigen Berichts. Beide Berichte gingen auf mein Thema ein und waren interessant zu lesen, aber die Vollversion der Tiefenforschung erhielt aufgrund ihrer Gründlichkeit den Vorzug.
Google Gemini
Der Tiefenforschungsmodus von Gemini steht Abonnenten und kostenlosen Nutzern zur Verfügung. Abonnenten erhalten in der Regel 20 Anfragen pro Tag, aber diese Zahl kann variieren. Kostenlose Nutzer sind auf 5 Anfragen pro Monat beschränkt.
Um die Tiefenforschung zu aktivieren, klicken Sie auf das Dropdown-Menü in der oberen linken Ecke, in dem das aktuelle Modell aufgeführt ist. Abonnenten können zwischen 2.0 Flash, 2.5 Pro (experimentell) und Tiefenforschung mit 2.5 Pro wählen. Kostenlose Nutzer können zwischen 2.0 Flash oder Tiefenforschung wählen. Sobald das gewünschte Modell ausgewählt ist, sollte die Schaltfläche "Tiefenforschung" unter der Eingabeaufforderung angezeigt werden. Geben Sie Ihre Frage an der Eingabeaufforderung ein, wählen Sie die Schaltfläche "Tiefenforschung" (wenn sie noch nicht hervorgehoben ist) und senden Sie Ihre Anfrage.
Nachdem ich die Anfrage nach Zeitreisen eingereicht hatte, erstellte Geminis Tiefenforschung schnell einen Entwurf, wie sie mein Thema bearbeiten wollte, den ich anpassen oder so genehmigen konnte, wie er war. Ich gab ihm ein "Daumen hoch", und Gemini begann, im Internet zu recherchieren.
Die KI informierte mich über den Fortschritt jedes Schritts und zeigte an, was sie tat, welche Websites sie konsultierte und wie der Bericht vorankam. Der gesamte Prozess dauerte etwa 10 Minuten.
Der resultierende Bericht war sehr tiefgehend, gründlich und ausführlich. Mir gefiel die enthaltene Tabelle mit Beispielen für die besprochenen Filme. Geminis Schreibstil ist akademischer als der von ChatGPT, der weniger formell und interessanter zu lesen ist. Aber Gemini hat sich trotzdem als lohnenswert erwiesen, um die Aufgabe zu erfüllen.
Perplexity AI
Der Tiefenforschungsmodus von Perplexity steht sowohl zahlenden Abonnenten als auch kostenlosen Nutzern zur Verfügung. Pro-Abonnenten erhalten bis zu 500 Anfragen pro Tag, während kostenlose Nutzer fünf Anfragen pro Tag erhalten. Geben Sie an der Eingabeaufforderung Ihre Frage ein, wählen Sie die Schaltfläche "Recherche" und senden Sie Ihre Anfrage.
Ich habe Perplexity’s Research Mode das gleiche Thema Zeitreisen bearbeiten lassen. Auch hier informierte mich die KI über den Fortschritt und teilte mir mit, welche spezifischen Unterthemen sie recherchierte und welche Websites sie analysierte. Perplexity brauchte nur etwa fünf Minuten, um seine Ergebnisse zusammenzustellen und seinen Bericht einzureichen. Aber das Ergebnis war enttäuschend.
Der Bericht selbst war deutlich kürzer als die von anderen KIs erstellten Berichte. Jedes Thema oder Element erhielt nur wenige Absätze, und die meisten von ihnen entbehrten jeglicher eingehenden Analyse. Der Bericht war als schnelle Lektüre in Ordnung. Aber er erinnerte mich an eine Hausarbeit, die ein Kind abgegeben hat, das sie einfach nur ohne viel Zeit und Mühe erledigen wollte.
Grok AI
xAI’s Grok 3 bietet zwei Tiefenforschungsmodi: DeepSearch und DeeperSearch. DeepSearch durchsucht eine große Anzahl von Online-Ressourcen, wobei jedoch nicht alle nützlich oder zuverlässig sind. Dieser Modus ist auch sehr schnell. DeeperSearch ist ein Upgrade von DeepSearch, das mehr hochwertige Ressourcen nutzt und länger dauert, aber in der Regel einen tiefergehenden Bericht liefert.
Unabhängig davon, für welchen Modus Sie sich entscheiden, können X Premium+-Abonnenten eine unbegrenzte Anzahl von Anfragen genießen, während kostenlose und Basic-Benutzer auf nur 10 DeepSearch-Anfragen pro Tag beschränkt sind.
Um diese Funktion auszuprobieren, geben Sie Ihre Anfrage an der Grok-Eingabeaufforderung ein, klicken Sie auf den Download-Pfeil für DeepSearch und wählen Sie DeepSearch oder DeeperSearch. Wenn Sie bereit sind, senden Sie Ihre Anfrage.
Ich habe Grok die gleiche Anfrage nach Zeitreisen gestellt. Im DeepSearch-Modus brauchte die KI nur eineinhalb Minuten, um den gesamten Prozess abzuschließen, was einen Geschwindigkeitsrekord darstellt. DeeperSearch dauerte etwas länger, nämlich zweieinhalb Minuten. Angesichts der Geschwindigkeit erwartete ich eigentlich einen schlechten Bericht. Aber das Ergebnis hat mich überrascht. In beiden Modi lieferte Grok einen interessanten und informativen Bericht, wenn auch kurz. Die Recherche enthielt verschiedene Beispiele, eine nützliche Tabelle mit Fernsehsendungen und Filmen sowie einige clevere Analysen. Gar nicht schlecht.
Welche KI hat also am besten abgeschnitten? Ich muss ChatGPT zum Sieger erklären. Obwohl es am längsten dauerte, war sein Bericht der gründlichste, tiefgehendste, am besten geschriebene und interessanteste. Ansonsten ist Grok auf jeden Fall einen Versuch wert, wenn Sie es eilig haben. Natürlich basiert all dies nur auf einer Anfrage. Für andere Themen würde ich vielleicht einen anderen Sieger küren. Aber diese Ergebnisse sind trotzdem einen Blick wert, wenn Sie das nächste Mal eine KI für Ihre eigene Art der Tiefenforschung benötigen.
Lassen Sie uns nun tiefer in die spezifischen Unterschiede der einzelnen KI-Modelle eintauchen und ihre jeweiligen Stärken und Schwächen bei der Bearbeitung komplexer Forschungsaufgaben untersuchen. Wir werden uns auf die folgenden Schlüsselaspekte konzentrieren:
- Qualität und Vielfalt der Informationsquellen: Ist die KI in der Lage, Informationen aus einer Vielzahl zuverlässiger Quellen zu identifizieren und zu nutzen?
- Tiefe und Aussagekraft der Analyse: Wiederholt die KI lediglich Informationen oder ist sie in der Lage, tiefgreifende Analysen und wertvolle Erkenntnisse zu liefern?
- Klarheit und Lesbarkeit des Berichts: Ist der von der KI generierte Bericht leicht verständlich, logisch klar und gut strukturiert?
- Bearbeitungszeit und Effizienz: Ist die Zeit, die die KI für die Erledigung der Forschungsaufgabe benötigt, angemessen und wie ist sie im Vergleich zu anderen Modellen?
Durch eine detailliertere Bewertung dieser Schlüsselaspekte können wir die Fähigkeiten der einzelnen KI-Modelle besser verstehen und feststellen, welches Modell am besten für bestimmte Forschungsbedürfnisse geeignet ist.
Werfen wir zunächst einen Blick auf die Leistung von ChatGPT im Bereich der Tiefenforschung. Wie bereits erwähnt, bietet ChatGPT zwei verschiedene Tiefenforschungsmodi an: die Vollversion und die Light-Version. Die Vollversion bietet eine tiefere und gründlichere Analyse, benötigt aber mehr Zeit für die Fertigstellung. Die Light-Version ist schneller, geht aber Kompromisse bei Tiefe und Detailgenauigkeit ein.
In Bezug auf die Informationsquellen scheint ChatGPT auf eine Vielzahl von Online-Ressourcen zugreifen zu können, darunter Fachzeitschriften, Nachrichtenartikel, Blogs und Websites. In einigen Fällen kann es sich jedoch auf weniger zuverlässige Quellen verlassen, was die Genauigkeit und Glaubwürdigkeit seines Berichts beeinträchtigen kann.
In Bezug auf die Tiefe und Aussagekraft der Analyse ist die Vollversion von ChatGPT in der Regel in der Lage, tiefgreifende Analysen und wertvolle Erkenntnisse zu liefern. Sie kann Beziehungen zwischen verschiedenen Quellen erkennen und fundierte Argumente vorbringen. Die Light-Version hingegen neigt dazu, diese Tiefe zu vermissen und eine oberflächlichere Analyse zu liefern.
In Bezug auf die Klarheit und Lesbarkeit des Berichts ist ChatGPT in der Regel in der Lage, leicht verständliche, logisch klare und gut strukturierte Berichte zu erstellen. In einigen Fällen kann sein Schreibstil jedoch zu förmlich oder akademisch sein, was seine Attraktivität beeinträchtigen kann.
In Bezug auf die Bearbeitungszeit und Effizienz benötigt die Vollversion von ChatGPT relativ lange, um eine Forschungsaufgabe abzuschließen. Dies kann auf seine gründlichere Analyse und seine Abhängigkeit von einem breiteren Spektrum an Quellen zurückzuführen sein. Die Light-Version ist schneller, geht aber Kompromisse bei Tiefe und Detailgenauigkeit ein.
Sehen wir uns als Nächstes an, wie Google Gemini im Bereich der Tiefenforschung abschneidet. Gemini bietet einen Tiefenforschungsmodus, der sowohl Abonnenten als auch kostenlosen Nutzern zur Verfügung steht. Es ermöglicht Benutzern, den Entwurf, wie die KI das Thema bearbeitet, anzupassen oder zu genehmigen.
In Bezug auf die Informationsquellen scheint Gemini auf eine ähnliche Bandbreite an Online-Ressourcen zugreifen zu können wie ChatGPT. Es kann jedoch eine strengere Filterung der Zuverlässigkeit bestimmter Quellen vornehmen, was die Genauigkeit und Glaubwürdigkeit seines Berichts erhöhen kann.
In Bezug auf die Tiefe und Aussagekraft der Analyse ist Geminis Tiefenforschung in der Regel in der Lage, tiefgreifende Analysen und wertvolle Erkenntnisse zu liefern. Sie kann Beziehungen zwischen verschiedenen Quellen erkennen und fundierte Argumente vorbringen. Sein Schreibstil kann jedoch akademischer sein als der von ChatGPT, was seine Attraktivität beeinträchtigen kann.
In Bezug auf die Klarheit und Lesbarkeit des Berichts ist Gemini in der Regel in der Lage, leicht verständliche, logisch klare und gut strukturierte Berichte zu erstellen. Sein akademischer Stil kann es jedoch für einige Leser schwierig machen, ihn zu verstehen.
In Bezug auf die Bearbeitungszeit und Effizienz ist Geminis Tiefenforschung in der Regel schneller als die Vollversion von ChatGPT. Dies kann auf seine effizientere Analyse und seine Abhängigkeit von einer schlankeren Anzahl von Quellen zurückzuführen sein.
Bewerten wir nun die Leistung von Perplexity AI im Bereich der Tiefenforschung. Perplexity bietet einen Tiefenforschungsmodus, der sowohl zahlenden Abonnenten als auch kostenlosen Nutzern zur Verfügung steht. Es informiert den Benutzer darüber, welche spezifischen Unterthemen es recherchiert und welche Websites es analysiert.
In Bezug auf die Informationsquellen scheint Perplexity auf eine ähnliche Bandbreite an Online-Ressourcen zugreifen zu können wie ChatGPT und Gemini. Es kann jedoch eine strengere Filterung der Zuverlässigkeit bestimmter Quellen vornehmen, was die Genauigkeit und Glaubwürdigkeit seines Berichts erhöhen kann.
In Bezug auf die Tiefe und Aussagekraft der Analyse mangelt es Perplexity’s Tiefenforschung in der Regel an Tiefe und Detailgenauigkeit. Es kann eine oberflächlichere Analyse liefern und ist möglicherweise nicht in der Lage, Beziehungen zwischen verschiedenen Quellen zu erkennen.
In Bezug auf die Klarheit und Lesbarkeit des Berichts ist Perplexity in der Regel in der Lage, leicht verständliche, logisch klare und gut strukturierte Berichte zu erstellen. Seine Prägnanz kann jedoch dazu führen, dass es an Attraktivität mangelt.
In Bezug auf die Bearbeitungszeit und Effizienz ist Perplexity’s Tiefenforschung in der Regel schneller als ChatGPT und Gemini. Dies kann auf seine effizientere Analyse und seine Abhängigkeit von einer schlankeren Anzahl von Quellen zurückzuführen sein.
Werfen wir abschließend einen Blick auf die Leistung von Grok AI im Bereich der Tiefenforschung. Grok bietet zwei Tiefenforschungsmodi an: DeepSearch und DeeperSearch. DeepSearch durchsucht eine große Anzahl von Online-Ressourcen, während DeeperSearch mehr hochwertige Ressourcen nutzt und mehr Zeit für die Ausführung benötigt.
In Bezug auf die Informationsquellen kann sich Grok’s DeepSearch auf weniger zuverlässige Quellen verlassen, was die Genauigkeit und Glaubwürdigkeit seines Berichts beeinträchtigen kann. DeeperSearch hingegen konzentriert sich stärker auf hochwertige Quellen.
In Bezug auf die Tiefe und Aussagekraft der Analyse ist Grok’s Tiefenforschung in der Regel in der Lage, interessante und informative Berichte zu liefern, obwohl sie kurz sind. Sie kann Beziehungen zwischen verschiedenen Quellen erkennen und fundierte Argumente vorbringen.
In Bezug auf die Klarheit und Lesbarkeit des Berichts ist Grok in der Regel in der Lage, leicht verständliche, logisch klare und gut strukturierte Berichte zu erstellen. Seine Prägnanz kann jedoch dazu führen, dass es an Attraktivität mangelt.
In Bezug auf die Bearbeitungszeit und Effizienz ist Grok’s Tiefenforschung das schnellste aller Modelle. Dies kann auf seine effizientere Analyse und seine Abhängigkeit von einer schlankeren Anzahl von Quellen zurückzuführen sein.
Zusammenfassend lässt sich sagen, dass jedes KI-Modell seine eigenen Stärken und Schwächen im Bereich der Tiefenforschung hat. ChatGPT bietet die gründlichste und tiefgehendste Analyse, benötigt aber am längsten für die Fertigstellung. Gemini bietet eine ähnliche Analyse wie ChatGPT, jedoch mit einem akademischeren Schreibstil. Perplexity AI ist schneller, aber es mangelt an Tiefe und Detailgenauigkeit. Grok AI ist das schnellste, kann sich aber auf weniger zuverlässige Quellen verlassen.
Letztendlich hängt das für Sie am besten geeignete KI-Modell von Ihren spezifischen Forschungsbedürfnissen ab. Wenn Sie die gründlichste und tiefgehendste Analyse benötigen und es Ihnen nichts ausmacht, länger zu warten, ist ChatGPT möglicherweise die beste Wahl. Wenn Sie eine effizientere Analyse benötigen und Kompromisse bei der Detailgenauigkeit akzeptabel sind, sind Gemini oder Perplexity AI möglicherweise eine bessere Wahl. Wenn Sie die schnellste Analyse benötigen und es Ihnen nichts ausmacht, sich auf weniger zuverlässige Quellen zu verlassen, ist Grok AI möglicherweise die beste Wahl.