DeepSeek: KI-Revolution für Unternehmen

DeepSeek Tag Zwei: Ein Schritt zur KI-Einführung in Unternehmen

DeepSeek, ein aufstrebendes chinesisches KI-Startup, sorgt mit seinen deutlich reduzierten Preisen für Foundation Models für Aufsehen. Dieser Schritt hat das Potenzial, die KI-Einführung in Unternehmen zu revolutionieren, indem er eine der größten Hürden angeht: die Kosten.

Die hohen Kosten der KI-Einführung

Laut den Analysten Brad Sills und Carly Liu von BofA Global Research sind die mit KI-Anwendungen verbundenen Kosten das Haupthindernis für ihre breite Implementierung. Ihr Bericht, der am Dienstag, den 28. Januar, veröffentlicht wurde, deutet darauf hin, dass Durchbrüche bei der Kostensenkung die Preise weiter senken und zu höheren Akzeptanzraten führen könnten.

DeepSeeks Ankündigung am Montag, den 27. Januar, schickte Schockwellen durch die KI-Branche und verursachte einen Rückgang der Aktien mehrerer KI-Unternehmen. Das Unternehmen enthüllte seine Fähigkeit, ein Foundation Model für nur 5,58 Millionen Dollar mit 2.048 Nvidia H800-Chips zu trainieren. Diese Zahl steht in krassem Gegensatz zu den geschätzten Kosten von OpenAI und Anthropic, die sich auf 100 Millionen bis eine Milliarde Dollar belaufen und den Einsatz von Tausenden von Nvidia-KI-Chips beinhalten.

Roy Benesh, CTO bei eSIMple, betonte das transformative Potenzial von DeepSeeks Leistung und erklärte, dass sie es kleineren Unternehmen, einzelnen Entwicklern und sogar Forschern ermöglicht, die Leistungsfähigkeit von KI zu nutzen, ohne unerschwingliche Kosten zu verursachen. Diese erhöhte Zugänglichkeit kann die Entwicklung innovativer Ideen und Technologien fördern und zu einer größeren Wettbewerbsfähigkeit in diesem Bereich führen. Infolgedessen können Kunden von neuen Optionen profitieren, während etablierte KI-Unternehmen wahrscheinlich ihre Preise senken und den technologischen Fortschritt beschleunigen werden.

Die BofA-Analysten gaben Beispiele für die Kosten, die mit bestehenden KI-Anwendungen verbunden sind. Microsofts 365 Copilot Chat kostet zwischen 1 Cent und 30 Cent pro Eingabeaufforderung, abhängig von der Komplexität der Anfrage. Salesforce’s Agentforce für Service Cloud berechnet eine Pauschale von 2 Dollar pro Konvertierung.

Während BofA einräumte, dass die von DeepSeek präsentierte Zahl von 5,58 Millionen Dollar in gewisser Weise irreführend ist, da Kosten im Zusammenhang mit Forschung, Experimenten, Architekturen, Algorithmen und Daten ausgeschlossen sind, betonten die Analysten die Bedeutung der Innovationen des Startups bei der Demonstration der Machbarkeit kostengünstigerer Trainingsmethoden.

Pre-Training vs. Inferencing: Die Kosten verstehen

Foundation AI-Modelle wie OpenAI’s GPT-4o und Google’s Gemini durchlaufen einen Prozess namens Pre-Training, bei dem sie riesigen Datenmengen ausgesetzt werden, z. B. dem gesamten Internet, um allgemeines Wissen zu entwickeln. Um diese Modelle jedoch für bestimmte Unternehmen und Branchen relevanter und nützlicher zu machen, müssen Unternehmen sie mithilfe ihrer eigenen Daten weiter trainieren oder feinabstimmen.

Sobald das KI-Modell feinabgestimmt wurde, kann es Benutzereingaben verarbeiten und relevante Antworten generieren. Der Prozess der Eingabeaufforderung des Modells und des Erhaltens einer Antwort verursacht jedoch Inferenzkosten, d. h. Gebühren, die mit der Beschäftigung des Modells mit neuen Daten zum Verstehen und Analysieren verbunden sind.

Es ist wichtig zu beachten, dass die meisten Unternehmen nicht die Kosten für das Training von Foundation Models tragen. Diese Verantwortung liegt bei den Entwicklern dieser Modelle, darunter OpenAI, Google, Meta, Amazon, Microsoft, Anthropic, Cohere, Hugging Face, Mistral AI, Stability AI, xAI, IBM, Nvidia, bestimmten Forschungslabors und chinesischen Technologiegiganten wie Baidu und Alibaba.

Unternehmen tragen in erster Linie Inferenzkosten für die Verarbeitung von KI-Workloads, die den Großteil der KI-bezogenen Ausgaben ausmachen.

Die China-Verbindung: DeepSeeks Inferenzkosten und Datenschutzbedenken

DeepSeek bietet seine eigenen Inferenzdienste zu deutlich geringeren Kosten als Unternehmen im Silicon Valley an. Bei der Nutzung dieser Dienste sind jedoch bestimmte Überlegungen zu berücksichtigen.

Gemäß der Datenschutzrichtlinie von DeepSeek werden Benutzerinformationen auf Servern in China gespeichert. Das Unternehmen erklärt außerdem, dass es seinen gesetzlichen Verpflichtungen nachkommen und Aufgaben im öffentlichen Interesse oder zum Schutz der lebenswichtigen Interessen seiner Benutzer und anderer Personen wahrnehmen wird.

Das chinesische nationale Geheimdienstgesetz, insbesondere Artikel 7, schreibt vor, dass alle Organisationen und Bürger die nationalen Geheimdienstbemühungen in Übereinstimmung mit dem Gesetz unterstützen, unterstützen und mit ihnen zusammenarbeiten und die nationalen Geheimdienstarbeitgeheimnisse schützen, die ihnen bekannt sind.

Kevin Surace, CEO von Appvance, äußerte Bedenken hinsichtlich des Datenschutzes und erklärte, dass die Datenerfassung von Benutzern in China eine gängige Praxis sei. Er riet den Benutzern zur Vorsicht.

In einem von PYMNTS durchgeführten Experiment wurde der Chatbot von DeepSeek gebeten zu erläutern, wie die Proteste auf dem Tiananmen-Platz 1989 die chinesische Politik beeinflusst haben. Der Chatbot antwortete: ‘Entschuldigung, ich bin mir noch nicht sicher, wie ich diese Art von Frage angehen soll.’

Tim Enneking, CEO bei Presearch, wies darauf hin, dass DeepSeek ein zu 100 % chinesisches Unternehmen mit Sitz in China ist. Er merkte an, dass die Unfähigkeit des Chatbots, Informationen über den Tiananmen-Platz oder hochrangige chinesische Regierungsbeamte bereitzustellen, auf Einschränkungen der Objektivität der Technologie hindeutet. Während Enneking das aufregende Potenzial der Technologie anerkannte, äußerte er Bedenken hinsichtlich ihrer Kontrolle.

Enneking hob jedoch auch die Open-Source-Natur der DeepSeek-Modelle hervor, die Revisionen ermöglichen, um staatliche und unternehmerische Kontrollen zu entfernen. Er glaubt, dass die ingenieurtechnische Kreativität des Unternehmens Chancen für kleinere Unternehmen und Länder schafft, am generativen KI-Bereich teilzunehmen und erfolgreich zu sein.

DeepSeeks Potenzial zur Senkung der Inferenzkosten für alle

DeepSeeks innovativer Ansatz zur Schulung von Foundation Models zu geringeren Kosten hat positive Auswirkungen auf Unternehmen wie Microsoft, die die Kosten für KI-Computing weiter senken und die Skalierung vorantreiben können. Laut Sills und Liu können niedrigere Rechenkosten zu verbesserten Margen bei KI-fähigen Angeboten führen.

In einer separaten Forschungsnotiz schlugen die BofA-Analysten Alkesh Shah, Andrew Moss und Brad Sills vor, dass niedrigere KI-Rechenkosten breitere KI-Dienste in verschiedenen Sektoren ermöglichen könnten, von Automobilen bis hin zu Smartphones.

Während es unwahrscheinlich ist, dass Entwickler von Foundation Models wie OpenAI sofort Trainingskosten erreichen, die so niedrig sind wie die von DeepSeek, glauben die Analysten, dass DeepSeeks innovative Trainings- und Post-Training-Techniken von konkurrierenden Frontier-Model-Entwicklern übernommen werden, um die Effizienz zu steigern. Sie betonen jedoch, dass aktuelle Modelle weiterhin erhebliche Investitionen erfordern, da sie die Grundlage für KI-Agenten bilden.

Langfristig erwarten die Analysten eine beschleunigte Einführung von KI durch Unternehmen, da Chatbots, Copiloten und Agenten sowohl intelligenter als auch billiger werden, ein Phänomen, das als Jevons-Paradox bekannt ist.

Microsoft CEO Satya Nadella bekräftigte diese Einschätzung auf X und erklärte, dass das Jevons-Paradoxon im Spiel ist, da KI effizienter und zugänglicher wird. Er glaubt, dass dies zu einem Anstieg der KI-Nutzung führen wird, der sie in eine Ware verwandelt, von der wir nicht genug bekommen können.

Ein tieferer Einblick in Foundation Models und ihre Auswirkungen

Foundation Models, das Rückgrat der modernen KI, revolutionieren die Art und Weise, wie Unternehmen arbeiten und mit Technologie interagieren. Diese Modelle, die auf riesigen Datensätzen trainiert werden, besitzen die Fähigkeit, eine Vielzahl von Aufgaben auszuführen, von der Verarbeitung natürlicher Sprache bis zur Bilderkennung. Die Entwicklung und Bereitstellung dieser Modelle beinhaltet jedoch ein komplexes Zusammenspiel von Faktoren, darunter Trainingskosten, Inferenzkosten, Datenschutz und ethische Überlegungen.

Foundation Models verstehen

Im Kern sind Foundation Models große neuronale Netze, die auf riesigen Datensätzen trainiert werden. Dieser Trainingsprozess ermöglicht es ihnen, Muster und Beziehungen innerhalb der Daten zu lernen, wodurch sie in der Lage sind, eine Vielzahl von Aufgaben mit bemerkenswerter Genauigkeit auszuführen. Einige Beispiele für Foundation Models sind:

  • GPT-4o: Ein leistungsstarkes Sprachmodell, das von OpenAI entwickelt wurde und in der Lage ist, menschenähnlichen Text zu generieren, Sprachen zu übersetzen und Fragen umfassend zu beantworten.
  • Googles Gemini: Ein multimodales KI-Modell, das verschiedene Datentypen verarbeiten und verstehen kann, darunter Text, Bilder und Audio.

Diese Modelle sind nicht auf bestimmte Aufgaben beschränkt, sondern können an eine Vielzahl von Anwendungen angepasst werden, was sie zu vielseitigen Werkzeugen für Unternehmen macht.

Die Rolle von Pre-Training und Fine-Tuning

Die Entwicklung eines Foundation Models umfasst in der Regel zwei Schlüsselphasen: Pre-Training und Fine-Tuning.

  • Pre-Training: In dieser Phase wird das Modell auf einem riesigen Datensatz trainiert, z. B. dem gesamten Internet, um allgemeines Wissen und Sprachkenntnisse zu erlernen. Dieser Prozess stattet das Modell mit der Fähigkeit aus, Text zu verstehen und zu generieren, Sprachen zu übersetzen und andere grundlegende Aufgaben auszuführen.
  • Fine-Tuning: In dieser Phase wird das vortrainierte Modell weiter auf einem kleineren, spezifischeren Datensatz trainiert, der sich auf eine bestimmte Aufgabe oder Branche bezieht. Dieser Prozess ermöglicht es dem Modell, sein Wissen und seine Fähigkeiten an die spezifischen Bedürfnisse der Anwendung anzupassen.

Beispielsweise könnte ein vortrainiertes Sprachmodell auf einem Datensatz von Kundendienstinteraktionen feinabgestimmt werden, um einen Chatbot zu erstellen, der effektiv auf Kundenanfragen reagieren kann.

Die Kosten für Training und Inferencing

Die mit Foundation Models verbundenen Kosten lassen sich in zwei Hauptkategorien unterteilen: Trainingskosten und Inferenzkosten.

  • Trainingskosten: Diese Kosten umfassen die Rechenressourcen, Daten und das Fachwissen, die erforderlich sind, um das Foundation Model zu trainieren. Das Training eines großen Foundation Models kann extrem teuer sein und erfordert oft Investitionen in Millionenhöhe.
  • Inferenzkosten: Diese Kosten umfassen die Rechenressourcen, die erforderlich sind, um das trainierte Modell zu verwenden, um Vorhersagen zu treffen oder Ausgaben zu generieren. Die Inferenzkosten können je nach Größe und Komplexität des Modells, der Menge der verarbeiteten Daten und der verwendeten Infrastruktur variieren.

DeepSeeks Innovation liegt in seiner Fähigkeit, die mit Foundation Models verbundenen Trainingskosten erheblich zu senken und sie so einem breiteren Spektrum von Unternehmen und Organisationen zugänglicher zu machen.

Umgang mit Datenschutz- und ethischen Bedenken

Die Verwendung von Foundation Models wirft wichtige Fragen zum Datenschutz und zu ethischen Überlegungen auf. Foundation Models werden auf riesigen Datensätzen trainiert, die sensible oder persönliche Informationen enthalten können. Es ist entscheidend, sicherzustellen, dass diese Modelle verantwortungsvoll und ethisch verwendet werden, wobei die Privatsphäre der Benutzer respektiert und Verzerrungen vermieden werden.

Einige Strategien zur Bewältigung dieser Bedenken sind:

  • Datenanonymisierung: Entfernen oder Maskieren persönlicher Informationen aus den Trainingsdaten, um die Privatsphäre der Benutzer zu schützen.
  • Verzerrungserkennung und -minderung: Identifizieren und Beheben von Verzerrungen in den Trainingsdaten, um sicherzustellen, dass das Modell keine schädlichen Stereotypen oder diskriminierenden Praktiken aufrechterhält.
  • Transparenz und Rechenschaftspflicht: Bereitstellung klarer Informationen darüber, wie das Modell funktioniert und wie es verwendet wird, und Einrichtung von Mechanismen für die Rechenschaftspflicht im Falle von Fehlern oder unbeabsichtigten Folgen.

Da Foundation Models immer weiter verbreitet werden, ist es wichtig, diese Datenschutz- und ethischen Bedenken proaktiv anzugehen, um sicherzustellen, dass sie zum Wohle der Gesellschaft eingesetzt werden.

Die Zukunft von Foundation Models

Foundation Models entwickeln sich rasant weiter und ihre potenziellen Auswirkungen auf die Gesellschaft sind immens. In Zukunft können wir Folgendes erwarten:

  • Leistungsstärkere und vielseitigere Modelle: Da Forscher weiterhin neue Architekturen und Trainingstechniken entwickeln, werden Foundation Models noch leistungsstärker und vielseitiger und in der Lage sein, eine größere Bandbreite von Aufgaben mit größerer Genauigkeit auszuführen.
  • Erhöhte Zugänglichkeit: Da die Trainingskosten sinken und Cloud-basierte KI-Plattformen immer weiter verbreitet werden, werden Foundation Models für Unternehmen aller Größen zugänglicher.
  • Neue Anwendungen und Anwendungsfälle: Foundation Models werden weiterhin auf neue und innovative Anwendungsfälle in verschiedenen Branchen angewendet, vom Gesundheitswesen über das Finanzwesen bis hin zur Bildung.

Der Aufstieg von Foundation Models stellt einen Paradigmenwechsel im Bereich der künstlichen Intelligenz dar. Indem wir ihre Fähigkeiten, Kosten und ethischen Überlegungen verstehen, können wir ihre Kraft nutzen, um eine bessere Zukunft zu schaffen.

DeepSeeks Beitrag zur Demokratisierung der KI

DeepSeeks Erfolg bei der deutlichen Reduzierung der Kosten für das Training von Foundation Models markiert einen Wendepunkt in der Demokratisierung der KI. Indem DeepSeek die Eintrittsbarriere senkt, ermöglicht es einer breiteren Palette von Organisationen und Einzelpersonen, an der KI-Revolution teilzunehmen.

Die Auswirkungen auf kleinere Unternehmen

Kleinere Unternehmen verfügen oft nicht über die Ressourcen und das Fachwissen, um ihre eigenen KI-Modelle zu entwickeln und bereitzustellen. DeepSeeks kostengünstige Foundation Models bieten diesen Unternehmen Zugang zu modernster KI-Technologie, die bisher unerreichbar war. Dies kann die Wettbewerbsbedingungen verbessern und es kleineren Unternehmen ermöglichen, effektiver mit größeren, etablierteren Unternehmen zu konkurrieren.

Beispielsweise könnte ein kleines E-Commerce-Unternehmen DeepSeeks Modelle verwenden, um Produktempfehlungen für seine Kunden zu personalisieren, seinen Kundenservice zu verbessern oder seine Marketingkampagnen zu automatisieren.

Die Ermächtigung einzelner Entwickler

DeepSeeks Modelle ermöglichen es auch einzelnen Entwicklern und Forschern, neue KI-Anwendungen und Innovationen zu erforschen. Mit dem Zugang zu erschwinglichen Foundation Models können Entwickler mit verschiedenen Ideen experimentieren, neue KI-gestützte Tools entwickeln und zur Weiterentwicklung der KI-Technologie beitragen.

Dies kann zu einem Innovationsschub führen, da mehr Menschen die Möglichkeit haben, an der Entwicklung von KI teilzunehmen.

Das Potenzial für Open-Source-Zusammenarbeit

DeepSeeks Open-Source-Ansatz fördert die Zusammenarbeit und Innovation in der KI-Community weiter. Indem DeepSeek seine Modelle der Öffentlichkeit zugänglich macht, ermutigt es Entwickler, zu ihrer Verbesserung beizutragen, Fehler zu identifizieren und zu beheben und neue Funktionen zu entwickeln.

Dieser kollaborative Ansatz kann die Entwicklung der KI-Technologie beschleunigen und sicherstellen, dass sie zum Wohle aller eingesetzt wird.

Die Beschleunigung der KI-Einführung

Indem DeepSeek die Kosten für KI senkt, beschleunigt es die Einführung von KI in verschiedenen Branchen. Da KI erschwinglicher und zugänglicher wird, werden mehr Unternehmen in der Lage sein, sie in ihre Abläufe zu integrieren, was zu erhöhter Produktivität, Effizienz und Innovation führt.

Dies kann tiefgreifende Auswirkungen auf die Weltwirtschaft haben, das Wachstum ankurbeln und neue Möglichkeiten schaffen.

Ein inklusiveres KI-Ökosystem

DeepSeeks Bemühungen zur Demokratisierung der KI tragen zu einem inklusiveren KI-Ökosystem bei, in dem mehr Menschen die Möglichkeit haben, an der Entwicklung und Nutzung von KI teilzunehmen. Dies kann dazu beitragen, sicherzustellen, dass KI so eingesetzt wird, dass sie allen Mitgliedern der Gesellschaft zugute kommt, und nicht nur einigen wenigen Auserwählten.

Indem DeepSeek kleinere Unternehmen, einzelne Entwickler und Forscher stärkt, fördert es eine vielfältigere und innovativere KI-Landschaft.