Die Oracle Cloud Infrastructure (OCI) Generative AI-Dienste haben bedeutende Upgrades erhalten, darunter die Veröffentlichung der Cohere Command A- und Rerank 3.5-Modelle sowie die Einführung von Cohere Embed 3 mit Multimodalitätsunterstützung. Diese neuen Modelle sollen OCI-Kunden noch leistungsfähigere KI-Funktionen auf Unternehmensebene bieten und ihre KI-Anwendungsfähigkeiten in verschiedenen Anwendungsszenarien weiter verbessern.
Command A: Der Gipfel von Leistung und Effizienz
Cohere’s Command A 03-2025 ist das derzeit leistungsstärkste Command-Modell. Der Datendurchsatz ist um 150 % höher als bei der vorherigen Generation, und es werden nur zwei GPUs benötigt. Laut Cohere ist dieses Modell in Bezug auf agentenbasierte Unternehmensaufgaben mit OpenAI 4o und DeepSeekv3 vergleichbar oder übertrifft diese sogar, und es bietet eine deutliche Verbesserung der Recheneffizienz.
Die herausragende Leistung von Command A beruht auf seinem fortschrittlichen Architekturdesign und seinen Trainingsmethoden, die es ihm ermöglichen, in einer Vielzahl komplexer KI-Anwendungen auf Unternehmensebene hervorragende Leistungen zu erbringen. Ob es um die Verarbeitung riesiger Datenmengen, die Ausführung komplexer Inferenzaufgaben oder die Durchführung von Natural Language Processing in Echtzeit geht, Command A bietet effiziente und zuverlässige Lösungen. Der Durchsatz kann um bis zu 150% des vorherigen Modells erhöht werden, während die Ressourcen deutlich geringer ausfallen. Dies ist ein großer Vorteil bei der Implementierung in Workloads im Production-Bereich und hilft auch, eine umweltfreundlichere Strategie im Umgang mit KI-Tools zu validieren.
Die wichtigsten Merkmale von Command A sind:
Sehr langes Kontextfenster: Unterstützt eine Kontextlänge von bis zu 256k Token, wodurch das Modell längere Textsequenzen verarbeiten und so Kontextinformationen besser verstehen und genauere und kohärentere Antworten generieren kann. Dies bedeutet, dass Command A komplexe Dokumente, lange Dialoge und mehrstufige Interaktionen verarbeiten kann, ohne wichtige Informationen zu verlieren. Die Möglichkeiten der Anwendungsfälle werden so quasi unbegrenzt.
Advanced Retrieval Augmented Generation (RAG): Durch die Integration der Retrieval-Augmented Generation-Technologie kann Command A relevante Informationen aus riesigen Datenmengen abrufen und in die generierten Inhalte integrieren, wodurch die Qualität und Genauigkeit der generierten Ergebnisse verbessert wird. Diese Technologie reduziert nicht nur die Abhängigkeit des Modells von externem Wissen, sondern ermöglicht es ihm auch, sich besser an sich ändernde Informationsumgebungen anzupassen. Dies sorgt für eine akkurate und relevante Wissensbasis. Es wird das Wissen, aber nicht die Wahrnehmung eines LLM’s mit eingebracht.
Native Agent Tool Use: Command A verfügt über native Agent Tool Use-Funktionen und kann in andere Tools und Dienste integriert werden, um komplexere Funktionen zu realisieren. Es kann beispielsweise mit Suchmaschinen, Datenbanken, APIs usw. interagieren, um die erforderlichen Informationen abzurufen oder bestimmte Aktionen auszuführen. Diese Fähigkeit ermöglicht es Command A, verschiedene komplexe Aufgaben zu erfüllen, wie z. B. die Automatisierung von Kundenservice, intelligente Assistenten und Datenanalyse. So kann Command A zum einen im First-Level-Support-Bereich eingesetzt werden, zum anderen aber auch Aufgaben übernehmen, die tief in die Kernprozesse eingreifen.
Enterprise-Sicherheit und Datenschutz: Command A wurde unter Berücksichtigung der Sicherheits- und Datenschutzanforderungen von Unternehmen entwickelt und verwendet verschiedene Sicherheitsmaßnahmen, um Kundendaten zu schützen. Es unterstützt beispielsweise Datenverschlüsselung, Zugriffskontrolle und Überwachungsfunktionen, um sicherzustellen, dass Kundendaten nicht unbefugt abgerufen oder offengelegt werden. Dies ist ein elementarer Baustein in der Bewertung eines jeden KI-Tools und sollte nicht vernachlässigt werden. Nur so können diese Anwendungen in den Unternehmen sicher eingesetzt werden.
Starke Mehrsprachigkeit: Command A wurde in 23 Sprachen trainiert, darunter Englisch, Französisch, Spanisch, Italienisch, Deutsch, Portugiesisch, Japanisch, Koreanisch, Arabisch, Chinesisch, Russisch, Polnisch, Türkisch, Vietnamesisch, Niederländisch, Tschechisch, Indonesisch, Ukrainisch, Rumänisch, Griechisch, Hindi, Hebräisch und Persisch. Dies ermöglicht es, Texte in verschiedenen Sprachen zu verarbeiten und Dienstleistungen für Nutzer auf der ganzen Welt anzubieten. In der heutigen Welt ein sehr wichtiges Kriterium, denn die Welt ist nicht Englisch, sondern multikulturell und mehrsprachig. Damit ist eine globale Abdeckung gewährleistet und es werden keine Informationen falsch übersetzt.
Texteingabe und -ausgabe: Command A unterstützt derzeit nur Texteingabe und -ausgabe, d. h. es wird hauptsächlich für die Verarbeitung textbezogener Aufgaben wie Textgenerierung, Textzusammenfassung, Textübersetzung und Textklassifizierung verwendet. Dies ermöglicht eine Fokussierung auf die Hauptaufgabe und vermeidet Ablenkungen durch weitere Möglichkeiten.
Hinweis: Das Command A-Modell unterstützt derzeit keine Feinabstimmung.
Rerank 3.5: Verbesserung der Genauigkeit der Unternehmenssuche
Rerank 3.5 ist das neueste AI-Suchgrundlagenmodell von Cohere, das die Genauigkeit von Unternehmenssuch- und Retrieval-Augmented Generation (RAG)-Systemen verbessern soll. Das Modell verfügt über verbesserte Inferenzfunktionen, kann komplexe Benutzerabfragen interpretieren und ist mit verschiedenen Datentypen (einschließlich langer Dokumente, E-Mails, Tabellen, JSON und Code) kompatibel. Darüber hinaus unterstützt Rerank 3.5 mehr als 100 Sprachen, um die Suchanforderungen globaler Unternehmen zu erfüllen. Dies ist ein großer Schritt in eine Zukunft der einfacheren Suchmechanismen.
Rerank 3.5 verbessert die Sucheffizienz und -zufriedenheit der Benutzer, indem es die Suchergebnisse neu ordnet und die relevantesten Ergebnisse an den Anfang stellt. Es kann nicht nur auf die traditionelle Textsuche angewendet werden, sondern auch auf verschiedene andere Arten der Suche, wie z. B. die Bildersuche, die Videosuche und die Audiosuche. Suchergebnisse können so nach Relevanz sortiert werden und das Finden der richtigen Informationen wird drastisch beschleunigt.
Die wichtigsten Merkmale von Rerank 3.5 sind:
Verbesserte Inferenzfunktionen: Rerank 3.5 verfügt über verbesserte Inferenzfunktionen, um komplexe Benutzerabfragen besser zu verstehen. Durch die Analyse der Semantik und des Kontextes der Abfrage kann es die Absicht des Benutzers genau erkennen und die relevantesten Ergebnisse liefern. Der Benutzer wird sich verstanden fühlen und ist somit zufriedener, als wenn er erst eine riesige Ergebnisliste durcharbeiten muss, um die für ihn relevanten Informationen zu finden.
Vielfältige Datenunterstützung: Rerank 3.5 ist mit verschiedenen Datentypen kompatibel, darunter lange Dokumente, E-Mails, Tabellen, JSON und Code. Dies bedeutet, dass es Daten aus verschiedenen Quellen verarbeiten und nützliche Informationen daraus extrahieren kann. Das Extrahieren der Informationen aus verschiedenen Quellen erlaubt eine ganzheitlichere Suche nach Informationen und gibt dem Benutzer eine bessere Sicht auf die recherchierten Punkte.
Verbesserte Mehrsprachigkeit: Rerank 3.5 unterstützt mehr als 100 Sprachen, darunter die wichtigsten Geschäftssprachen wie Englisch, Arabisch, Chinesisch, Französisch, Deutsch, Hindi, Japanisch, Koreanisch, Portugiesisch, Russisch und Spanisch. Dies ermöglicht hochwertige Suchdienste für Benutzer auf der ganzen Welt. Auch dieses Tool verschafft den Benutzern einen großen Vorteil in der Suche nach Informationen auf der ganzen Welt.
Höhere Suchgenauigkeit: In Tests mit Finanzdaten übertraf Rerank 3.5 Hybris Search um 23,4 % und BM25 um 30,8 %. BM25 ist eine häufig verwendete Rangfolgefunktion in Suchmaschinen und Informationsabrufsystemen, um die Relevanz von Dokumenten für eine bestimmte Suchabfrage zu bestimmen. Die Zahlen sprechen für sich. Rerank 3.5 ist den aktuellen Systemen um fast ein Drittel überlegen.
Erweiterte Sprachunterstützung: Wie Rerank 3.5 mehr als 100 Sprachen unterstützt
Die Mehrsprachigkeit von Rerank 3.5 zeigt sich darin, dass es Abfragen aus mehr als 100 Sprachen verstehen und verarbeiten kann. Dies bedeutet, dass es nicht nur die wörtliche Bedeutung der Abfrage verstehen kann, sondern auch den kulturellen Hintergrund und den Kontext, der hinter der Abfrage steht. Wenn ein Benutzer beispielsweise auf Spanisch nach “mejores restaurantes en Madrid” sucht, kann Rerank 3.5 verstehen, dass der Benutzer nach den besten Restaurants in Madrid sucht, und die entsprechenden spanischen Suchergebnisse zurückgeben.
Um dies zu erreichen, verwendet Rerank 3.5 eine Vielzahl von Technologien, darunter:
Mehrsprachige Trainingsdaten: Rerank 3.5 wurde auf einer großen Menge mehrsprachiger Daten trainiert, darunter verschiedene Arten von Texten, wie z. B. Nachrichtenartikel, Blogbeiträge, Social-Media-Posts und Produktrezensionen. Das hilft dem Tool sehr, die Sprache in den unterschiedlichen Ausprägungen kennenzulernen und zu verstehen, um dann im Suchvorgang die besten Ergebnisse zu liefern.
Sprachübergreifende Einbettung: Rerank 3.5 verwendet die sprachübergreifende Einbettungstechnologie, um Wörter in verschiedenen Sprachen demselben Vektorraum zuzuordnen. Dies ermöglicht es dem Modell, die semantischen Beziehungen zwischen verschiedenen Sprachen zu verstehen und relevante sprachübergreifende Suchergebnisse zurückzugeben. Auch dieses Vorgehen hilft der Technologie komplexe Zusammenhänge besser zu verstehen und dem Benutzer das bestmögliche Ergebnis zu liefern.
Spracherkennung und -übersetzung: Rerank 3.5 kann die Sprache der Benutzerabfrage automatisch erkennen und in Englisch oder eine andere unterstützte Sprache übersetzen. Dies ermöglicht es dem Modell, Abfragen in verschiedenen Sprachen zu verarbeiten und relevante Suchergebnisse zurückzugeben. Die automatische Erkennung, Analyse und Übersetzung macht Rerank 3.5 sehr flexibel und zum perfekten Werkzeug für die Suche nach Informationen in den verschiedensten Sprachen.
Durch den Einsatz dieser Technologien kann Rerank 3.5 Benutzern auf der ganzen Welt einen hochwertigen Suchdienst bieten, unabhängig davon, in welcher Sprache sie suchen.
Verbesserte Inferenzfunktionen: Wie Rerank 3.5 komplexe Abfragen versteht
Die Inferenzfähigkeiten von Rerank 3.5 zeigen sich darin, dass es komplexe Abfragen verstehen und nützliche Informationen daraus extrahieren kann. Wenn ein Benutzer beispielsweise nach “Welche Technologieunternehmen haben im Vergleich zum letzten Jahr eine bessere Aktienperformance erzielt?” sucht, kann Rerank 3.5 verstehen, dass der Benutzer nach Technologieunternehmen sucht, deren Aktienperformance im Vergleich zum letzten Jahr besser war.
Um dies zu erreichen, verwendet Rerank 3.5 eine Vielzahl von Technologien, darunter:
Semantische Analyse: Rerank 3.5 verwendet die semantische Analysetechnologie, um die semantische Struktur und den Kontext der Abfrage zu analysieren. Dies ermöglicht es dem Modell, die Bedeutung der Abfrage zu verstehen und die Absicht des Benutzers zu erkennen.
Entitätserkennung: Rerank 3.5 verwendet die Entitätserkennungstechnologie, um die Entitäten in der Abfrage zu erkennen, wie z. B. Unternehmen, Orte und Personen. Dies ermöglicht es dem Modell, die Abfrage mit den entsprechenden Entitäten zu verknüpfen und relevante Suchergebnisse zurückzugeben.
Beziehungsextraktion: Rerank 3.5 verwendet die Beziehungsextraktionstechnologie, um die Beziehungen zwischen den Entitäten in der Abfrage zu extrahieren. Dies ermöglicht es dem Modell, die Bedeutung der Abfrage zu verstehen und relevante Suchergebnisse zurückzugeben.
Durch den Einsatz dieser Technologien kann Rerank 3.5 komplexe Abfragen verstehen und die entsprechenden Suchergebnisse zurückgeben, wodurch die Sucheffizienz und -zufriedenheit der Benutzer erhöht wird. Somit wird dem Anwender ein Werkzeug an die Hand gegeben, welches immer bessere Ergebnisse liefert, je öfter er Rerank 3.5 für seine Recherchen einsetzt.
Wie OCI-Kunden diese Modelle nutzen können:
OCI-Kunden können diese Cohere-Modelle auf verschiedene Weise nutzen, darunter:
Sofortige Integration: Auf diese Modelle kann nahtlos über Chat-Oberflächen, APIs oder dedizierte Endpunkte zugegriffen werden, ohne dass Sie sich um die Infrastrukturverwaltung kümmern müssen. So können Kunden diese Modelle einfach in ihre eigenen Anwendungen integrieren, ohne dass eine komplexe Konfiguration und Bereitstellung erforderlich ist. Es ist also keine langwierige Integration in das bestehende System notwendig.
Vereinfachte KI-Entwicklung: Der OCI Generative AI-Dienst bietet eine umfassende Suite von Tools und Diensten, die Kunden bei der Rationalisierung des KI-Entwicklungsprozesses unterstützen können. Diese Tools und Dienste umfassen:
Datenaufbereitung: Der OCI Generative AI-Dienst bietet eine Reihe von Datenaufbereitungstools, mit denen Kunden Daten bereinigen, transformieren und aufbereiten können, um sie für das Training und die Inferenz von KI-Modellen zu verwenden.
Modelltraining: Der OCI Generative AI-Dienst bietet eine Reihe von Modelltrainingstools, mit denen Kunden ihre eigenen KI-Modelle trainieren können. Diese Tools unterstützen verschiedene Modelltypen und Frameworks wie TensorFlow, PyTorch und Scikit-learn.
Modellbereitstellung: Der OCI Generative AI-Dienst bietet eine Reihe von Modellbereitstellungstools, mit denen Kunden trainierte KI-Modelle in einer Produktionsumgebung bereitstellen können.
Modellüberwachung: Der OCI Generative AI-Dienst bietet eine Reihe von Modellüberwachungstools, mit denen Kunden die Leistung und Genauigkeit von KI-Modellen überwachen können.
Rationalisierung von RAG-Workflows: Verwenden Sie Command A für die Inhaltserstellung und optimieren Sie die erweiterten Ergebnisse über Rerank 3.5, um komplexe RAG-Prozesse effizienter und einfacher zu gestalten. Dies hilft enorm bei der Implementierung in vorhandene Systeme und Prozesse. Es sollte darauf geachtet werden, die richtige Konfiguration zu wählen, um das Optimum an Informationen zu generieren.
Vielfalt der Anwendungsfälle:
Diese Modelle können in einer Vielzahl von Geschäftsanwendungsszenarien eingesetzt werden, darunter:
Kundendienst: Command A und Rerank 3.5 können verwendet werden, um intelligente Kundendienst-Chatbots zu erstellen, die Kundenfragen beantworten,Kundenbedenken ausräumen und personalisierte Dienstleistungen anbieten können.
Content-Generierung: Command A kann verwendet werden, um verschiedene Arten von Textinhalten wie Nachrichtenartikel, Blogbeiträge, Produktbeschreibungen und Social-Media-Posts zu erstellen.
Suche: Rerank 3.5 kann verwendet werden, um die Genauigkeit und Effizienz der Unternehmenssuche zu verbessern und Benutzern zu helfen, die benötigten Informationen schnell zu finden. So können zum Beispiel Mitarbeiter in Wissensdatenbanken schnell die richtigen Inhalte finden.
Datenanalyse: Command A und Rerank 3.5 können verwendet werden, um verschiedene Arten von Daten zu analysieren, nützliche Informationen daraus zu extrahieren und Unternehmen zu helfen, bessere Entscheidungen zu treffen. Durch die aufbereiteten Daten können fundierte Entscheidungen getroffen werden.
Wissensmanagement: Intelligente Wissensdatenbanken können erstellt werden, in denen Mitarbeiter schnell die benötigten Informationen finden und so die Arbeitseffizienz steigern können. Mitarbeitern wird so ein Werkzeug zur Verfügung gestellt, um effizienter zu arbeiten.
Die OCI Generative AI-Dienste ermöglichen es Unternehmen dank der Bereitstellung leistungsstarker, multifunktionaler und skalierbarer KI-Modelle, innovative KI-Lösungen zu entwickeln und so ihre Wettbewerbsfähigkeit und ihren Geschäftswert zu steigern. Dies bietet dem Anwender die Möglichkeit, neue und innovative Geschäftsmodelle zu entwickeln.
Weitere Informationen zu den Integrationsdetails und Preisinformationen finden Sie in unserer Generative AI-Servicedokumentation oder wenden Sie sich an Ihren Oracle-Ansprechpartner.