Tag: Fine-Tuning

Sarvam AI's LLM fordert Meta & Google heraus

Sarvam AI's neues LLM, Sarvam-M, konkurriert mit Meta und Google. Es zeichnet sich in indischen Sprachen, Mathematik und Programmierung aus und ist Open Source.

Sarvam AI's LLM fordert Meta & Google heraus

SKT A.X 4.0: Einblick in das Sprachmodell

SK Telecom hat still und leise sein großes Sprachmodell A.X 4.0 vorgestellt. Das Modell wurde durch die Integration des Koreanischen in ein Open-Source-Framework entwickelt und soll bald in eine Vielzahl von Unternehmensservices integriert werden.

SKT A.X 4.0: Einblick in das Sprachmodell

DMind-1: Open-Source LLM für Web3

DMind stellt DMind-1 vor, ein Open-Source-LLM für Web3, feinabgestimmt von Alibaba's Qwen3-32B, mit SOTA-Leistung in neun Kategorien und niedrigen Inferenzkosten.

DMind-1: Open-Source LLM für Web3

Alibaba: 90% weniger KI-Training dank ZEROSEARCH

Alibaba Group senkt KI-Trainingskosten um 90% mit ZEROSEARCH, das Suchvorgänge ohne API-Aufrufe simuliert und die KI-Entwicklung revolutioniert.

Alibaba: 90% weniger KI-Training dank ZEROSEARCH

KI-Durchbruch in Shanghai: DeepSeek 2.0 Herausforderung?

Ein Shanghaier Quant-Fonds präsentiert eine KI-Trainingsmethode, die DeepSeek 2.0 herausfordern könnte. SASR zielt darauf ab, die Grenzen von SFT und RL zu überwinden und so adaptive und effiziente KI-Modelle zu entwickeln.

KI-Durchbruch in Shanghai: DeepSeek 2.0 Herausforderung?

Mistral AI Medium 3: KI-Lösung für Unternehmen

Mistral Medium 3: Ein maßgeschneidertes Sprachmodell für Unternehmen, das Kosteneffizienz, Leistung und flexible Bereitstellung vereint.

Mistral AI Medium 3: KI-Lösung für Unternehmen

NVIDIAs Innovationen: Llama Nemotron Ultra & Parakeet

Ein exklusives Interview mit Joey Conway enthüllt NVIDIAs Fortschritte bei Open-Source-LLMs und ASR, insbesondere Llama Nemotron Ultra und Parakeet, die NVIDIAs Engagement für KI-Innovation zeigen.

NVIDIAs Innovationen: Llama Nemotron Ultra & Parakeet

Microsofts Phi-4: Triumph des Reinforcement Learning

Microsofts Phi-Familie glänzt mit Phi-4 Reasoning Plus, das durch Reinforcement Learning beeindruckende Ergebnisse erzielt und selbst größere Modelle übertrifft.

Microsofts Phi-4: Triumph des Reinforcement Learning

Googles Gemma: 150 Millionen Downloads

Googles Gemma AI-Modelle haben 150 Millionen Downloads überschritten. Die vielfältigen Anwendungen und Varianten auf Hugging Face zeigen das wachsende Potenzial und die Akzeptanz.

Googles Gemma: 150 Millionen Downloads

Revolutionäre LLM-Tool-Nutzung: Nemotron-Tool-N1

Nemotron-Tool-N1 revolutioniert die LLM-Tool-Nutzung durch Reinforcement Learning, überwindet Einschränkungen traditioneller Methoden und optimiert das eigenständige Reasoning.

Revolutionäre LLM-Tool-Nutzung: Nemotron-Tool-N1