IBM: Mniejsze modele AI dla firm

Udoskonalanie serii Granite: Skoncentrowana wydajność, zmniejszony rozmiar

Modele Granite 3.2 firmy IBM stanowią kontynuację strategii firmy polegającej na opracowywaniu mniejszych modeli. Modele te zostały zaprojektowane tak, aby zapewniać określone możliwości bez nakładania nadmiernych wymagań na zasoby obliczeniowe. Takie podejście jest zgodne z praktycznymi potrzebami wielu firm, które wymagają rozwiązań AI, które są zarówno wydajne, jak i opłacalne.

Modele te są otwarcie dostępne na licencji Apache 2.0 w serwisie Hugging Face. Wybrane wersje są również dostępne za pośrednictwem platformy IBM watsonx.ai, a także Ollama, Replicate i LM Studio. Ta szeroka dostępność jest dodatkowo wzmocniona planami integracji tych modeli z Red Hat Enterprise Linux AI 1.5 w nadchodzących miesiącach, co umacnia zaangażowanie IBM w AI o otwartym kodzie źródłowym.

Rewolucja w przetwarzaniu dokumentów: Model Granite Vision

Wyróżniającą cechą tego wydania jest nowatorski model języka wizyjnego, specjalnie zaprojektowany do zadań związanych z rozumieniem dokumentów. Model ten stanowi znaczący postęp w sposobie, w jaki firmy mogą wchodzić w interakcje z dokumentami i wydobywać z nich informacje. Według wewnętrznych testów porównawczych IBM, ten nowy model działa na równi z, a nawet przewyższa, znacznie większe modele konkurencji w testach zaprojektowanych specjalnie w celu odzwierciedlenia obciążeń na poziomie przedsiębiorstwa.

Opracowanie tej funkcji obejmowało wykorzystanie otwartego zestawu narzędzi Docling firmy IBM. Ten zestaw narzędzi został użyty do przetworzenia oszałamiającej liczby 85 milionów dokumentów PDF, generując 26 milionów syntetycznych par pytań i odpowiedzi. To szeroko zakrojone przygotowanie zapewnia, że model jest dobrze przygotowany do obsługi intensywnych przepływów pracy z dokumentami, które są charakterystyczne dla wielu środowisk korporacyjnych, w tym usług finansowych, opieki zdrowotnej i usług prawnych.

Kluczowe statystyki podkreślają skalę i wydajność:

  • 85 milionów: Liczba dokumentów PDF przetworzonych przy użyciu zestawu narzędzi Docling firmy IBM w celu przeszkolenia nowego modelu wizyjnego. Ten ogromny zbiór danych podkreśla gotowość modelu do rzeczywistych wyzwań związanych z przetwarzaniem dokumentów.
  • 30%: Redukcja rozmiaru osiągnięta w modelach bezpieczeństwa Granite Guardian przy zachowaniu poziomu wydajności. To pokazuje zaangażowanie IBM w optymalizację wydajności bez poświęcania bezpieczeństwa.
  • 2 lata: Maksymalny zakres prognozy modeli TinyTimeMixers firmy IBM, pomimo posiadania mniej niż 10 milionów parametrów. To pokazuje niezwykłe możliwości tych wyspecjalizowanych modeli do długoterminowego prognozowania.

Ulepszone rozumowanie: Łańcuch myśli i skalowanie wnioskowania

IBM włączył również rozumowanie „łańcucha myśli” (chain of thought) do wersji 2B i 8B parametrów Granite 3.2. Ta funkcja pozwala modelom podchodzić do problemów w uporządkowany, metodyczny sposób, dzieląc je na etapy, które odzwierciedlają ludzkie procesy rozumowania. Zwiększa to zdolność modeli do radzenia sobie ze złożonymi zadaniami, które wymagają logicznej dedukcji.

Co najważniejsze, użytkownicy mają swobodę aktywowania lub dezaktywowania tej funkcji w zależności od złożoności zadania. Ta zdolność adaptacji jest kluczowym wyróżnikiem, pozwalającym organizacjom optymalizować wykorzystanie zasobów w oparciu o ich specyficzne potrzeby. W przypadku prostszych zadań rozumowanie łańcucha myśli można wyłączyć, aby oszczędzać moc obliczeniową, podczas gdy w przypadku bardziej złożonych problemów można je włączyć, aby wykorzystać pełny potencjał rozumowania modelu.

Te ulepszenia doprowadziły do znacznej poprawy wydajności modelu 8B w testach porównawczych dotyczących wykonywania instrukcji, przewyższając poprzednie wersje. Dzięki innowacyjnym metodom „skalowania wnioskowania” (inference scaling) IBM wykazał, że nawet ten stosunkowo mały model może skutecznie konkurować ze znacznie większymi systemami w testach porównawczych rozumowania matematycznego. Podkreśla to potencjał mniejszych, zoptymalizowanych modeli do zapewniania imponującej wydajności w określonych dziedzinach.

Bezpieczeństwo i niuanse: Aktualizacje Granite Guardian

Modele bezpieczeństwa Granite Guardian, zaprojektowane do monitorowania i łagodzenia potencjalnych zagrożeń związanych z treściami generowanymi przez AI, również przeszły znaczące aktualizacje. Modele te zostały zmniejszone o 30% przy zachowaniu ich poziomu wydajności. Ta optymalizacja przyczynia się do większej wydajności i zmniejszonego zużycia zasobów.

Ponadto modele te zawierają teraz funkcję zwaną „werbalizowaną pewnością” (verbalized confidence). Ta funkcja zapewnia bardziej zniuansowaną ocenę ryzyka, uwzględniając stopnie niepewności w monitorowaniu bezpieczeństwa. Zamiast po prostu zapewniać binarną klasyfikację bezpieczne/niebezpieczne, modele mogą wyrażać różne poziomy pewności w swoich ocenach, zapewniając użytkownikom bardziej informacyjną i przejrzystą ocenę.

TinyTimeMixers: Długoterminowe prognozowanie dla planowania strategicznego

Oprócz aktualizacji Granite, IBM wydał również nową generację swoich modeli TinyTimeMixers. Modele te są niezwykle małe, zawierają mniej niż 10 milionów parametrów – ułamek wielkości wielu innych modeli w branży. Pomimo niewielkich rozmiarów, te wyspecjalizowane modele są w stanie prognozować dane szeregów czasowych z wyprzedzeniem do dwóch lat.

Ta funkcja jest szczególnie cenna w przypadku szeregu zastosowań biznesowych, w tym:

  • Analiza trendów finansowych: Przewidywanie ruchów rynkowych i identyfikowanie możliwości inwestycyjnych.
  • Planowanie łańcucha dostaw: Optymalizacja poziomów zapasów i przewidywanie wahań popytu.
  • Zarządzanie zapasami w handlu detalicznym: Zapewnienie odpowiednich poziomów zapasów, aby zaspokoić popyt klientów, przy jednoczesnym minimalizowaniu strat.

Wszystkie te zastosowania opierają się na możliwości podejmowania świadomych decyzji w oparciu o długoterminowe prognozy, co czyni modele TinyTimeMixers potężnym narzędziem do strategicznego planowania biznesowego.

Rozwiązywanie rzeczywistych ograniczeń biznesowych

Możliwość przełączania możliwości rozumowania w modelach Granite bezpośrednio rozwiązuje praktyczne wyzwanie we wdrażaniu AI. Podejścia oparte na rozumowaniu krok po kroku, choć potężne, wymagają znacznej mocy obliczeniowej, która nie zawsze jest konieczna. Czyniąc tę funkcję opcjonalną, IBM umożliwia organizacjom obniżenie kosztów obliczeniowych dla prostszych zadań, zachowując jednocześnie opcję zaawansowanego rozumowania dla bardziej złożonych problemów.

Takie podejście odzwierciedla głębokie zrozumienie rzeczywistych ograniczeń biznesowych, w których wydajność i opłacalność są często równie ważne jak surowa wydajność. Koncentracja IBM na dostarczaniu praktycznych rozwiązań, które można dostosować do konkretnych potrzeb biznesowych, jest kluczowym wyróżnikiem na coraz bardziej zatłoczonym rynku AI.

Zdobywanie popularności: Dowody na praktyczny wpływ

Strategia IBM polegająca na opracowywaniu mniejszych, wyspecjalizowanych modeli wydaje się rezonować z rynkiem. Poprzedni model Granite 3.1 8B osiągnął niedawno wysoką wydajność w teście porównawczym Salesforce LLM Benchmark for Customer Relationship Management (CRM). Ten test porównawczy został specjalnie zaprojektowany do oceny wydajności LLM w zadaniach związanych z CRM, takich jak analiza interakcji z klientami i generowanie spersonalizowanych treści.

Wysoka wydajność modelu Granite 3.1 8B w tym teście porównawczym sugeruje, że mniejsze, wyspecjalizowane modele mogą rzeczywiście skutecznie zaspokajać określone potrzeby biznesowe. Stanowi to kolejny dowód na to, że podejście IBM jest nie tylko teoretycznie uzasadnione, ale także praktycznie wykonalne.

Koncentracja na wydajności, integracji i realnym wpływie

Sriram Raghavan, wiceprezes IBM AI Research, zwięźle podsumowuje filozofię firmy: „Następna era AI to wydajność, integracja i realny wpływ – gdzie przedsiębiorstwa mogą osiągać potężne wyniki bez nadmiernych wydatków na obliczenia. Najnowsze osiągnięcia IBM Granite koncentrują się na otwartych rozwiązaniach, demonstrując kolejny krok naprzód w uczynieniu AI bardziej dostępnym, opłacalnym i wartościowym dla nowoczesnych przedsiębiorstw”.

To stwierdzenie oddaje zaangażowanie IBM w opracowywanie rozwiązań AI, które są nie tylko zaawansowane technologicznie, ale także praktyczne, dostępne i dostosowane do rzeczywistych potrzeb firm. Koncentracja na otwartych rozwiązaniach dodatkowo podkreśla zaangażowanie IBM we wspieranie współpracy i innowacji w społeczności AI. Nacisk przesuwa się z prostego budowania największych modeli na tworzenie narzędzi AI, które zapewniają wymierną wartość i umożliwiają firmom osiąganie ich strategicznych celów.