Cohere Command A и Rerank на Oracle Cloud

Услугата Oracle Cloud Infrastructure (OCI) Generative AI получи редица важни подобрения, включително пускането на моделите Cohere Command A и Rerank 3.5, както и въвеждането на Cohere Embed 3 с мултимодална поддръжка. Тези нови модели имат за цел да предоставят на клиентите на OCI по-мощни AI функции от корпоративен клас и допълнително да подобрят възможностите им за AI приложения в различни сценарии на приложение.

Command A: Върхът на производителността и ефективността

Cohere Command A 03-2025 е най-мощният Command модел до момента, с 150% по-висока производителност от предишното поколение продукти, като същевременно изисква само два GPU. Според данни, предоставени от Cohere, този модел се конкурира или надминава OpenAI 4o и DeepSeekv3 по отношение на производителността при прокси корпоративни задачи и има значително подобрение в изчислителната ефективност.

Изключителната производителност на Command A се дължи на неговата усъвършенствана архитектура и методи за обучение, което му позволява да се представя отлично в различни сложни корпоративни AI приложения. Независимо дали става въпрос за обработка на огромни обеми от данни, изпълнение на сложни задачи за извличане на информация или извършване на обработка на естествен език в реално време, Command A може да осигури ефективни и надеждни решения.

Основни характеристики на Command A:

  • Свръхдълъг контекстен прозорец: Поддържа контекстна дължина до 256k токена, което позволява на модела да обработва по-дълги текстови последователности, за да разбере по-добре контекстната информация и да генерира по-точни и кохерентни отговори. Това означава, че Command A може да обработва сложни документи, дълги разговори и многократни взаимодействия, без да губи важна информация.

  • Разширено генериране чрез извличане (RAG): Чрез интегриране на технология за генериране чрез извличане, Command A може да извлича подходяща информация от огромни количества данни и да я интегрира в генерираното съдържание, като по този начин подобрява качеството и точността на генерираните резултати. Тази технология не само може да намали зависимостта на модела от външни знания, но и да му позволи да се адаптира по-добре към постоянно променящата се информационна среда.

  • Използване на естествени прокси инструменти: Command A има естествени възможности за използване на прокси инструменти и може да се интегрира с други инструменти и услуги за постигане на по-сложни функции. Например, той може да взаимодейства с търсачки, бази данни, API и т.н., за да получи необходимата информация или да изпълни конкретни операции. Тази възможност позволява на Command A да се справи с различни сложни задачи, като автоматизирано обслужване на клиенти, интелигентни асистенти и анализ на данни.

  • Сигурност и поверителност от корпоративен клас: Command A е проектиран с пълно внимание към корпоративните изисквания за сигурност и поверителност и използва различни мерки за сигурност, за да защити данните на клиентите. Например, той поддържа криптиране на данни, контрол на достъпа и функции за одит, за да гарантира, че данните на клиентите не са обект на неоторизиран достъп или изтичане.

  • Мощни многоезични възможности:: Command A е обучен на 23 езика, включително английски, френски, испански, италиански, немски, португалски, японски, корейски, арабски, китайски, руски, полски, турски, виетнамски, нидерландски, чешки, индонезийски, украински, румънски, гръцки, хинди, иврит и персийски. Това му позволява да обработва текст на различни езици и да предоставя услуги на глобални потребители.

  • Текстов вход и изход: Command A в момента поддържа само текстов вход и изход, което означава, че се използва главно за обработка на текстове, като генериране на текст, обобщаване на текст, превод на текст и текстова класификация.

Забележка: Моделът Command A понастоящем не поддържа финна настройка.

Rerank 3.5: Подобряване на точността на фирменото търсене

Rerank 3.5 е най-новият основен модел за AI търсене на Cohere, предназначен да подобри точността на фирмените търсения и системите за генериране на информация (RAG). Този модел има засилени възможности за разсъждение, може да разбира сложни заявки от потребителите и е съвместим с различни типове данни (включително дълги документи, имейли, таблици, JSON и код). В допълнение, Rerank 3.5 поддържа над 100 езика, което може да отговори на нуждите за търсене на глобални предприятия.

Rerank 3.5 подобрява ефективността и удовлетвореността на потребителите от търсенето, като пренарежда резултатите от търсенето, за да постави най-подходящите резултати отпред. Той може да се прилага не само към традиционното търсене на текст, но и към различни други видове търсене, като търсене на изображения, търсене на видео и търсене на аудио.

Основни характеристики на Rerank 3.5:

  • Подобрени възможности за логическо мислене: Rerank 3.5 има подобрени възможности за логическо мислене и може да разбира по-добре сложни потребителски заявки. Той може точно да идентифицира намерението на потребителя чрез анализиране на семантиката и контекста на заявката и да върне най-подходящите резултати.

  • Разнообразност на поддържаните данни: Rerank 3.5 е съвместим с различни видове данни, включително дълги документи, имейли, таблици, JSON и код. Това означава, че може да обработва данни от различни източници и да извлича полезна информация от тях.

  • Подобрена многоезична поддръжка: Rerank 3.5 поддържа над 100 езика, включително основните търговски езици, като английски, арабски, китайски, френски, немски, хинди, японски, корейски, португалски, руски и испански. Това му позволява да предоставя висококачествени услуги за търсене на глобални потребители.

  • По-висока точност на търсене: В тестове, насочени към финансови данни, производителността на Rerank 3.5 е по-добра от Hybris Search 23.4% и по-добра от BM25 30.8%. BM25 е често използвана функция за сортиране, която се използва в търсачките и системите за извличане на информация, за да се определи релевантността на даден документ към дадена заявка за търсене.

Разширена езикова поддръжка: Как Rerank 3.5 поддържа повече от 100 езика

Многоезичните възможности на Rerank 3.5 се отразяват в способността му да разбира и обработва заявки от повече от 100 езика. Това означава, че той може не само да разбира буквалното значение на запитването, но и да разбира културния контекст и контекста зад запитването. Например, ако потребител търси на испански „mejores restaurantes en Madrid”, Rerank 3.5 може да разбере, че намерението на потребителя е да търси най-добрите ресторанти в Мадрид и да върне подходящи испански резултати от търсенето.

За да постигне това, Rerank 3.5 използва няколко технологии, включително:

  • Многоезични данни за обучение: Rerank 3.5 е обучен на голям обем многоезични данни, които включват различни видове текст, като новинарски статии, публикации в блогове, публикации в социални медии и ревюта на продукти.
  • Междуезикови вграждания: Rerank 3.5 използва технология за междуезикови вграждания, за да картографира думи от различни езици в едно и също векторно пространство. Това позволява на модела да разбере семантичните взаимоотношения между различните езици и да връща подходящи кръстосано езикови резултати от търсенето.
  • Откриване и превод на езици: Rerank 3.5 може автоматично да разпознава езика на потребителско запитване и да го превежда на английски или други поддържани езици. Това позволява на модела да обработвa запитвания на различни езици и да връща подходящи резултати от търсенето.

Използвайки тези технологии, Rerank 3.5 може да предоставя висококачествени услуги за търсене на глобални потребители, независимо от това кой език използват за търсене.

Подобрени възможности за разсъждение: Как Rerank 3.5 разбира сложни запитвания

Способността за разсъждение на Rerank 3.5 се отразява в способността му да разбира сложни запитвания и да извлича полезна информация от тях. Например, ако потребител търси „Кои технологични компании се представят по-добре от миналата година?”, Rerank 3.5 може да разбере, че намерението на потребителя е да намери технологични компании, чиито акции се представят по-добре от миналата година.

За да постигне това, Rerank 3.5 използва няколко технологии, включително:

  • Семантичен анализ: Rerank 3.5 използва технология за семантичен анализ, за да анализира семантичната структура и контекста на запитването. Това позволява на модела да разбере значението на запитването и да идентифицира намерението на потребителя.
  • Разпознаване на обекти: Rerank 3.5 използва технология за разпознаване на обекти, за да разпознае обекти в запитването, като компании, места и хора. Това позволява на модела да свързва запитването със съответните обекти и да връща подходящи резултати от търсенето.
  • Извличане на взаимоотношения: Rerank 3.5 използва технология за извличане на взаимоотношения, за да извлича взаимоотношенията между обекти в запитването. Това позволява на модела да разбере значението на запитването и да връща подходящи резултати от търсенето.

Използвайки тези технологии, Rerank 3.5 може да разбира сложни запитвания и да връща подходящи резултати от търсенето, като по този начин подобрява ефективността и удовлетвореността на потребителите от търсенето.

Как клиентите на OCI могат да се възползват от тези модели:

Клиентите на OCI могат да се възползват от тези модели на Cohere по различни начини, включително:

  • Незабавнa интеграция: Тези модели са достъпни безпроблемно чрез интерфейси за чат, API или специален крайна точка, без да се налага да се притеснявате за управлението на инфраструктурата. Това улеснява клиентите да интегрират тези модели в собствените си приложения, без да се налага да извършват сложни конфигурации и внедрявания.

  • Опростяване на разработването на AI: Услугата OCI Generative AI предоставя пълен набор от инструменти и услуги, които могат да помогнат на клиентите да опростят процесите на разработване на AI. Тези инструменти и услуги включват:

    • Подготовка на данни: Услугата OCI Generative AI предоставя серия от инструменти за подготовка на данни, които могат да помогнат на клиентите да почистват, преобразуват и подготвят данни, за да ги използват за обучение и извличане на информация от AI модели.
    • Обучениe на модела: Услугата OCI Generative AI предоставя серия от инструменти за обучение на модела, които могат да помогнат на клиентите да обучат собствените си AI модели. Тези инструменти поддържат различни типове модели и рамки, като TensorFlow, PyTorch и Scikit-learn.
    • Внедряване на модели: Услугата OCI Generative AI предоставя серия от инструменти за внедряване на модели, които могат да помогнат на клиентите да внедрят обучени AI модели в производствена среда.
    • Мониторинг на модела: Услугата OCI Generative AI предоставя серия от инструменти за наблюдение на модела, които могат да помогнат на клиентите да наблюдават производителността и точността на AI моделите.
  • Опростете процеса на RAG: Използването на Command A за генериране на съдържание и оптимизирането на подобрите резултати чрез Rerank 3.5 прави сложния процес на RAG по-ефективен и рационализиран.

Разнообразие от сценарии на приложение:

Тези модели могат да се прилагат в голямо разнообразие от корпоративни сценарии на приложение, включително:

  • Обслужване на клиенти: Command A и Rerank 3.5 могат да се използват за изграждане на интелигентни роботи за обслужване на клиенти, които могат да отговарят на въпросите на клиентите, да разрешават притесненията на клиентите и да предоставят персонализирани услуги.
  • Генериране на съдържание: Command A може да се използва за генериране на различни видове текстово съдържание, като новинарски статии, публикации в блогове, описания на продукти и публикации в социални медии.
  • Търсене: Rerank 3.5 може да се използва за подобряване на точността и ефективността на фирмените търсения, за да се помогне на потребителите бързо да намерят необходимата информация.
  • Анализ на данни: Command A и Rerank 3.5 могат да се използват за анализ на различни видове данни, да се извлича полезна информация от тях и да се помага на компаниите да вземат по-добри решения.
  • Управление на знания: Можете да създадете интелигентни бази знания, където служителите могат бързо да намерят необходимата им информация и да подобрят ефективността на работата си.

Услугата OCI Generative AI дава възможност на компаниите да създават различни иновативни AI решения, като предоставя високопроизводителни, многофункционални и мащабируеми AI модели, като по този начин повишава конкурентоспособността си и бизнес стойността си.

За подробности относно интегрирането и информация за ценообразуването, моля, вижте нашата документация за услугите за Generative AI или се свържете с вашия представител на Oracle.