NVIDIA FFN Fusion: Ufanisi Mpya kwa LLM
NVIDIA inaleta FFN Fusion, mbinu mpya ya kuongeza ufanisi wa Large Language Models (LLMs) kwa kupunguza vikwazo vya mfuatano. Inachanganya tabaka za FFN ili kuharakisha inference na kupunguza gharama, kama ilivyoonyeshwa na Ultra-253B-Base kutoka Llama-405B. Hii inaboresha kasi na kupunguza matumizi ya rasilimali bila kuathiri utendaji.