ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਦੇ ਵਿਕਾਸ ਦੀ ਨਿਰੰਤਰ ਗਤੀ ਬੇਰੋਕ ਜਾਰੀ ਹੈ, ਜਿਸ ਵਿੱਚ ਪ੍ਰਮੁੱਖ ਤਕਨਾਲੋਜੀ ਕੰਪਨੀਆਂ ਵਧੇਰੇ ਸ਼ਕਤੀਸ਼ਾਲੀ, ਕੁਸ਼ਲ ਅਤੇ ਬਹੁਮੁਖੀ ਮਾਡਲ ਬਣਾਉਣ ਵਿੱਚ ਸਰਵਉੱਚਤਾ ਲਈ ਮੁਕਾਬਲਾ ਕਰ ਰਹੀਆਂ ਹਨ। ਇਸ ਸਖ਼ਤ ਮੁਕਾਬਲੇ ਵਾਲੇ ਮਾਹੌਲ ਵਿੱਚ, Meta ਨੇ ਆਪਣੀ Llama 4 ਸੀਰੀਜ਼ ਦੇ ਐਲਾਨ ਨਾਲ ਇੱਕ ਨਵੀਂ ਚੁਣੌਤੀ ਪੇਸ਼ ਕੀਤੀ ਹੈ, ਜੋ ਕਿ ਬੁਨਿਆਦੀ AI ਮਾਡਲਾਂ ਦਾ ਇੱਕ ਸੰਗ੍ਰਹਿ ਹੈ ਜਿਸਨੂੰ ਕਲਾ ਦੀ ਸਥਿਤੀ ਨੂੰ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ ਅੱਗੇ ਵਧਾਉਣ ਅਤੇ ਡਿਵੈਲਪਰ ਟੂਲਸ ਤੋਂ ਲੈ ਕੇ ਉਪਭੋਗਤਾ-ਮੁਖੀ ਸਹਾਇਕਾਂ ਤੱਕ, ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਨੂੰ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਹ ਲਾਂਚ Meta ਦੀਆਂ AI ਅਭਿਲਾਸ਼ਾਵਾਂ ਲਈ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਪਲ ਹੈ, ਜਿਸ ਵਿੱਚ ਇੱਕ ਨਹੀਂ, ਬਲਕਿ ਦੋ ਵੱਖਰੇ ਮਾਡਲ ਤੁਰੰਤ ਉਪਲਬਧ ਕਰਵਾਏ ਗਏ ਹਨ, ਜਦੋਂ ਕਿ ਇੱਕ ਤੀਜੇ, ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਕ੍ਰਾਂਤੀਕਾਰੀ ਵਿਸ਼ਾਲ ਮਾਡਲ ਦਾ ਸੰਕੇਤ ਦਿੱਤਾ ਗਿਆ ਹੈ ਜੋ ਵਰਤਮਾਨ ਵਿੱਚ ਸਖ਼ਤ ਸਿਖਲਾਈ ਵਿੱਚੋਂ ਗੁਜ਼ਰ ਰਿਹਾ ਹੈ। Llama 4 ਪਰਿਵਾਰ ਇੱਕ ਰਣਨੀਤਕ ਵਿਕਾਸ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਅਤਿ-ਆਧੁਨਿਕ ਆਰਕੀਟੈਕਚਰਲ ਚੋਣਾਂ ਸ਼ਾਮਲ ਹਨ ਅਤੇ OpenAI, Google, ਅਤੇ Anthropic ਵਰਗੇ ਵਿਰੋਧੀਆਂ ਦੁਆਰਾ ਸਥਾਪਤ ਕੀਤੇ ਗਏ ਮਾਪਦੰਡਾਂ ਨੂੰ ਚੁਣੌਤੀ ਦੇਣ ਦਾ ਉਦੇਸ਼ ਹੈ। ਇਹ ਪਹਿਲਕਦਮੀ AI ਦੇ ਭਵਿੱਖ ਨੂੰ ਆਕਾਰ ਦੇਣ ਲਈ Meta ਦੀ ਵਚਨਬੱਧਤਾ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ, ਖੁੱਲ੍ਹੇ ਖੋਜ ਭਾਈਚਾਰੇ ਵਿੱਚ ਯੋਗਦਾਨ ਪਾ ਕੇ (ਭਾਵੇਂ ਕੁਝ ਚੇਤਾਵਨੀਆਂ ਨਾਲ) ਅਤੇ ਇਹਨਾਂ ਉੱਨਤ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਇਸਦੇ ਸੋਸ਼ਲ ਮੀਡੀਆ ਅਤੇ ਸੰਚਾਰ ਪਲੇਟਫਾਰਮਾਂ ਦੇ ਵਿਸ਼ਾਲ ਈਕੋਸਿਸਟਮ ਵਿੱਚ ਏਕੀਕ੍ਰਿਤ ਕਰਕੇ।
Llama 4 Scout: ਇੱਕ ਸੰਖੇਪ ਪੈਕੇਜ ਵਿੱਚ ਸ਼ਕਤੀ
ਸਭ ਤੋਂ ਅੱਗੇ Llama 4 Scout ਹੈ, ਇੱਕ ਮਾਡਲ ਜਿਸਨੂੰ ਕੁਸ਼ਲਤਾ ਅਤੇ ਪਹੁੰਚਯੋਗਤਾ ਨੂੰ ਧਿਆਨ ਵਿੱਚ ਰੱਖ ਕੇ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। Meta Scout ਦੀ ਕਮਾਲ ਦੀ ਯੋਗਤਾ ਨੂੰ ਉਜਾਗਰ ਕਰਦਾ ਹੈ ਕਿ ਇਹ ਇੰਨਾ ਸੰਖੇਪ ਹੁੰਦੇ ਹੋਏ ਵੀ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਕੰਮ ਕਰ ਸਕਦਾ ਹੈ ਕਿ ਇਹ ‘ਇੱਕ ਸਿੰਗਲ Nvidia H100 GPU ਵਿੱਚ ਫਿੱਟ ਹੋ ਸਕਦਾ ਹੈ।’ ਇਹ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਤਕਨੀਕੀ ਪ੍ਰਾਪਤੀ ਅਤੇ ਇੱਕ ਰਣਨੀਤਕ ਲਾਭ ਹੈ। ਇੱਕ ਅਜਿਹੇ ਯੁੱਗ ਵਿੱਚ ਜਿੱਥੇ ਕੰਪਿਊਟੇਸ਼ਨਲ ਸਰੋਤ, ਖਾਸ ਤੌਰ ‘ਤੇ H100 ਵਰਗੇ ਉੱਚ-ਅੰਤ ਦੇ GPUs, ਮਹਿੰਗੇ ਅਤੇ ਉੱਚ ਮੰਗ ਵਿੱਚ ਹਨ, ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਮਾਡਲ ਜੋ ਇੱਕ ਸਿੰਗਲ ਯੂਨਿਟ ‘ਤੇ ਚੱਲ ਸਕਦਾ ਹੈ, ਡਿਵੈਲਪਰਾਂ, ਖੋਜਕਰਤਾਵਾਂ ਅਤੇ ਛੋਟੀਆਂ ਸੰਸਥਾਵਾਂ ਲਈ ਦਾਖਲੇ ਦੀ ਰੁਕਾਵਟ ਨੂੰ ਨਾਟਕੀ ਢੰਗ ਨਾਲ ਘਟਾਉਂਦਾ ਹੈ। ਇਹ ਸਰੋਤ-ਸੀਮਤ ਵਾਤਾਵਰਣਾਂ ਵਿੱਚ ਆਧੁਨਿਕ AI ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਤੈਨਾਤ ਕਰਨ ਦੀਆਂ ਸੰਭਾਵਨਾਵਾਂ ਖੋਲ੍ਹਦਾ ਹੈ, ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਵਧੇਰੇ ਸਥਾਨਕ ਜਾਂ ਆਨ-ਡਿਵਾਈਸ AI ਪ੍ਰੋਸੈਸਿੰਗ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦਾ ਹੈ, ਲੇਟੈਂਸੀ ਨੂੰ ਘਟਾਉਂਦਾ ਹੈ ਅਤੇ ਗੋਪਨੀਯਤਾ ਨੂੰ ਵਧਾਉਂਦਾ ਹੈ।
Meta ਆਪਣੇ ਮੁਕਾਬਲੇਬਾਜ਼ਾਂ ਦੇ ਵਿਰੁੱਧ Scout ਨੂੰ ਸਥਾਪਤ ਕਰਨ ਤੋਂ ਝਿਜਕਦਾ ਨਹੀਂ ਹੈ। ਕੰਪਨੀ ਦਾ ਦਾਅਵਾ ਹੈ ਕਿ Scout ਆਪਣੀ ਵੇਟ ਕਲਾਸ ਵਿੱਚ ਕਈ ਮਹੱਤਵਪੂਰਨ ਮਾਡਲਾਂ ਨੂੰ ਪਛਾੜਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ Google ਦਾ Gemma 3 ਅਤੇ Gemini 2.0 Flash-Lite, ਨਾਲ ਹੀ ਵਿਆਪਕ ਤੌਰ ‘ਤੇ ਸਤਿਕਾਰਤ ਓਪਨ-ਸੋਰਸ Mistral 3.1 ਮਾਡਲ ਸ਼ਾਮਲ ਹਨ। ਇਹ ਦਾਅਵੇ ‘ਵਿਆਪਕ ਤੌਰ ‘ਤੇ ਰਿਪੋਰਟ ਕੀਤੇ ਗਏ ਬੈਂਚਮਾਰਕਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਵਿੱਚ’ ਪ੍ਰਦਰਸ਼ਨ ‘ਤੇ ਅਧਾਰਤ ਹਨ। ਹਾਲਾਂਕਿ ਬੈਂਚਮਾਰਕ ਨਤੀਜਿਆਂ ਦੀ ਹਮੇਸ਼ਾ ਧਿਆਨ ਨਾਲ ਜਾਂਚ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ - ਕਿਉਂਕਿ ਉਹ ਅਸਲ-ਸੰਸਾਰ ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਸਾਰੇ ਪਹਿਲੂਆਂ ਨੂੰ ਕੈਪਚਰ ਨਹੀਂ ਕਰ ਸਕਦੇ - ਸਥਾਪਤ ਮਾਡਲਾਂ ਨੂੰ ਲਗਾਤਾਰ ਪਛਾੜਨਾ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ Scout ਸ਼ਕਤੀ ਅਤੇ ਕੁਸ਼ਲਤਾ ਦਾ ਇੱਕ ਆਕਰਸ਼ਕ ਸੰਤੁਲਨ ਰੱਖਦਾ ਹੈ। ਇਹ ਬੈਂਚਮਾਰਕ ਆਮ ਤੌਰ ‘ਤੇ ਭਾਸ਼ਾ ਦੀ ਸਮਝ, ਤਰਕ, ਗਣਿਤ ਦੀ ਸਮੱਸਿਆ-ਹੱਲ ਕਰਨ ਅਤੇ ਕੋਡ ਜਨਰੇਸ਼ਨ ਵਰਗੀਆਂ ਸਮਰੱਥਾਵਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਦੇ ਹਨ। ਇੱਕ ਵਿਭਿੰਨ ਸਮੂਹ ਵਿੱਚ ਉੱਤਮਤਾ ਪ੍ਰਾਪਤ ਕਰਨਾ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ Scout ਇੱਕ ਵਿਸ਼ੇਸ਼ ਮਾਡਲ ਨਹੀਂ ਹੈ ਬਲਕਿ ਇੱਕ ਬਹੁਮੁਖੀ ਸਾਧਨ ਹੈ ਜੋ ਕਈ ਤਰ੍ਹਾਂ ਦੇ ਕਾਰਜਾਂ ਨੂੰ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਸੰਭਾਲਣ ਦੇ ਸਮਰੱਥ ਹੈ।
ਇਸ ਤੋਂ ਇਲਾਵਾ, Llama 4 Scout ਇੱਕ ਪ੍ਰਭਾਵਸ਼ਾਲੀ 10-ਮਿਲੀਅਨ-ਟੋਕਨ ਕੰਟੈਕਸਟ ਵਿੰਡੋ ਦਾ ਮਾਣ ਕਰਦਾ ਹੈ। ਕੰਟੈਕਸਟ ਵਿੰਡੋ ਲਾਜ਼ਮੀ ਤੌਰ ‘ਤੇ ਉਸ ਜਾਣਕਾਰੀ ਦੀ ਮਾਤਰਾ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਦੀ ਹੈ ਜਿਸਨੂੰ ਇੱਕ AI ਮਾਡਲ ਕਿਸੇ ਗੱਲਬਾਤ ਜਾਂ ਕਾਰਜ ਦੌਰਾਨ ਕਿਸੇ ਵੀ ਸਮੇਂ ‘ਯਾਦ’ ਰੱਖ ਸਕਦਾ ਹੈ ਜਾਂ ਵਿਚਾਰ ਸਕਦਾ ਹੈ। ਇੱਕ ਵੱਡੀ ਕੰਟੈਕਸਟ ਵਿੰਡੋ ਮਾਡਲ ਨੂੰ ਲੰਬੇ ਸਮੇਂ ਤੱਕ ਚੱਲਣ ਵਾਲੀ ਗੱਲਬਾਤ ਦੌਰਾਨ ਇਕਸਾਰਤਾ ਬਣਾਈ ਰੱਖਣ, ਗੁੰਝਲਦਾਰ ਦਸਤਾਵੇਜ਼ਾਂ ਨੂੰ ਸਮਝਣ, ਗੁੰਝਲਦਾਰ ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਪਾਲਣਾ ਕਰਨ ਅਤੇ ਇਨਪੁਟ ਵਿੱਚ ਪਹਿਲਾਂ ਤੋਂ ਵੇਰਵਿਆਂ ਨੂੰ ਯਾਦ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ। 10-ਮਿਲੀਅਨ-ਟੋਕਨ ਦੀ ਸਮਰੱਥਾ ਕਾਫ਼ੀ ਹੈ, ਜੋ ਲੰਬੀਆਂ ਰਿਪੋਰਟਾਂ ਦਾ ਸਾਰਾਂਸ਼ ਕਰਨ, ਵਿਆਪਕ ਕੋਡਬੇਸ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ, ਜਾਂ ਬਿਰਤਾਂਤਕ ਧਾਗੇ ਨੂੰ ਗੁਆਏ ਬਿਨਾਂ ਲੰਬੇ, ਬਹੁ-ਵਾਰੀ ਸੰਵਾਦਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਹੋਣ ਵਰਗੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦੀ ਹੈ। ਇਹ ਵਿਸ਼ੇਸ਼ਤਾ ਗੁੰਝਲਦਾਰ, ਜਾਣਕਾਰੀ-ਸੰਘਣੀ ਕਾਰਜਾਂ ਲਈ Scout ਦੀ ਉਪਯੋਗਤਾ ਨੂੰ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ ਵਧਾਉਂਦੀ ਹੈ, ਇਸਨੂੰ ਸਿਰਫ਼ ਇੱਕ ਹਲਕੇ ਬਦਲ ਤੋਂ ਕਿਤੇ ਵੱਧ ਬਣਾਉਂਦੀ ਹੈ। ਸਿੰਗਲ-GPU ਅਨੁਕੂਲਤਾ ਅਤੇ ਇੱਕ ਵੱਡੀ ਕੰਟੈਕਸਟ ਵਿੰਡੋ ਦਾ ਸੁਮੇਲ Scout ਨੂੰ ਉਹਨਾਂ ਡਿਵੈਲਪਰਾਂ ਲਈ ਇੱਕ ਖਾਸ ਤੌਰ ‘ਤੇ ਦਿਲਚਸਪ ਪੇਸ਼ਕਸ਼ ਬਣਾਉਂਦਾ ਹੈ ਜੋ ਵੱਡੇ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਦੇ ਨਿਵੇਸ਼ਾਂ ਦੀ ਲੋੜ ਤੋਂ ਬਿਨਾਂ ਸ਼ਕਤੀਸ਼ਾਲੀ AI ਦੀ ਭਾਲ ਕਰ ਰਹੇ ਹਨ।
Maverick: ਮੁੱਖ ਧਾਰਾ ਦਾ ਦਾਅਵੇਦਾਰ
ਸ਼ੁਰੂਆਤੀ Llama 4 ਰੀਲੀਜ਼ ਵਿੱਚ ਵਧੇਰੇ ਸ਼ਕਤੀਸ਼ਾਲੀ ਭੈਣ-ਭਰਾ ਵਜੋਂ ਸਥਾਪਤ Llama 4 Maverick ਹੈ। ਇਹ ਮਾਡਲ AI ਸੰਸਾਰ ਦੇ ਹੈਵੀਵੇਟਸ ਨਾਲ ਸਿੱਧਾ ਮੁਕਾਬਲਾ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ, ਜਿਸਦੀ ਤੁਲਨਾ OpenAI ਦੇ GPT-4o ਅਤੇ Google ਦੇ Gemini 2.0 Flash ਵਰਗੇ ਸ਼ਕਤੀਸ਼ਾਲੀ ਮਾਡਲਾਂ ਨਾਲ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। Maverick ਵੱਡੇ ਪੈਮਾਨੇ, ਉੱਚ-ਪ੍ਰਦਰਸ਼ਨ ਵਾਲੇ AI ਦੇ ਖੇਤਰ ਵਿੱਚ ਲੀਡਰਸ਼ਿਪ ਲਈ Meta ਦੀ ਬੋਲੀ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਜਿਸਦਾ ਉਦੇਸ਼ ਅਜਿਹੀਆਂ ਸਮਰੱਥਾਵਾਂ ਪ੍ਰਦਾਨ ਕਰਨਾ ਹੈ ਜੋ ਸਭ ਤੋਂ ਵੱਧ ਮੰਗ ਵਾਲੇ ਜਨਰੇਟਿਵ AI ਕਾਰਜਾਂ ਨੂੰ ਸੰਭਾਲ ਸਕਦੀਆਂ ਹਨ। ਇਹ Meta AI ਸਹਾਇਕ ਦੇ ਅੰਦਰ ਸਭ ਤੋਂ ਆਧੁਨਿਕ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਨ ਦਾ ਇਰਾਦਾ ਰੱਖਣ ਵਾਲਾ ਇੰਜਣ ਹੈ, ਜੋ ਹੁਣ ਵੈੱਬ ‘ਤੇ ਪਹੁੰਚਯੋਗ ਹੈ ਅਤੇ ਕੰਪਨੀ ਦੀਆਂ ਮੁੱਖ ਸੰਚਾਰ ਐਪਾਂ: WhatsApp, Messenger, ਅਤੇ Instagram Direct ਵਿੱਚ ਏਕੀਕ੍ਰਿਤ ਹੈ।
Meta ਆਪਣੇ ਪ੍ਰਾਇਮਰੀ ਵਿਰੋਧੀਆਂ ਦੇ ਮੁਕਾਬਲੇ ਇਸਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦੀ ਅਨੁਕੂਲਤਾ ਨਾਲ ਤੁਲਨਾ ਕਰਕੇ Maverick ਦੀ ਸ਼ਕਤੀ ‘ਤੇ ਜ਼ੋਰ ਦਿੰਦਾ ਹੈ। ਕੰਪਨੀ ਦਾ ਦਾਅਵਾ ਹੈ ਕਿ Maverick GPT-4o ਅਤੇ Gemini 2.0 Flash ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਦੇ ਮੁਕਾਬਲੇ ਆਪਣੀ ਥਾਂ ਬਣਾਉਂਦਾ ਹੈ, ਅਤੇ ਕੁਝ ਸਥਿਤੀਆਂ ਵਿੱਚ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਉਨ੍ਹਾਂ ਨੂੰ ਪਾਰ ਕਰਦਾ ਹੈ। ਇਹ ਤੁਲਨਾਵਾਂ ਮਹੱਤਵਪੂਰਨ ਹਨ, ਕਿਉਂਕਿ GPT-4o ਅਤੇ Gemini ਪਰਿਵਾਰ ਵਿਆਪਕ ਤੌਰ ‘ਤੇ ਉਪਲਬਧ AI ਮਾਡਲਾਂ ਦੇ ਅਤਿ-ਆਧੁਨਿਕ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ। ਇੱਥੇ ਸਫਲਤਾ ਦਾ ਮਤਲਬ ਹੈ ਕਿ Maverick ਸੂਖਮ ਭਾਸ਼ਾ ਉਤਪਤੀ, ਗੁੰਝਲਦਾਰ ਤਰਕ, ਆਧੁਨਿਕ ਸਮੱਸਿਆ-ਹੱਲ ਕਰਨ, ਅਤੇ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਮਲਟੀ-ਮੋਡਲ ਪਰਸਪਰ ਕ੍ਰਿਆਵਾਂ ਦੇ ਸਮਰੱਥ ਹੈ (ਹਾਲਾਂਕਿ ਸ਼ੁਰੂਆਤੀ ਰੀਲੀਜ਼ ਟੈਕਸਟ-ਅਧਾਰਤ ਬੈਂਚਮਾਰਕਾਂ ‘ਤੇ ਭਾਰੀ ਧਿਆਨ ਕੇਂਦਰਤ ਕਰਦੀ ਹੈ)।
ਦਿਲਚਸਪ ਗੱਲ ਇਹ ਹੈ ਕਿ, Meta ਹੋਰ ਉੱਚ-ਪ੍ਰਦਰਸ਼ਨ ਵਾਲੇ ਮਾਡਲਾਂ ਦੇ ਮੁਕਾਬਲੇ Maverick ਦੀ ਕੁਸ਼ਲਤਾ ਨੂੰ ਵੀ ਉਜਾਗਰ ਕਰਦਾ ਹੈ, ਖਾਸ ਤੌਰ ‘ਤੇ ਕੋਡਿੰਗ ਅਤੇ ਤਰਕ ਕਾਰਜਾਂ ਦੇ ਖੇਤਰਾਂ ਵਿੱਚ DeepSeek-V3 ਦਾ ਜ਼ਿਕਰ ਕਰਦਾ ਹੈ। Meta ਦੱਸਦਾ ਹੈ ਕਿ Maverick ‘ਅੱਧੇ ਤੋਂ ਘੱਟ ਐਕਟਿਵ ਪੈਰਾਮੀਟਰਾਂ’ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਤੁਲਨਾਤਮਕ ਨਤੀਜੇ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ। ਇਹ ਦਾਅਵਾ ਮਾਡਲ ਆਰਕੀਟੈਕਚਰ ਅਤੇ ਸਿਖਲਾਈ ਤਕਨੀਕਾਂ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਤਰੱਕੀ ਵੱਲ ਇਸ਼ਾਰਾ ਕਰਦਾ ਹੈ। ਪੈਰਾਮੀਟਰ, ਮੋਟੇ ਤੌਰ ‘ਤੇ, ਉਹ ਵੇਰੀਏਬਲ ਹੁੰਦੇ ਹਨ ਜੋ ਮਾਡਲ ਸਿਖਲਾਈ ਦੌਰਾਨ ਸਿੱਖਦਾ ਹੈ ਜੋ ਇਸਦੇ ਗਿਆਨ ਨੂੰ ਸਟੋਰ ਕਰਦੇ ਹਨ। ‘ਐਕਟਿਵ ਪੈਰਾਮੀਟਰ’ ਅਕਸਰ Mixture of Experts (MoE) ਵਰਗੇ ਆਰਕੀਟੈਕਚਰ ਨਾਲ ਸਬੰਧਤ ਹੁੰਦੇ ਹਨ, ਜਿੱਥੇ ਕਿਸੇ ਵੀ ਦਿੱਤੇ ਗਏ ਇਨਪੁਟ ਲਈ ਕੁੱਲ ਪੈਰਾਮੀਟਰਾਂ ਦਾ ਸਿਰਫ਼ ਇੱਕ ਸਬਸੈੱਟ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ। ਘੱਟ ਐਕਟਿਵ ਪੈਰਾਮੀਟਰਾਂ ਨਾਲ ਸਮਾਨ ਪ੍ਰਦਰਸ਼ਨ ਪ੍ਰਾਪਤ ਕਰਨਾ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ Maverick ਚਲਾਉਣ ਲਈ ਕੰਪਿਊਟੇਸ਼ਨਲ ਤੌਰ ‘ਤੇ ਸਸਤਾ ਹੋ ਸਕਦਾ ਹੈ (ਇਨਫਰੈਂਸ ਲਾਗਤ) ਅਤੇ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਵੱਡੇ ਐਕਟਿਵ ਪੈਰਾਮੀਟਰ ਗਿਣਤੀ ਵਾਲੇ ਮਾਡਲਾਂ ਨਾਲੋਂ ਤੇਜ਼ ਹੋ ਸਕਦਾ ਹੈ, ਇੱਕ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ-ਪ੍ਰਤੀ-ਵਾਟ ਜਾਂ ਪ੍ਰਦਰਸ਼ਨ-ਪ੍ਰਤੀ-ਡਾਲਰ ਅਨੁਪਾਤ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦਾ ਹੈ। ਇਹ ਕੁਸ਼ਲਤਾ Meta ਦੁਆਰਾ ਸੰਚਾਲਿਤ ਪੈਮਾਨੇ ‘ਤੇ AI ਨੂੰ ਤੈਨਾਤ ਕਰਨ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ, ਜਿੱਥੇ ਮਾਮੂਲੀ ਸੁਧਾਰ ਵੀ ਮਹੱਤਵਪੂਰਨ ਲਾਗਤ ਬੱਚਤਾਂ ਅਤੇ ਬਿਹਤਰ ਉਪਭੋਗਤਾ ਅਨੁਭਵ ਵਿੱਚ ਬਦਲ ਸਕਦੇ ਹਨ। Maverick, ਇਸਲਈ, ਉੱਚ-ਪੱਧਰੀ ਪ੍ਰਦਰਸ਼ਨ ਅਤੇ ਸੰਚਾਲਨ ਕੁਸ਼ਲਤਾ ਦੇ ਵਿਚਕਾਰ ਇੱਕ ਸੰਤੁਲਨ ਬਣਾਉਣ ਦਾ ਉਦੇਸ਼ ਰੱਖਦਾ ਹੈ, ਇਸਨੂੰ ਡਿਵੈਲਪਰ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੀ ਮੰਗ ਕਰਨ ਅਤੇ ਅਰਬਾਂ ਉਪਭੋਗਤਾਵਾਂ ਦੀ ਸੇਵਾ ਕਰਨ ਵਾਲੇ ਉਤਪਾਦਾਂ ਵਿੱਚ ਏਕੀਕਰਣ ਦੋਵਾਂ ਲਈ ਢੁਕਵਾਂ ਬਣਾਉਂਦਾ ਹੈ।
Behemoth: ਉਡੀਕਿਆ ਜਾ ਰਿਹਾ ਦੈਂਤ
ਜਦੋਂ ਕਿ Scout ਅਤੇ Maverick ਹੁਣ ਉਪਲਬਧ ਹਨ, Meta ਨੇ ਇੱਕ ਹੋਰ ਵੀ ਵੱਡੇ ਅਤੇ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਵਧੇਰੇ ਸ਼ਕਤੀਸ਼ਾਲੀ ਮਾਡਲ ਦੇ ਵਿਕਾਸ ਦੀ ਪੂਰਵ-ਘੋਸ਼ਣਾ ਵੀ ਕੀਤੀ ਹੈ: Llama 4 Behemoth। ਜਿਵੇਂ ਕਿ ਨਾਮ ਤੋਂ ਪਤਾ ਲੱਗਦਾ ਹੈ, Behemoth ਨੂੰ AI ਲੈਂਡਸਕੇਪ ਵਿੱਚ ਇੱਕ ਦੈਂਤ ਵਜੋਂ ਕਲਪਨਾ ਕੀਤੀ ਗਈ ਹੈ। Meta ਦੇ CEO Mark Zuckerberg ਨੇ ਜਨਤਕ ਤੌਰ ‘ਤੇ ਇਸ ਮਾਡਲ ਲਈ ਅਭਿਲਾਸ਼ਾ ਬਿਆਨ ਕੀਤੀ ਹੈ, ਇਸਨੂੰ ਇਸਦੀ ਸਿਖਲਾਈ ਦੇ ਪੂਰਾ ਹੋਣ ‘ਤੇ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ‘ਦੁਨੀਆ ਦਾ ਸਭ ਤੋਂ ਉੱਚ ਪ੍ਰਦਰਸ਼ਨ ਕਰਨ ਵਾਲਾ ਬੇਸ ਮਾਡਲ’ ਦੱਸਿਆ ਹੈ। ਇਹ AI ਸਮਰੱਥਾ ਦੀਆਂ ਪੂਰੀਆਂ ਹੱਦਾਂ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣ ਦੇ Meta ਦੇ ਇਰਾਦੇ ਦਾ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ।
Behemoth ਦਾ ਪੈਮਾਨਾ ਹੈਰਾਨ ਕਰਨ ਵਾਲਾ ਹੈ। Meta ਨੇ ਖੁਲਾਸਾ ਕੀਤਾ ਹੈ ਕਿ ਇਸ ਕੋਲ 288 ਬਿਲੀਅਨ ਐਕਟਿਵ ਪੈਰਾਮੀਟਰ ਹਨ, ਜੋ 2 ਟ੍ਰਿਲੀਅਨ ਕੁੱਲ ਪੈਰਾਮੀਟਰਾਂ ਦੇ ਇੱਕ ਵਿਸ਼ਾਲ ਪੂਲ ਤੋਂ ਲਏ ਗਏ ਹਨ। ਇਹ ਇੱਕ ਬੇਮਿਸਾਲ ਪੈਮਾਨੇ ‘ਤੇ ਇੱਕ ਆਧੁਨਿਕ Mixture of Experts (MoE) ਆਰਕੀਟੈਕਚਰ ਦੀ ਵਰਤੋਂ ਦਾ ਜ਼ੋਰਦਾਰ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ। ਮਾਡਲ ਦਾ ਸਿਰਫ਼ ਆਕਾਰ ਹੀ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ ਇਸਨੂੰ ਵਿਸ਼ਾਲ ਡਾਟਾਸੈਟਾਂ ‘ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾ ਰਹੀ ਹੈ ਅਤੇ ਇਸਨੂੰ ਅਵਿਸ਼ਵਾਸ਼ਯੋਗ ਤੌਰ ‘ਤੇ ਗੁੰਝਲਦਾਰ ਪੈਟਰਨਾਂ ਅਤੇ ਗਿਆਨ ਨੂੰ ਹਾਸਲ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਜਦੋਂ ਕਿ ਅਜਿਹੇ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣਾ ਇੱਕ ਬਹੁਤ ਵੱਡਾ ਕੰਮ ਹੈ, ਜਿਸ ਲਈ ਬਹੁਤ ਜ਼ਿਆਦਾ ਕੰਪਿਊਟੇਸ਼ਨਲ ਸਰੋਤਾਂ ਅਤੇ ਸਮੇਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਸੰਭਾਵੀ ਲਾਭ ਵੀ ਓਨਾ ਹੀ ਮਹੱਤਵਪੂਰਨ ਹੈ।
ਹਾਲਾਂਕਿ Behemoth ਨੂੰ ਅਜੇ ਜਾਰੀ ਨਹੀਂ ਕੀਤਾ ਗਿਆ ਹੈ, Meta ਪਹਿਲਾਂ ਹੀ ਇਸਦੇ ਪ੍ਰਦਰਸ਼ਨ ਲਈ ਉੱਚ ਉਮੀਦਾਂ ਤੈਅ ਕਰ ਰਿਹਾ ਹੈ। ਕੰਪਨੀ ਦਾ ਦਾਅਵਾ ਹੈ ਕਿ, ਚੱਲ ਰਹੀ ਸਿਖਲਾਈ ਅਤੇ ਮੁਲਾਂਕਣ ਦੇ ਅਧਾਰ ‘ਤੇ, Behemoth OpenAI ਦੇ ਅਨੁਮਾਨਿਤ GPT-4.5 ਅਤੇ Anthropic ਦੇ Claude Sonnet 3.7 ਵਰਗੇ ਪ੍ਰਮੁੱਖ ਮੁਕਾਬਲੇਬਾਜ਼ਾਂ ਨੂੰ ਪਛਾੜਨ ਦੀ ਸਮਰੱਥਾ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰ ਰਿਹਾ ਹੈ, ਖਾਸ ਤੌਰ ‘ਤੇ ‘ਕਈ STEM ਬੈਂਚਮਾਰਕਾਂ ‘ਤੇ।’ ਵਿਗਿਆਨ, ਤਕਨਾਲੋਜੀ, ਇੰਜੀਨੀਅਰਿੰਗ, ਅਤੇ ਗਣਿਤ (STEM) ਬੈਂਚਮਾਰਕਾਂ ਵਿੱਚ ਸਫਲਤਾ ਨੂੰ ਅਕਸਰ ਉੱਨਤ ਤਰਕ ਅਤੇ ਸਮੱਸਿਆ-ਹੱਲ ਕਰਨ ਦੀਆਂ ਯੋਗਤਾਵਾਂ ਦਾ ਇੱਕ ਮੁੱਖ ਸੂਚਕ ਮੰਨਿਆ ਜਾਂਦਾ ਹੈ। ਇਹਨਾਂ ਖੇਤਰਾਂ ਵਿੱਚ ਉੱਤਮਤਾ ਪ੍ਰਾਪਤ ਕਰਨ ਵਾਲੇ ਮਾਡਲ ਵਿਗਿਆਨਕ ਖੋਜ ਵਿੱਚ ਸਫਲਤਾਵਾਂ ਨੂੰ ਅਨਲੌਕ ਕਰ ਸਕਦੇ ਹਨ, ਇੰਜੀਨੀਅਰਿੰਗ ਡਿਜ਼ਾਈਨ ਪ੍ਰਕਿਰਿਆਵਾਂ ਨੂੰ ਤੇਜ਼ ਕਰ ਸਕਦੇ ਹਨ, ਅਤੇ ਗੁੰਝਲਦਾਰ ਵਿਸ਼ਲੇਸ਼ਣਾਤਮਕ ਚੁਣੌਤੀਆਂ ਨਾਲ ਨਜਿੱਠ ਸਕਦੇ ਹਨ ਜੋ ਵਰਤਮਾਨ ਵਿੱਚ AI ਦੀ ਪਹੁੰਚ ਤੋਂ ਬਾਹਰ ਹਨ। STEM ‘ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਨਾ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ Meta Behemoth ਨੂੰ ਸਿਰਫ਼ ਇੱਕ ਭਾਸ਼ਾ ਮਾਡਲ ਵਜੋਂ ਨਹੀਂ, ਬਲਕਿ ਨਵੀਨਤਾ ਅਤੇ ਖੋਜ ਲਈ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਇੰਜਣ ਵਜੋਂ ਦੇਖਦਾ ਹੈ। Behemoth ਦਾ ਵਿਕਾਸ Meta ਦੀ ਲੰਬੀ-ਮਿਆਦ ਦੀ ਰਣਨੀਤੀ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ: ਨਾ ਸਿਰਫ਼ ਉੱਚ ਪੱਧਰ ‘ਤੇ ਮੁਕਾਬਲਾ ਕਰਨਾ ਬਲਕਿ ਬੁਨਿਆਦੀ AI ਮਾਡਲਾਂ ਲਈ ਪ੍ਰਦਰਸ਼ਨ ਦੀ ਸੀਮਾ ਨੂੰ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਮੁੜ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨਾ। ਇਸਦੀ ਅੰਤਿਮ ਰਿਲੀਜ਼ ‘ਤੇ ਪੂਰੇ AI ਭਾਈਚਾਰੇ ਦੁਆਰਾ ਨੇੜਿਓਂ ਨਜ਼ਰ ਰੱਖੀ ਜਾਵੇਗੀ।
ਪਰਦੇ ਪਿੱਛੇ: ਮਾਹਿਰਾਂ ਦੇ ਮਿਸ਼ਰਣ ਦਾ ਫਾਇਦਾ (Mixture of Experts Advantage)
Llama 4 ਸੀਰੀਜ਼ ਨੂੰ ਆਧਾਰ ਦੇਣ ਵਾਲੀ ਇੱਕ ਮੁੱਖ ਤਕਨੀਕੀ ਤਬਦੀਲੀ Meta ਦੁਆਰਾ ‘ਮਾਹਿਰਾਂ ਦਾ ਮਿਸ਼ਰਣ’ (MoE - Mixture of Experts) ਆਰਕੀਟੈਕਚਰ ਨੂੰ ਅਪਣਾਉਣਾ ਹੈ। ਇਹ ਮੋਨੋਲਿਥਿਕ ਮਾਡਲ ਡਿਜ਼ਾਈਨਾਂ ਤੋਂ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਵਿਕਾਸ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਜਿੱਥੇ ਪੂਰਾ ਮਾਡਲ ਹਰੇਕ ਇਨਪੁਟ ਦੀ ਪ੍ਰਕਿਰਿਆ ਕਰਦਾ ਹੈ। MoE ਇਨਫਰੈਂਸ (ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਆਉਟਪੁੱਟ ਤਿਆਰ ਕਰਨ ਦੀ ਪ੍ਰਕਿਰਿਆ) ਦੌਰਾਨ ਕੰਪਿਊਟੇਸ਼ਨਲ ਲਾਗਤ ਵਿੱਚ ਅਨੁਪਾਤਕ ਵਾਧੇ ਤੋਂ ਬਿਨਾਂ ਬਹੁਤ ਵੱਡੇ ਅਤੇ ਵਧੇਰੇ ਸਮਰੱਥ ਮਾਡਲ ਬਣਾਉਣ ਦਾ ਇੱਕ ਮਾਰਗ ਪੇਸ਼ ਕਰਦਾ ਹੈ।
ਇੱਕ MoE ਮਾਡਲ ਵਿੱਚ, ਸਿਸਟਮ ਬਹੁਤ ਸਾਰੇ ਛੋਟੇ, ਵਿਸ਼ੇਸ਼ ‘ਮਾਹਰ’ ਨੈੱਟਵਰਕਾਂ ਦਾ ਬਣਿਆ ਹੁੰਦਾ ਹੈ। ਜਦੋਂ ਇੱਕ ਇਨਪੁਟ (ਜਿਵੇਂ ਕਿ ਇੱਕ ਟੈਕਸਟ ਪ੍ਰੋਂਪਟ) ਪ੍ਰਾਪਤ ਹੁੰਦਾ ਹੈ, ਤਾਂ ਇੱਕ ਗੇਟਿੰਗ ਨੈੱਟਵਰਕ ਜਾਂ ਰਾਊਟਰ ਮਕੈਨਿਜ਼ਮ ਇਨਪੁਟ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਦਾ ਹੈ ਅਤੇ ਇਹ ਨਿਰਧਾਰਤ ਕਰਦਾ ਹੈ ਕਿ ਉਸ ਖਾਸ ਕਾਰਜ ਜਾਂ ਜਾਣਕਾਰੀ ਦੀ ਕਿਸਮ ਨੂੰ ਸੰਭਾਲਣ ਲਈ ਮਾਹਰਾਂ ਦਾ ਕਿਹੜਾ ਸਬਸੈੱਟ ਸਭ ਤੋਂ ਵਧੀਆ ਹੈ। ਸਿਰਫ਼ ਇਹ ਚੁਣੇ ਹੋਏ ਮਾਹਰ ਹੀ ਇਨਪੁਟ ਦੀ ਪ੍ਰਕਿਰਿਆ ਕਰਨ ਲਈ ਸਰਗਰਮ ਹੁੰਦੇ ਹਨ, ਜਦੋਂ ਕਿ ਬਾਕੀ ਸੁਸਤ ਰਹਿੰਦੇ ਹਨ। ਇਹ ਸ਼ਰਤੀਆ ਕੰਪਿਊਟੇਸ਼ਨ MoE ਦਾ ਮੁੱਖ ਫਾਇਦਾ ਹੈ।
ਇਸਦੇ ਦੋ ਫਾਇਦੇ ਹਨ:
- ਸਕੇਲੇਬਿਲਟੀ (Scalability): ਇਹ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਇੱਕ ਮਾਡਲ ਵਿੱਚ ਪੈਰਾਮੀਟਰਾਂ ਦੀ ਕੁੱਲ ਸੰਖਿਆ (ਜਿਵੇਂ ਕਿ Behemoth ਵਿੱਚ 2 ਟ੍ਰਿਲੀਅਨ) ਨੂੰ ਨਾਟਕੀ ਢੰਗ ਨਾਲ ਵਧਾਉਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ ਕਿਉਂਕਿ ਉਹਨਾਂ ਵਿੱਚੋਂ ਸਿਰਫ਼ ਇੱਕ ਹਿੱਸਾ (ਐਕਟਿਵ ਪੈਰਾਮੀਟਰ, ਉਦਾਹਰਨ ਲਈ, Behemoth ਲਈ 288 ਬਿਲੀਅਨ) ਕਿਸੇ ਇੱਕ ਇਨਫਰੈਂਸ ਲਈ ਲੱਗੇ ਹੁੰਦੇ ਹਨ। ਇਹ ਮਾਡਲ ਨੂੰ ਗਿਆਨ ਦੀ ਇੱਕ ਬਹੁਤ ਵੱਡੀ ਮਾਤਰਾ ਨੂੰ ਸਟੋਰ ਕਰਨ ਅਤੇ ਇਸਦੇ ਮਾਹਰ ਨੈੱਟਵਰਕਾਂ ਦੇ ਅੰਦਰ ਵਧੇਰੇ ਵਿਸ਼ੇਸ਼ ਕਾਰਜਾਂ ਨੂੰ ਸਿੱਖਣ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ।
- ਕੁਸ਼ਲਤਾ (Efficiency): ਕਿਉਂਕਿ ਕਿਸੇ ਵੀ ਸਮੇਂ ਮਾਡਲ ਦਾ ਸਿਰਫ਼ ਇੱਕ ਹਿੱਸਾ ਹੀ ਸਰਗਰਮ ਹੁੰਦਾ ਹੈ, ਇਸ ਲਈ ਇਨਫਰੈਂਸ ਲਈ ਲੋੜੀਂਦੀ ਕੰਪਿਊਟੇਸ਼ਨਲ ਲਾਗਤ ਅਤੇ ਊਰਜਾ ਦੀ ਖਪਤ ਸਮਾਨ ਕੁੱਲ ਪੈਰਾਮੀਟਰ ਆਕਾਰ ਦੇ ਇੱਕ ਸੰਘਣੇ ਮਾਡਲ ਦੇ ਮੁਕਾਬਲੇ ਕਾਫ਼ੀ ਘੱਟ ਹੋ ਸਕਦੀ ਹੈ। ਇਹ ਬਹੁਤ ਵੱਡੇ ਮਾਡਲਾਂ ਨੂੰ ਚਲਾਉਣਾ ਵਧੇਰੇ ਵਿਹਾਰਕ ਅਤੇ ਕਿਫ਼ਾਇਤੀ ਬਣਾਉਂਦਾ ਹੈ, ਖਾਸ ਕਰਕੇ ਵੱਡੇ ਪੈਮਾਨੇ ‘ਤੇ।
Meta ਦੁਆਰਾ Llama 4 ਲਈ MoE ‘ਤੇ ਸਵਿਚ ਕਰਨ ਦਾ ਸਪੱਸ਼ਟ ਜ਼ਿਕਰ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਇਹ ਆਰਕੀਟੈਕਚਰ Scout, Maverick, ਅਤੇ ਖਾਸ ਤੌਰ ‘ਤੇ ਵਿਸ਼ਾਲ Behemoth ਲਈ ਨਿਰਧਾਰਤ ਪ੍ਰਦਰਸ਼ਨ ਅਤੇ ਕੁਸ਼ਲਤਾ ਟੀਚਿਆਂ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਕੇਂਦਰੀ ਹੈ। ਜਦੋਂ ਕਿ MoE ਆਰਕੀਟੈਕਚਰ ਆਪਣੀਆਂ ਗੁੰਝਲਾਂ ਪੇਸ਼ ਕਰਦੇ ਹਨ, ਖਾਸ ਤੌਰ ‘ਤੇ ਗੇਟਿੰਗ ਨੈੱਟਵਰਕ ਨੂੰ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਸਿਖਲਾਈ ਦੇਣ ਅਤੇ ਮਾਹਰਾਂ ਵਿਚਕਾਰ ਸੰਚਾਰ ਦਾ ਪ੍ਰਬੰਧਨ ਕਰਨ ਵਿੱਚ, Meta ਵਰਗੇ ਪ੍ਰਮੁੱਖ ਖਿਡਾਰੀਆਂ ਦੁਆਰਾ ਉਹਨਾਂ ਨੂੰ ਅਪਣਾਉਣਾ AI ਵਿਕਾਸ ਦੀਆਂ ਸਰਹੱਦਾਂ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣ ਵਿੱਚ ਉਹਨਾਂ ਦੀ ਵੱਧ ਰਹੀ ਮਹੱਤਤਾ ਦਾ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ। ਇਹ ਆਰਕੀਟੈਕਚਰਲ ਚੋਣ ਸੰਭਾਵਤ ਤੌਰ ‘ਤੇ DeepSeek-V3 ਦੇ ਵਿਰੁੱਧ Maverick ਦੀ ਦਾਅਵਾ ਕੀਤੀ ਕੁਸ਼ਲਤਾ ਅਤੇ Behemoth ਲਈ ਕਲਪਨਾ ਕੀਤੇ ਗਏ ਸਿਰੇ ਦੇ ਪੈਮਾਨੇ ਦੇ ਪਿੱਛੇ ਇੱਕ ਮੁੱਖ ਕਾਰਕ ਹੈ।
ਵੰਡ ਰਣਨੀਤੀ: ਖੁੱਲ੍ਹੀ ਪਹੁੰਚ ਅਤੇ ਏਕੀਕ੍ਰਿਤ ਅਨੁਭਵ
Meta ਆਪਣੇ Llama 4 ਮਾਡਲਾਂ ਦੇ ਪ੍ਰਸਾਰ ਅਤੇ ਉਪਯੋਗ ਲਈ ਇੱਕ ਦੋ-ਪੱਖੀ ਰਣਨੀਤੀ ਅਪਣਾ ਰਿਹਾ ਹੈ, ਜੋ ਇੱਕ ਵਿਸ਼ਾਲ ਡਿਵੈਲਪਰ ਈਕੋਸਿਸਟਮ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਨ ਅਤੇ ਇਸਦੇ ਆਪਣੇ ਵਿਸ਼ਾਲ ਉਪਭੋਗਤਾ ਅਧਾਰ ਦਾ ਲਾਭ ਉਠਾਉਣ ਦੀ ਇੱਛਾ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ।
ਪਹਿਲਾਂ, Llama 4 Scout ਅਤੇ Llama 4 Maverick ਨੂੰ ਡਾਊਨਲੋਡ ਲਈ ਉਪਲਬਧ ਕਰਵਾਇਆ ਜਾ ਰਿਹਾ ਹੈ। ਡਿਵੈਲਪਰ ਅਤੇ ਖੋਜਕਰਤਾ ਮਾਡਲਾਂ ਨੂੰ ਸਿੱਧੇ Meta ਤੋਂ ਜਾਂ Hugging Face ਵਰਗੇ ਪ੍ਰਸਿੱਧ ਪਲੇਟਫਾਰਮਾਂ ਰਾਹੀਂ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦੇ ਹਨ, ਜੋ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਭਾਈਚਾਰੇ ਲਈ ਇੱਕ ਕੇਂਦਰੀ ਹੱਬ ਹੈ। ਇਹ ਪਹੁੰਚ ਪ੍ਰਯੋਗ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦੀ ਹੈ, ਬਾਹਰੀ ਪਾਰਟੀਆਂ ਨੂੰ Llama 4 ਦੇ ਸਿਖਰ ‘ਤੇ ਐਪਲੀਕੇਸ਼ਨ ਬਣਾਉਣ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ, ਅਤੇ ਮਾਡਲਾਂ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਦੀ ਸੁਤੰਤਰ ਜਾਂਚ ਅਤੇ ਪ੍ਰਮਾਣਿਕਤਾ ਦੀ ਸਹੂਲਤ ਦਿੰਦੀ ਹੈ। ਮਾਡਲਾਂ ਨੂੰ ਡਾਊਨਲੋਡ ਲਈ ਪੇਸ਼ ਕਰਕੇ, Meta ਵਿਆਪਕ AI ਲੈਂਡਸਕੇਪ ਵਿੱਚ ਯੋਗਦਾਨ ਪਾਉਂਦਾ ਹੈ, ਆਪਣੀਆਂ ਉਤਪਾਦ ਟੀਮਾਂ ਤੋਂ ਪਰੇ ਨਵੀਨਤਾ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦਾ ਹੈ। ਇਹ, ਘੱਟੋ ਘੱਟ ਅੰਸ਼ਕ ਤੌਰ ‘ਤੇ, ਖੁੱਲ੍ਹੀ ਖੋਜ ਅਤੇ ਵਿਕਾਸ ਦੇ ਸਿਧਾਂਤ ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੈ ਜਿਸ ਨੇ ਇਤਿਹਾਸਕ ਤੌਰ ‘ਤੇ ਖੇਤਰ ਵਿੱਚ ਤਰੱਕੀ ਨੂੰ ਤੇਜ਼ ਕੀਤਾ ਹੈ।
ਦੂਜਾ, ਅਤੇ ਇਸਦੇ ਨਾਲ ਹੀ, Meta Llama 4 ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਆਪਣੇ ਉਤਪਾਦਾਂ ਵਿੱਚ ਡੂੰਘਾਈ ਨਾਲ ਏਕੀਕ੍ਰਿਤ ਕਰ ਰਿਹਾ ਹੈ। ਇਹਨਾਂ ਨਵੇਂ ਮਾਡਲਾਂ ਦੁਆਰਾ ਸੰਚਾਲਿਤ Meta AI ਸਹਾਇਕ, ਕੰਪਨੀ ਦੀ ਵੈੱਬ ਮੌਜੂਦਗੀ ਵਿੱਚ ਅਤੇ, ਸ਼ਾਇਦ ਵਧੇਰੇ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ, ਇਸਦੀਆਂ ਵਿਆਪਕ ਤੌਰ ‘ਤੇ ਵਰਤੀਆਂ ਜਾਣ ਵਾਲੀਆਂ ਸੰਚਾਰ ਐਪਾਂ: WhatsApp, Messenger, ਅਤੇ Instagram Direct ਦੇ ਅੰਦਰ ਰੋਲ ਆਊਟ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ। ਇਹ ਤੁਰੰਤ ਦੁਨੀਆ ਭਰ ਦੇ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਅਰਬਾਂ ਉਪਭੋਗਤਾਵਾਂ ਦੇ ਹੱਥਾਂ ਵਿੱਚ ਉੱਨਤ AI ਟੂਲ ਰੱਖਦਾ ਹੈ। ਇਹ ਏਕੀਕਰਣ ਕਈ ਰਣਨੀਤਕ ਉਦੇਸ਼ਾਂ ਦੀ ਪੂਰਤੀ ਕਰਦਾ ਹੈ: ਇਹ Meta ਦੇ ਪਲੇਟਫਾਰਮਾਂ ਦੇ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਤੁਰੰਤ ਮੁੱਲ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਅਸਲ-ਸੰਸਾਰ ਪਰਸਪਰ ਕ੍ਰਿਆ ਡੇਟਾ ਤਿਆਰ ਕਰਦਾ ਹੈ (ਜੋ ਗੋਪਨੀਯਤਾ ਦੇ ਵਿਚਾਰਾਂ ਦੇ ਅਧੀਨ, ਹੋਰ ਮਾਡਲ ਸੁਧਾਈ ਲਈ ਅਨਮੋਲ ਹੋ ਸਕਦਾ ਹੈ), ਅਤੇ Meta ਦੀਆਂ ਐਪਾਂ ਨੂੰ AI ਇੰਟੈਲੀਜੈਂਸ ਨਾਲ ਭਰਪੂਰ ਅਤਿ-ਆਧੁਨਿਕ ਪਲੇਟਫਾਰਮਾਂ ਵਜੋਂ ਸਥਾਪਤ ਕਰਦਾ ਹੈ। ਇਹ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਫੀਡਬੈਕ ਲੂਪ ਬਣਾਉਂਦਾ ਹੈ ਅਤੇ ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦਾ ਹੈ ਕਿ Meta ਆਪਣੀਆਂ ਮੁੱਖ ਸੇਵਾਵਾਂ ਨੂੰ ਵਧਾ ਕੇ ਆਪਣੀਆਂ AI ਤਰੱਕੀਆਂ ਤੋਂ ਸਿੱਧਾ ਲਾਭ ਉਠਾਉਂਦਾ ਹੈ।
ਇਹ ਦੋਹਰੀ ਰਣਨੀਤੀ ਕੁਝ ਮੁਕਾਬਲੇਬਾਜ਼ਾਂ ਦੁਆਰਾ ਅਪਣਾਏ ਗਏ ਤਰੀਕਿਆਂ ਦੇ ਉਲਟ ਹੈ। ਜਦੋਂ ਕਿ OpenAI ਮੁੱਖ ਤੌਰ ‘ਤੇ APIs (ਜਿਵੇਂ ਕਿ GPT-4 ਲਈ) ਰਾਹੀਂ ਪਹੁੰਚ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦਾ ਹੈ ਅਤੇ Google Gemini ਨੂੰ ਆਪਣੀਆਂ ਸੇਵਾਵਾਂ ਵਿੱਚ ਡੂੰਘਾਈ ਨਾਲ ਏਕੀਕ੍ਰਿਤ ਕਰਦਾ ਹੈ ਜਦੋਂ ਕਿ API ਪਹੁੰਚ ਦੀ ਪੇਸ਼ਕਸ਼ ਵੀ ਕਰਦਾ ਹੈ, Meta ਦਾ ਮ