Meta ਦਾ Llama 4 ਮਾਡਲ ਸੂਟ: AI ਵਿੱਚ ਨਵਾਂ ਕਦਮ

ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ (AI) ਵਿੱਚ ਤਰੱਕੀ ਦੀ ਲਗਾਤਾਰ ਰਫ਼ਤਾਰ ਬੇਰੋਕ ਜਾਰੀ ਹੈ, ਅਤੇ Meta Platforms, Inc. ਨੇ ਆਪਣੇ Llama 4 ਸੀਰੀਜ਼ ਦੇ AI ਮਾਡਲਾਂ ਦੀ ਪੇਸ਼ਕਾਰੀ ਨਾਲ ਇੱਕ ਕੇਂਦਰੀ ਖਿਡਾਰੀ ਬਣੇ ਰਹਿਣ ਦੇ ਆਪਣੇ ਇਰਾਦੇ ਦਾ ਪੱਕਾ ਸੰਕੇਤ ਦਿੱਤਾ ਹੈ। ਇਹ ਨਵੀਂ ਪੀੜ੍ਹੀ Meta ਦੀਆਂ AI ਸਮਰੱਥਾਵਾਂ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਵਿਕਾਸ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ, ਜੋ ਨਾ ਸਿਰਫ਼ ਕੰਪਨੀ ਦੇ ਆਪਣੇ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੇ ਵਿਸ਼ਾਲ ਈਕੋਸਿਸਟਮ ਨੂੰ ਸ਼ਕਤੀ ਦੇਣ ਲਈ ਤਿਆਰ ਕੀਤੀ ਗਈ ਹੈ, ਬਲਕਿ ਵਿਆਪਕ ਡਿਵੈਲਪਰ ਭਾਈਚਾਰੇ ਲਈ ਵੀ ਉਪਲਬਧ ਕਰਵਾਈ ਜਾਵੇਗੀ। ਦੋ ਵੱਖਰੇ ਮਾਡਲ ਇਸ ਰਿਲੀਜ਼ ਦੀ ਅਗਵਾਈ ਕਰਦੇ ਹਨ: Llama 4 Scout ਅਤੇ Llama 4 Maverick, ਹਰੇਕ ਵੱਖ-ਵੱਖ ਸੰਚਾਲਨ ਪੈਮਾਨਿਆਂ ਅਤੇ ਪ੍ਰਦਰਸ਼ਨ ਟੀਚਿਆਂ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਸ ਤੋਂ ਇਲਾਵਾ, Meta ਨੇ ਇੱਕ ਹੋਰ ਵੀ ਸ਼ਕਤੀਸ਼ਾਲੀ ਮਾਡਲ, Llama 4 Behemoth, ਜੋ ਵਰਤਮਾਨ ਵਿੱਚ ਵਿਕਾਸ ਅਧੀਨ ਹੈ, ਦੀ ਝਲਕ ਦਿਖਾ ਕੇ AI ਜਗਤ ਨੂੰ ਉਤਸੁਕ ਕੀਤਾ ਹੈ, ਇਸਨੂੰ AI ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਸਿਖਰ ‘ਤੇ ਭਵਿੱਖ ਦੇ ਦਾਅਵੇਦਾਰ ਵਜੋਂ ਸਥਾਪਤ ਕੀਤਾ ਹੈ। ਇਹ ਬਹੁ-ਪੱਖੀ ਰਿਲੀਜ਼ ਵੱਡੇ ਭਾਸ਼ਾਈ ਮਾਡਲਾਂ (LLMs) ਦੀਆਂ ਸੀਮਾਵਾਂ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣ ਅਤੇ OpenAI, Google, ਅਤੇ Anthropic ਵਰਗੇ ਦਿੱਗਜਾਂ ਦੇ ਦਬਦਬੇ ਵਾਲੇ ਖੇਤਰ ਵਿੱਚ ਹਮਲਾਵਰ ਢੰਗ ਨਾਲ ਮੁਕਾਬਲਾ ਕਰਨ ਲਈ Meta ਦੀ ਵਚਨਬੱਧਤਾ ਨੂੰ ਰੇਖਾਂਕਿਤ ਕਰਦੀ ਹੈ।

Llama 4 ਜੋੜੀ ਨੂੰ ਸਮਝਣਾ: Scout ਅਤੇ Maverick ਕੇਂਦਰ ਵਿੱਚ

Meta ਦੀ ਸ਼ੁਰੂਆਤੀ ਰੋਲਆਊਟ ਦੋ ਮਾਡਲਾਂ ‘ਤੇ ਕੇਂਦ੍ਰਿਤ ਹੈ ਜੋ AI ਲੈਂਡਸਕੇਪ ਦੇ ਵੱਖ-ਵੱਖ ਹਿੱਸਿਆਂ ਨੂੰ ਸੰਬੋਧਿਤ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤੇ ਗਏ ਹਨ। ਉਹ ਪਹੁੰਚਯੋਗ ਸ਼ਕਤੀ ਅਤੇ ਉੱਚ-ਪੱਧਰੀ ਪ੍ਰਦਰਸ਼ਨ ਦੋਵਾਂ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਨ ਲਈ ਇੱਕ ਰਣਨੀਤਕ ਕੋਸ਼ਿਸ਼ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ, ਸੰਭਾਵੀ ਉਪਭੋਗਤਾਵਾਂ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਨੂੰ ਪੂਰਾ ਕਰਦੇ ਹਨ।

Llama 4 Scout: ਵਿਸ਼ਾਲ ਮੈਮੋਰੀ ਵਾਲਾ ਸੰਖੇਪ ਪਾਵਰਹਾਊਸ

ਜੋੜੀ ਵਿੱਚੋਂ ਪਹਿਲਾ, Llama 4 Scout, ਕੁਸ਼ਲਤਾ ਅਤੇ ਪਹੁੰਚਯੋਗਤਾ ਨੂੰ ਧਿਆਨ ਵਿੱਚ ਰੱਖ ਕੇ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। Meta ਇਸਦੇ ਮੁਕਾਬਲਤਨ ਮਾਮੂਲੀ ਫੁੱਟਪ੍ਰਿੰਟ ਨੂੰ ਉਜਾਗਰ ਕਰਦਾ ਹੈ, ਇਹ ਦੱਸਦੇ ਹੋਏ ਕਿ ਇਹ ‘ਇੱਕ ਸਿੰਗਲ Nvidia H100 GPU ਵਿੱਚ ਫਿੱਟ ਹੋਣ’ ਦੇ ਸਮਰੱਥ ਹੈ। ਇਹ ਮੌਜੂਦਾ AI ਮਾਹੌਲ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਵੇਰਵਾ ਹੈ, ਜਿੱਥੇ ਉੱਚ-ਪ੍ਰਦਰਸ਼ਨ ਵਾਲੇ ਕੰਪਿਊਟਿੰਗ ਸਰੋਤਾਂ, ਖਾਸ ਤੌਰ ‘ਤੇ H100 ਵਰਗੇ ਮੰਗੇ ਜਾਣ ਵਾਲੇ GPUs ਤੱਕ ਪਹੁੰਚ, ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਸੰਗਠਨਾਂ ਲਈ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਰੁਕਾਵਟ ਹੋ ਸਕਦੀ ਹੈ। Scout ਨੂੰ ਅਜਿਹੀ ਇੱਕ ਇਕਾਈ ਦੀਆਂ ਸੀਮਾਵਾਂ ਦੇ ਅੰਦਰ ਕੰਮ ਕਰਨ ਲਈ ਡਿਜ਼ਾਈਨ ਕਰਕੇ, Meta ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਉੱਨਤ AI ਸਮਰੱਥਾਵਾਂ ਦਾ ਲਾਭ ਉਠਾਉਣ ਲਈ ਦਾਖਲੇ ਦੀ ਰੁਕਾਵਟ ਨੂੰ ਘੱਟ ਕਰਦਾ ਹੈ।

ਇਸਦੇ ਸੰਖੇਪ ਸੁਭਾਅ ਦੇ ਬਾਵਜੂਦ, Scout ਨੂੰ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਪ੍ਰਦਰਸ਼ਨਕਾਰ ਵਜੋਂ ਪੇਸ਼ ਕੀਤਾ ਗਿਆ ਹੈ। Meta ਦਾਅਵਾ ਕਰਦਾ ਹੈ ਕਿ ਇਹ ਆਪਣੀ ਸ਼੍ਰੇਣੀ ਵਿੱਚ ਕਈ ਸਥਾਪਿਤ ਮਾਡਲਾਂ ਨੂੰ ਪਛਾੜਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ Google ਦਾ Gemma 3 ਅਤੇ Gemini 2.0 Flash-Lite, ਅਤੇ ਨਾਲ ਹੀ ਪ੍ਰਸਿੱਧ ਓਪਨ-ਸੋਰਸ ਮਾਡਲ Mistral 3.1 ਸ਼ਾਮਲ ਹਨ। ਇਹ ਦਾਅਵੇ ‘ਵਿਆਪਕ ਤੌਰ ‘ਤੇ ਰਿਪੋਰਟ ਕੀਤੇ ਗਏ ਬੈਂਚਮਾਰਕਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਵਿੱਚ’ ਪ੍ਰਦਰਸ਼ਨ ‘ਤੇ ਅਧਾਰਤ ਹਨ, ਜੋ ਤਰਕ, ਭਾਸ਼ਾ ਦੀ ਸਮਝ, ਅਤੇ ਸਮੱਸਿਆ-ਹੱਲ ਕਰਨ ਦੀਆਂ ਯੋਗਤਾਵਾਂ ਨੂੰ ਮਾਪਣ ਲਈ ਤਿਆਰ ਕੀਤੇ ਗਏ ਵੱਖ-ਵੱਖ ਮਾਨਕੀਕ੍ਰਿਤ AI ਕਾਰਜਾਂ ਵਿੱਚ ਯੋਗਤਾ ਦਾ ਸੁਝਾਅ ਦਿੰਦੇ ਹਨ।

ਸ਼ਾਇਦ Scout ਦੀਆਂ ਸਭ ਤੋਂ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਵਿੱਚੋਂ ਇੱਕ ਇਸਦੀ 10-ਮਿਲੀਅਨ-ਟੋਕਨ ਕੰਟੈਕਸਟ ਵਿੰਡੋ ਹੈ। ਕੰਟੈਕਸਟ ਵਿੰਡੋ ਉਸ ਜਾਣਕਾਰੀ ਦੀ ਮਾਤਰਾ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਦੀ ਹੈ ਜੋ ਇੱਕ AI ਮਾਡਲ ਇੱਕ ਬੇਨਤੀ ਦੀ ਪ੍ਰਕਿਰਿਆ ਕਰਦੇ ਸਮੇਂ ਆਪਣੀ ਸਰਗਰਮ ਮੈਮੋਰੀ ਵਿੱਚ ਰੱਖ ਸਕਦਾ ਹੈ। ਇੱਕ ਵੱਡੀ ਕੰਟੈਕਸਟ ਵਿੰਡੋ ਮਾਡਲ ਨੂੰ ਬਹੁਤ ਲੰਬੇ ਦਸਤਾਵੇਜ਼ਾਂ ਨੂੰ ਸਮਝਣ ਅਤੇ ਹਵਾਲਾ ਦੇਣ, ਵਿਸਤ੍ਰਿਤ ਗੱਲਬਾਤ ਦੌਰਾਨ ਇਕਸਾਰਤਾ ਬਣਾਈ ਰੱਖਣ, ਅਤੇ ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਕਾਰਜਾਂ ਨਾਲ ਨਜਿੱਠਣ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ ਜਿਨ੍ਹਾਂ ਲਈ ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਜਾਣਕਾਰੀ ਨੂੰ ਬਰਕਰਾਰ ਰੱਖਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। 10-ਮਿਲੀਅਨ-ਟੋਕਨ ਸਮਰੱਥਾ ਕਾਫ਼ੀ ਹੈ, ਜੋ ਵਿਸਤ੍ਰਿਤ ਦਸਤਾਵੇਜ਼ ਵਿਸ਼ਲੇਸ਼ਣ, ਆਧੁਨਿਕ ਚੈਟਬੋਟ ਪਰਸਪਰ ਕ੍ਰਿਆਵਾਂ ਜੋ ਪਿਛਲੀ ਗੱਲਬਾਤ ਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਯਾਦ ਰੱਖਦੀਆਂ ਹਨ, ਅਤੇ ਵੱਡੇ ਕੋਡਬੇਸਾਂ ‘ਤੇ ਅਧਾਰਤ ਗੁੰਝਲਦਾਰ ਕੋਡ ਉਤਪਾਦਨ ਵਰਗੇ ਖੇਤਰਾਂ ਵਿੱਚ ਸੰਭਾਵੀ ਐਪਲੀਕੇਸ਼ਨਾਂ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦੀ ਹੈ। ਇਹ ਵੱਡੀ ਮੈਮੋਰੀ, ਇਸਦੀ ਕਥਿਤ ਕੁਸ਼ਲਤਾ ਅਤੇ ਬੈਂਚਮਾਰਕ ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਨਾਲ ਮਿਲ ਕੇ, Scout ਨੂੰ ਸਰੋਤ ਲੋੜਾਂ ਅਤੇ ਉੱਨਤ ਸਮਰੱਥਾਵਾਂ ਵਿਚਕਾਰ ਸੰਤੁਲਨ ਦੀ ਮੰਗ ਕਰਨ ਵਾਲੇ ਡਿਵੈਲਪਰਾਂ ਲਈ ਇੱਕ ਬਹੁਮੁਖੀ ਸਾਧਨ ਵਜੋਂ ਸਥਾਪਤ ਕਰਦੀ ਹੈ।

Llama 4 Maverick: ਉੱਚ-ਦਾਅ ਵਾਲੇ ਮੁਕਾਬਲੇ ਲਈ ਸਕੇਲਿੰਗ ਅੱਪ

ਵਧੇਰੇ ਸ਼ਕਤੀਸ਼ਾਲੀ ਭੈਣ-ਭਰਾ ਵਜੋਂ ਸਥਾਪਤ, Llama 4 Maverick ਪ੍ਰਦਰਸ਼ਨ ਸਪੈਕਟ੍ਰਮ ਦੇ ਉੱਚ ਸਿਰੇ ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾਉਂਦਾ ਹੈ, ਉਦਯੋਗ ਦੇ ਦਿੱਗਜਾਂ ਜਿਵੇਂ ਕਿ OpenAI ਦੇ GPT-4o ਅਤੇ Google ਦੇ Gemini 2.0 Flash ਨਾਲ ਤੁਲਨਾ ਕਰਦਾ ਹੈ। ਇਹ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ Maverick ਵਧੇਰੇ ਸੂਖਮਤਾ, ਰਚਨਾਤਮਕਤਾ, ਅਤੇ ਗੁੰਝਲਦਾਰ ਤਰਕ ਦੀ ਮੰਗ ਕਰਨ ਵਾਲੇ ਕਾਰਜਾਂ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। Meta ਅੰਦਰੂਨੀ ਟੈਸਟਿੰਗ ਅਤੇ ਬੈਂਚਮਾਰਕ ਨਤੀਜਿਆਂ ਦੇ ਅਧਾਰ ‘ਤੇ ਇਹਨਾਂ ਪ੍ਰਮੁੱਖ ਵਿਰੋਧੀਆਂ ਦੇ ਵਿਰੁੱਧ ਉੱਤਮ ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਦਾਅਵਾ ਕਰਦੇ ਹੋਏ, Maverick ਦੇ ਮੁਕਾਬਲੇ ਵਾਲੇ ਕਿਨਾਰੇ ‘ਤੇ ਜ਼ੋਰ ਦਿੰਦਾ ਹੈ।

Maverick ਦੇ ਪ੍ਰੋਫਾਈਲ ਦਾ ਇੱਕ ਦਿਲਚਸਪ ਪਹਿਲੂ ਇਸਦੀ ਸ਼ਕਤੀ ਦੇ ਮੁਕਾਬਲੇ ਇਸਦੀ ਦਾਅਵਾ ਕੀਤੀ ਕੁਸ਼ਲਤਾ ਹੈ। Meta ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ Maverick ਖਾਸ ਤੌਰ ‘ਤੇ ਕੋਡਿੰਗ ਅਤੇ ਤਰਕ ਕਾਰਜਾਂ ਵਿੱਚ DeepSeek-V3 ਦੇ ਤੁਲਨਾਤਮਕ ਨਤੀਜੇ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ, ਜਦੋਂ ਕਿ ‘ਅੱਧੇ ਤੋਂ ਘੱਟ ਸਰਗਰਮ ਪੈਰਾਮੀਟਰਾਂ’ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਇੱਕ AI ਮਾਡਲ ਵਿੱਚ ਪੈਰਾਮੀਟਰ ਦਿਮਾਗ ਵਿੱਚ ਨਿਊਰੋਨਸ ਦੇ ਵਿਚਕਾਰ ਕਨੈਕਸ਼ਨਾਂ ਦੇ ਸਮਾਨ ਹੁੰਦੇ ਹਨ; ਵਧੇਰੇ ਪੈਰਾਮੀਟਰ ਆਮ ਤੌਰ ‘ਤੇ ਵਧੇਰੇ ਸੰਭਾਵੀ ਗੁੰਝਲਤਾ ਅਤੇ ਸਮਰੱਥਾ ਨਾਲ ਸਬੰਧ ਰੱਖਦੇ ਹਨ, ਪਰ ਉੱਚ ਕੰਪਿਊਟੇਸ਼ਨਲ ਲਾਗਤ ਵੀ। ਜੇਕਰ Maverick ਅਸਲ ਵਿੱਚ ਕਾਫ਼ੀ ਘੱਟ ਸਰਗਰਮ ਪੈਰਾਮੀਟਰਾਂ (ਖਾਸ ਕਰਕੇ ਜਦੋਂ Mixture of Experts ਵਰਗੀਆਂ ਤਕਨੀਕਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, ਜਿਸ ਬਾਰੇ ਬਾਅਦ ਵਿੱਚ ਚਰਚਾ ਕੀਤੀ ਗਈ ਹੈ) ਨਾਲ ਉੱਚ-ਪੱਧਰੀ ਪ੍ਰਦਰਸ਼ਨ ਪ੍ਰਦਾਨ ਕਰ ਸਕਦਾ ਹੈ, ਤਾਂ ਇਹ ਮਾਡਲ ਅਨੁਕੂਲਨ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਪ੍ਰਾਪਤੀ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਤੇਜ਼ ਜਵਾਬ ਸਮੇਂ ਅਤੇ ਸਮਾਨ ਸਮਰੱਥਾ ਵਾਲੇ ਮਾਡਲਾਂ ਦੀ ਤੁਲਨਾ ਵਿੱਚ ਘੱਟ ਸੰਚਾਲਨ ਲਾਗਤਾਂ ਵੱਲ ਅਗਵਾਈ ਕਰਦਾ ਹੈ। ਕੱਚੀ ਸ਼ਕਤੀ ਦੇ ਨਾਲ ਕੁਸ਼ਲਤਾ ‘ਤੇ ਇਹ ਫੋਕਸ Maverick ਨੂੰ ਉਹਨਾਂ ਸੰਗਠਨਾਂ ਲਈ ਇੱਕ ਆਕਰਸ਼ਕ ਵਿਕਲਪ ਬਣਾ ਸਕਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਨੂੰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਵੱਧ ਤੋਂ ਵੱਧ ਕੰਪਿਊਟੇਸ਼ਨਲ ਓਵਰਹੈੱਡ ਖਰਚ ਕੀਤੇ ਬਿਨਾਂ ਅਤਿ-ਆਧੁਨਿਕ AI ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।

Scout ਅਤੇ Maverick ਦੋਵੇਂ Meta ਤੋਂ ਸਿੱਧੇ ਅਤੇ Hugging Face, AI ਮਾਡਲਾਂ ਅਤੇ ਡੇਟਾਸੈਟਾਂ ਨੂੰ ਸਾਂਝਾ ਕਰਨ ਲਈ ਇੱਕ ਪ੍ਰਸਿੱਧ ਪਲੇਟਫਾਰਮ, ਰਾਹੀਂ ਡਾਊਨਲੋਡ ਕਰਨ ਲਈ ਉਪਲਬਧ ਕਰਵਾਏ ਜਾ ਰਹੇ ਹਨ। ਇਹ ਵੰਡ ਰਣਨੀਤੀ ਖੋਜ ਅਤੇ ਵਿਕਾਸ ਭਾਈਚਾਰਿਆਂ ਦੇ ਅੰਦਰ ਅਪਣਾਉਣ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਨ ਦਾ ਉਦੇਸ਼ ਰੱਖਦੀ ਹੈ, ਬਾਹਰੀ ਪਾਰਟੀਆਂ ਨੂੰ ਇਹਨਾਂ ਮਾਡਲਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ, ਉਹਨਾਂ ‘ਤੇ ਨਿਰਮਾਣ ਕਰਨ, ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਆਪਣੇ ਪ੍ਰੋਜੈਕਟਾਂ ਵਿੱਚ ਏਕੀਕ੍ਰਿਤ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ।

AI ਨੂੰ ਸਮਾਜਿਕ ਤਾਣੇ-ਬਾਣੇ ਵਿੱਚ ਬੁਣਨਾ: Meta ਦੇ ਪਲੇਟਫਾਰਮਾਂ ਵਿੱਚ Llama 4 ਏਕੀਕਰਣ

ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ, Llama 4 ਮਾਡਲ ਸਿਰਫ਼ ਸਿਧਾਂਤਕ ਨਿਰਮਾਣ ਜਾਂ ਸਿਰਫ਼ ਬਾਹਰੀ ਡਿਵੈਲਪਰਾਂ ਲਈ ਸਾਧਨ ਨਹੀਂ ਹਨ। Meta ਤੁਰੰਤ ਇਸ ਨਵੀਂ ਤਕਨਾਲੋਜੀ ਨੂੰ ਆਪਣੇ ਉਪਭੋਗਤਾ-ਸਾਹਮਣੇ ਵਾਲੇ ਉਤਪਾਦਾਂ ਨੂੰ ਵਧਾਉਣ ਲਈ ਤੈਨਾਤ ਕਰ ਰਿਹਾ ਹੈ। Meta AI ਅਸਿਸਟੈਂਟ, ਕੰਪਨੀ ਦਾ ਗੱਲਬਾਤ ਵਾਲਾ AI ਜੋ ਇਸਦੀਆਂ ਵੱਖ-ਵੱਖ ਸੇਵਾਵਾਂ ਵਿੱਚ ਉਪਭੋਗਤਾਵਾਂ ਦੀ ਸਹਾਇਤਾ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ, ਹੁਣ Llama 4 ਦੁਆਰਾ ਸੰਚਾਲਿਤ ਹੈ।

ਇਹ ਏਕੀਕਰਣ Meta ਦੇ ਸਭ ਤੋਂ ਪ੍ਰਸਿੱਧ ਪਲੇਟਫਾਰਮਾਂ ਵਿੱਚ ਫੈਲਿਆ ਹੋਇਆ ਹੈ:

  • Meta AI ਲਈ ਵੈੱਬ ਇੰਟਰਫੇਸ: ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਵਧੇ ਹੋਏ ਸਹਾਇਕ ਨਾਲ ਗੱਲਬਾਤ ਕਰਨ ਲਈ ਇੱਕ ਸਮਰਪਿਤ ਪੋਰਟਲ ਪ੍ਰਦਾਨ ਕਰਨਾ।
  • WhatsApp: ਦੁਨੀਆ ਦੀ ਸਭ ਤੋਂ ਵੱਧ ਵਰਤੀ ਜਾਣ ਵਾਲੀ ਮੈਸੇਜਿੰਗ ਐਪ ਵਿੱਚ ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਉੱਨਤ AI ਸਮਰੱਥਾਵਾਂ ਲਿਆਉਣਾ।
  • Messenger: Llama 4 ਦੀ ਸ਼ਕਤੀ ਨਾਲ Meta ਦੇ ਦੂਜੇ ਪ੍ਰਮੁੱਖ ਸੰਚਾਰ ਪਲੇਟਫਾਰਮ ਨੂੰ ਵਧਾਉਣਾ।
  • Instagram: ਵਿਜ਼ੂਅਲ-ਕੇਂਦ੍ਰਿਤ ਸੋਸ਼ਲ ਨੈਟਵਰਕ ਦੇ ਅੰਦਰ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਸਮੱਗਰੀ ਬਣਾਉਣ, ਖੋਜ, ਜਾਂ ਸਿੱਧੇ ਮੈਸੇਜਿੰਗ ਨਾਲ ਸਬੰਧਤ AI ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਏਕੀਕ੍ਰਿਤ ਕਰਨਾ।

ਇਹ ਵਿਆਪਕ ਤੈਨਾਤੀ ਅਰਬਾਂ ਉਪਭੋਗਤਾਵਾਂ ਲਈ ਉੱਨਤ AI ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਅੰਬੀਨਟ ਅਤੇ ਪਹੁੰਚਯੋਗ ਬਣਾਉਣ ਵਿੱਚ ਇੱਕ ਵੱਡਾ ਕਦਮ ਦਰਸਾਉਂਦੀ ਹੈ। ਅੰਤਮ-ਉਪਭੋਗਤਾ ਲਈ, ਇਸਦਾ ਮਤਲਬ Meta AI ਸਹਾਇਕ ਨਾਲ ਵਧੇਰੇ ਮਦਦਗਾਰ, ਸੰਦਰਭ-ਜਾਣੂ, ਅਤੇ ਸਮਰੱਥ ਪਰਸਪਰ ਕ੍ਰਿਆਵਾਂ ਹੋ ਸਕਦਾ ਹੈ। ਲੰਬੀਆਂ ਚੈਟ ਥ੍ਰੈੱਡਾਂ ਦਾ ਸਾਰાંਸ਼ ਕਰਨਾ, ਸੁਨੇਹੇ ਤਿਆਰ ਕਰਨਾ, ਰਚਨਾਤਮਕ ਟੈਕਸਟ ਫਾਰਮੈਟ ਤਿਆਰ ਕਰਨਾ, ਜਾਣਕਾਰੀ ਲੱਭਣਾ, ਜਾਂ ਇੱਥੋਂ ਤੱਕ ਕਿ ਚਿੱਤਰ ਬਣਾਉਣਾ ਵਰਗੇ ਕਾਰਜ ਕਾਫ਼ੀ ਜ਼ਿਆਦਾ ਆਧੁਨਿਕ ਅਤੇ ਭਰੋਸੇਮੰਦ ਬਣ ਸਕਦੇ ਹਨ।

Meta ਦੇ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਤੋਂ, ਇਹ ਏਕੀਕਰਣ ਕਈ ਰਣਨੀਤਕ ਉਦੇਸ਼ਾਂ ਦੀ ਪੂਰਤੀ ਕਰਦਾ ਹੈ। ਪਹਿਲਾਂ, ਇਹ ਇਸਦੇ ਮੁੱਖ ਉਤਪਾਦਾਂ ਵਿੱਚ ਉਪਭੋਗਤਾ ਅਨੁਭਵ ਨੂੰ ਵਧਾਉਂਦਾ ਹੈ, ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਸ਼ਮੂਲੀਅਤ ਅਤੇ ਪਲੇਟਫਾਰਮ ਸਟਿੱਕੀਨੈੱਸ ਨੂੰ ਵਧਾਉਂਦਾ ਹੈ। ਦੂਜਾ, ਇਹ Llama 4 ਲਈ ਇੱਕ ਬੇਮਿਸਾਲ ਅਸਲ-ਸੰਸਾਰ ਟੈਸਟਿੰਗ ਗਰਾਊਂਡ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਪਰਸਪਰ ਕ੍ਰਿਆ ਡੇਟਾ (ਸੰਭਾਵਤ ਤੌਰ ‘ਤੇ ਅਗਿਆਤ ਅਤੇ ਗੋਪਨੀਯਤਾ ਨੀਤੀਆਂ ਅਨੁਸਾਰ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ) ਤਿਆਰ ਕਰਦਾ ਹੈ ਜੋ ਸੁਧਾਰ ਲਈ ਖੇਤਰਾਂ ਦੀ ਪਛਾਣ ਕਰਨ ਅਤੇ ਭਵਿੱਖ ਦੇ ਮਾਡਲ ਦੁਹਰਾਓ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਅਨਮੋਲ ਹੋ ਸਕਦਾ ਹੈ। ਇਹ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਫੀਡਬੈਕ ਲੂਪ ਬਣਾਉਂਦਾ ਹੈ, Meta ਦੇ ਵਿਸ਼ਾਲ ਉਪਭੋਗਤਾ ਅਧਾਰ ਦਾ ਲਾਭ ਉਠਾ ਕੇ ਇਸਦੀ AI ਤਕਨਾਲੋਜੀ ਨੂੰ ਲਗਾਤਾਰ ਸੁਧਾਰਦਾ ਹੈ। ਇਹ ਏਕੀਕਰਣ Meta ਦੇ AI ਯਤਨਾਂ ਨੂੰ ਬਹੁਤ ਜ਼ਿਆਦਾ ਦਿਖਣਯੋਗ ਅਤੇ ਇਸਦੇ ਪ੍ਰਾਇਮਰੀ ਕਾਰੋਬਾਰ ‘ਤੇ ਸਿੱਧਾ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਬਣਾਉਂਦਾ ਹੈ।

Behemoth ਦਾ ਪਰਛਾਵਾਂ: Meta ਦੀਆਂ ਉੱਚ-ਪੱਧਰੀ ਅਭਿਲਾਸ਼ਾਵਾਂ ਦੀ ਇੱਕ ਝਲਕ

ਜਦੋਂ ਕਿ Scout ਅਤੇ Maverick ਵਰਤਮਾਨ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ, Meta ਪਹਿਲਾਂ ਹੀ Llama 4 Behemoth ਨਾਲ ਆਪਣੇ ਭਵਿੱਖ ਦੇ ਮਾਰਗ ਦਾ ਸੰਕੇਤ ਦੇ ਰਿਹਾ ਹੈ। ਇਹ ਮਾਡਲ, ਜੋ ਅਜੇ ਵੀ ਤੀਬਰ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚੋਂ ਲੰਘ ਰਿਹਾ ਹੈ, Meta ਦੇ ਅੰਤਮ ਪਾਵਰਹਾਊਸ ਵਜੋਂ ਸਥਾਪਤ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ AI ਸਮਰੱਥਾ ਦੇ ਬਿਲਕੁਲ ਸਿਖਰ ‘ਤੇ ਮੁਕਾਬਲਾ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। Meta ਦੇ CEO Mark Zuckerberg ਨੇ ਦਲੇਰੀ ਨਾਲ ਦਾਅਵਾ ਕੀਤਾ ਹੈ ਕਿ ਇਸਦਾ ਉਦੇਸ਼ ‘ਦੁਨੀਆ ਦਾ ਸਭ ਤੋਂ ਉੱਚ ਪ੍ਰਦਰਸ਼ਨ ਕਰਨ ਵਾਲਾ ਬੇਸ ਮਾਡਲ’ ਬਣਨਾ ਹੈ।

Behemoth ਬਾਰੇ ਸਾਂਝੇ ਕੀਤੇ ਗਏ ਅੰਕੜੇ ਹੈਰਾਨ ਕਰਨ ਵਾਲੇ ਹਨ: ਇਸ ਵਿੱਚ ਕਥਿਤ ਤੌਰ ‘ਤੇ 288 ਬਿਲੀਅਨ ਸਰਗਰਮ ਪੈਰਾਮੀਟਰ ਹਨ, ਜੋ 2 ਟ੍ਰਿਲੀਅਨ ਪੈਰਾਮੀਟਰਾਂ ਦੇ ਕੁੱਲ ਪੂਲ ਵਿੱਚੋਂ ਲਏ ਗਏ ਹਨ। ਇਹ ਵਿਸ਼ਾਲ ਪੈਮਾਨਾ ਇਸਨੂੰ ਫਰੰਟੀਅਰ ਮਾਡਲਾਂ ਦੀ ਸ਼੍ਰੇਣੀ ਵਿੱਚ ਪੱਕਾ ਕਰਦਾ ਹੈ, ਆਕਾਰ ਵਿੱਚ ਤੁਲਨਾਤਮਕ ਜਾਂ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਵਰਤਮਾਨ ਵਿੱਚ ਉਪਲਬਧ ਜਾਂ ਅਫਵਾਹਾਂ ਵਾਲੇ ਕੁਝ ਸਭ ਤੋਂ ਵੱਡੇ ਮਾਡਲਾਂ ਤੋਂ ਵੱਧ। ‘ਸਰਗਰਮ’ ਅਤੇ ‘ਕੁੱਲ’ ਪੈਰਾਮੀਟਰਾਂ ਵਿਚਕਾਰ ਅੰਤਰ ਸੰਭਾਵਤ ਤੌਰ ‘ਤੇ Mixture of Experts (MoE) ਆਰਕੀਟੈਕਚਰ ਦੀ ਵਰਤੋਂ ਵੱਲ ਇਸ਼ਾਰਾ ਕਰਦਾ ਹੈ, ਜਿੱਥੇ ਕਿਸੇ ਵੀ ਦਿੱਤੇ ਗਏ ਕਾਰਜ ਲਈ ਕੁੱਲ ਪੈਰਾਮੀਟਰਾਂ ਦਾ ਸਿਰਫ ਇੱਕ ਹਿੱਸਾ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਇਨਫਰੈਂਸ ਦੌਰਾਨ ਅਨੁਪਾਤਕ ਤੌਰ ‘ਤੇ ਵਿਸ਼ਾਲ ਕੰਪਿਊਟੇਸ਼ਨਲ ਲਾਗਤ ਤੋਂ ਬਿਨਾਂ ਵਿਸ਼ਾਲ ਪੈਮਾਨੇ ਦੀ ਆਗਿਆ ਮਿਲਦੀ ਹੈ।

ਹਾਲਾਂਕਿ Behemoth ਅਜੇ ਜਾਰੀ ਨਹੀਂ ਕੀਤਾ ਗਿਆ ਹੈ, Meta ਪਹਿਲਾਂ ਹੀ ਇਸਦੇ ਚੱਲ ਰਹੇ ਵਿਕਾਸ ਦੇ ਅਧਾਰ ‘ਤੇ ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਦਾਅਵੇ ਕਰ ਰਿਹਾ ਹੈ। ਕੰਪਨੀ ਸੁਝਾਅ ਦਿੰਦੀ ਹੈ ਕਿ ਇਹ GPT-4.5 (ਸੰਭਾਵਤ ਤੌਰ ‘ਤੇ ਇੱਕ ਕਾਲਪਨਿਕ ਜਾਂ ਆਉਣ ਵਾਲਾ OpenAI ਮਾਡਲ) ਅਤੇ Claude Sonnet 3.7 (Anthropic ਤੋਂ ਇੱਕ ਸੰਭਾਵਿਤ ਮਾਡਲ) ਵਰਗੇ ਸ਼ਕਤੀਸ਼ਾਲੀ ਪ੍ਰਤੀਯੋਗੀਆਂ ਨੂੰ ਖਾਸ ਤੌਰ ‘ਤੇ ‘ਕਈ STEM ਬੈਂਚਮਾਰਕਾਂ’ ‘ਤੇ ਪਛਾੜ ਸਕਦਾ ਹੈ। STEM (ਵਿਗਿਆਨ, ਤਕਨਾਲੋਜੀ, ਇੰਜੀਨੀਅਰਿੰਗ, ਅਤੇ ਗਣਿਤ) ਬੈਂਚਮਾਰਕ ਖਾਸ ਤੌਰ ‘ਤੇ ਚੁਣੌਤੀਪੂਰਨ ਟੈਸਟ ਹਨ ਜੋ ਗੁੰਝਲਦਾਰ ਗਣਿਤਕ ਤਰਕ, ਵਿਗਿਆਨਕ ਸਮਝ, ਅਤੇ ਕੋਡਿੰਗ ਮੁਹਾਰਤ ਵਰਗੇ ਖੇਤਰਾਂ ਵਿੱਚ AI ਦੀ ਯੋਗਤਾ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤੇ ਗਏ ਹਨ। ਇਹਨਾਂ ਡੋਮੇਨਾਂ ਵਿੱਚ ਸਫਲਤਾ ਨੂੰ ਅਕਸਰ ਇੱਕ ਮਾਡਲ ਦੀਆਂ ਉੱਨਤ ਬੋਧਾਤਮਕ ਸਮਰੱਥਾਵਾਂ ਦਾ ਮੁੱਖ ਸੂਚਕ ਮੰਨਿਆ ਜਾਂਦਾ ਹੈ।

Behemoth ਦਾ ਵਿਕਾਸ Meta ਦੀ ਸਿਰਫ਼ AI ਦੌੜ ਵਿੱਚ ਹਿੱਸਾ ਲੈਣ ਦੀ ਹੀ ਨਹੀਂ, ਸਗੋਂ ਇਸਦੀ ਅਗਵਾਈ ਕਰਨ ਦੀ ਅਭਿਲਾਸ਼ਾ ਨੂੰ ਰੇਖਾਂਕਿਤ ਕਰਦਾ ਹੈ, ਸਮਝੇ ਗਏ ਮੋਹਰੀਆਂ ਨੂੰ ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਚੁਣੌਤੀ ਦਿੰਦਾ ਹੈ। ਅਜਿਹੇ ਵਿਸ਼ਾਲ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਬਹੁਤ ਜ਼ਿਆਦਾ ਕੰਪਿਊਟੇਸ਼ਨਲ ਸਰੋਤਾਂ, ਮਹੱਤਵਪੂਰਨ ਇੰਜੀਨੀਅਰਿੰਗ ਮੁਹਾਰਤ, ਅਤੇ ਵਿਸ਼ਾਲ ਡੇਟਾਸੈਟਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਜੋ AI ਖੋਜ ਅਤੇ ਵਿਕਾਸ ਵਿੱਚ Meta ਦੇ ਨਿਵੇਸ਼ ਦੇ ਪੈਮਾਨੇ ਨੂੰ ਉਜਾਗਰ ਕਰਦਾ ਹੈ। Behemoth ਦੀ ਅੰਤਮ ਰਿਲੀਜ਼, ਜਦੋਂ ਵੀ ਇਹ ਹੁੰਦੀ ਹੈ, ਨੂੰ ਅਤਿ-ਆਧੁਨਿਕ AI ਪ੍ਰਦਰਸ਼ਨ ਲਈ ਇੱਕ ਸੰਭਾਵੀ ਨਵੇਂ ਬੈਂਚਮਾਰਕ ਵਜੋਂ ਨੇੜਿਓਂ ਦੇਖਿਆ ਜਾਵੇਗਾ।

ਆਰਕੀਟੈਕਚਰਲ ਈਵੇਲੂਸ਼ਨ: Mixture of Experts (MoE) ਨੂੰ ਅਪਣਾਉਣਾ

Llama 4 ਪੀੜ੍ਹੀ ਨੂੰ ਆਧਾਰ ਬਣਾਉਣ ਵਾਲਾ ਇੱਕ ਮੁੱਖ ਤਕਨੀਕੀ ਬਦਲਾਅ Meta ਦੁਆਰਾ ‘mixture of experts’ (MoE) ਆਰਕੀਟੈਕਚਰ ਨੂੰ ਅਪਣਾਉਣਾ ਹੈ। ਇਹ ਰਵਾਇਤੀ ਸੰਘਣੇ ਮਾਡਲ ਆਰਕੀਟੈਕਚਰ ਤੋਂ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਵਿਦਾਇਗੀ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਜਿੱਥੇ ਮਾਡਲ ਦੇ ਸਾਰੇ ਹਿੱਸੇ ਹਰ ਗਣਨਾ ਲਈ ਸਰਗਰਮ ਹੁੰਦੇ ਹਨ।

ਇੱਕ MoE ਆਰਕੀਟੈਕਚਰ ਵਿੱਚ, ਮਾਡਲ ਨੂੰ ਸੰਕਲਪਿਕ ਤੌਰ ‘ਤੇ ਕਈ ਛੋਟੇ ‘ਮਾਹਰ’ ਉਪ-ਨੈੱਟਵਰਕਾਂ ਵਿੱਚ ਵੰਡਿਆ ਜਾਂਦਾ ਹੈ, ਹਰੇਕ ਵੱਖ-ਵੱਖ ਕਿਸਮਾਂ ਦੇ ਡੇਟਾ ਜਾਂ ਕਾਰਜਾਂ ਵਿੱਚ ਮੁਹਾਰਤ ਰੱਖਦਾ ਹੈ। ਇੱਕ ਗੇਟਿੰਗ ਮਕੈਨਿਜ਼ਮ, ਜ਼ਰੂਰੀ ਤੌਰ ‘ਤੇ ਇੱਕ ਟ੍ਰੈਫਿਕ ਕੰਟਰੋਲਰ, ਆਉਣ ਵਾਲੇ ਡੇਟਾ ਨੂੰ ਸਿਰਫ ਉਸ ਖਾਸ ਜਾਣਕਾਰੀ ਦੇ ਟੁਕੜੇ ਦੀ ਪ੍ਰਕਿਰਿਆ ਕਰਨ ਲਈ ਲੋੜੀਂਦੇ ਸਭ ਤੋਂ ਢੁਕਵੇਂ ਮਾਹਰ(ਆਂ) ਨੂੰ ਭੇਜਦਾ ਹੈ।

ਇਸ ਪਹੁੰਚ ਦੇ ਮੁੱਖ ਫਾਇਦੇ ਹਨ:

  1. ਕੰਪਿਊਟੇਸ਼ਨਲ ਕੁਸ਼ਲਤਾ: ਕਿਸੇ ਵੀ ਦਿੱਤੇ ਗਏ ਇਨਪੁਟ ਲਈ ਮਾਡਲ ਦੇ ਕੁੱਲ ਪੈਰਾਮੀਟਰਾਂ ਦੇ ਸਿਰਫ ਇੱਕ ਹਿੱਸੇ ਨੂੰ ਸਰਗਰਮ ਕਰਕੇ, MoE ਮਾਡਲ ਸਮਾਨ ਕੁੱਲ ਆਕਾਰ ਦੇ ਸੰਘਣੇ ਮਾਡਲਾਂ ਦੀ ਤੁਲਨਾ ਵਿੱਚ ਇਨਫਰੈਂਸ (ਆਉਟਪੁੱਟ ਤਿਆਰ ਕਰਨ ਦੀ ਪ੍ਰਕਿਰਿਆ) ਦੌਰਾਨ ਕਾਫ਼ੀ ਤੇਜ਼ ਅਤੇ ਘੱਟ ਕੰਪਿਊਟੇਸ਼ਨਲ ਤੌਰ ‘ਤੇ ਮਹਿੰਗੇ ਹੋ ਸਕਦੇ ਹਨ। ਇਹ ਵੱਡੇ ਮਾਡਲਾਂ ਨੂੰ ਲਾਗਤ-ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਤੈਨਾਤ ਕਰਨ ਅਤੇ ਉਪਭੋਗਤਾ ਪਰਸਪਰ ਕ੍ਰਿਆਵਾਂ ਵਿੱਚ ਘੱਟ ਲੇਟੈਂਸੀ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ।
  2. ਸਕੇਲੇਬਿਲਟੀ: MoE ਹਰੇਕ ਇਨਫਰੈਂਸ ਕਦਮ ਲਈ ਕੰਪਿਊਟੇਸ਼ਨਲ ਲੋੜਾਂ ਵਿੱਚ ਅਨੁਸਾਰੀ ਰੇਖਿਕ ਵਾਧੇ ਤੋਂ ਬਿਨਾਂ ਬਹੁਤ ਵੱਡੇ ਕੁੱਲ ਪੈਰਾਮੀਟਰ ਗਿਣਤੀ (ਜਿਵੇਂ ਕਿ Behemoth ਦੇ 2 ਟ੍ਰਿਲੀਅਨ) ਵਾਲੇ ਮਾਡਲਾਂ ਦੀ ਸਿਰਜਣਾ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ। ਇਹ ਮਾਡਲ ਸਮਰੱਥਾ ਨੂੰ ਸਕੇਲ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ ਜੋ ਸੰਘਣੇ ਆਰਕੀਟੈਕਚਰ ਨਾਲ ਵਿਹਾਰਕ ਹੋ ਸਕਦਾ ਹੈ।
  3. ਮੁਹਾਰਤ: ਹਰੇਕ ਮਾਹਰ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਬਹੁਤ ਵਿਸ਼ੇਸ਼ ਗਿਆਨ ਵਿਕਸਿਤ ਕਰ ਸਕਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਹਰ ਚੀਜ਼ ਨੂੰ ਸੰਭਾਲਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਨ ਵਾਲੇ ਇੱਕ ਸਿੰਗਲ ਮੋਨੋਲਿਥਿਕ ਮਾਡਲ ਦੀ ਤੁਲਨਾ ਵਿੱਚ ਖਾਸ ਕਿਸਮ ਦੇ ਕਾਰਜਾਂ ‘ਤੇ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਹੁੰਦਾ ਹੈ।

Llama 4 ਲਈ MoE ਵਿੱਚ Meta ਦਾ ਬਦਲਾਅ AI ਉਦਯੋਗ ਵਿੱਚ ਇੱਕ ਵਿਆਪਕ ਰੁਝਾਨ ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ Google ਅਤੇ Mistral AI ਵਰਗੀਆਂ ਕੰਪਨੀਆਂ ਵੀ ਆਪਣੇ ਪ੍ਰਮੁੱਖ ਮਾਡਲਾਂ ਵਿੱਚ ਇਸ ਤਕਨੀਕ ਦੀ ਵਰਤੋਂ ਕਰ ਰਹੀਆਂ ਹਨ। ਇਹ ਇੱਕ ਵਧ ਰਹੀ ਸਮਝ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ AI ਵਿਕਾਸ ਅਤੇ ਤੈਨਾਤੀ ਦੀਆਂ ਵਧਦੀਆਂ ਲਾਗਤਾਂ ਦਾ ਪ੍ਰਬੰਧਨ ਕਰਦੇ ਹੋਏ ਪ੍ਰਦਰਸ਼ਨ ਲਿਫਾਫੇ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣ ਵਿੱਚ ਆਰਕੀਟੈਕਚਰਲ ਨਵੀਨਤਾ ਓਨੀ ਹੀ ਮਹੱਤਵਪੂਰਨ ਹੈ ਜਿੰਨੀ ਕਿ ਸਿਰਫ਼ ਪੈਮਾਨਾ। ਇਹ ਆਰਕੀਟੈਕਚਰਲ ਚੋਣ ਸੰਭਾਵਤ ਤੌਰ ‘ਤੇ Maverick (ਘੱਟ ਸਰਗਰਮ ਪੈਰਾਮੀਟਰਾਂ ਨਾਲ ਉੱਚ ਪ੍ਰਦਰਸ਼ਨ ਪ੍ਰਾਪਤ ਕਰਨਾ) ਅਤੇ ਵਿਸ਼ਾਲ Behemoth ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਦੀ ਸੰਭਾਵਨਾ ਦੋਵਾਂ ਲਈ ਕੀਤੇ ਗਏ ਪ੍ਰਦਰਸ਼ਨ ਅਤੇ ਕੁਸ਼ਲਤਾ ਦੇ ਦਾਅਵਿਆਂ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਯੋਗਦਾਨ ਪਾਉਂਦੀ ਹੈ। Meta ਦੇ MoE ਲਾਗੂਕਰਨ ਦੇ ਵੇਰਵੇ AI ਖੋਜਕਰਤਾਵਾਂ ਲਈ ਡੂੰਘੀ ਦਿਲਚਸਪੀ ਵਾਲੇ ਹੋਣਗੇ।

‘ਓਪਨ’ ਦੀਆਂ ਜਟਿਲਤਾਵਾਂ: Llama 4 ਅਤੇ ਲਾਇਸੈਂਸਿੰਗ ਸਵਾਲ

Meta ਆਪਣੇ Llama ਮਾਡਲਾਂ ਨੂੰ, ਨਵੇਂ Llama 4 ਪਰਿਵਾਰ ਸਮੇਤ, ‘ਓਪਨ-ਸੋਰਸ’ ਵਜੋਂ ਲੇਬਲ ਕਰਨਾ ਜਾਰੀ ਰੱਖਦਾ ਹੈ। ਇਹ ਸ਼ਬਦਾਵਲੀ, ਹਾਲਾਂਕਿ, Llama ਲਾਇਸੈਂਸ ਦੀਆਂ ਖਾਸ ਸ਼ਰਤਾਂ ਦੇ ਕਾਰਨ ਤਕਨਾਲੋਜੀ ਭਾਈਚਾਰੇ ਦੇ ਅੰਦਰ ਵਿਵਾਦ ਦਾ ਇੱਕ ਬਿੰਦੂ ਬਣੀ ਹੋਈ ਹੈ। ਜਦੋਂ ਕਿ ਮਾਡਲ ਅਸਲ ਵਿੱਚ ਡਾਊਨਲੋਡ ਅਤੇ ਸੋਧ ਲਈ ਜਨਤਕ ਤੌਰ ‘ਤੇ ਉਪਲਬਧ ਕਰਵਾਏ ਜਾਂਦੇ ਹਨ, ਲਾਇਸੈਂਸ ਵਿੱਚ ਪਾਬੰਦੀਆਂ ਸ਼ਾਮਲ ਹੁੰਦੀਆਂ ਹਨ ਜੋ ਇਸਨੂੰ ਰਵਾਇਤੀ ਓਪਨ-ਸੋਰਸ ਪਰਿਭਾਸ਼ਾਵਾਂ ਤੋਂ ਵੱਖ ਕਰਦੀਆਂ ਹਨ।

ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਪਾਬੰਦੀ ਇਹ ਨਿਰਧਾਰਤ ਕਰਦੀ ਹੈ ਕਿ 700 ਮਿਲੀਅਨ ਤੋਂ ਵੱਧ ਮਾਸਿਕ ਸਰਗਰਮ ਉਪਭੋਗਤਾਵਾਂ (MAU) ਵਾਲੀਆਂ ਵਪਾਰਕ ਸੰਸਥਾਵਾਂ ਨੂੰ ਆਪਣੇ ਉਤਪਾਦਾਂ ਜਾਂ ਸੇਵਾਵਾਂ ਵਿੱਚ Llama 4 ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ Meta ਤੋਂ ਖਾਸ ਇਜਾਜ਼ਤ ਲੈਣੀ ਚਾਹੀਦੀ ਹੈ। ਇਹ ਥ੍ਰੈਸ਼ਹੋਲਡ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ Meta ਦੇ ਸਭ ਤੋਂ ਵੱਡੇ ਪ੍ਰਤੀਯੋਗੀਆਂ - Google, Microsoft, Apple, ByteDance, ਅਤੇ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਹੋਰਾਂ ਵਰਗੀਆਂ ਕੰਪਨੀਆਂ - ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾਉਂਦਾ ਹੈ, ਉਹਨਾਂ ਨੂੰ ਇੱਕ ਵੱਖਰੇ ਸਮਝੌਤੇ ਤੋਂ ਬਿਨਾਂ Meta ਦੀ ਉੱਨਤ AI ਤਕਨਾਲੋਜੀ ਦਾ ਸੁਤੰਤਰ ਤੌਰ ‘ਤੇ ਲਾਭ ਉਠਾਉਣ ਤੋਂ ਰੋਕਦਾ ਹੈ।

ਇਸ ਲਾਇਸੈਂਸਿੰਗ ਪਹੁੰਚ ਨੇ ਆਲੋਚਨਾ ਖਿੱਚੀ ਹੈ, ਖਾਸ ਤੌਰ ‘ਤੇ Open Source Initiative (OSI) ਤੋਂ, ਜੋ ਓਪਨ ਸੋਰਸ ਦੀ ਪਰਿਭਾਸ਼ਾ ਦਾ ਇੱਕ ਵਿਆਪਕ ਤੌਰ ‘ਤੇ ਸਤਿਕਾਰਤ ਪ੍ਰਬੰਧਕ ਹੈ। 2023 ਵਿੱਚ, ਸਮਾਨ ਪਾਬੰਦੀਆਂ ਵਾਲੇ ਪੁਰਾਣੇ Llama ਸੰਸਕਰਣਾਂ ਦੇ ਸਬੰਧ ਵਿੱਚ, OSI ਨੇ ਕਿਹਾ ਕਿ ਅਜਿਹੀਆਂ ਸੀਮਾਵਾਂ ਲਾਇਸੈਂਸ ਨੂੰ ‘’ਓਪਨ ਸੋਰਸ’ ਦੀ ਸ਼੍ਰੇਣੀ ਤੋਂ ਬਾਹਰ’ ਲੈ ਜਾਂਦੀਆਂ ਹਨ। OSI-ਪਰਿਭਾਸ਼ਿਤ ਓਪਨ ਸੋਰਸ ਦਾ ਮੁੱਖ ਸਿਧਾਂਤ ਗੈਰ-ਵਿਤਕਰਾ ਹੈ, ਭਾਵ ਲਾਇਸੈਂਸਾਂ ਨੂੰ ਇਹ ਸੀਮਤ ਨਹੀਂ ਕਰਨਾ ਚਾਹੀਦਾ ਕਿ ਕੌਣ ਸੌਫਟਵੇਅਰ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦਾ ਹੈ ਜਾਂ ਕਿਸ ਉਦੇਸ਼ ਲਈ, ਜਿਸ ਵਿੱਚ ਵੱਡੇ ਪ੍ਰਤੀਯੋਗੀਆਂ ਦੁਆਰਾ ਵਪਾਰਕ ਵਰਤੋਂ ਸ਼ਾਮਲ ਹੈ।

Meta ਦੀ ਰਣਨੀਤੀ ਨੂੰ ਸ਼ੁੱਧ ਓਪਨ ਸੋਰਸ ਦੀ ਬਜਾਏ ‘ਓਪਨ ਐਕਸੈਸ’ ਜਾਂ ‘ਕਮਿਊਨਿਟੀ ਲਾਇਸੈਂਸਿੰਗ’ ਦੇ ਇੱਕ ਰੂਪ ਵਜੋਂ ਸਮਝਿਆ ਜਾ ਸਕਦਾ ਹੈ। ਇਹ ਖੋਜਕਰਤਾਵਾਂ, ਸਟਾਰਟਅੱਪਾਂ, ਛੋਟੀਆਂ ਕੰਪਨੀਆਂ, ਅਤੇ ਵਿਅਕਤੀਗਤ ਡਿਵੈਲਪਰਾਂ ਲਈ ਵਿਆਪਕ ਪਹੁੰਚ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ, ਨਵੀਨਤਾ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦਾ ਹੈ ਅਤੇ Llama ਦੇ ਆਲੇ ਦੁਆਲੇ ਇੱਕ ਈਕੋਸਿਸਟਮ ਬਣਾਉਂਦਾ ਹੈ। ਇਹ ਵਿਕਾਸ ਨੂੰ ਤੇਜ਼ ਕਰ ਸਕਦਾ ਹੈ, ਬੱਗਾਂ ਦੀ ਪਛਾਣ ਕਰ ਸਕਦਾ ਹੈ, ਅਤੇ ਸਦ