Meta ਦੇ Llama ਲਾਰਜ ਲੈਂਗਵੇਜ ਮਾਡਲ (LLM) ਦਾ ਸਫ਼ਰ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਭਾਈਚਾਰੇ (Artificial intelligence community) ਵਿੱਚ ਬਹੁਤ ਜ਼ਿਆਦਾ ਜਾਂਚ ਅਤੇ ਬਹਿਸ ਦਾ ਵਿਸ਼ਾ ਰਿਹਾ ਹੈ। Llama 3 ਅਤੇ Llama 4 ਦੀ ਰਿਲੀਜ਼ ਦੇ ਵਿਚਕਾਰ ਲਗਭਗ ਇੱਕ ਸਾਲ ਦਾ ਸਮਾਂ ਸੀ, ਜੋ ਕਿ AI ਦੇ ਤੇਜ਼ੀ ਨਾਲ ਵਿਕਸਤ ਹੋ ਰਹੇ ਖੇਤਰ ਵਿੱਚ ਬਹੁਤ ਲੰਬਾ ਸਮਾਂ ਹੈ। ਜਦੋਂ ਕਿ ਸ਼ੁਰੂ ਵਿੱਚ ਇਸਨੂੰ OpenAI ਦੀਆਂ ਪੇਸ਼ਕਸ਼ਾਂ ਵਰਗੇ ਪ੍ਰੋਪਰਾਈਟਰੀ ਮਾਡਲਾਂ (proprietary models) ਦੇ ਵਿਕਲਪ ਵਜੋਂ ਸਲਾਹਿਆ ਗਿਆ ਸੀ, ਪਰ ਹਾਲ ਹੀ ਦੇ ਵਿਕਾਸਾਂ ਨੇ ਧਾਰਨਾ ਵਿੱਚ ਬਦਲਾਅ ਦਾ ਸੁਝਾਅ ਦਿੱਤਾ ਹੈ, ਕੁਝ ਲੋਕਾਂ ਨੇ AI ਨਵੀਨਤਾ ਦੇ ਮੋਹਰੀ ਕਿਨਾਰੇ ‘ਤੇ Llama ਦੀ ਨਿਰੰਤਰ ਪ੍ਰਸੰਗਿਕਤਾ ‘ਤੇ ਸਵਾਲ ਉਠਾਏ ਹਨ।
LlamaCon ਦੀਆਂ ਨਿਰਾਸ਼ਾਵਾਂ ਅਤੇ ਬਦਲਦੀਆਂ ਉਮੀਦਾਂ (LlamaCon: Disappointments and Shifting Expectations)
LlamaCon ਵਿੱਚ, Meta ਦੀ ਓਪਨ-ਸੋਰਸ LLM ਨੂੰ ਸਮਰਪਿਤ ਉਦਘਾਟਨੀ ਕਾਨਫਰੰਸ ਵਿੱਚ, ਨਾ ਪੂਰੀਆਂ ਹੋਈਆਂ ਉਮੀਦਾਂ ਦਾ ਮਾਹੌਲ ਬਣਿਆ ਰਿਹਾ। ਹਾਜ਼ਰ ਹੋਏ ਕਈ ਡਿਵੈਲਪਰਾਂ ਨੇ ਦੱਸਿਆ ਕਿ ਉਨ੍ਹਾਂ ਨੇ ਇੱਕ ਵਧੀਆ ਤਰਕ ਮਾਡਲ (reasoning model) ਦੀ ਉਮੀਦ ਕੀਤੀ ਸੀ, ਜਾਂ ਘੱਟੋ-ਘੱਟ ਇੱਕ ਪਰੰਪਰਾਗਤ ਮਾਡਲ ਦੀ ਉਮੀਦ ਕੀਤੀ ਸੀ ਜੋ ਕਿ DeepSeek ਦੇ V3 ਅਤੇ Qwen ਵਰਗੇ ਮੁਕਾਬਲੇਬਾਜ਼ਾਂ ਨੂੰ ਪਛਾੜਨ ਦੇ ਸਮਰੱਥ ਹੋਵੇ, Qwen ਜੋ ਕਿ ਅਲੀਬਾਬਾ ਦੇ ਕਲਾਉਡ ਕੰਪਿਊਟਿੰਗ ਡਿਵੀਜ਼ਨ (Alibaba’s cloud computing division) ਦੁਆਰਾ ਵਿਕਸਤ ਮਾਡਲਾਂ ਦਾ ਇੱਕ ਸੂਟ ਹੈ।
ਅਜਿਹੀਆਂ ਘੋਸ਼ਣਾਵਾਂ ਦੀ ਅਣਹੋਂਦ ਨੇ ਚਿੰਤਾਵਾਂ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕੀਤਾ ਕਿ Llama AI ਸਰਵਉੱਚਤਾ ਦੀ ਦੌੜ ਵਿੱਚ ਪਿੱਛੇ ਰਹਿ ਰਿਹਾ ਹੈ। ਕਾਨਫਰੰਸ ਤੋਂ ਠੀਕ ਇੱਕ ਮਹੀਨਾ ਪਹਿਲਾਂ, Meta ਨੇ ਆਪਣੇ Llama ਪਰਿਵਾਰ ਦੀ ਚੌਥੀ ਪੀੜ੍ਹੀ ਲਾਂਚ ਕੀਤੀ ਸੀ, ਜਿਸ ਵਿੱਚ ਓਪਨ-ਵੇਟ ਮਾਡਲ Llama 4 Scout ਅਤੇ Llama 4 Maverick ਸ਼ਾਮਲ ਸਨ। Scout ਨੂੰ ਇੱਕ ਸਿੰਗਲ GPU ‘ਤੇ ਕੁਸ਼ਲ ਪ੍ਰਦਰਸ਼ਨ ਲਈ ਇੰਜੀਨੀਅਰ ਕੀਤਾ ਗਿਆ ਸੀ, ਜਦੋਂ ਕਿ Maverick ਨੂੰ ਦੂਜੇ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲਾਂ (foundation models) ਦਾ ਮੁਕਾਬਲਾ ਕਰਨ ਲਈ ਇੱਕ ਵੱਡੇ ਮਾਡਲ ਵਜੋਂ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਗਿਆ ਸੀ।
Scout ਅਤੇ Maverick ਤੋਂ ਇਲਾਵਾ, Meta ਨੇ Llama 4 Behemoth ਦੀ ਵੀ ਇੱਕ ਝਲਕ ਦਿਖਾਈ, ਜੋ ਕਿ ਇੱਕ ਵੱਡਾ "ਅਧਿਆਪਕ ਮਾਡਲ" ਹੈ ਜੋ ਅਜੇ ਵੀ ਸਿਖਲਾਈ ਅਧੀਨ ਹੈ। Behemoth ਦਾ ਉਦੇਸ਼ ਡਿਸਟਿਲੇਸ਼ਨ (distillation) ਦੀ ਸਹੂਲਤ ਦੇਣਾ ਹੈ, ਇੱਕ ਵੱਡੇ, ਵਧੇਰੇ ਆਮ ਮਾਡਲ ਤੋਂ ਛੋਟੇ, ਵਿਸ਼ੇਸ਼ ਮਾਡਲ ਬਣਾਉਣ ਦੀ ਇੱਕ ਤਕਨੀਕ ਹੈ।
ਹਾਲਾਂਕਿ, ਰਿਪੋਰਟਾਂ ਸਾਹਮਣੇ ਆਈਆਂ ਹਨ ਜੋ Behemoth ਦੀ ਰਿਲੀਜ਼ ਵਿੱਚ ਦੇਰੀ ਅਤੇ Llama 4 ਸੂਟ ਨਾਲ ਮੁਕਾਬਲੇ ਵਾਲੀ ਕਾਰਗੁਜ਼ਾਰੀ ਪ੍ਰਾਪਤ ਕਰਨ ਵਿੱਚ ਚੁਣੌਤੀਆਂ ਦਾ ਸੰਕੇਤ ਦਿੰਦੀਆਂ ਹਨ। state-of-the-art ਸਮਰੱਥਾਵਾਂ ਦੇ Meta ਦੇ ਦਾਅਵਿਆਂ ਦੇ ਬਾਵਜੂਦ, ਕੁਝ ਡਿਵੈਲਪਰਾਂ ਵਿੱਚ ਇਹ ਧਾਰਨਾ ਸੀ ਕਿ Llama ਹੁਣ ਮੋਹਰੀ ਨਹੀਂ ਰਿਹਾ ਹੈ।
ਮੁਕਾਬਲੇਬਾਜ਼ਾਂ ਦਾ ਉਭਾਰ: Qwen ਅਤੇ DeepSeek (The Rise of Competitors: Qwen and DeepSeek)
LlamaCon ਅਤੇ Llama 4 ਮਾਡਲਾਂ ਦੇ ਆਲੇ ਦੁਆਲੇ ਦੀ ਨਿਰਾਸ਼ਾ ਇੱਕ ਵਿਆਪਕ ਭਾਵਨਾ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ ਕਿ Meta ਦੇ ਓਪਨ-ਸੋਰਸ LLM ਤਕਨੀਕੀ ਪ੍ਰਦਰਸ਼ਨ ਅਤੇ ਡਿਵੈਲਪਰ ਉਤਸ਼ਾਹ ਦੋਵਾਂ ਦੇ ਮਾਮਲੇ ਵਿੱਚ ਆਪਣੀ ਗਤੀ ਗੁਆ ਰਹੇ ਹਨ। ਜਦੋਂ ਕਿ Meta ਓਪਨ-ਸੋਰਸ ਸਿਧਾਂਤਾਂ, ਈਕੋਸਿਸਟਮ ਬਿਲਡਿੰਗ (ecosystem building) ਅਤੇ ਨਵੀਨਤਾ ਪ੍ਰਤੀ ਆਪਣੀ ਵਚਨਬੱਧਤਾ ‘ਤੇ ਜ਼ੋਰ ਦਿੰਦਾ ਹੈ, DeepSeek, Qwen ਅਤੇ OpenAI ਵਰਗੇ ਮੁਕਾਬਲੇਬਾਜ਼ ਤਰਕ, ਟੂਲ ਦੀ ਵਰਤੋਂ ਅਤੇ ਅਸਲ-ਸੰਸਾਰ ਤੈਨਾਤੀ ਵਰਗੇ ਮਹੱਤਵਪੂਰਨ ਖੇਤਰਾਂ ਵਿੱਚ ਤੇਜ਼ੀ ਨਾਲ ਅੱਗੇ ਵੱਧ ਰਹੇ ਹਨ।
ਇੱਕ ਡਿਵੈਲਪਰ, Vineeth Sai Varikuntla ਨੇ ਆਪਣੀ ਨਿਰਾਸ਼ਾ ਜ਼ਾਹਰ ਕਰਦੇ ਹੋਏ ਕਿਹਾ ਕਿ ਉਸਨੇ ਉਮੀਦ ਕੀਤੀ ਸੀ ਕਿ Llama ਆਮ ਵਰਤੋਂ ਦੇ ਮਾਮਲਿਆਂ ਅਤੇ ਤਰਕ ਵਿੱਚ Qwen ਅਤੇ DeepSeek ਨੂੰ ਪਛਾੜ ਦੇਵੇਗਾ, ਪਰ ਉਸਨੇ ਦੇਖਿਆ ਕਿ Qwen ਕਾਫ਼ੀ ਅੱਗੇ ਹੈ।
ਇਹ ਭਾਵਨਾ Meta ਨੂੰ ਇੱਕ ਪ੍ਰਮੁੱਖ ਓਪਨ-ਸੋਰਸ LLM ਵਜੋਂ Llama ਦੀ ਸਥਿਤੀ ਨੂੰ ਬਣਾਈ ਰੱਖਣ ਵਿੱਚ ਦਰਪੇਸ਼ ਚੁਣੌਤੀਆਂ ਨੂੰ ਉਜਾਗਰ ਕਰਦੀ ਹੈ। ਜਦੋਂ ਕਿ Llama ਦੀਆਂ ਸ਼ੁਰੂਆਤੀ ਰਿਲੀਜ਼ਾਂ ਨੇ ਬਹੁਤ ਧਿਆਨ ਅਤੇ ਪ੍ਰਸ਼ੰਸਾ ਪ੍ਰਾਪਤ ਕੀਤੀ, ਪਰ ਵੱਧ ਤੋਂ ਵੱਧ ਸਮਰੱਥ ਵਿਕਲਪਾਂ ਦੇ ਉਭਾਰ ਨੇ ਮੁਕਾਬਲੇਬਾਜ਼ੀ ਦੇ ਦ੍ਰਿਸ਼ ਨੂੰ ਤੇਜ਼ ਕਰ ਦਿੱਤਾ ਹੈ।
ਇੱਕ ਵਾਅਦਾ ਭਰਿਆ ਸ਼ੁਰੂਆਤ: Llama 2 ਦਾ ਪ੍ਰਭਾਵ (A Promising Start: Llama 2’s Impact)
Llama ਦੇ ਆਲੇ ਦੁਆਲੇ ਮੌਜੂਦਾ ਕਹਾਣੀ ਦੀ ਪੂਰੀ ਤਰ੍ਹਾਂ ਕਦਰ ਕਰਨ ਲਈ, ਇਸਦੇ ਮੂਲ ਅਤੇ ਸ਼ੁਰੂਆਤੀ ਉਤਸ਼ਾਹ ਨੂੰ ਯਾਦ ਰੱਖਣਾ ਜ਼ਰੂਰੀ ਹੈ ਜਿਸਨੇ ਇਸਨੂੰ ਪੈਦਾ ਕੀਤਾ। 2023 ਵਿੱਚ, Nvidia ਦੇ CEO Jensen Huang ਨੇ Llama 2 ਦੀ ਲਾਂਚ ਨੂੰ ਉਸ ਸਾਲ ਦੀ "AI ਵਿੱਚ ਸ਼ਾਇਦ ਸਭ ਤੋਂ ਵੱਡੀ ਘਟਨਾ" ਵਜੋਂ ਸ਼ਲਾਘਾ ਕੀਤੀ। ਜੁਲਾਈ 2024 ਤੱਕ, Llama 3 ਦੀ ਰਿਲੀਜ਼ ਨੂੰ ਇੱਕ ਵੱਡੀ ਸਫਲਤਾ ਮੰਨਿਆ ਗਿਆ, ਜੋ ਕਿ OpenAI ਦੇ ਦਬਦਬੇ ਨੂੰ ਚੁਣੌਤੀ ਦੇਣ ਦੇ ਸਮਰੱਥ ਪਹਿਲੇ ਓਪਨ LLM ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ।
SemiAnalysis ਦੇ ਮੁੱਖ ਵਿਸ਼ਲੇਸ਼ਕ Dylan Patel ਦੇ ਅਨੁਸਾਰ, Llama 3 ਦੇ ਆਉਣ ਨਾਲ ਕੰਪਿਊਟਿੰਗ ਪਾਵਰ (computing power) ਦੀ ਮੰਗ ਵਿੱਚਤੁਰੰਤ ਵਾਧਾ ਹੋਇਆ, ਜਿਸ ਨਾਲ GPU ਕਿਰਾਏ ਦੀਆਂ ਕੀਮਤਾਂ ਵਿੱਚ ਵਾਧਾ ਹੋਇਆ। ਇਸ ਸਮੇਂ ਦੌਰਾਨ "Meta" ਅਤੇ "Llama" ਲਈ Google ਖੋਜਾਂ ਵੀ ਸਿਖਰਾਂ ‘ਤੇ ਪਹੁੰਚ ਗਈਆਂ, ਜੋ ਕਿ ਨਵੇਂ ਮਾਡਲ ਵਿੱਚ ਵਿਆਪਕ ਦਿਲਚਸਪੀ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ।
Llama 3 ਨੂੰ ਇੱਕ ਅਮਰੀਕੀ-ਨਿਰਮਿਤ, ਓਪਨ ਅਤੇ ਉੱਚ-ਦਰਜੇ ਦੇ LLM ਵਜੋਂ ਮਨਾਇਆ ਗਿਆ। ਜਦੋਂ ਕਿ ਇਸਨੇ ਲਗਾਤਾਰ ਉਦਯੋਗਿਕ ਮਾਪਦੰਡਾਂ ਵਿੱਚ ਸਿਖਰਲਾ ਸਥਾਨ ਪ੍ਰਾਪਤ ਨਹੀਂ ਕੀਤਾ, ਪਰ ਇਸਨੇ AI ਭਾਈਚਾਰੇ ਵਿੱਚ ਕਾਫ਼ੀ ਪ੍ਰਭਾਵ ਅਤੇ ਪ੍ਰਸੰਗਿਕਤਾ ਪਾਈ। ਫਿਰ ਵੀ, ਇਹ ਗਤੀਸ਼ੀਲਤਾ ਹੌਲੀ ਹੌਲੀ ਬਦਲ ਗਈ ਹੈ।
Architectural ਤਬਦੀਲੀਆਂ ਅਤੇ ਆਲੋਚਨਾਵਾਂ (Architectural Shifts and Criticisms)
Llama 4 ਮਾਡਲਾਂ ਨੇ "ਮਾਹਰਾਂ ਦਾ ਮਿਸ਼ਰਣ" Architectural ਪੇਸ਼ ਕੀਤਾ, ਇੱਕ ਡਿਜ਼ਾਈਨ ਜਿਸਨੂੰ DeepSeek ਦੁਆਰਾ ਪ੍ਰਸਿੱਧ ਕੀਤਾ ਗਿਆ ਸੀ। ਇਹ Architectural ਮਾਡਲ ਨੂੰ ਇੱਕ ਖਾਸ ਕੰਮ ਲਈ ਸਿਰਫ਼ ਸਭ ਤੋਂ ਢੁਕਵੀਂ ਮੁਹਾਰਤ ਨੂੰ ਸਰਗਰਮ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਕੁਸ਼ਲਤਾ ਵਿੱਚ ਸੁਧਾਰ ਹੁੰਦਾ ਹੈ।
ਹਾਲਾਂਕਿ, Llama 4 ਦੀ ਰਿਲੀਜ਼ ਦੀ ਆਲੋਚਨਾ ਕੀਤੀ ਗਈ ਜਦੋਂ ਡਿਵੈਲਪਰਾਂ ਨੇ ਖੋਜ ਕੀਤੀ ਕਿ ਜਨਤਕ ਬੈਂਚਮਾਰਕਿੰਗ (benchmarking) ਲਈ ਵਰਤਿਆ ਜਾਣ ਵਾਲਾ ਸੰਸਕਰਣ ਡਾਊਨਲੋਡ ਅਤੇ ਤੈਨਾਤੀ ਲਈ ਉਪਲਬਧ ਸੰਸਕਰਣ ਤੋਂ ਵੱਖਰਾ ਸੀ। ਇਸ ਅੰਤਰ ਨੇ "ਲੀਡਰਬੋਰਡਜ਼ ਨੂੰ ਗੇਮ ਕਰਨ" ਦੇ ਦੋਸ਼ਾਂ ਨੂੰ ਜਨਮ ਦਿੱਤਾ, ਜਿਸ ਤੋਂ Meta ਨੇ ਇਨਕਾਰ ਕੀਤਾ, ਇਹ ਦੱਸਦੇ ਹੋਏ ਕਿ ਸਵਾਲ ਵਿੱਚ ਵੱਖਰਾ ਰੂਪ ਪ੍ਰਯੋਗਾਤਮਕ ਸੀ ਅਤੇ ਇਹ ਕਿ ਇੱਕ ਮਾਡਲ ਦੇ ਕਈ ਸੰਸਕਰਣਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨਾ ਇੱਕ ਆਮ ਅਭਿਆਸ ਹੈ।
Meta ਦੇ ਸਪੱਸ਼ਟੀਕਰਨਾਂ ਦੇ ਬਾਵਜੂਦ, ਵਿਵਾਦ ਨੇ ਇਸ ਧਾਰਨਾ ਵਿੱਚ ਯੋਗਦਾਨ ਪਾਇਆ ਕਿ Llama ਆਪਣੀ ਪ੍ਰਤੀਯੋਗੀ ਸਥਿਤੀ ਨੂੰ ਬਣਾਈ ਰੱਖਣ ਲਈ ਸੰਘਰਸ਼ ਕਰ ਰਿਹਾ ਹੈ। ਜਿਵੇਂ ਕਿ ਮੁਕਾਬਲੇ ਵਾਲੇ ਮਾਡਲ ਅੱਗੇ ਵਧਦੇ ਰਹੇ, Meta ਕੋਲ ਕੋਈ ਸਪਸ਼ਟ ਦਿਸ਼ਾ ਨਹੀਂ ਜਾਪਦੀ ਸੀ।
ਡਿਵੈਲਪਰ ਅਪਣਾਉਣ ਨੂੰ ਮਾਪਣਾ: ਇੱਕ ਗੁੰਝਲਦਾਰ ਕੰਮ (Measuring Developer Adoption: A Complex Task)
ਇਹ ਨਿਰਧਾਰਤ ਕਰਨਾ ਕਿ ਕਿਹੜਾ LLM ਪਰਿਵਾਰ ਡਿਵੈਲਪਰਾਂ ਵਿੱਚ ਸਭ ਤੋਂ ਵੱਧ ਪ੍ਰਸਿੱਧ ਹੈ, ਇੱਕ ਚੁਣੌਤੀਪੂਰਨ ਕੰਮ ਹੈ। ਹਾਲਾਂਕਿ, ਉਪਲਬਧ ਡੇਟਾ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ Llama ਦੇ ਨਵੀਨਤਮ ਮਾਡਲ ਲੀਡਰਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਨਹੀਂ ਹਨ।
ਖਾਸ ਤੌਰ ‘ਤੇ, Qwen ਲਗਾਤარ ਇੰਟਰਨੈੱਟ ‘ਤੇ ਵੱਖ-ਵੱਖ ਲੀਡਰਬੋਰਡਾਂ ‘ਤੇ ਉੱਚਾ ਦਰਜਾ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ। Artificial Analysis ਦੇ ਅਨੁਸਾਰ, ਇੱਕ ਸਾਈਟ ਜੋ ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਆਧਾਰ ‘ਤੇ ਮਾਡਲਾਂ ਨੂੰ ਦਰਜਾ ਦਿੰਦੀ ਹੈ, Llama 4 Maverick ਅਤੇ Scout ਨੂੰ OpenAI ਦੇ GPT-4 ਮਾਡਲ (ਪਿਛਲੇ ਸਾਲ ਦੇ ਅੰਤ ਵਿੱਚ ਜਾਰੀ ਕੀਤੇ ਗਏ) ਤੋਂ ਥੋੜ੍ਹਾ ਉੱਪਰ ਅਤੇ xAI ਦੇ Grok ਅਤੇ Anthropic ਦੇ Claude ਤੋਂ ਹੇਠਾਂ ਰੱਖਿਆ ਗਿਆ ਹੈ।
OpenRouter, ਇੱਕ ਪਲੇਟਫਾਰਮ ਜੋ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਵੱਖ-ਵੱਖ ਮਾਡਲਾਂ ਤੱਕ ਪਹੁੰਚ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ ਅਤੇ API ਵਰਤੋਂ ਦੇ ਆਧਾਰ ‘ਤੇ ਲੀਡਰਬੋਰਡਾਂ ਨੂੰ ਪ੍ਰਕਾਸ਼ਿਤ ਕਰਦਾ ਹੈ, ਮਈ ਦੇ ਸ਼ੁਰੂ ਵਿੱਚ ਚੋਟੀ ਦੇ 20 ਮਾਡਲਾਂ ਵਿੱਚ Llama 3.3 ਦਿਖਾਉਂਦਾ ਹੈ, ਪਰ Llama 4 ਨਹੀਂ।
ਇਹ ਡੇਟਾ ਪੁਆਇੰਟ, ਹਾਲਾਂਕਿ ਨਿਸ਼ਚਿਤ ਨਹੀਂ ਹਨ, ਸੁਝਾਅ ਦਿੰਦੇ ਹਨ ਕਿ Llama ਦੇ ਨਵੀਨਤਮ ਦੁਹਰਾਓ ਡਿਵੈਲਪਰਾਂ ਨਾਲ ਓਨੇ ਜ਼ਿਆਦਾ ਨਹੀਂ ਜੁੜੇ ਜਿੰਨੇ ਉਨ੍ਹਾਂ ਦੇ ਪੂਰਵਜ।
ਮਾਪਦੰਡਾਂ ਤੋਂ ਪਰੇ: ਟੂਲ ਦੀ ਵਰਤੋਂ ਅਤੇ ਤਰਕ (Beyond Benchmarks: Tool Use and Reasoning)
ਜਦੋਂ ਕਿ Llama 4 ਦੇ ਮਿਆਰੀ ਮੁਲਾਂਕਣ ਨਿਰਾਸ਼ਾਜਨਕ ਰਹੇ ਹੋਣਗੇ, ਮਾਹਰਾਂ ਦਾ ਤਰਕ ਹੈ ਕਿ ਦਿਲਚਸਪੀ ਦੀ ਘਾਟ ਸਿਰਫ਼ ਕੱਚੇ ਪ੍ਰਦਰਸ਼ਨ ਮੀਟ੍ਰਿਕਸ ਤੋਂ ਪਰੇ ਕਾਰਕਾਂ ਤੋਂ ਪੈਦਾ ਹੁੰਦੀ ਹੈ।
SemiAnalysis ਦੇ ਇੱਕ ਵਿਸ਼ਲੇਸ਼ਕ, AJ Kourabi, "ਟੂਲ ਕਾਲਿੰਗ" ਦੀ ਮਹੱਤਤਾ ਅਤੇ ਇੱਕ ਸਧਾਰਨ ਚੈਟਬੋਟ ਕਾਰਜਕੁਸ਼ਲਤਾ ਤੋਂ ਪਰੇ ਵਧਾਉਣ ਦੀ ਮਾਡਲ ਦੀ ਸਮਰੱਥਾ ‘ਤੇ ਜ਼ੋਰ ਦਿੰਦੇ ਹਨ। ਟੂਲ ਕਾਲਿੰਗ ਦਾ ਮਤਲਬ ਹੈ ਇੰਟਰਨੈੱਟ ‘ਤੇ ਜਾਂ ਕਿਸੇ ਉਪਭੋਗਤਾ ਦੇ ਡਿਵਾਈਸ ‘ਤੇ ਹੋਰ ਐਪਲੀਕੇਸ਼ਨਾਂ ਤੱਕ ਪਹੁੰਚ ਕਰਨ ਅਤੇ ਉਨ੍ਹਾਂ ਨੂੰ ਹਦਾਇਤ ਦੇਣ ਦੀ ਮਾਡਲ ਦੀ ਸਮਰੱਥਾ, ਜੋ ਕਿ agentic AI ਲਈ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਵਿਸ਼ੇਸ਼ਤਾ ਹੈ, ਜੋ ਕਿ ਯਾਤਰਾ ਬੁੱਕ ਕਰਨ ਅਤੇ ਖਰਚਿਆਂ ਦੇ ਪ੍ਰਬੰਧਨ ਵਰਗੇ ਕੰਮਾਂ ਨੂੰ ਆਟੋਮੈਟ ਕਰਨ ਦਾ ਵਾਅਦਾ ਕਰਦੀ ਹੈ।
Meta ਨੇ ਕਿਹਾ ਹੈ ਕਿ Llama ਮਾਡਲ ਇਸਦੇ API ਦੁਆਰਾ ਟੂਲ ਕਾਲਿੰਗ ਦਾ ਸਮਰਥਨ ਕਰਦੇ ਹਨ। ਹਾਲਾਂਕਿ, ਇੱਕ ਡਿਵੈਲਪਰ ਅਤੇ ਯੂਟਿਊਬਰ Theo Browne ਦਾ ਤਰਕ ਹੈ ਕਿ ਏਜੰਟਿਕ ਟੂਲਜ਼ (agentic tools) ਦੇ ਮਹੱਤਵਪੂਰਨ ਹੋਣ ਦੇ ਨਾਲ ਹੀ ਟੂਲ ਕਾਲਿੰਗ ਮੋਹਰੀ ਪ੍ਰਸੰਗਿਕਤਾ ਲਈ ਜ਼ਰੂਰੀ ਹੋ ਗਈ ਹੈ।
Anthropic ਟੂਲ ਦੀ ਵਰਤੋਂ ਵਿੱਚ ਇੱਕ ਸ਼ੁਰੂਆਤੀ ਲੀਡਰ ਵਜੋਂ ਉਭਰਿਆ ਹੈ, ਅਤੇ OpenAI ਵਰਗੇ ਪ੍ਰੋਪਰਾਈਟਰੀ ਮਾਡਲ ਤੇਜ਼ੀ ਨਾਲ ਅੱਗੇ ਵੱਧ ਰਹੇ ਹਨ। ਸਹੀ ਜਵਾਬ ਪੈਦਾ ਕਰਨ ਲਈ ਸਹੀ ਟੂਲ ਨੂੰ ਭਰੋਸੇਯੋਗ ਢੰਗ ਨਾਲ ਕਾਲ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਬਹੁਤ ਕੀਮਤੀ ਹੈ, ਅਤੇ OpenAI ਨੇ ਆਪਣਾ ਧਿਆਨ ਇਸ ਸਮਰੱਥਾ ਨੂੰ ਤਰਜੀਹ ਦੇਣ ‘ਤੇ ਕੇਂਦਰਿਤ ਕੀਤਾ ਹੈ।
Kourabi ਦਾ ਤਰਕ ਹੈ ਕਿ ਇੱਕ ਮਜ਼ਬੂਤ ਤਰਕ ਮਾਡਲ ਦੀ ਅਣਹੋਂਦ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਸੰਕੇਤ ਹੈ ਕਿ Meta ਪਿੱਛੇ ਰਹਿ ਗਿਆ ਹੈ। ਤਰਕ ਨੂੰ ਏਜੰਟਿਕ AI ਸਮੀਕਰਨ ਵਿੱਚ ਇੱਕ ਬੁਨਿਆਦੀ ਤੱਤ ਮੰਨਿਆ ਜਾਂਦਾ ਹੈ, ਜੋ ਮਾਡਲਾਂ ਨੂੰ ਕੰਮਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਅਤੇ ਕਾਰਵਾਈ ਦੇ ਢੁਕਵੇਂ ਕੋਰਸ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ।
Llama ਦਾ ਖੇਤਰ: ਵਿਹਾਰਕ ਐਪਲੀਕੇਸ਼ਨਾਂ ਅਤੇ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਗ੍ਰਹਿਣ (Llama’s Niche: Practical Applications and Enterprise Adoption)
AI ਖੋਜ ਦੇ ਮੋਹਰੀ ਸਥਾਨ ‘ਤੇ ਆਪਣੀ ਸਥਿਤੀ ਬਾਰੇ ਚਿੰਤਾਵਾਂ ਦੇ ਬਾਵਜੂਦ, Llama ਬਹੁਤ ਸਾਰੇ ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਸੰਸਥਾਵਾਂ ਲਈ ਇੱਕ ਕੀਮਤੀ ਟੂਲ ਬਣਿਆ ਹੋਇਆ ਹੈ।
RockerBox ਦੇ ਉਤਪਾਦ ਮੁਖੀ Nate Jones ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਆਪਣੀ ਰੈਜ਼ਿਊਮੇ ਵਿੱਚ Llama ਨੂੰ ਸ਼ਾਮਲ ਕਰਨ ਦੀ ਸਲਾਹ ਦਿੰਦੇ ਹਨ, ਕਿਉਂਕਿ ਮਾਡਲ ਤੋਂ ਜਾਣੂ ਹੋਣਾ ਭਵਿੱਖ ਵਿੱਚ ਮੰਗਿਆ ਜਾ ਸਕਦਾ ਹੈ।
GAI Insights ਦੇ CEO ਅਤੇ ਪ੍ਰਮੁੱਖ ਵਿਸ਼ਲੇਸ਼ਕ Paul Baier ਦਾ ਮੰਨਣਾ ਹੈ ਕਿ Llama ਕਈ ਕੰਪਨੀਆਂ ਲਈ AI ਰਣਨੀਤੀਆਂ ਦਾ ਇੱਕ ਮੁੱਖ ਹਿੱਸਾ ਬਣਿਆ ਰਹੇਗਾ, ਖਾਸ ਕਰਕੇ ਤਕਨਾਲੋਜੀ ਉਦਯੋਗ ਤੋਂ ਬਾਹਰ ਦੀਆਂ ਕੰਪਨੀਆਂ ਲਈ।
ਐਂਟਰਪ੍ਰਾਈਜ਼ ਓਪਨ-ਸੋਰਸ ਮਾਡਲਾਂ ਦੀ ਮਹੱਤਤਾ ਨੂੰ ਪਛਾਣਦੇ ਹਨ, ਜਿਸ ਵਿੱਚ Llama ਇੱਕ ਪ੍ਰਮੁੱਖ ਉਦਾਹਰਣ ਹੈ, ਘੱਟ ਗੁੰਝਲਦਾਰ ਕੰਮਾਂ ਨੂੰ ਸੰਭਾਲਣ ਅਤੇ ਲਾਗਤਾਂ ਨੂੰ ਕੰਟਰੋਲ ਕਰਨ ਲਈ। ਬਹੁਤ ਸਾਰੀਆਂ ਸੰਸਥਾਵਾਂ ਆਪਣੀਆਂ ਵਿਭਿੰਨ ਲੋੜਾਂ ਨੂੰ ਪੂਰਾ ਕਰਨ ਲਈ ਬੰਦ ਅਤੇ ਓਪਨ ਮਾਡਲਾਂ ਦੇ ਸੁਮੇਲ ਨੂੰ ਤਰਜੀਹ ਦਿੰਦੀਆਂ ਹਨ।
Snowflake ਵਿੱਚ AI ਦੇ ਮੁਖੀ Baris Gultekin ਨੋਟ ਕਰਦੇ ਹਨ ਕਿ ਗਾਹਕ ਅਕਸਰ ਮਾਪਦੰਡਾਂ ‘ਤੇ ਪੂਰੀ ਤਰ੍ਹਾਂ ਭਰੋਸਾ ਕਰਨ ਦੀ ਬਜਾਏ ਆਪਣੇ ਖਾਸ ਵਰਤੋਂ ਦੇ ਮਾਮਲਿਆਂ ਦੇ ਆਧਾਰ ‘ਤੇ ਮਾਡਲਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਦੇ ਹਨ। ਇਸਦੀ ਘੱਟ ਲਾਗਤ ਦੇ ਮੱਦੇਨਜ਼ਰ, Llama ਅਕਸਰ ਬਹੁਤ ਸਾਰੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਕਾਫ਼ੀ ਸਾਬਤ ਹੁੰਦਾ ਹੈ।
Snowflake ਵਿੱਚ, Llama ਦੀ ਵਰਤੋਂ ਵਿਕਰੀ ਕਾਲ ਟ੍ਰਾਂਸਕ੍ਰਿਪਟਾਂ (sales call transcripts) ਨੂੰ ਸੰਖੇਪ ਕਰਨ ਅਤੇ ਗਾਹਕ ਸਮੀਖਿਆਵਾਂ ਤੋਂ ਢਾਂਚਾਗਤ ਜਾਣਕਾਰੀ ਕੱਢਣ ਵਰਗੇ ਕੰਮਾਂ ਲਈ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। Dremio ਵਿੱਚ, Llama SQL ਕੋਡ ਤਿਆਰ ਕਰਦਾ ਹੈ ਅਤੇ ਮਾਰਕੀਟਿੰਗ ਈਮੇਲਾਂ ਲਿਖਦਾ ਹੈ।
Dremio ਦੇ ਸਹਿ-ਸੰਸਥਾਪਕ ਅਤੇ ਮੁੱਖ ਉਤਪਾਦ ਅਧਿਕਾਰੀ Tomer Shiran ਸੁਝਾਅ ਦਿੰਦੇ ਹਨ ਕਿ ਖਾਸ ਮਾਡਲ 80% ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਮਹੱਤਵਪੂਰਨ ਨਹੀਂ ਹੋ ਸਕਦਾ ਹੈ, ਕਿਉਂਕਿ ਜ਼ਿਆਦਾਤਰ ਮਾਡਲ ਹੁਣ ਬੁਨਿਆਦੀ ਲੋੜਾਂ ਨੂੰ ਪੂਰਾ ਕਰਨ ਲਈ "ਕਾਫ਼ੀ ਵਧੀਆ" ਹਨ।
ਇੱਕ ਵਿਭਿੰਨਤਾ ਵਾਲਾ ਦ੍ਰਿਸ਼: Llama ਦੀ ਠੋਸ ਭੂਮਿਕਾ (A Diversifying Landscape: Llama’s Solidifying Role)
ਜਦੋਂ ਕਿ Llama ਕੁਝ ਖੇਤਰਾਂ ਵਿੱਚ ਪ੍ਰੋਪਰਾਈਟਰੀ ਮਾਡਲਾਂ ਨਾਲ ਸਿੱਧੇ ਮੁਕਾਬਲੇ ਤੋਂ ਦੂਰ ਹੋ ਸਕਦਾ ਹੈ, ਸਮੁੱਚੇ AI ਦਾ ਦ੍ਰਿਸ਼ ਵਧੇਰੇ ਵਿਭਿੰਨ ਹੁੰਦਾ ਜਾ ਰਿਹਾ ਹੈ, ਅਤੇ Llama ਦੀ ਭੂਮਿਕਾ ਖਾਸ ਖੇਤਰਾਂ ਵਿੱਚ ਠੋਸ ਹੋ ਰਹੀ ਹੈ।
Shiran ਜ਼ੋਰ ਦਿੰਦਾ ਹੈ ਕਿ ਮਾਪਦੰਡ ਮਾਡਲ ਦੀ ਚੋਣ ਦਾ ਮੁੱਖ ਕਾਰਨ ਨਹੀਂ ਹਨ, ਕਿਉਂਕਿ ਉਪਭੋਗਤਾ ਆਪਣੇ ਖੁਦ ਦੇ ਵਰਤੋਂ ਦੇ ਮਾਮਲਿਆਂ ‘ਤੇ ਮਾਡਲਾਂ ਦੀ ਜਾਂਚ ਨੂੰ ਤਰਜੀਹ ਦਿੰਦੇ ਹਨ। ਇੱਕ ਗਾਹਕ ਦੇ ਡੇਟਾ ‘ਤੇ ਇੱਕ ਮਾਡਲ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਹੁੰਦਾ ਹੈ, ਅਤੇ ਇਹ ਪ੍ਰਦਰਸ਼ਨ ਸਮੇਂ ਦੇ ਨਾਲ ਬਦਲ ਸਕਦਾ ਹੈ।
Gultekin ਨੇ ਅੱਗੇ ਕਿਹਾ ਕਿ ਮਾਡਲ ਦੀ ਚੋਣ ਅਕਸਰ ਇੱਕ ਵਾਰ ਦੀ ਘਟਨਾ ਦੀ ਬਜਾਏ ਇੱਕ ਵਰਤੋਂ-ਕੇਸ-ਵਿਸ਼ੇਸ਼ ਫੈਸਲਾ ਹੁੰਦਾ ਹੈ।
Llama ਉਨ੍ਹਾਂ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਗੁਆ ਸਕਦਾ ਹੈ ਜੋ ਲਗਾਤਾਰ ਨਵੀਨਤਮ ਤਰੱਕੀ ਦੀ ਭਾਲ ਵਿੱਚ ਰਹਿੰਦੇ ਹਨ, ਪਰ ਇਹ ਵਿਹਾਰਕ AI-ਸੰਚਾਲਿਤ ਟੂਲ ਬਣਾਉਣ ‘ਤੇ ਕੇਂਦ੍ਰਿਤ ਬਹੁਤ ਸਾਰੇ ਡਿਵੈਲਪਰਾਂ ਦਾ ਸਮਰਥਨ ਬਰਕਰਾਰ ਰੱਖਦਾ ਹੈ।
ਇਹ ਗਤੀਸ਼ੀਲਤਾ Meta ਦੀ ਵਿਆਪਕ ਓਪਨ-ਸੋਰਸ ਰਣਨੀਤੀ ਨਾਲ ਮੇਲ ਖਾਂਦੀ ਹੈ, ਜਿਸਦੀ ਮਿਸਾਲ 2013 ਵਿੱਚ React ਦੀ ਲਾਂਚ ਅਤੇ 2016 ਵਿੱਚ PyTorch ਦੀ ਰਚਨਾ ਹੈ। ਸਫਲ ਈਕੋਸਿਸਟਮਾਂ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਕੇ, Meta ਓਪਨ-ਸੋਰਸ ਭਾਈਚਾਰੇ ਦੇ ਯੋਗਦਾਨਾਂ ਤੋਂ ਲਾਭ ਉਠਾਉਂਦਾ ਹੈ।
ਜਿਵੇਂ ਕਿ Nate Jones ਨੇ ਨੋਟ ਕੀਤਾ ਹੈ, Zuckerberg ਨੂੰ Meta ਦੀਆਂ ਓਪਨ-ਸੋਰਸ ਪਹਿਲਕਦਮੀਆਂ ਤੋਂ ਬਹੁਤ ਮਦਦ ਮਿਲਦੀ ਹੈ।