ਗਲੋਬਲ AI ਹਾਰਡਵੇਅਰ ਦੌੜ ਵਿੱਚ ਉੱਚ ਦਾਅ
ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ (AI) ਦੇ ਵਿਕਾਸ ਦਾ ਲੈਂਡਸਕੇਪ ਸਿਰਫ਼ ਐਲਗੋਰਿਦਮਿਕ ਸਫਲਤਾਵਾਂ ਦੁਆਰਾ ਹੀ ਨਹੀਂ, ਸਗੋਂ ਵੱਡੇ ਮਾਡਲਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਅਤੇ ਚਲਾਉਣ ਲਈ ਲੋੜੀਂਦੇ ਉੱਨਤ ਹਾਰਡਵੇਅਰ ਤੱਕ ਪਹੁੰਚ ਦੁਆਰਾ ਵੀ ਤੇਜ਼ੀ ਨਾਲ ਪਰਿਭਾਸ਼ਿਤ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ। ਇਸ ਹਾਰਡਵੇਅਰ ਸਮੀਕਰਨ ਦੇ ਕੇਂਦਰ ਵਿੱਚ ਗ੍ਰਾਫਿਕਸ ਪ੍ਰੋਸੈਸਿੰਗ ਯੂਨਿਟ (GPU) ਹੈ, ਇੱਕ ਕੰਪੋਨੈਂਟ ਜੋ ਸ਼ੁਰੂ ਵਿੱਚ ਚਿੱਤਰਾਂ ਨੂੰ ਰੈਂਡਰ ਕਰਨ ਲਈ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਗਿਆ ਸੀ ਪਰ ਹੁਣ AI ਦੀਆਂ ਸਮਾਨਾਂਤਰ ਪ੍ਰੋਸੈਸਿੰਗ ਮੰਗਾਂ ਲਈ ਲਾਜ਼ਮੀ ਹੈ। ਸਾਲਾਂ ਤੋਂ, Nvidia Corporation ਇਸ ਖੇਤਰ ਵਿੱਚ ਨਿਰਵਿਵਾਦ ਦਿੱਗਜ ਵਜੋਂ ਖੜ੍ਹੀ ਹੈ, ਇਸਦੇ ਉੱਨਤ GPUs ਸੋਨੇ ਦਾ ਮਿਆਰ ਬਣ ਗਏ ਹਨ, ਜੋ Silicon Valley ਅਤੇ ਇਸ ਤੋਂ ਬਾਹਰ ਨਵੀਨਤਾ ਨੂੰ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰ ਰਹੇ ਹਨ। ਹਾਲਾਂਕਿ, ਇਸ ਦਬਦਬੇ ਨੇ ਕੰਪਨੀ, ਅਤੇ ਇਸਦੇ ਗਾਹਕਾਂ ਨੂੰ, ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਭੂ-ਰਾਜਨੀਤਿਕ ਤਣਾਅ ਦੇ ਨਿਸ਼ਾਨੇ ‘ਤੇ ਰੱਖ ਦਿੱਤਾ ਹੈ।
Washington ਦੁਆਰਾ ਚੀਨ ਦੀ ਅਤਿ-ਆਧੁਨਿਕ ਸੈਮੀਕੰਡਕਟਰ ਤਕਨਾਲੋਜੀ ਤੱਕ ਪਹੁੰਚ ਨੂੰ ਰੋਕਣ ਦੇ ਉਦੇਸ਼ ਨਾਲ ਸਖ਼ਤ ਨਿਰਯਾਤ ਨਿਯੰਤਰਣ ਲਗਾਉਣ ਨੇ ਮਾਰਕੀਟ ਨੂੰ ਬੁਨਿਆਦੀ ਤੌਰ ‘ਤੇ ਮੁੜ ਆਕਾਰ ਦਿੱਤਾ ਹੈ। ਇਹ ਪਾਬੰਦੀਆਂ ਖਾਸ ਤੌਰ ‘ਤੇ ਉੱਚ-ਪ੍ਰਦਰਸ਼ਨ ਵਾਲੇ GPUs ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾਉਂਦੀਆਂ ਹਨ, ਜਿਵੇਂ ਕਿ Nvidia ਦੁਆਰਾ ਤਿਆਰ ਕੀਤੇ ਗਏ, ਜੋ ਉੱਨਤ AI ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਮਹੱਤਵਪੂਰਨ ਮੰਨੇ ਜਾਂਦੇ ਹਨ, ਜਿਸ ਵਿੱਚ ਸੰਭਾਵੀ ਫੌਜੀ ਵਰਤੋਂ ਵਾਲੇ ਵੀ ਸ਼ਾਮਲ ਹਨ। ਇਸ ਦਾ ਤੁਰੰਤ ਪ੍ਰਭਾਵ ਚੀਨ ਦੇ ਵਧ ਰਹੇ ਤਕਨੀਕੀ ਖੇਤਰ ਵਿੱਚ ਇੱਕ ਹਫੜਾ-ਦਫੜੀ ਸੀ। AI ਵਿੱਚ ਭਾਰੀ ਨਿਵੇਸ਼ ਕਰਨ ਵਾਲੀਆਂ ਕੰਪਨੀਆਂ, ਸਥਾਪਿਤ ਦਿੱਗਜਾਂ ਤੋਂ ਲੈ ਕੇ ਉਤਸ਼ਾਹੀ ਸਟਾਰਟ-ਅੱਪਸ ਤੱਕ, ਅਚਾਨਕ ਤਕਨੀਕੀ ਤਰੱਕੀ ਦੀ ਅਗਲੀ ਲਹਿਰ ਨੂੰ ਚਲਾਉਣ ਵਾਲੇ ਜ਼ਰੂਰੀ ਸਾਧਨਾਂ ਤੋਂ ਕੱਟੇ ਜਾਣ ਦੀ ਸੰਭਾਵਨਾ ਦਾ ਸਾਹਮਣਾ ਕਰਨਾ ਪਿਆ। ਇਸ ਨੇ ਇੱਕ ਜ਼ਰੂਰੀ ਲੋੜ ਪੈਦਾ ਕੀਤੀ: ਵਿਹਾਰਕ ਵਿਕਲਪ ਲੱਭੋ ਜਾਂ ਵਿਸ਼ਵ ਪੱਧਰ ‘ਤੇ ਪ੍ਰਤੀਯੋਗੀ ਖੇਤਰ ਵਿੱਚ ਪਿੱਛੇ ਰਹਿ ਜਾਣ ਦਾ ਖ਼ਤਰਾ ਮੁੱਲ ਲਓ। ਚੁਣੌਤੀ ਸਿਰਫ਼ ਇੱਕ ਚਿੱਪ ਨੂੰ ਦੂਜੀ ਨਾਲ ਬਦਲਣ ਬਾਰੇ ਨਹੀਂ ਸੀ; ਇਸ ਵਿੱਚ ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਅੰਤਰ, ਸੌਫਟਵੇਅਰ ਅਨੁਕੂਲਤਾ ਮੁੱਦਿਆਂ, ਅਤੇ ਸੈਂਕੜੇ ਅਰਬਾਂ, ਜਾਂ ਇੱਥੋਂ ਤੱਕ ਕਿ ਖਰਬਾਂ, ਪੈਰਾਮੀਟਰਾਂ ਵਾਲੇ ਮਾਡਲਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਲੋੜੀਂਦੇ ਵੱਡੇ ਪੈਮਾਨੇ ਦੇ ਇੱਕ ਗੁੰਝਲਦਾਰ ਜਾਲ ਨੂੰ ਨੈਵੀਗੇਟ ਕਰਨਾ ਸ਼ਾਮਲ ਸੀ।
Ant Group ਕੰਪਿਊਟ ਸੁਤੰਤਰਤਾ ਵੱਲ ਇੱਕ ਕੋਰਸ ਤਿਆਰ ਕਰਦਾ ਹੈ
ਸਪਲਾਈ ਚੇਨ ਦੀ ਅਨਿਸ਼ਚਿਤਤਾ ਅਤੇ ਵਧਦੀ ਤਕਨੀਕੀ ਦੁਸ਼ਮਣੀ ਦੇ ਇਸ ਪਿਛੋਕੜ ਦੇ ਵਿਰੁੱਧ, Ant Group, Alibaba Group Holding ਨਾਲ ਜੁੜੀ ਫਿਨਟੈਕ ਦਿੱਗਜ, ਨੇ ਵਧੇਰੇ ਕੰਪਿਊਟੇਸ਼ਨਲ ਸਵੈ-ਨਿਰਭਰਤਾ ਵੱਲ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਕਦਮ ਦਾ ਸੰਕੇਤ ਦਿੱਤਾ ਹੈ। ਕੰਪਨੀ ਦੀ Ling ਟੀਮ - ਇਸਦੇ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲ (LLM) ਪਹਿਲਕਦਮੀਆਂ ਦੀ ਅਗਵਾਈ ਕਰਨ ਵਾਲਾ ਡਿਵੀਜ਼ਨ - ਦੁਆਰਾ ਇੱਕ ਖੋਜ ਪੱਤਰ ਵਿੱਚ ਵਿਸਤ੍ਰਿਤ ਤਾਜ਼ਾ ਖੁਲਾਸੇ, Nvidia-ਕੇਂਦ੍ਰਿਤ ਮਾਰਗ ਤੋਂ ਇੱਕ ਸਫਲ ਭਟਕਣ ਦਾ ਸੰਕੇਤ ਦਿੰਦੇ ਹਨ। ਇਸ ਪ੍ਰਾਪਤੀ ਦਾ ਮੂਲ ਘਰੇਲੂ ਤੌਰ ‘ਤੇ ਤਿਆਰ ਕੀਤੇ GPUs ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇੱਕ ਉੱਨਤ AI ਮਾਡਲ ਨੂੰ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਸਿਖਲਾਈ ਦੇਣ ਦੀ ਉਨ੍ਹਾਂ ਦੀ ਯੋਗਤਾ ਵਿੱਚ ਹੈ।
ਸਵਾਲ ਵਿੱਚ ਮਾਡਲ, ਜਿਸਦਾ ਨਾਮ Ling-Plus-Base ਹੈ, ਕੋਈ ਹਲਕਾ ਨਹੀਂ ਹੈ। ਇਹ ਇੱਕ Mixture-of-Experts (MoE) ਆਰਕੀਟੈਕਚਰ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਗਿਆ ਹੈ, ਇੱਕ ਤਕਨੀਕ ਜੋ LLMs ਨੂੰ ਸਕੇਲ ਕਰਨ ਵਿੱਚ ਇਸਦੀ ਕੁਸ਼ਲਤਾ ਲਈ ਖਿੱਚ ਪ੍ਰਾਪਤ ਕਰ ਰਹੀ ਹੈ। ਇੱਕ ਮਹੱਤਵਪੂਰਨ 300 ਬਿਲੀਅਨ ਪੈਰਾਮੀਟਰਾਂ ਦਾ ਮਾਣ ਕਰਦੇ ਹੋਏ, Ling-Plus-Base ਹੋਰ ਪ੍ਰਮੁੱਖ ਗਲੋਬਲ ਮਾਡਲਾਂ ਦੇ ਮੁਕਾਬਲੇ ਇੱਕ ਲੀਗ ਵਿੱਚ ਕੰਮ ਕਰਦਾ ਹੈ। ਮਹੱਤਵਪੂਰਨ ਅੰਤਰ, ਹਾਲਾਂਕਿ, ਇਸਦੀ ਸਿਖਲਾਈ ਨੂੰ ਅਧਾਰ ਬਣਾਉਣ ਵਾਲਾ ਹਾਰਡਵੇਅਰ ਹੈ। ਖੋਜ ਦੇ ਨਤੀਜਿਆਂ ਅਨੁਸਾਰ, ਇਸ ਸ਼ਕਤੀਸ਼ਾਲੀ ਮਾਡਲ ਨੂੰ ਟੀਮ ਦੁਆਰਾ ‘ਘੱਟ-ਪ੍ਰਦਰਸ਼ਨ ਵਾਲੇ ਉਪਕਰਣਾਂ’ ਵਜੋਂ ਵਰਣਿਤ ਕੀਤੇ ਗਏ ਉਪਕਰਣਾਂ ‘ਤੇ ਪਰਿਪੱਕਤਾ ਲਈ ਪਾਲਿਆ ਜਾ ਸਕਦਾ ਹੈ। ਇਹ ਧਿਆਨ ਨਾਲ ਚੁਣਿਆ ਗਿਆ ਵਾਕੰਸ਼ ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਪ੍ਰੋਸੈਸਿੰਗ ਯੂਨਿਟਾਂ ਦੀ ਵਰਤੋਂ ਵੱਲ ਇਸ਼ਾਰਾ ਕਰਦਾ ਹੈ ਜੋ US ਨਿਰਯਾਤ ਪਾਬੰਦੀਆਂ ਦੇ ਦਾਇਰੇ ਤੋਂ ਬਾਹਰ ਆਉਂਦੀਆਂ ਹਨ, ਚੀਨ ਦੇ ਅੰਦਰ ਡਿਜ਼ਾਈਨ ਕੀਤੇ ਅਤੇ ਨਿਰਮਿਤ ਚਿੱਪਾਂ ਦੀ ਵਰਤੋਂ ਦਾ ਜ਼ੋਰਦਾਰ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ।
ਇਹ ਵਿਕਾਸ ਸਿਰਫ਼ ਇੱਕ ਤਕਨੀਕੀ ਹੱਲ ਤੋਂ ਵੱਧ ਹੈ; ਇਹ ਇੱਕ ਸੰਭਾਵੀ ਰਣਨੀਤਕ ਧੁਰੀ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਸਭ ਤੋਂ ਉੱਚ-ਪੱਧਰੀ, ਪ੍ਰਤਿਬੰਧਿਤ ਵਿਦੇਸ਼ੀ ਹਾਰਡਵੇਅਰ ‘ਤੇ ਵਿਸ਼ੇਸ਼ ਤੌਰ ‘ਤੇ ਨਿਰਭਰ ਕੀਤੇ ਬਿਨਾਂ ਅਤਿ-ਆਧੁਨਿਕ ਮਾਡਲਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਦੀ ਸਮਰੱਥਾ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਕੇ, Ant Group ਨਾ ਸਿਰਫ਼ ਸਪਲਾਈ ਚੇਨ ਦੇ ਜੋਖਮਾਂ ਨੂੰ ਘਟਾ ਰਿਹਾ ਹੈ ਬਲਕਿ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਮਹੱਤਵਪੂਰਨ ਲਾਗਤ ਕੁਸ਼ਲਤਾਵਾਂ ਨੂੰ ਵੀ ਅਨਲੌਕ ਕਰ ਰਿਹਾ ਹੈ।
ਆਰਥਿਕ ਸਮੀਕਰਨ: ਸਿਖਲਾਈ ਲਾਗਤਾਂ ਵਿੱਚ ਕਟੌਤੀ
Ling ਟੀਮ ਦੀ ਖੋਜ ਤੋਂ ਉੱਭਰਨ ਵਾਲੇ ਸਭ ਤੋਂ ਮਜਬੂਰ ਕਰਨ ਵਾਲੇ ਅੰਕੜਿਆਂ ਵਿੱਚੋਂ ਇੱਕ Ling-Plus-Base ਮਾਡਲ ਦੇ ਮਹੱਤਵਪੂਰਨ ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਪੜਾਅ ਦੌਰਾਨ ਕੰਪਿਊਟਿੰਗ ਲਾਗਤਾਂ ਵਿੱਚ 20 ਪ੍ਰਤੀਸ਼ਤ ਦੀ ਕਮੀ ਹੈ। ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਬਦਨਾਮ ਤੌਰ ‘ਤੇ ਸਰੋਤ-ਸੰਘਣੀ ਹੁੰਦੀ ਹੈ, ਜਿਸ ਵਿੱਚ ਭਾਸ਼ਾ ਦੇ ਪੈਟਰਨ, ਸੰਦਰਭ ਅਤੇ ਗਿਆਨ ਸਿੱਖਣ ਲਈ ਮਾਡਲ ਨੂੰ ਵਿਸ਼ਾਲ ਡੇਟਾਸੈਟਾਂ ਨੂੰ ਫੀਡ ਕਰਨਾ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ। ਇਹ ਬੁਨਿਆਦੀ LLMs ਨੂੰ ਵਿਕਸਤ ਕਰਨ ਨਾਲ ਜੁੜੇ ਸਮੁੱਚੇ ਖਰਚੇ ਦਾ ਇੱਕ ਵੱਡਾ ਹਿੱਸਾ ਬਣਦਾ ਹੈ। ਇਸ ਲਈ, ਇਸ ਪੜਾਅ ਵਿੱਚ ਪੰਜਵੇਂ ਹਿੱਸੇ ਦੀ ਲਾਗਤ ਵਿੱਚ ਕਮੀ ਪ੍ਰਾਪਤ ਕਰਨਾ ਮਹੱਤਵਪੂਰਨ ਬੱਚਤਾਂ ਵਿੱਚ ਬਦਲਦਾ ਹੈ, ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਹੋਰ ਖੋਜ, ਵਿਕਾਸ, ਜਾਂ ਵੱਡੇ ਪੈਮਾਨੇ ‘ਤੇ ਤੈਨਾਤੀ ਲਈ ਪੂੰਜੀ ਨੂੰ ਮੁਕਤ ਕਰਦਾ ਹੈ।
ਇਹ ਲਾਗਤ ਬੱਚਤ ਕਿਵੇਂ ਪ੍ਰਾਪਤ ਕੀਤੀ ਜਾਂਦੀ ਹੈ? ਜਦੋਂ ਕਿ ਪੇਪਰ ਸਹੀ ਲਾਗਤ ਦੇ ਵੇਰਵੇ ਨਹੀਂ ਦਿੰਦਾ, ਕਈ ਕਾਰਕ ਸੰਭਾਵਤ ਤੌਰ ‘ਤੇ ਯੋਗਦਾਨ ਪਾਉਂਦੇ ਹਨ:
- ਹਾਰਡਵੇਅਰ ਖਰੀਦ: ਘਰੇਲੂ ਤੌਰ ‘ਤੇ ਤਿਆਰ ਕੀਤੇ GPUs, ਭਾਵੇਂ Nvidia ਦੀਆਂ ਚੋਟੀ ਦੀਆਂ ਪੇਸ਼ਕਸ਼ਾਂ ਨਾਲੋਂ ਵਿਅਕਤੀਗਤ ਤੌਰ ‘ਤੇ ਘੱਟ ਸ਼ਕਤੀਸ਼ਾਲੀ ਹੋਣ, ਘੱਟ ਖਰੀਦ ਮੁੱਲ ‘ਤੇ ਆ ਸਕਦੇ ਹਨ ਜਾਂ ਚੀਨੀ ਮਾਰਕੀਟ ਦੇ ਅੰਦਰ ਵਧੇਰੇ ਅਨੁਕੂਲ ਵਾਲੀਅਮ ਛੋਟਾਂ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰ ਸਕਦੇ ਹਨ, ਖਾਸ ਤੌਰ ‘ਤੇ ਉੱਚ-ਅੰਤ ਵਾਲੇ Nvidia ਚਿੱਪਾਂ ਦੀ ਸੀਮਤ ਸਪਲਾਈ ਨੂੰ ਧਿਆਨ ਵਿੱਚ ਰੱਖਦੇ ਹੋਏ।
- ਊਰਜਾ ਕੁਸ਼ਲਤਾ: ਹਾਲਾਂਕਿ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਨਹੀਂ ਦੱਸਿਆ ਗਿਆ ਹੈ, ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਘੱਟ ਬਿਜਲੀ ਦੀ ਖਪਤ ਕਰਨ ਵਾਲੇ (ਹਾਲਾਂਕਿ ਸ਼ਾਇਦ ਪ੍ਰਤੀ ਯੂਨਿਟ ਘੱਟ ਪ੍ਰਦਰਸ਼ਨ ਕਰਨ ਵਾਲੇ) ਘਰੇਲੂ ਚਿੱਪਾਂ ਲਈ ਸਿਖਲਾਈ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣਾ ਘੱਟ ਸੰਚਾਲਨ ਊਰਜਾ ਲਾਗਤਾਂ ਵਿੱਚ ਯੋਗਦਾਨ ਪਾ ਸਕਦਾ ਹੈ, ਜੋ ਵੱਡੇ ਡੇਟਾ ਸੈਂਟਰਾਂ ਨੂੰ ਚਲਾਉਣ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਕਾਰਕ ਹੈ।
- ਐਲਗੋਰਿਦਮਿਕ ਅਤੇ ਆਰਕੀਟੈਕਚਰਲ ਓਪਟੀਮਾਈਜੇਸ਼ਨ: MoE ਆਰਕੀਟੈਕਚਰ ਦੀ ਵਰਤੋਂ ਆਪਣੇ ਆਪ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਹੈ। MoE ਮਾਡਲ ਕਿਸੇ ਦਿੱਤੇ ਗਏ ਇਨਪੁਟ ਲਈ ਸਿਰਫ਼ ਖਾਸ ‘ਮਾਹਰ’ ਸਬ-ਨੈੱਟਵਰਕਾਂ ਨੂੰ ਸਰਗਰਮ ਕਰਦੇ ਹਨ, ਨਾ ਕਿ ਸੰਘਣੇ ਆਰਕੀਟੈਕਚਰ ਵਾਂਗ ਪੂਰੇ ਮਾਡਲ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨ ਦੀ ਬਜਾਏ। ਇਹ ਅੰਦਰੂਨੀ ਵਿਰਲਤਾ ਸਿਖਲਾਈ ਅਤੇ ਅਨੁਮਾਨ ਦੋਵਾਂ ਦੌਰਾਨ ਕੰਪਿਊਟੇਸ਼ਨਲ ਲੋਡ ਨੂੰ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ ਘਟਾ ਸਕਦੀ ਹੈ, ਜਿਸ ਨਾਲ ਪ੍ਰਤੀ ਚਿੱਪ ਘੱਟ ਕੱਚੀ ਪ੍ਰੋਸੈਸਿੰਗ ਸ਼ਕਤੀ ਦੇ ਨਾਲ ਵੀ ਚੰਗੇ ਨਤੀਜੇ ਪ੍ਰਾਪਤ ਕਰਨਾ ਸੰਭਵ ਹੋ ਜਾਂਦਾ ਹੈ। Ant ਦੀ ਸਫਲਤਾ ਉਪਲਬਧ ਘਰੇਲੂ ਹਾਰਡਵੇਅਰ ਦੀ ਕੁਸ਼ਲਤਾ ਨੂੰ ਵੱਧ ਤੋਂ ਵੱਧ ਕਰਨ ਲਈ ਉੱਨਤ ਸੌਫਟਵੇਅਰ ਅਤੇ ਐਲਗੋਰਿਦਮਿਕ ਟਿਊਨਿੰਗ ਦਾ ਸੁਝਾਅ ਦਿੰਦੀ ਹੈ।
ਇਹ ਲਾਗਤ ਵਿੱਚ ਕਮੀ ਸਿਰਫ਼ ਇੱਕ ਲੇਖਾ ਲਾਭ ਨਹੀਂ ਹੈ; ਇਹ ਵੱਡੇ ਪੈਮਾਨੇ ਦੇ ਮਾਡਲਾਂ ਨੂੰ ਵਿਕਸਤ ਕਰਨ ਲਈ ਦਾਖਲੇ ਦੀ ਰੁਕਾਵਟ ਨੂੰ ਘੱਟ ਕਰਦਾ ਹੈ ਅਤੇ ਕੰਪਨੀ ਦੇ ਅੰਦਰ ਅਤੇ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਵਿਆਪਕ ਚੀਨੀ ਤਕਨੀਕੀ ਈਕੋਸਿਸਟਮ ਵਿੱਚ AI ਨਵੀਨਤਾ ਦੀ ਗਤੀ ਨੂੰ ਤੇਜ਼ ਕਰ ਸਕਦਾ ਹੈ ਜੇਕਰ ਢੰਗ ਦੁਹਰਾਉਣ ਯੋਗ ਸਾਬਤ ਹੁੰਦੇ ਹਨ।
ਪ੍ਰਦਰਸ਼ਨ ਸਮਾਨਤਾ: ਹਾਰਡਵੇਅਰ ਪਾੜੇ ਨੂੰ ਪੂਰਾ ਕਰਨਾ?
ਲਾਗਤ ਬੱਚਤਾਂ ਆਕਰਸ਼ਕ ਹੁੰਦੀਆਂ ਹਨ, ਪਰ ਜੇਕਰ ਨਤੀਜੇ ਵਜੋਂ AI ਮਾਡਲ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ ਘੱਟ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ ਤਾਂ ਉਹਨਾਂ ਦਾ ਕੋਈ ਮਤਲਬ ਨਹੀਂ ਹੁੰਦਾ। Ant ਦੀ Ling ਟੀਮ ਇਸ ਨੂੰ ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਸੰਬੋਧਿਤ ਕਰਦੀ ਹੈ, ਇਹ ਦਾਅਵਾ ਕਰਦੇ ਹੋਏ ਕਿ Ling-Plus-Base ਖੇਤਰ ਵਿੱਚ ਹੋਰ ਚੰਗੀ ਤਰ੍ਹਾਂ ਮੰਨੇ ਜਾਂਦੇ ਮਾਡਲਾਂ ਦੇ ਮੁਕਾਬਲੇ ਪ੍ਰਦਰਸ਼ਨ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ। ਖਾਸ ਤੌਰ ‘ਤੇ, ਉਹਨਾਂ ਨੇ ਆਪਣੀ ਰਚਨਾ ਨੂੰ Qwen2.5-72B-Instruct (ਪੇਰੈਂਟ ਕੰਪਨੀ Alibaba ਦੁਆਰਾ ਵਿਕਸਤ) ਅਤੇ DeepSeek-V2.5-1210-Chat, ਇੱਕ ਹੋਰ ਪ੍ਰਮੁੱਖ ਚੀਨੀ LLM ਵਰਗੇ ਮਾਡਲਾਂ ਦੇ ਵਿਰੁੱਧ ਬੈਂਚਮਾਰਕ ਕੀਤਾ।
‘ਘੱਟ-ਪ੍ਰਦਰਸ਼ਨ ਵਾਲੇ ਉਪਕਰਣਾਂ’ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੇ ਬਾਵਜੂਦ ‘ਤੁਲਨਾਤਮਕ ਪ੍ਰਦਰਸ਼ਨ’ ਦਾ ਦਾਅਵਾ ਧਿਆਨ ਦੇਣ ਯੋਗ ਹੈ। ਇਹ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ Ant ਨੇ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਕਿਸੇ ਵੀ ਕੱਚੇ ਕੰਪਿਊਟੇਸ਼ਨਲ ਘਾਟੇ ਦੀ ਪੂਰਤੀ ਲਈ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਤਰੀਕੇ ਲੱਭੇ ਹਨ:
- ਐਡਵਾਂਸਡ ਮਾਡਲ ਆਰਕੀਟੈਕਚਰ: MoE ਡਿਜ਼ਾਈਨ ਇੱਥੇ ਮਹੱਤਵਪੂਰਨ ਹੈ, ਕਾਰਜਭਾਰ ਨੂੰ ਕੁਸ਼ਲਤਾ ਨਾਲ ਵੰਡਦਾ ਹੈ।
- ਸੌਫਟਵੇਅਰ ਓਪਟੀਮਾਈਜੇਸ਼ਨ: ਵਰਤੇ ਜਾ ਰਹੇ ਘਰੇਲੂ GPUs ਦੇ ਆਰਕੀਟੈਕਚਰ ਲਈ ਖਾਸ ਤੌਰ ‘ਤੇ ਸਿਖਲਾਈ ਸੌਫਟਵੇਅਰ ਸਟੈਕ (ਜਿਵੇਂ ਕਿ ਸਮਾਨਾਂਤਰ ਫਰੇਮਵਰਕ ਅਤੇ ਸੰਖਿਆਤਮਕ ਲਾਇਬ੍ਰੇਰੀਆਂ) ਨੂੰ ਤਿਆਰ ਕਰਨਾ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਇਸ ਵਿੱਚ ਅਕਸਰ ਮਹੱਤਵਪੂਰਨ ਇੰਜੀਨੀਅਰਿੰਗ ਯਤਨ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ।
- ਡੇਟਾ ਕਿਊਰੇਸ਼ਨ ਅਤੇ ਸਿਖਲਾਈ ਤਕਨੀਕਾਂ: ਸਿਖਲਾਈ ਡੇਟਾ ਦੀ ਚੋਣ ਕਰਨ ਅਤੇ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਸੁਧਾਰਨ ਲਈ ਉੱਨਤ ਢੰਗ ਅੰਤਿਮ ਮਾਡਲ ਦੀ ਗੁਣਵੱਤਾ ਨੂੰ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ ਪ੍ਰਭਾਵਤ ਕਰ ਸਕਦੇ ਹਨ, ਕਈ ਵਾਰ ਹਾਰਡਵੇਅਰ ਸੀਮਾਵਾਂ ਦੀ ਪੂਰਤੀ ਕਰਦੇ ਹਨ।
ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਦਾਅਵਿਆਂ ਨੂੰ ਸੂਖਮਤਾ ਨਾਲ ਪਹੁੰਚਣਾ ਮਹੱਤਵਪੂਰਨ ਹੈ। ‘ਤੁਲਨਾਤਮਕ’ ਵੱਖ-ਵੱਖ ਬੈਂਚਮਾਰਕਾਂ (ਜਿਵੇਂ ਕਿ ਭਾਸ਼ਾ ਸਮਝ, ਤਰਕ, ਉਤਪਾਦਨ, ਕੋਡਿੰਗ) ਵਿੱਚ ਨਤੀਜਿਆਂ ਦੀ ਇੱਕ ਸੀਮਾ ਨੂੰ ਸ਼ਾਮਲ ਕਰ ਸਕਦਾ ਹੈ। ਕਈ ਮਾਨਕੀਕ੍ਰਿਤ ਟੈਸਟਾਂ ਵਿੱਚ ਵਿਸਤ੍ਰਿਤ ਬੈਂਚਮਾਰਕ ਨਤੀਜਿਆਂ ਤੱਕ ਪਹੁੰਚ ਤੋਂ ਬਿਨਾਂ, ਇੱਕ ਸਹੀ ਤੁਲਨਾ ਚੁਣੌਤੀਪੂਰਨ ਬਣੀ ਹੋਈ ਹੈ। ਹਾਲਾਂਕਿ, ਦਾਅਵਾ ਖੁਦ Ant ਦੇ ਵਿਸ਼ਵਾਸ ਦਾ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ ਕਿ ਇਸਦੀ ਪਹੁੰਚ ਲਾਗਤ/ਪਹੁੰਚਯੋਗਤਾ ਅਤੇ ਸਮਰੱਥਾ ਦੇ ਵਿਚਕਾਰ ਇੱਕ ਅਪੰਗ ਵਪਾਰ-ਬੰਦ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ। ਇਹ ਹਾਰਡਵੇਅਰ ਪਾਬੰਦੀਆਂ ਦੁਆਰਾ ਲਗਾਈਆਂ ਗਈਆਂ ਰੁਕਾਵਟਾਂ ਦੇ ਅੰਦਰ ਵੀ ਮੁਕਾਬਲੇਬਾਜ਼ੀ ਬਣਾਈ ਰੱਖਣ ਦਾ ਇੱਕ ਮਾਰਗ ਦਰਸਾਉਂਦਾ ਹੈ।
ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਖੁਦ ਵਿਆਪਕ ਪ੍ਰਭਾਵਾਂ ਨੂੰ ਉਜਾਗਰ ਕੀਤਾ: ‘ਇਹ ਨਤੀਜੇ ਘੱਟ ਸ਼ਕਤੀਸ਼ਾਲੀ ਹਾਰਡਵੇਅਰ ‘ਤੇ ਅਤਿ-ਆਧੁਨਿਕ ਵੱਡੇ ਪੈਮਾਨੇ ਦੇ MoE ਮਾਡਲਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਦੀ ਸੰਭਾਵਨਾ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ, ਕੰਪਿਊਟਿੰਗ ਸਰੋਤ ਚੋਣ ਦੇ ਸਬੰਧ ਵਿੱਚ ਬੁਨਿਆਦੀ ਮਾਡਲ ਵਿਕਾਸ ਲਈ ਵਧੇਰੇ ਲਚਕਦਾਰ ਅਤੇ ਲਾਗਤ-ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਪਹੁੰਚ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦੇ ਹਨ।’ ਇਹ ਇੱਕ ਕਿਸਮ ਦੇ ਲੋਕਤੰਤਰੀਕਰਨ ਵੱਲ ਇਸ਼ਾਰਾ ਕਰਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਅਤਿ-ਆਧੁਨਿਕ AI ਵਿਕਾਸ ਨੂੰ ਅੱਗੇ ਵਧਣ ਦੀ ਇਜਾਜ਼ਤ ਮਿਲਦੀ ਹੈ ਭਾਵੇਂ ਪ੍ਰੋਸੈਸਿੰਗ ਸ਼ਕਤੀ ਦੇ ਪੂਰਨ ਸਿਖਰ ਤੱਕ ਪਹੁੰਚ ਸੀਮਤ ਹੋਵੇ।
Mixture-of-Experts (MoE) ਲਾਭ ਨੂੰ ਸਮਝਣਾ
Mixture-of-Experts ਆਰਕੀਟੈਕਚਰ Ant Group ਦੀ ਰਿਪੋਰਟ ਕੀਤੀ ਸਫਲਤਾ ਦਾ ਕੇਂਦਰ ਹੈ। ਇਹ ਰਵਾਇਤੀ ‘ਸੰਘਣੇ’ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਮਾਡਲਾਂ ਤੋਂ ਇੱਕ ਵਿਦਾਇਗੀ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ ਜਿੱਥੇ ਹਰੇਕ ਇਨਪੁਟ ਹਰੇਕ ਪੈਰਾਮੀਟਰ ਨੂੰ ਸਰਗਰਮ ਕਰਦਾ ਹੈ। ਇੱਕ MoE ਮਾਡਲ ਵਿੱਚ:
- ਮਾਡਲ ਬਹੁਤ ਸਾਰੇ ਛੋਟੇ, ਵਿਸ਼ੇਸ਼ ‘ਮਾਹਰ’ ਨੈੱਟਵਰਕਾਂ ਦਾ ਬਣਿਆ ਹੁੰਦਾ ਹੈ।
- ਇੱਕ ‘ਗੇਟਿੰਗ ਨੈੱਟਵਰਕ’ ਜਾਂ ‘ਰਾਊਟਰ’ ਵਿਧੀ ਆਉਣ ਵਾਲੇ ਡੇਟਾ (LLMs ਦੇ ਮਾਮਲੇ ਵਿੱਚ ਟੋਕਨ) ਨੂੰ ਪ੍ਰੋਸੈਸਿੰਗ ਲਈ ਸਭ ਤੋਂ ਢੁਕਵੇਂ ਮਾਹਰ(ਆਂ) ਵੱਲ ਨਿਰਦੇਸ਼ਿਤ ਕਰਨਾ ਸਿੱਖਦੀ ਹੈ।
- ਸਿਰਫ਼ ਚੁਣੇ ਗਏ ਮਾਹਰ(ਆਂ) - ਅਕਸਰ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਸੈਂਕੜਿਆਂ ਵਿੱਚੋਂ ਸਿਰਫ਼ ਇੱਕ ਜਾਂ ਦੋ - ਉਸ ਖਾਸ ਡੇਟਾ ਦੇ ਟੁਕੜੇ ਲਈ ਗਣਨਾ ਕਰਦੇ ਹਨ।
ਇਹ ਪਹੁੰਚ ਕਈ ਮੁੱਖ ਫਾਇਦੇ ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ, ਖਾਸ ਤੌਰ ‘ਤੇ ਹਾਰਡਵੇਅਰ ਦੀਆਂ ਰੁਕਾਵਟਾਂ ਦੇ ਸੰਦਰਭ ਵਿੱਚ ਢੁਕਵੀਂ:
- ਸਕੇਲੇਬਿਲਟੀ: MoE ਮਾਡਲਾਂ ਨੂੰ ਅਨੁਮਾਨ ਜਾਂ ਸਿਖਲਾਈ ਦੇ ਕਦਮਾਂ ਦੌਰਾਨ ਹਰੇਕ ਇਨਪੁਟ ਟੋਕਨ ਦੀ ਪ੍ਰੋਸੈਸਿੰਗ ਲਈ ਕੰਪਿਊਟੇਸ਼ਨਲ ਲਾਗਤ ਵਿੱਚ ਅਨੁਪਾਤਕ ਵਾਧੇ ਤੋਂ ਬਿਨਾਂ ਵਿਸ਼ਾਲ ਪੈਰਾਮੀਟਰ ਗਿਣਤੀ (ਖਰਬਾਂ ਸੰਭਵ ਹੋ ਰਹੇ ਹਨ) ਤੱਕ ਵਧਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ। ਇਹ ਇਸ ਲਈ ਹੈ ਕਿਉਂਕਿ ਕੁੱਲ ਪੈਰਾਮੀਟਰਾਂ ਦਾ ਸਿਰਫ਼ ਇੱਕ ਹਿੱਸਾ ਕਿਸੇ ਵੀ ਸਮੇਂ ਸਰਗਰਮ ਹੁੰਦਾ ਹੈ।
- ਸਿਖਲਾਈ ਕੁਸ਼ਲਤਾ: ਜਦੋਂ ਕਿ MoE ਮਾਡਲਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਦੀਆਂ ਆਪਣੀਆਂ ਜਟਿਲਤਾਵਾਂ ਹੁੰਦੀਆਂ ਹਨ (ਜਿਵੇਂ ਕਿ ਮਾਹਰਾਂ ਵਿੱਚ ਲੋਡ ਸੰਤੁਲਨ), ਪ੍ਰਤੀ ਟੋਕਨ ਘਟੀ ਹੋਈ ਗਣਨਾ ਤੇਜ਼ ਸਿਖਲਾਈ ਦੇ ਸਮੇਂ ਵਿੱਚ ਬਦਲ ਸਕਦੀ ਹੈ ਜਾਂ, ਜਿਵੇਂ ਕਿ Ant ਦਰਸਾਉਂਦਾ ਹੈ, ਵਾਜਬ ਸਮਾਂ-ਸੀਮਾਵਾਂ ਦੇ ਅੰਦਰ ਘੱਟ ਸ਼ਕਤੀਸ਼ਾਲੀ ਹਾਰਡਵੇਅਰ ‘ਤੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਸਿਖਲਾਈ ਦੇਣ ਦੀ ਯੋਗਤਾ।
- ਵਿਸ਼ੇਸ਼ਤਾ: ਹਰੇਕ ਮਾਹਰ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਵੱਖ-ਵੱਖ ਕਿਸਮਾਂ ਦੇ ਡੇਟਾ, ਕਾਰਜਾਂ, ਜਾਂ ਗਿਆਨ ਡੋਮੇਨਾਂ ਵਿੱਚ ਮੁਹਾਰਤ ਹਾਸਲ ਕਰ ਸਕਦਾ ਹੈ, ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਖਾਸ ਖੇਤਰਾਂ ਵਿੱਚ ਉੱਚ ਗੁਣਵੱਤਾ ਵਾਲੇ ਆਉਟਪੁੱਟ ਵੱਲ ਅਗਵਾਈ ਕਰਦਾ ਹੈ।
ਦੁਨੀਆ ਭਰ ਦੀਆਂ ਪ੍ਰਮੁੱਖ AI ਲੈਬਾਂ ਨੇ MoE ਨੂੰ ਅਪਣਾਇਆ ਹੈ, ਜਿਸ ਵਿੱਚ Google (GShard, Switch Transformer), Mistral AI (Mixtral ਮਾਡਲ), ਅਤੇ ਚੀਨ ਦੇ ਅੰਦਰ, DeepSeek ਅਤੇ Alibaba (ਜਿਨ੍ਹਾਂ ਦੇ Qwen ਮਾਡਲਾਂ ਵਿੱਚ MoE ਤੱਤ ਸ਼ਾਮਲ ਹਨ) ਵਰਗੀਆਂ ਕੰਪਨੀਆਂ ਸ਼ਾਮਲ ਹਨ। Ant ਦਾ Ling-Plus-Base ਇਸ ਨੂੰ ਇਸ ਮੋਹਰੀ ਕਤਾਰ ਵਿੱਚ ਮਜ਼ਬੂਤੀ ਨਾਲ ਰੱਖਦਾ ਹੈ, ਹਾਰਡਵੇਅਰ ਹਕੀਕਤਾਂ ਨੂੰ ਨੈਵੀਗੇਟ ਕਰਨ ਲਈ ਆਰਕੀਟੈਕਚਰਲ ਨਵੀਨਤਾ ਦਾ ਲਾਭ ਉਠਾਉਂਦਾ ਹੈ।
ਘਰੇਲੂ ਹਾਰਡਵੇਅਰ ਈਕੋਸਿਸਟਮ: Nvidia ਖਾਲੀ ਥਾਂ ਨੂੰ ਭਰਨਾ
ਜਦੋਂ ਕਿ Ant ਖੋਜ ਪੱਤਰ ਨੇ ਵਰਤੇ ਗਏ ਹਾਰਡਵੇਅਰ ਦਾ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਨਾਮ ਲੈਣ ਤੋਂ ਪਰਹੇਜ਼ ਕੀਤਾ, ਬਾਅਦ ਦੀ ਰਿਪੋਰਟਿੰਗ, ਖਾਸ ਤੌਰ ‘ਤੇ Bloomberg ਦੁਆਰਾ, ਨੇ ਸੰਕੇਤ ਦਿੱਤਾ ਕਿ ਇਸ ਕਾਰਨਾਮੇ ਵਿੱਚ ਘਰੇਲੂ ਤੌਰ ‘ਤੇ ਡਿਜ਼ਾਈਨ ਕੀਤੇ ਚਿੱਪ ਸ਼ਾਮਲ ਸਨ। ਇਸ ਵਿੱਚ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ Ant ਦੀ ਸਹਿਯੋਗੀ ਕੰਪਨੀ, Alibaba ਤੋਂ ਉਤਪੰਨ ਹੋਣ ਵਾਲੇ ਪ੍ਰੋਸੈਸਰ ਸ਼ਾਮਲ ਹਨ, ਜਿਸਦੀ ਆਪਣੀ ਚਿੱਪ ਡਿਜ਼ਾਈਨ ਯੂਨਿਟ T-Head ਹੈ (Yitian 710 ਵਰਗੇ CPUs ਦਾ ਉਤਪਾਦਨ ਕਰਦੀ ਹੈ ਅਤੇ ਪਹਿਲਾਂ AI ਐਕਸਲੇਟਰਾਂ ਦੀ ਖੋਜ ਕਰਦੀ ਸੀ), ਅਤੇ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ, Huawei Technologies।
Huawei, ਖੁਦ ਤੀਬਰ US ਪਾਬੰਦੀਆਂ ਦਾ ਸਾਹਮਣਾ ਕਰਨ ਦੇ ਬਾਵਜੂਦ, ਚੀਨੀ ਮਾਰਕੀਟ ਦੇ ਅੰਦਰ Nvidia ਦੀਆਂ ਪੇਸ਼ਕਸ਼ਾਂ ਦੇ ਸਿੱਧੇ ਵਿਕਲਪ ਵਜੋਂ ਆਪਣੀ Ascend ਸੀਰੀਜ਼ ਦੇ AI ਐਕਸਲੇਟਰਾਂ (ਜਿਵੇਂ ਕਿ Ascend 910B) ਨੂੰ ਹਮਲਾਵਰ ਢੰਗ ਨਾਲ ਵਿਕਸਤ ਕਰ ਰਿਹਾ ਹੈ। ਇਹ ਚਿੱਪ ਕਥਿਤ ਤੌਰ ‘ਤੇ ਪ੍ਰਮੁੱਖ ਚੀਨੀ ਤਕਨੀਕੀ ਫਰਮਾਂ ਦੁਆਰਾ ਅਪਣਾਏ ਜਾ ਰਹੇ ਹਨ। Ant Group ਦੀ Ling-Plus-Base ਜਿੰਨੇ ਵੱਡੇ ਮਾਡਲ ਲਈ ਅਜਿਹੇ ਹਾਰਡਵੇਅਰ ਦੀ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਵਰਤੋਂ ਕਰਨ ਦੀ ਯੋਗਤਾ ਇਹਨਾਂ ਘਰੇਲੂ ਵਿਕਲਪਾਂ ਦੀ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਪ੍ਰਮਾਣਿਕਤਾ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ।
ਇਹ ਨੋਟ ਕਰਨਾ ਮਹੱਤਵਪੂਰਨ ਹੈ ਕਿ Ant Group ਨੇ Nvidia ਨੂੰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਨਹੀਂ ਛੱਡਿਆ ਹੈ। ਰਿਪੋਰਟਾਂ ਸੁਝਾਅ ਦਿੰਦੀਆਂ ਹਨ ਕਿ Nvidia ਚਿੱਪ Ant ਦੇ AI ਵਿਕਾਸ ਟੂਲਕਿੱਟ ਦਾ ਹਿੱਸਾ ਬਣੇ ਹੋਏ ਹਨ, ਸੰਭਾਵਤ ਤੌਰ ‘ਤੇ ਉਹਨਾਂ ਕਾਰਜਾਂ ਲਈ ਵਰਤੇ ਜਾਂਦੇ ਹਨ ਜਿੱਥੇ ਉਹਨਾਂ ਦੀਆਂ ਖਾਸ ਪ੍ਰਦਰਸ਼ਨ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਜਾਂ ਪਰਿਪੱਕ ਸੌਫਟਵੇਅਰ ਈਕੋਸਿਸਟਮ (ਜਿਵੇਂ ਕਿ CUDA) ਫਾਇਦੇ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ, ਜਾਂ ਪੁਰਾਣੇ ਸਿਸਟਮਾਂ ਲਈ। ਇਹ ਕਦਮ ਜ਼ਰੂਰੀ ਤੌਰ ‘ਤੇ ਰਾਤੋ-ਰਾਤ ਪੂਰੀ ਤਰ੍ਹਾਂ ਬਦਲਣ ਬਾਰੇ ਨਹੀਂ ਹੈ ਬਲਕਿ ਵਿਹਾਰਕ, ਸਮਾਨਾਂਤਰ ਮਾਰਗ ਬਣਾਉਣ ਬਾਰੇ ਹੈ ਜੋ ਰਣਨੀਤਕ ਕਮਜ਼ੋਰੀ ਨੂੰ ਘਟਾਉਂਦੇ ਹਨ ਅਤੇ ਲਾਗਤਾਂ ਨੂੰ ਨਿਯੰਤਰਿਤ ਕਰਦੇ ਹਨ। ਇਹ ਹਾਈਬ੍ਰਿਡ ਪਹੁੰਚ ਕੰਪਨੀ ਨੂੰ ਸੁਤੰਤਰਤਾ ਪੈਦਾ ਕਰਦੇ ਹੋਏ ਸਭ ਤੋਂ ਵਧੀਆ ਉਪਲਬਧ ਸਾਧਨਾਂ ਦਾ ਲਾਭ ਉਠਾਉਣ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ। Ant Group ਨੇ ਖੁਦ ਕਾਰਪੋਰੇਟ ਵਿਵੇਕ ਦੀ ਇੱਕ ਡਿਗਰੀ ਬਣਾਈ ਰੱਖੀ, ਵਰਤੇ ਗਏ ਖਾਸ ਚਿੱਪਾਂ ‘ਤੇ ਅਧਿਕਾਰਤ ਤੌਰ ‘ਤੇ ਟਿੱਪਣੀ ਕਰਨ ਤੋਂ ਇਨਕਾਰ ਕਰ ਦਿੱਤਾ।
ਇੱਕ ਵਿਆਪਕ ਰੁਝਾਨ: AI ਸਵੈ-ਨਿਰਭਰਤਾ ਲਈ ਚੀਨ ਦਾ ਸਮੂਹਿਕ ਜ਼ੋਰ
Ant Group ਦੀ ਪਹਿਲਕਦਮੀ ਇਕੱਲਤਾ ਵਿੱਚ ਨਹੀਂ ਹੋ ਰਹੀ ਹੈ। ਇਹ US ਨਿਰਯਾਤ ਨਿਯੰਤਰਣਾਂ ਦੁਆਰਾ ਲਗਾਈਆਂ ਗਈਆਂ ਸੀਮਾਵਾਂ ਦੇ ਆਲੇ ਦੁਆਲੇ ਨਵੀਨਤਾ ਲਿਆਉਣ ਲਈ ਚੀਨ ਦੇ ਤਕਨਾਲੋਜੀ ਖੇਤਰ ਵਿੱਚ ਇੱਕ ਵਿਆਪਕ ਰਣਨੀਤਕ ਜ਼ੋਰ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ‘ਤਕਨੀਕੀ ਯੁੱਧ’ ਨੇ ਮਹੱਤਵਪੂਰਨ ਤਕਨਾਲੋਜੀਆਂ, ਖਾਸ ਤੌਰ ‘ਤੇ ਸੈਮੀਕੰਡਕਟਰਾਂ ਅਤੇ AI ਵਿੱਚ ਵਧੇਰੇ ਸਵੈ-ਨਿਰਭਰਤਾ ਪ੍ਰਾਪਤ ਕਰਨ ਦੇ ਯਤਨਾਂ ਨੂੰ ਉਤਪ੍ਰੇਰਿਤ ਕੀਤਾ ਹੈ।
ਹੋਰ ਪ੍ਰਮੁੱਖ ਖਿਡਾਰੀ ਸਮਾਨ ਟੀਚਿਆਂ ਦਾ ਪਿੱਛਾ ਕਰ ਰਹੇ ਹਨ:
- ByteDance: TikTok ਦੀ ਪੇਰੈਂਟ ਕੰਪਨੀ ਵੀ ਕਥਿਤ ਤੌਰ ‘ਤੇ ਆਪਣੀਆਂ AI ਅਭਿਲਾਸ਼ਾਵਾਂ ਲਈ ਵਿਕਲਪਕ ਚਿੱਪਾਂ, ਘਰੇਲੂ ਵਿਕਲਪਾਂ ਸਮੇਤ, ਨੂੰ ਸੁਰੱਖਿਅਤ ਕਰਨ ਅਤੇ ਵਰਤਣ ਲਈ ਕੰਮ ਕਰ ਰਹੀ ਹੈ, ਜੋ ਸਿਫਾਰਸ਼ ਐਲਗੋਰਿਦਮ, ਜਨਰੇਟਿਵ AI, ਅਤੇ ਹੋਰ ਬਹੁਤ ਕੁਝ ਫੈਲਾਉਂਦੀਆਂ ਹਨ।
- DeepSeek: ਇਹ AI ਸਟਾਰਟ-ਅੱਪ, ਜੋ ਆਪਣੇ ਸ਼ਕਤੀਸ਼ਾਲੀ ਓਪਨ-ਸੋਰਸ ਮਾਡਲਾਂ ਲਈ ਜਾਣਿਆ ਜਾਂਦਾ ਹੈ, ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਸਿਖਲਾਈ ਕੁਸ਼ਲਤਾ ਦਾ ਜ਼ਿਕਰ ਕਰਦਾ ਹੈ ਅਤੇ MoE ਆਰਕੀਟੈਕਚਰ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਮਾਡਲ ਵਿਕਸਤ ਕੀਤੇ ਹਨ, ਉਹਨਾਂ ਰਣਨੀਤੀਆਂ ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੈ ਜੋ ਸਿਰਫ਼ ਸਭ ਤੋਂ ਸ਼ਕਤੀਸ਼ਾਲੀ GPUs ਦੇ ਵਿਸ਼ਾਲ ਫਲੀਟਾਂ ‘ਤੇ ਘੱਟ ਨਿਰਭਰ ਹਨ।
- Baidu, Tencent, ਅਤੇ ਹੋਰ: ਸਾਰੀਆਂ ਪ੍ਰਮੁੱਖ ਚੀਨੀ ਕਲਾਉਡ ਅਤੇ ਤਕਨੀਕੀ ਕੰਪਨੀਆਂ AI ਵਿੱਚ ਭਾਰੀ ਨਿਵੇਸ਼ ਕਰ ਰਹੀਆਂ ਹਨ ਅਤੇ ਲਾਜ਼ਮੀ ਤੌਰ ‘ਤੇ ਹਾਰਡਵੇਅਰ ਵਿਭਿੰਨਤਾ ਰਣਨੀਤੀਆਂ ਦੀ ਖੋਜ ਕਰ ਰਹੀਆਂ