ਡੀਪਸੀਕ ਯੁੱਗ ਤੋਂ ਬਾਅਦ ਏਆਈ ਚਿਪਸ ਅਤੇ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ‘ਤੇ ਮੁੜ ਵਿਚਾਰ
ਡੀਪਸੀਕ ਦੀਆਂ ਤਰੱਕੀਆਂ ਦੁਆਰਾ ਦਰਸਾਈ ਗਈ ਏਆਈ ਤਕਨਾਲੋਜੀ ਵਿੱਚ ਤੇਜ਼ੀ ਨਾਲ ਹੋ ਰਹੇ ਨਵੀਨੀਕਰਨ ਲਈ ਇਹ ਜ਼ਰੂਰੀ ਹੈ ਕਿ ਅਸੀਂ ਡਾਟਾ ਸੈਂਟਰਾਂ, ਚਿਪਸ ਅਤੇ ਸਿਸਟਮਾਂ ਨੂੰ ਕਿਵੇਂ ਬਣਾਉਂਦੇ ਹਾਂ ਤਾਂ ਜੋ ਲੋੜੀਂਦੀ ਕੰਪਿਊਟਿੰਗ ਪਾਵਰ ਪ੍ਰਦਾਨ ਕੀਤੀ ਜਾ ਸਕੇ, ਇਸ ਬਾਰੇ ਬੁਨਿਆਦੀ ਮੁਲਾਂਕਣ ਕੀਤਾ ਜਾਵੇ। ਡੀਪਸੀਕ ਦੀਆਂ ਇੰਜੀਨੀਅਰਿੰਗ ਕਾਢਾਂ ਨੇ ਏਆਈ ਕੰਪਿਊਟਿੰਗ ਦੀ ਲਾਗਤ ਨੂੰ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ ਘਟਾ ਦਿੱਤਾ ਹੈ, ਜਿਸ ਨਾਲ ਏਆਈ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਦੇ ਭਵਿੱਖ ਬਾਰੇ ਇੱਕ ਵਿਆਪਕ ਚਰਚਾ ਸ਼ੁਰੂ ਹੋ ਗਈ ਹੈ।
ਹਾਲਾਂਕਿ ਡੀਪਸੀਕ ਨੇ ਏਆਈ ਤਕਨਾਲੋਜੀ ਦੀਆਂ ਸੀਮਾਵਾਂ ਨੂੰ ਜ਼ਿਆਦਾ ਵਧਾਇਆ ਨਹੀਂ ਹੋ ਸਕਦਾ, ਪਰ ਏਆਈ ਮਾਰਕੀਟ ‘ਤੇ ਇਸਦਾ ਪ੍ਰਭਾਵ ਡੂੰਘਾ ਹੈ। ਮਿਕਸਚਰ ਆਫ ਐਕਸਪਰਟਸ (MoE), ਮਲਟੀ-ਲੇਅਰ ਅਟੈਂਸ਼ਨ (MLA), ਅਤੇ ਮਲਟੀ-ਟੋਕਨ ਪ੍ਰੈਡਿਕਸ਼ਨ (MTP) ਵਰਗੀਆਂ ਤਕਨਾਲੋਜੀਆਂ ਨੇ ਡੀਪਸੀਕ ਦੇ ਨਾਲ ਪ੍ਰਮੁੱਖਤਾ ਪ੍ਰਾਪਤ ਕੀਤੀ ਹੈ। ਭਾਵੇਂ ਇਹਨਾਂ ਵਿੱਚੋਂ ਸਾਰੀਆਂ ਤਕਨਾਲੋਜੀਆਂ ਡੀਪਸੀਕ ਦੁਆਰਾ ਸ਼ੁਰੂ ਨਹੀਂ ਕੀਤੀਆਂ ਗਈਆਂ ਸਨ, ਪਰ ਉਹਨਾਂ ਦੇ ਸਫਲ ਲਾਗੂਕਰਨ ਨੇ ਵਿਆਪਕ ਗੋਦ ਲੈਣ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕੀਤਾ ਹੈ। ਐਮਐਲਏ, ਖਾਸ ਤੌਰ ‘ਤੇ, ਐਜ ਡਿਵਾਈਸਾਂ ਤੋਂ ਲੈ ਕੇ ਕਲਾਉਡ ਕੰਪਿਊਟਿੰਗ ਤੱਕ, ਵੱਖ-ਵੱਖ ਪਲੇਟਫਾਰਮਾਂ ‘ਤੇ ਚਰਚਾ ਦਾ ਕੇਂਦਰ ਬਣ ਗਿਆ ਹੈ।
ਐਮਐਲਏ ਅਤੇ ਐਲਗੋਰਿਦਮ ਇਨੋਵੇਸ਼ਨ ਦੀ ਚੁਣੌਤੀ
ਨੈਕਸਟਸਿਲੀਕਾਨ ਦੇ ਸੀਈਓ ਇਲਾਦ ਰਾਜ਼ ਨੇ ਹਾਲ ਹੀ ਵਿੱਚ ਦੱਸਿਆ ਕਿ ਜਦੋਂ ਕਿ ਐਮਐਲਏ ਮੈਮੋਰੀ ਕੁਸ਼ਲਤਾ ਵਿੱਚ ਸੁਧਾਰ ਕਰਦਾ ਹੈ, ਇਹ ਡਿਵੈਲਪਰਾਂ ਲਈ ਕੰਮ ਦਾ ਭਾਰ ਵੀ ਵਧਾ ਸਕਦਾ ਹੈ ਅਤੇ ਉਤਪਾਦਨ ਵਾਤਾਵਰਣ ਵਿੱਚ ਏਆਈ ਦੀ ਵਰਤੋਂ ਨੂੰ ਗੁੰਝਲਦਾਰ ਬਣਾ ਸਕਦਾ ਹੈ। GPU ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਐਮਐਲਏ ਲਈ ‘ਹੱਥ-ਕੋਡ’ ਔਪਟੀਮਾਈਜੇਸ਼ਨ ਵਿੱਚ ਸ਼ਾਮਲ ਹੋਣ ਦੀ ਲੋੜ ਹੋ ਸਕਦੀ ਹੈ। ਇਹ ਉਦਾਹਰਣ ਡੀਪਸੀਕ ਯੁੱਗ ਤੋਂ ਬਾਅਦ ਏਆਈ ਚਿਪਸ ਅਤੇ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਦੇ ਆਰਕੀਟੈਕਚਰ ਦੇ ਲਾਗੂਕਰਨ ‘ਤੇ ਮੁੜ ਵਿਚਾਰ ਕਰਨ ਦੀ ਲੋੜ ‘ਤੇ ਜ਼ੋਰ ਦਿੰਦਾ ਹੈ।
ਐਮਐਲਏ ਦੀ ਮਹੱਤਤਾ ਨੂੰ ਸਮਝਣ ਲਈ, ਲਾਰਜ ਲੈਂਗੂਏਜ ਮਾਡਲ (LLM) ਦੇ ਅੰਤਰੀਵ ਸੰਕਲਪਾਂ ਨੂੰ ਸਮਝਣਾ ਜ਼ਰੂਰੀ ਹੈ। ਉਪਭੋਗਤਾ ਇਨਪੁਟਸ ਦੇ ਜਵਾਬ ਤਿਆਰ ਕਰਦੇ ਸਮੇਂ, LLM ਕੇਵੀ ਵੈਕਟਰਾਂ - ਕੁੰਜੀਆਂ ਅਤੇ ਮੁੱਲਾਂ ‘ਤੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਨਿਰਭਰ ਕਰਦੇ ਹਨ - ਜੋ ਮਾਡਲ ਨੂੰ ਸੰਬੰਧਿਤ ਡਾਟਾ ‘ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦੇ ਹਨ। ਧਿਆਨ ਦੇਣ ਵਾਲੇ ਤੰਤਰਾਂ ਵਿੱਚ, ਮਾਡਲ ਸਭ ਤੋਂ ਢੁਕਵੀਂ ਸਮੱਗਰੀ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰਨ ਲਈ ਨਵੀਆਂ ਬੇਨਤੀਆਂ ਦੀ ਕੁੰਜੀਆਂ ਨਾਲ ਤੁਲਨਾ ਕਰਦਾ ਹੈ।
ਇਲਾਦ ਰਾਜ਼ ਇੱਕ ਕਿਤਾਬ ਦੀ ਸਮਾਨਤਾ ਵਰਤਦਾ ਹੈ, ਕੁੰਜੀ “ਇੱਕ ਕਿਤਾਬ ਦੇ ਚੈਪਟਰ ਟਾਈਟਲ ਵਾਂਗ ਹੋਣ ਕਰਕੇ, ਇਹ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਹਰ ਹਿੱਸਾ ਕਿਸ ਬਾਰੇ ਹੈ, ਜਿਸਦਾ ਮੁੱਲ ਉਹਨਾਂ ਸਿਰਲੇਖਾਂ ਦੇ ਅਧੀਨ ਵਧੇਰੇ ਵਿਸਤ੍ਰਿਤ ਸੰਖੇਪ ਜਾਣਕਾਰੀ ਹੈ। ਇਸ ਲਈ ਜਿਵੇਂ ਕਿ ਇੱਕ ਉਪਭੋਗਤਾ ਬੇਨਤੀ ਵਿੱਚ ਪਾਉਂਦਾ ਹੈ, ਇਹ ਜਵਾਬ ਤਿਆਰ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਨ ਲਈ ਖੋਜ ਸ਼ਬਦ ਮੰਗਦਾ ਹੈ। ਇਹ ਪੁੱਛ ਰਿਹਾ ਹੈ, ‘ਇਸ ਕਹਾਣੀ ਦੇ ਅਧੀਨ, ਕਿਹੜਾ ਚੈਪਟਰ ਸਭ ਤੋਂ ਢੁਕਵਾਂ ਹੈ?’”
ਐਮਐਲਏ ਇਹਨਾਂ ਚੈਪਟਰ ਟਾਈਟਲਾਂ (ਕੁੰਜੀਆਂ) ਅਤੇ ਸੰਖੇਪ ਜਾਣਕਾਰੀਆਂ (ਮੁੱਲਾਂ) ਨੂੰ ਸੰਕੁਚਿਤ ਕਰਦਾ ਹੈ, ਜਵਾਬ ਲੱਭਣ ਦੀ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਤੇਜ਼ ਕਰਦਾ ਹੈ ਅਤੇ ਕੁਸ਼ਲਤਾ ਨੂੰ ਵਧਾਉਂਦਾ ਹੈ। ਅੰਤ ਵਿੱਚ, ਐਮਐਲਏ ਡੀਪਸੀਕ ਨੂੰ ਮੈਮੋਰੀ ਦੀ ਵਰਤੋਂ ਨੂੰ 5-13% ਤੱਕ ਘਟਾਉਣ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ। ਵਧੇਰੇ ਵਿਸਤ੍ਰਿਤ ਜਾਣਕਾਰੀ ਡੀਪਸੀਕ ਦੇ ਅਧਿਕਾਰਤ ਪੇਪਰ ਵਿੱਚ ਮਿਲ ਸਕਦੀ ਹੈ। ਮੀਡੀਆਟੈਕ ਦੇ ਡਿਵੈਲਪਰ ਸੰਮੇਲਨ ਨੇ ਉਹਨਾਂ ਦੀਆਂ ਡਾਇਮੇਂਸਿਟੀ ਮੋਬਾਈਲ ਚਿਪਸ ਵਿੱਚ ਐਮਐਲਏ ਲਈ ਸਮਰਥਨ ਬਾਰੇ ਵੀ ਚਰਚਾ ਕੀਤੀ, ਜੋ ਡੀਪਸੀਕ ਦੇ ਵਿਆਪਕ ਪ੍ਰਭਾਵ ਨੂੰ ਰੇਖਾਂਕਿਤ ਕਰਦੀ ਹੈ।
ਐਮਐਲਏ ਵਰਗੀਆਂ ਤਕਨਾਲੋਜੀਆਂ ਏਆਈ ਯੁੱਗ ਵਿੱਚ ਆਮ ਐਲਗੋਰਿਦਮਿਕ ਨਵੀਨਤਾਵਾਂ ਨੂੰ ਦਰਸਾਉਂਦੀਆਂ ਹਨ। ਹਾਲਾਂਕਿ, ਏਆਈ ਤਕਨਾਲੋਜੀ ਦੇ ਤੇਜ਼ੀ ਨਾਲ ਵਿਕਾਸ ਦੇ ਕਾਰਨ ਨਵੀਨਤਾਵਾਂ ਦੀ ਇੱਕ ਨਿਰੰਤਰ ਧਾਰਾ ਆਉਂਦੀ ਹੈ, ਜੋ ਬਦਲੇ ਵਿੱਚ ਨਵੀਆਂ ਚੁਣੌਤੀਆਂ ਪੈਦਾ ਕਰਦੀ ਹੈ, ਖਾਸ ਕਰਕੇ ਜਦੋਂ ਇਹ ਨਵੀਨਤਾਵਾਂ ਖਾਸ ਪਲੇਟਫਾਰਮਾਂ ਲਈ ਤਿਆਰ ਕੀਤੀਆਂ ਜਾਂਦੀਆਂ ਹਨ। ਐਮਐਲਏ ਦੇ ਮਾਮਲੇ ਵਿੱਚ, ਗੈਰ-ਐਨਵੀਡੀਆ GPU ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਤਕਨਾਲੋਜੀ ਦਾ ਲਾਭ ਲੈਣ ਲਈ ਵਾਧੂ ਦਸਤੀ ਕੋਡਿੰਗ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।
ਜਦੋਂ ਕਿ ਡੀਪਸੀਕ ਦੀਆਂ ਤਕਨਾਲੋਜੀਆਂ ਏਆਈ ਯੁੱਗ ਦੀ ਨਵੀਨਤਾ ਅਤੇ ਮੁੱਲ ਨੂੰ ਦਰਸਾਉਂਦੀਆਂ ਹਨ, ਹਾਰਡਵੇਅਰ ਅਤੇ ਸੌਫਟਵੇਅਰ ਨੂੰ ਇਹਨਾਂ ਨਵੀਨਤਾਵਾਂ ਦੇ ਅਨੁਕੂਲ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ। ਇਲਾਦ ਰਾਜ਼ ਦੇ ਅਨੁਸਾਰ, ਅਜਿਹੇ ਅਨੁਕੂਲਤਾ ਨੂੰ ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਉਤਪਾਦਨ ਵਾਤਾਵਰਣਾਂ ਲਈ ਗੁੰਝਲਤਾ ਨੂੰ ਘੱਟ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ। ਨਹੀਂ ਤਾਂ, ਹਰੇਕ ਨਵੀਨਤਾ ਦੀ ਲਾਗਤ ਬਹੁਤ ਜ਼ਿਆਦਾ ਹੋ ਜਾਂਦੀ ਹੈ।
ਫਿਰ ਸਵਾਲ ਇਹ ਬਣਦਾ ਹੈ: “ਜੇ ਅਗਲੀ ਐਲਗੋਰਿਦਮ ਨਵੀਨਤਾ ਮੌਜੂਦਾ ਆਰਕੀਟੈਕਚਰ ਵਿੱਚ ਚੰਗੀ ਤਰ੍ਹਾਂ ਅਤੇ ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਅਨੁਵਾਦ ਨਹੀਂ ਕਰਦੀ ਤਾਂ ਕੀ ਹੁੰਦਾ ਹੈ?”
ਚਿਪ ਡਿਜ਼ਾਈਨ ਅਤੇ ਐਲਗੋਰਿਦਮ ਇਨੋਵੇਸ਼ਨ ਵਿਚਕਾਰ ਟਕਰਾਅ
ਪਿਛਲੇ ਕੁਝ ਸਾਲਾਂ ਵਿੱਚ, ਏਆਈ ਚਿਪ ਨਿਰਮਾਤਾਵਾਂ ਨੇ ਲਗਾਤਾਰ ਦੱਸਿਆ ਹੈ ਕਿ ਵੱਡੀਆਂ ਏਆਈ ਚਿਪਸ ਨੂੰ ਡਿਜ਼ਾਈਨ ਕਰਨ ਵਿੱਚ ਘੱਟੋ ਘੱਟ 1-2 ਸਾਲ ਲੱਗਦੇ ਹਨ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਚਿਪ ਦੀ ਮਾਰਕੀਟ ਰਿਲੀਜ਼ ਤੋਂ ਬਹੁਤ ਪਹਿਲਾਂ ਚਿਪ ਡਿਜ਼ਾਈਨ ਸ਼ੁਰੂ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ। ਏਆਈ ਤਕਨਾਲੋਜੀ ਵਿੱਚ ਤੇਜ਼ੀ ਨਾਲ ਹੋ ਰਹੇ ਵਾਧੇ ਨੂੰ ਦੇਖਦੇ ਹੋਏ, ਏਆਈ ਚਿਪ ਡਿਜ਼ਾਈਨ ਭਵਿੱਖਮੁਖੀ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ। ਸਿਰਫ਼ ਮੌਜੂਦਾ ਲੋੜਾਂ ‘ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਨ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਪੁਰਾਣੀਆਂ ਏਆਈ ਚਿਪਸ ਹੋਣਗੀਆਂ ਜੋ ਨਵੀਨਤਮ ਐਪਲੀਕੇਸ਼ਨ ਨਵੀਨਤਾਵਾਂ ਦੇ ਅਨੁਕੂਲ ਨਹੀਂ ਹੋ ਸਕਦੀਆਂ।
ਏਆਈ ਐਪਲੀਕੇਸ਼ਨ ਐਲਗੋਰਿਦਮ ਨਵੀਨਤਾ ਹੁਣ ਹਫਤਾਵਾਰੀ ਆਧਾਰ ‘ਤੇ ਹੁੰਦੀ ਹੈ। ਜਿਵੇਂ ਕਿ ਪਿਛਲੇ ਲੇਖਾਂ ਵਿੱਚ ਦੱਸਿਆ ਗਿਆ ਹੈ, ਏਆਈ ਮਾਡਲਾਂ ਨੂੰ ਇੱਕੋ ਸਮਰੱਥਾ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਲੋੜੀਂਦੀ ਕੰਪਿਊਟਿੰਗ ਪਾਵਰ ਸਾਲਾਨਾ 4-10 ਗੁਣਾ ਘੱਟ ਜਾਂਦੀ ਹੈ। GPT-3 ਵਰਗੀ ਸਮਾਨ ਗੁਣਵੱਤਾ ਪ੍ਰਾਪਤ ਕਰਨ ਵਾਲੇ ਏਆਈ ਮਾਡਲਾਂ ਦੀ ਅਨੁਮਾਨ ਲਾਗਤ ਪਿਛਲੇ ਤਿੰਨ ਸਾਲਾਂ ਵਿੱਚ 1200 ਗੁਣਾ ਘੱਟ ਗਈ ਹੈ। ਵਰਤਮਾਨ ਵਿੱਚ, 2B ਪੈਰਾਮੀਟਰਾਂ ਵਾਲੇ ਮਾਡਲ ਪਿਛਲੇ ਸਾਲ ਦੇ 170B ਪੈਰਾਮੀਟਰ GPT-3 ਦੇ ਸਮਾਨ ਪੱਧਰ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦੇ ਹਨ। ਏਆਈ ਤਕਨਾਲੋਜੀ ਸਟੈਕ ਦੀਆਂ ਉੱਪਰਲੀਆਂ ਪਰਤਾਂ ਵਿੱਚ ਇਹ ਤੇਜ਼ੀ ਨਾਲ ਹੋ ਰਹੀ ਨਵੀਨਤਾ ਰਵਾਇਤੀ ਚਿਪ ਆਰਕੀਟੈਕਚਰ ਯੋਜਨਾਬੰਦੀ ਅਤੇ ਡਿਜ਼ਾਈਨ ਲਈ ਮਹੱਤਵਪੂਰਨ ਚੁਣੌਤੀਆਂ ਪੇਸ਼ ਕਰਦੀ ਹੈ।
ਇਲਾਦ ਰਾਜ਼ ਦਾ ਮੰਨਣਾ ਹੈ ਕਿ ਉਦਯੋਗ ਨੂੰ ਡੀਪਸੀਕ ਐਮਐਲਏ ਵਰਗੀਆਂ ਨਵੀਨਤਾਵਾਂ ਨੂੰ ਏਆਈ ਤਕਨਾਲੋਜੀ ਲਈ ਆਮ ਮੰਨਣ ਦੀ ਲੋੜ ਹੈ। “ਅਗਲੀ ਪੀੜ੍ਹੀ ਦੀ ਕੰਪਿਊਟਿੰਗ ਨੂੰ ਨਾ ਸਿਰਫ਼ ਅੱਜ ਦੇ ਵਰਕਲੋਡਸ ਲਈ ਅਨੁਕੂਲ ਬਣਾਉਣ ਦੀ ਲੋੜ ਹੈ, ਸਗੋਂ ਭਵਿੱਖ ਦੀਆਂ ਸਫਲਤਾਵਾਂ ਨੂੰ ਵੀ ਅਨੁਕੂਲ ਬਣਾਉਣ ਦੀ ਲੋੜ ਹੈ।” ਇਹ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਨਾ ਸਿਰਫ਼ ਚਿਪ ਉਦਯੋਗ ‘ਤੇ ਲਾਗੂ ਹੁੰਦਾ ਹੈ, ਸਗੋਂ ਏਆਈ ਤਕਨਾਲੋਜੀ ਸਟੈਕ ਦੇ ਪੂਰੇ ਮੱਧ-ਤੋਂ-ਹੇਠਲੇ-ਪੱਧਰ ਦੇ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ‘ਤੇ ਵੀ ਲਾਗੂ ਹੁੰਦਾ ਹੈ।
ਇਲਾਦ ਰਾਜ਼ ਨੇ ਕਿਹਾ, “ਡੀਪਸੀਕ ਅਤੇ ਹੋਰ ਨਵੀਨਤਾਵਾਂ ਨੇ ਐਲਗੋਰਿਦਮ ਨਵੀਨਤਾ ਦੀ ਤੇਜ਼ੀ ਨਾਲ ਤਰੱਕੀ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕੀਤਾ ਹੈ।” “ਖੋਜਕਰਤਾਵਾਂ ਅਤੇ ਡਾਟਾ ਵਿਗਿਆਨੀਆਂ ਨੂੰ ਨਵੀਆਂ ਸਮਝਾਂ ਅਤੇ ਖੋਜਾਂ ਨੂੰ ਚਲਾਉਣ ਲਈ ਵਧੇਰੇ ਬਹੁਮੁਖੀ, ਲਚਕੀਲੇ ਸਾਧਨਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਮਾਰਕੀਟ ਨੂੰ ਬੁੱਧੀਮਾਨ, ਸੌਫਟਵੇਅਰ-ਪਰਿਭਾਸ਼ਿਤ ਹਾਰਡਵੇਅਰ ਕੰਪਿਊਟਿੰਗ ਪਲੇਟਫਾਰਮਾਂ ਦੀ ਲੋੜ ਹੈ ਜੋ ਗਾਹਕਾਂ ਨੂੰ ਮੌਜੂਦਾ ਐਕਸਲੇਟਰ ਹੱਲਾਂ ਨੂੰ ‘ਡਰਾਪ-ਇਨ ਰਿਪਲੇਸ’ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦੇ ਹਨ, ਜਦੋਂ ਕਿ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਆਪਣੇ ਕੰਮ ਨੂੰ ਦਰਦ ਰਹਿਤ ਢੰਗ ਨਾਲ ਪੋਰਟ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦੇ ਹਨ।”
ਇਸ ਸਥਿਤੀ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ, ਉਦਯੋਗ ਨੂੰ ਵਧੇਰੇ ਬੁੱਧੀਮਾਨ, ਅਨੁਕੂਲ ਹੋਣ ਵਾਲਾ ਅਤੇ ਲਚਕਦਾਰ ਕੰਪਿਊਟਿੰਗ ਬੁਨਿਆਦੀ ਢਾਂਚਾ ਡਿਜ਼ਾਈਨ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ।
ਲਚਕਤਾ ਅਤੇ ਕੁਸ਼ਲਤਾ ਅਕਸਰ ਵਿਰੋਧੀ ਟੀਚੇ ਹੁੰਦੇ ਹਨ। CPU ਬਹੁਤ ਲਚਕਦਾਰ ਹੁੰਦੇ ਹਨ ਪਰ GPUs ਨਾਲੋਂ ਬਹੁਤ ਘੱਟ ਸਮਾਨਾਂਤਰ ਕੰਪਿਊਟਿੰਗ ਕੁਸ਼ਲਤਾ ਹੁੰਦੀ ਹੈ। GPUs, ਉਹਨਾਂ ਦੀ ਪ੍ਰੋਗਰਾਮਿੰਗ ਸਮਰੱਥਾ ਦੇ ਨਾਲ, ਸਮਰਪਿਤ AI ASIC ਚਿਪਸ ਨਾਲੋਂ ਘੱਟ ਕੁਸ਼ਲ ਹੋ ਸਕਦੇ ਹਨ।
ਇਲਾਦ ਰਾਜ਼ ਨੇ ਨੋਟ ਕੀਤਾ ਕਿ NVIDIA ਨੂੰ ਉਮੀਦ ਹੈ ਕਿ AI ਡਾਟਾ ਸੈਂਟਰ ਰੈਕ ਜਲਦੀ ਹੀ 600kW ਪਾਵਰ ਖਪਤ ਤੱਕ ਪਹੁੰਚ ਜਾਣਗੇ। ਪ੍ਰਸੰਗ ਲਈ, 75% ਸਟੈਂਡਰਡ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਡਾਟਾ ਸੈਂਟਰਾਂ ਵਿੱਚ ਪ੍ਰਤੀ ਰੈਕ ਸਿਰਫ਼ 15-20kW ਦੀ ਸਿਖਰ ਪਾਵਰ ਖਪਤ ਹੁੰਦੀ ਹੈ। AI ਵਿੱਚ ਸੰਭਾਵੀ ਕੁਸ਼ਲਤਾ ਲਾਭਾਂ ਦੀ ਪਰਵਾਹ ਕੀਤੇ ਬਿਨਾਂ, ਇਹ ਕੰਪਿਊਟਿੰਗ ਬੁਨਿਆਦੀ ਢਾਂਚਾ ਪ੍ਰਣਾਲੀਆਂ ਬਣਾਉਣ ਵਾਲੇ ਡਾਟਾ ਸੈਂਟਰਾਂ ਲਈ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਚੁਣੌਤੀ ਪੇਸ਼ ਕਰਦਾ ਹੈ।
ਇਲਾਦ ਰਾਜ਼ ਦੇ ਵਿਚਾਰ ਵਿੱਚ, ਮੌਜੂਦਾ GPUs ਅਤੇ AI ਐਕਸਲੇਟਰ AI ਅਤੇ ਹਾਈ-ਪਰਫਾਰਮੈਂਸ ਕੰਪਿਊਟਿੰਗ (HPC) ਦੀਆਂ ਸੰਭਾਵੀ ਮੰਗਾਂ ਨੂੰ ਪੂਰਾ ਕਰਨ ਲਈ ਕਾਫ਼ੀ ਨਹੀਂ ਹੋ ਸਕਦੇ ਹਨ। ‘ਜੇ ਅਸੀਂ ਕੰਪਿਊਟਿੰਗ ਕੁਸ਼ਲਤਾ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣ ਦੇ ਤਰੀਕੇ ‘ਤੇ ਬੁਨਿਆਦੀ ਤੌਰ ‘ਤੇ ਮੁੜ ਵਿਚਾਰ ਨਹੀਂ ਕਰਦੇ, ਤਾਂ ਉਦਯੋਗ ਨੂੰ ਭੌਤਿਕ ਅਤੇ ਆਰਥਿਕ ਸੀਮਾਵਾਂ ‘ਤੇ ਪਹੁੰਚਣ ਦਾ ਖਤਰਾ ਹੈ। ਇਸ ਕੰਧ ਦੇ ਮਾੜੇ ਪ੍ਰਭਾਵ ਵੀ ਹੋਣਗੇ, ਜਿਸ ਨਾਲ ਹੋਰ ਸੰਸਥਾਵਾਂ ਲਈ AI ਅਤੇ HPC ਤੱਕ ਪਹੁੰਚ ਸੀਮਤ ਹੋ ਜਾਵੇਗੀ, ਐਲਗੋਰਿਦਮ ਜਾਂ ਰਵਾਇਤੀ GPU ਆਰਕੀਟੈਕਚਰ ਵਿੱਚ ਤਰੱਕੀ ਦੇ ਬਾਵਜੂਦ ਨਵੀਨਤਾ ਵਿੱਚ ਰੁਕਾਵਟ ਆਵੇਗੀ।”
ਅਗਲੀ ਪੀੜ੍ਹੀ ਦੇ ਕੰਪਿਊਟਿੰਗ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਲਈ ਸਿਫ਼ਾਰਸ਼ਾਂ ਅਤੇ ਲੋੜਾਂ
ਇਹਨਾਂ ਨਿਰੀਖਣਾਂ ਦੇ ਆਧਾਰ ‘ਤੇ, ਇਲਾਦ ਰਾਜ਼ ਨੇ ਅਗਲੀ ਪੀੜ੍ਹੀ ਦੇ ਕੰਪਿਊਟਿੰਗ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨ ਲਈ ‘ਚਾਰ ਥੰਮ੍ਹਾਂ’ ਦਾ ਪ੍ਰਸਤਾਵ ਦਿੱਤਾ:
(1) ਪਲੱਗ-ਐਂਡ-ਪਲੇ ਰਿਪਲੇਸੇਬਿਲਟੀ: ‘ਇਤਿਹਾਸ ਨੇ ਦਿਖਾਇਆ ਹੈ ਕਿ CPU ਤੋਂ GPU ਵਿੱਚ ਤਬਦੀਲੀ ਵਰਗੀਆਂ ਗੁੰਝਲਦਾਰ ਆਰਕੀਟੈਕਚਰ ਤਬਦੀਲੀਆਂ ਨੂੰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਲਾਗੂ ਕਰਨ ਵਿੱਚ ਦਹਾਕੇ ਲੱਗ ਸਕਦੇ ਹਨ। ਇਸ ਲਈ, ਅਗਲੀ ਪੀੜ੍ਹੀ ਦੇ ਕੰਪਿਊਟਿੰਗ ਆਰਕੀਟੈਕਚਰ ਨੂੰ ਸੁਚਾਰੂ ਮਾਈਗ੍ਰੇਸ਼ਨ ਦਾ ਸਮਰਥਨ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ।” ‘ਪਲੱਗ-ਐਂਡ-ਪਲੇ’ ਰਿਪਲੇਸੇਬਿਲਟੀ ਲਈ, ਇਲਾਦ ਰਾਜ਼ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ ਨਵੇਂ ਕੰਪਿਊਟਿੰਗ ਆਰਕੀਟੈਕਚਰ ਨੂੰ x86 ਅਤੇ Arm ਈਕੋਸਿਸਟਮ ਤੋਂ ਸਿੱਖਣਾ ਚਾਹੀਦਾ ਹੈ, ਅਤੇ ਪਿਛਲੀ ਅਨੁਕੂਲਤਾ ਦੁਆਰਾ ਵਿਆਪਕ ਗੋਦ ਲੈਣਾ ਚਾਹੀਦਾ ਹੈ।
ਆਧੁਨਿਕ ਡਿਜ਼ਾਈਨਾਂ ਨੂੰ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਕੋਡ ਨੂੰ ਦੁਬਾਰਾ ਲਿਖਣ ਜਾਂ ਖਾਸ ਵਿਕਰੇਤਾਵਾਂ ‘ਤੇ ਨਿਰਭਰਤਾ ਪੈਦਾ ਕਰਨ ਤੋਂ ਵੀ ਬਚਣਾ ਚਾਹੀਦਾ ਹੈ। “ਉਦਾਹਰਨ ਲਈ, MLA ਵਰਗੀਆਂ ਉੱਭਰ ਰਹੀਆਂ ਤਕਨਾਲੋਜੀਆਂ ਲਈ ਸਮਰਥਨ ਨੂੰ ਮਿਆਰੀ ਬਣਾਇਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ, ਨਾ ਕਿ ਵਾਧੂ ਦਸਤੀ ਐਡਜਸਟਮੈਂਟਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ ਜਿਵੇਂ ਕਿ ਗੈਰ-NVIDIA GPUs ਦੇ ਮਾਮਲੇ ਵਿੱਚ ਹੁੰਦਾ ਹੈ। ਅਗਲੀ ਪੀੜ੍ਹੀ ਦੇ ਸਿਸਟਮਾਂ ਨੂੰ ਦਸਤੀ ਕੋਡ ਸੋਧਾਂ ਜਾਂ ਮਹੱਤਵਪੂਰਨ API ਐਡਜਸਟਮੈਂਟਾਂ ਦੀ ਲੋੜ ਤੋਂ ਬਿਨਾਂ, ਨਵੇਂ ਵਰਕਲੋਡਸ ਨੂੰ ਬਾਕਸ ਤੋਂ ਬਾਹਰ ਸਮਝਣਾ ਅਤੇ ਅਨੁਕੂਲ ਬਣਾਉਣਾ ਚਾਹੀਦਾ ਹੈ।”
(2) ਅਡੈਪਟੇਬਲ, ਰੀਅਲ-ਟਾਈਮ ਪਰਫਾਰਮੈਂਸ ਔਪਟੀਮਾਈਜੇਸ਼ਨ: ਇਲਾਦ ਰਾਜ਼ ਦਾ ਮੰਨਣਾ ਹੈ ਕਿ ਉਦਯੋਗ ਨੂੰ ਫਿਕਸਡ-ਫੰਕਸ਼ਨ ਐਕਸਲੇਟਰਾਂ ਤੋਂ ਦੂਰ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ। ‘ਉਦਯੋਗ ਨੂੰ ਬੁੱਧੀਮਾਨ, ਸੌਫਟਵੇਅਰ-ਪਰਿਭਾਸ਼ਿਤ ਹਾਰਡਵੇਅਰ ਫਾਊਂਡੇਸ਼ਨਾਂ ‘ਤੇ ਬਣਾਉਣ ਦੀ ਲੋੜ ਹੈ ਜੋ ਰਨਟਾਈਮ ‘ਤੇ ਗਤੀਸ਼ੀਲ ਤੌਰ ‘ਤੇ ਸਵੈ-ਅਨੁਕੂਲਿਤ ਹੋ ਸਕਦੀਆਂ ਹਨ।”
“ਵਰਕਲੋਡਸ ਤੋਂ ਲਗਾਤਾਰ ਸਿੱਖ ਕੇ, ਭਵਿੱਖ ਦੇ ਸਿਸਟਮ ਆਪਣੇ ਆਪ ਨੂੰ ਰੀਅਲ-ਟਾਈਮ ਵਿੱਚ ਐਡਜਸਟ ਕਰ ਸਕਦੇ ਹਨ, ਵਰਤੋਂ ਨੂੰ ਵੱਧ ਤੋਂ ਵੱਧ ਕਰ ਸਕਦੇ ਹਨ ਅਤੇ ਨਿਰੰਤਰ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਵਧਾ ਸਕਦੇ ਹਨ, ਭਾਵੇਂ ਕੋਈ ਖਾਸ ਐਪਲੀਕੇਸ਼ਨ ਵਰਕਲੋਡ ਹੋਵੇ। ਇਹ ਗਤੀਸ਼ੀਲ ਅਨੁਕੂਲਤਾ ਦਾ ਮਤਲਬ ਹੈ ਕਿ ਬੁਨਿਆਦੀ ਢਾਂਚਾ ਅਸਲ-ਸੰਸਾਰ ਦੇ ਦ੍ਰਿਸ਼ਾਂ ਵਿੱਚ ਨਿਰੰਤਰ ਕੁਸ਼ਲਤਾ ਪ੍ਰਦਾਨ ਕਰ ਸਕਦਾ ਹੈ, ਭਾਵੇਂ ਇਹ HPC ਸਿਮੂਲੇਸ਼ਨ, ਗੁੰਝਲਦਾਰ AI ਮਾਡਲ, ਜਾਂ ਵੈਕਟਰ ਡੇਟਾਬੇਸ ਔਪਰੇਸ਼ਨ ਚਲਾ ਰਿਹਾ ਹੋਵੇ।”
(3) ਸਕੇਲੇਬਲ ਕੁਸ਼ਲਤਾ: “ਹਾਰਡਵੇਅਰ ਅਤੇ ਸੌਫਟਵੇਅਰ ਨੂੰ ਵੱਖ ਕਰਕੇ ਅਤੇ ਬੁੱਧੀਮਾਨ ਰੀਅਲ-ਟਾਈਮ ਔਪਟੀਮਾਈਜੇਸ਼ਨ ‘ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਕੇ, ਭਵਿੱਖ ਦੇ ਸਿਸਟਮਾਂ ਨੂੰ ਉੱਚ ਵਰਤੋਂ ਅਤੇ ਘੱਟ ਸਮੁੱਚੀ ਊਰਜਾ ਖਪਤ ਪ੍ਰਾਪਤ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ। ਇਸ ਨਾਲ ਨਵੇਂ ਵਰਕਲੋਡਸ ਦੀਆਂ ਵਿਕਸਤ ਮੰਗਾਂ ਨੂੰ ਪੂਰਾ ਕਰਨ ਲਈ ਬੁਨਿਆਦੀ ਢਾਂਚਾ ਵਧੇਰੇ ਲਾਗਤ-ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਅਤੇ ਸਕੇਲੇਬਲ ਹੋਵੇਗਾ।”
(4) ਭਵਿੱਖ-ਡਿਜ਼ਾਈਨ: ਇਹ ਨੁਕਤਾ ਏਆਈ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਲਈ ਅੱਗੇ-ਦਿੱਖਣ ਦੀ ਲੋੜ ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੈ, ਖਾਸ ਕਰਕੇ ਚਿਪ ਡਿਜ਼ਾਈਨ। “ਅੱਜ ਦੇ ਅਤਿ ਆਧੁਨਿਕ ਐਲਗੋਰਿਦਮ ਕੱਲ੍ਹ ਨੂੰ ਪੁਰਾਣੇ ਹੋ ਸਕਦੇ ਹਨ।” “ਭਾਵੇਂ ਇਹ AI ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਹੋਣ ਜਾਂ ਟ੍ਰਾਂਸਫਾਰਮਰ-ਅਧਾਰਿਤ LLM ਮਾਡਲ, ਅਗਲੀ ਪੀੜ੍ਹੀ ਦੇ ਕੰਪਿਊਟਿੰਗ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਨੂੰ ਅਨੁਕੂਲ ਹੋਣ ਯੋਗ ਹੋਣ ਦੀ ਲੋੜ ਹੈ, ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦੇ ਹੋਏ ਕਿ ਉੱਦਮਾਂ ਦੇ ਤਕਨਾਲੋਜੀ ਨਿਵੇਸ਼ ਆਉਣ ਵਾਲੇ ਸਾਲਾਂ ਤੱਕ ਲਚਕੀਲੇ ਰਹਿਣ।”
ਇਹ ਸੁਝਾਅ ਇੱਕ ਮੁਕਾਬਲਤਨ ਆਦਰਸ਼ਕ ਪਰ ਫਿਰ ਵੀ ਸੋਚਣ ਵਾਲਾ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਪੇਸ਼ ਕਰਦੇ ਹਨ। ਇਸ ਮਾਰਗਦਰਸ਼ਕ ਵਿਧੀ ਨੂੰ ਏਆਈ ਅਤੇ HPC ਤਕਨਾਲੋਜੀਆਂ ਦੇ ਭਵਿੱਖ ਦੇ ਵਿਕਾਸ ਲਈ ਵਿਚਾਰਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ, ਭਾਵੇਂ ਕਿ ਕੁਝ ਅੰਦਰੂਨੀ ਵਿਰੋਧਾਭਾਸ ਉਦਯੋਗ ਵਿੱਚ ਲੰਬੇ ਸਮੇਂ ਤੋਂ ਚੱਲੇ ਆ ਰਹੇ ਮੁੱਦੇ ਬਣੇ ਰਹਿਣ। “AI, HPC, ਅਤੇ ਹੋਰ ਭਵਿੱਖ ਦੀ ਕੰਪਿਊਟਿੰਗ ਅਤੇ ਡਾਟਾ-ਇੰਟੈਂਸਿਵ ਵਰਕਲੋਡਸ ਦੀ ਸੰਭਾਵਨਾ ਨੂੰ ਜਾਰੀ ਕਰਨ ਲਈ, ਸਾਨੂੰ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ‘ਤੇ ਮੁੜ ਵਿਚਾਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ ਅਤੇ ਨਵੀਨਤਾ ਅਤੇ ਮੋਹਰੀਆਂ ਦਾ ਸਮਰਥਨ ਕਰਨ ਲਈ ਗਤੀਸ਼ੀਲ ਅਤੇ ਬੁੱਧੀਮਾਨ ਹੱਲਾਂ ਨੂੰ ਅਪਣਾਉਣਾ ਚਾਹੀਦਾ ਹੈ।”