ਅਨੁਮਾਨ ਦਾ ਉਭਾਰ: ਨਵੀਡੀਆ ਦੀ ਏਆਈ ਚਿੱਪ ਸਰਵਉੱਚਤਾ ਨੂੰ ਚੁਣੌਤੀ

ਸਿਖਲਾਈ ਬਨਾਮ ਅਨੁਮਾਨ: AI ਸਿੱਕੇ ਦੇ ਦੋ ਪਹਿਲੂ

ਅਨੁਮਾਨ ਦੀ ਮਹੱਤਤਾ ਨੂੰ ਸਮਝਣ ਲਈ, ਇਸ ਨੂੰ ਇਸਦੇ ਹਮਰੁਤਬਾ: ਸਿਖਲਾਈ ਤੋਂ ਵੱਖ ਕਰਨਾ ਜ਼ਰੂਰੀ ਹੈ। AI ਮਾਡਲ, ਬੁੱਧੀਮਾਨ ਐਪਲੀਕੇਸ਼ਨਾਂ ਨੂੰ ਚਲਾਉਣ ਵਾਲੇ ਇੰਜਣ, ਦੋ ਵੱਖ-ਵੱਖ ਪੜਾਵਾਂ ਵਿੱਚੋਂ ਲੰਘਦੇ ਹਨ।

  • ਸਿਖਲਾਈ: ਇਹ ਕੰਪਿਊਟੇਸ਼ਨਲ ਤੌਰ ‘ਤੇ ਗੁੰਝਲਦਾਰ ਪੜਾਅ ਹੈ ਜਿੱਥੇ AI ਮਾਡਲ ਵੱਡੇ ਡੇਟਾਸੈਟਾਂ ਤੋਂ ਸਿੱਖਦਾ ਹੈ। ਇਸ ਨੂੰ ਇਸ ਤਰ੍ਹਾਂ ਸਮਝੋ ਜਿਵੇਂ ਮਾਡਲ ਸਕੂਲ ਜਾ ਰਿਹਾ ਹੈ, ਆਪਣੀ ਬੁੱਧੀ ਨੂੰ ਵਿਕਸਤ ਕਰਨ ਲਈ ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਜਾਣਕਾਰੀ ਨੂੰ ਜਜ਼ਬ ਕਰ ਰਿਹਾ ਹੈ। ਇਸ ਪੜਾਅ ਲਈ ਬਹੁਤ ਜ਼ਿਆਦਾ ਪ੍ਰੋਸੈਸਿੰਗ ਪਾਵਰ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਅਤੇ Nvidia ਦੇ GPUs (ਗ੍ਰਾਫਿਕਸ ਪ੍ਰੋਸੈਸਿੰਗ ਯੂਨਿਟ) ਇਤਿਹਾਸਕ ਤੌਰ ‘ਤੇ ਇੱਥੇ ਉੱਤਮ ਰਹੇ ਹਨ, ਸਿਖਲਾਈ ਵਿੱਚ ਸ਼ਾਮਲ ਗੁੰਝਲਦਾਰ ਗਣਨਾਵਾਂ ਨੂੰ ਸੰਭਾਲਣ ਲਈ ਲੋੜੀਂਦੀ ਸਮਾਨਾਂਤਰ ਪ੍ਰੋਸੈਸਿੰਗ ਸਮਰੱਥਾਵਾਂ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦੇ ਹਨ।

  • ਅਨੁਮਾਨ: ਇੱਕ ਵਾਰ ਜਦੋਂ ਮਾਡਲ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਕਰ ਲੈਂਦਾ ਹੈ, ਤਾਂ ਇਹ ਤਾਇਨਾਤ ਕੀਤੇ ਜਾਣ ਅਤੇ ਕੰਮ ਕਰਨ ਲਈ ਤਿਆਰ ਹੁੰਦਾ ਹੈ। ਇਹ ਉਹ ਥਾਂ ਹੈ ਜਿੱਥੇ ਅਨੁਮਾਨ ਆਉਂਦਾ ਹੈ। ਅਨੁਮਾਨ ਨਵੇਂ ਡੇਟਾ ਦੇ ਅਧਾਰ ਤੇ ਭਵਿੱਖਬਾਣੀਆਂ ਜਾਂ ਫੈਸਲੇ ਲੈਣ ਲਈ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੀ ਪ੍ਰਕਿਰਿਆ ਹੈ। ਇਹ ਇਸ ਤਰ੍ਹਾਂ ਹੈ ਜਿਵੇਂ ਮਾਡਲ ਗ੍ਰੈਜੂਏਟ ਹੋ ਰਿਹਾ ਹੈ ਅਤੇ ਅਸਲ ਸੰਸਾਰ ਵਿੱਚ ਆਪਣੇ ਗਿਆਨ ਨੂੰ ਲਾਗੂ ਕਰ ਰਿਹਾ ਹੈ। ਸਿਖਲਾਈ ਨਾਲੋਂ ਘੱਟ ਕੰਪਿਊਟੇਸ਼ਨਲ ਮੰਗ ਹੋਣ ਦੇ ਬਾਵਜੂਦ, ਅਨੁਮਾਨ ਲਈ ਗਤੀ, ਕੁਸ਼ਲਤਾ ਅਤੇ ਅਕਸਰ, ਘੱਟ ਪਾਵਰ ਖਪਤ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।

ਇਹ ਅੰਤਰ ਮਹੱਤਵਪੂਰਨ ਹੈ ਕਿਉਂਕਿ ਸਿਖਲਾਈ ਅਤੇ ਅਨੁਮਾਨ ਲਈ ਹਾਰਡਵੇਅਰ ਦੀਆਂ ਲੋੜਾਂ ਕਾਫ਼ੀ ਵੱਖਰੀਆਂ ਹਨ। ਜਦੋਂ ਕਿ Nvidia ਦੇ GPUs ਨੇ ਸਿਖਲਾਈ ਬਾਜ਼ਾਰ ‘ਤੇ ਦਬਦਬਾ ਬਣਾਇਆ ਹੈ, ਅਨੁਮਾਨ ਬਾਜ਼ਾਰ ਵਧੇਰੇ ਵਿਭਿੰਨ ਅਤੇ ਪ੍ਰਤੀਯੋਗੀ ਲੈਂਡਸਕੇਪ ਪੇਸ਼ ਕਰਦਾ ਹੈ।

ਅਨੁਮਾਨ ਕਿਉਂ ਗਤੀ ਪ੍ਰਾਪਤ ਕਰ ਰਿਹਾ ਹੈ

ਕਈ ਕਾਰਕ AI ਚਿੱਪ ਮਾਰਕੀਟ ਵਿੱਚ ਅਨੁਮਾਨ ਦੇ ਵਧ ਰਹੇ ਮਹੱਤਵ ਵਿੱਚ ਯੋਗਦਾਨ ਪਾ ਰਹੇ ਹਨ:

  1. AI ਐਪਲੀਕੇਸ਼ਨਾਂ ਦਾ ਪ੍ਰਸਾਰ: AI ਹੁਣ ਖੋਜ ਪ੍ਰਯੋਗਸ਼ਾਲਾਵਾਂ ਅਤੇ ਤਕਨੀਕੀ ਦਿੱਗਜਾਂ ਤੱਕ ਸੀਮਤ ਨਹੀਂ ਹੈ। ਇਹ ਤੇਜ਼ੀ ਨਾਲ ਸਾਡੇ ਜੀਵਨ ਦੇ ਹਰ ਪਹਿਲੂ ਵਿੱਚ ਫੈਲ ਰਿਹਾ ਹੈ, ਸਮਾਰਟਫ਼ੋਨਾਂ ਅਤੇ ਸਮਾਰਟ ਹੋਮਜ਼ ਤੋਂ ਲੈ ਕੇ ਆਟੋਨੋਮਸ ਵਾਹਨਾਂ ਅਤੇ ਮੈਡੀਕਲ ਡਾਇਗਨੌਸਟਿਕਸ ਤੱਕ। ਇਸ ਵਿਆਪਕ ਤੈਨਾਤੀ ਦਾ ਮਤਲਬ ਹੈ ਕਿ ਅਨੁਮਾਨ, AI ਮਾਡਲਾਂ ਦੀ ਅਸਲ ਵਿੱਚ ਵਰਤੋਂ ਕਰਨ ਦੀ ਪ੍ਰਕਿਰਿਆ, ਇੱਕ ਬੇਮਿਸਾਲ ਪੈਮਾਨੇ ‘ਤੇ ਹੋ ਰਹੀ ਹੈ।

  2. Edge Computing: Edge Computing ਦਾ ਵਾਧਾ ਇੱਕ ਹੋਰ ਵੱਡਾ ਡ੍ਰਾਈਵਰ ਹੈ। Edge Computing ਵਿੱਚ ਕੇਂਦਰੀਕ੍ਰਿਤ ਕਲਾਉਡ ਸਰਵਰਾਂ ਨੂੰ ਡੇਟਾ ਭੇਜਣ ਦੀ ਬਜਾਏ, ਸਰੋਤ ਦੇ ਨੇੜੇ ਡੇਟਾ ਦੀ ਪ੍ਰਕਿਰਿਆ ਕਰਨਾ ਸ਼ਾਮਲ ਹੈ। ਇਹ ਉਹਨਾਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ ਜਿਨ੍ਹਾਂ ਨੂੰ ਰੀਅਲ-ਟਾਈਮ ਜਵਾਬਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਜਿਵੇਂ ਕਿ ਸਵੈ-ਡਰਾਈਵਿੰਗ ਕਾਰਾਂ ਜਾਂ ਉਦਯੋਗਿਕ ਆਟੋਮੇਸ਼ਨ। Edge ਉਪਕਰਣ, ਅਕਸਰ ਪਾਵਰ-ਸੀਮਤ ਵਾਤਾਵਰਣ ਵਿੱਚ ਕੰਮ ਕਰਦੇ ਹਨ, ਨੂੰ ਘੱਟ-ਪਾਵਰ, ਕੁਸ਼ਲ ਅਨੁਮਾਨ ਲਈ ਅਨੁਕੂਲਿਤ ਚਿਪਸ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।

  3. ਲਾਗਤ ਅਨੁਕੂਲਤਾ: ਜਦੋਂ ਕਿ ਇੱਕ AI ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣਾ ਇੱਕ ਵਾਰ (ਜਾਂ ਕਦੇ-ਕਦਾਈਂ) ਦੀ ਲਾਗਤ ਹੈ, ਅਨੁਮਾਨ ਇੱਕ ਚੱਲ ਰਿਹਾ ਸੰਚਾਲਨ ਖਰਚ ਹੈ। ਜਿਵੇਂ ਕਿ AI ਤੈਨਾਤੀਆਂ ਦਾ ਪੈਮਾਨਾ ਵਧਦਾ ਹੈ, ਅਨੁਮਾਨ ਦੀ ਲਾਗਤ ਕਾਫ਼ੀ ਵੱਧ ਸਕਦੀ ਹੈ। ਇਹ ਉਹਨਾਂ ਚਿਪਸ ਦੀ ਮੰਗ ਨੂੰ ਵਧਾ ਰਿਹਾ ਹੈ ਜੋ ਅਨੁਮਾਨ ਨੂੰ ਵਧੇਰੇ ਕੁਸ਼ਲਤਾ ਨਾਲ ਕਰ ਸਕਦੇ ਹਨ, ਊਰਜਾ ਦੀ ਖਪਤ ਅਤੇ ਸਮੁੱਚੇ ਸੰਚਾਲਨ ਖਰਚਿਆਂ ਨੂੰ ਘਟਾ ਸਕਦੇ ਹਨ।

  4. ਲੇਟੈਂਸੀ ਲੋੜਾਂ: ਬਹੁਤ ਸਾਰੀਆਂ AI ਐਪਲੀਕੇਸ਼ਨਾਂ, ਖਾਸ ਤੌਰ ‘ਤੇ ਉਹ ਜਿਹਨਾਂ ਵਿੱਚ ਰੀਅਲ-ਟਾਈਮ ਇੰਟਰੈਕਸ਼ਨ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ, ਘੱਟ ਲੇਟੈਂਸੀ ਦੀ ਮੰਗ ਕਰਦੇ ਹਨ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ AI ਮਾਡਲ ਦੁਆਰਾ ਡੇਟਾ ਦੀ ਪ੍ਰਕਿਰਿਆ ਕਰਨ ਅਤੇ ਜਵਾਬ ਤਿਆਰ ਕਰਨ ਵਿੱਚ ਲੱਗਣ ਵਾਲਾ ਸਮਾਂ ਘੱਟੋ-ਘੱਟ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ। ਅਨੁਮਾਨ-ਅਨੁਕੂਲਿਤ ਚਿਪਸ ਇਸ ਲੇਟੈਂਸੀ ਨੂੰ ਘੱਟ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤੀਆਂ ਗਈਆਂ ਹਨ, ਤੇਜ਼ ਅਤੇ ਵਧੇਰੇ ਜਵਾਬਦੇਹ AI ਅਨੁਭਵਾਂ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦੀਆਂ ਹਨ।

  5. AI ਮਾਡਲਾਂ ਦੀ ਪਰਿਪੱਕਤਾ: ਜਿਵੇਂ ਕਿ AI ਮਾਡਲ ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਅਤੇ ਵਿਸ਼ੇਸ਼ ਬਣ ਜਾਂਦੇ ਹਨ, ਅਨੁਕੂਲਿਤ ਅਨੁਮਾਨ ਹਾਰਡਵੇਅਰ ਦੀ ਲੋੜ ਵਧ ਜਾਂਦੀ ਹੈ। ਆਮ-ਉਦੇਸ਼ ਵਾਲੇ GPUs, ਸਿਖਲਾਈ ਲਈ ਸ਼ਾਨਦਾਰ ਹੋਣ ਦੇ ਬਾਵਜੂਦ, ਖਾਸ, ਉੱਚ-ਟਿਊਨਡ AI ਮਾਡਲਾਂ ਨੂੰ ਚਲਾਉਣ ਲਈ ਸਭ ਤੋਂ ਕੁਸ਼ਲ ਹੱਲ ਨਹੀਂ ਹੋ ਸਕਦੇ ਹਨ।

ਚੁਣੌਤੀ ਦੇਣ ਵਾਲੇ ਉਭਰਦੇ ਹਨ: ਇੱਕ ਵਿਭਿੰਨ ਲੈਂਡਸਕੇਪ

ਅਨੁਮਾਨ ਦੀ ਵਧਦੀ ਮਹੱਤਤਾ Nvidia ਦੇ ਦਬਦਬੇ ਨੂੰ ਚੁਣੌਤੀ ਦੇਣ ਲਈ ਉਤਸੁਕ ਮੁਕਾਬਲੇਬਾਜ਼ਾਂ ਦੀ ਇੱਕ ਲਹਿਰ ਨੂੰ ਆਕਰਸ਼ਿਤ ਕਰ ਰਹੀ ਹੈ। ਇਹ ਕੰਪਨੀਆਂ ਇਸ ਵਧ ਰਹੇ ਬਾਜ਼ਾਰ ਵਿੱਚ ਪੈਰ ਜਮਾਉਣ ਲਈ ਵੱਖ-ਵੱਖ ਰਣਨੀਤੀਆਂ ਅਤੇ ਤਕਨੀਕਾਂ ਨੂੰ ਲਗਾ ਰਹੀਆਂ ਹਨ:

  1. ਵਿਸ਼ੇਸ਼ ਆਰਕੀਟੈਕਚਰ ਵਾਲੇ ਸਟਾਰਟਅੱਪ: ਬਹੁਤ ਸਾਰੇ ਸਟਾਰਟਅੱਪ ਖਾਸ ਤੌਰ ‘ਤੇ ਅਨੁਮਾਨ ਲਈ ਤਿਆਰ ਕੀਤੀਆਂ ਚਿਪਸ ਵਿਕਸਤ ਕਰ ਰਹੇ ਹਨ। ਇਹ ਚਿਪਸ ਅਕਸਰ ਖਾਸ AI ਵਰਕਲੋਡਾਂ ਲਈ ਅਨੁਕੂਲਿਤ ਨਾਵਲ ਆਰਕੀਟੈਕਚਰ ਦੀ ਵਿਸ਼ੇਸ਼ਤਾ ਰੱਖਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਪ੍ਰੋਸੈਸਿੰਗ ਜਾਂ ਕੰਪਿਊਟਰ ਵਿਜ਼ਨ। ਉਦਾਹਰਨਾਂ ਵਿੱਚ Graphcore, Cerebras Systems, ਅਤੇ SambaNova Systems ਵਰਗੀਆਂ ਕੰਪਨੀਆਂ ਸ਼ਾਮਲ ਹਨ। ਇਹ ਕੰਪਨੀਆਂ ਇਸ ਵਿਚਾਰ ‘ਤੇ ਸੱਟਾ ਲਗਾ ਰਹੀਆਂ ਹਨ ਕਿ ਵਿਸ਼ੇਸ਼ ਹਾਰਡਵੇਅਰ ਖਾਸ ਅਨੁਮਾਨ ਕਾਰਜਾਂ ਵਿੱਚ ਆਮ-ਉਦੇਸ਼ ਵਾਲੇ GPUs ਨੂੰ ਪਛਾੜ ਸਕਦਾ ਹੈ।

  2. FPGA-ਅਧਾਰਿਤ ਹੱਲ: ਫੀਲਡ-ਪ੍ਰੋਗਰਾਮੇਬਲ ਗੇਟ ਐਰੇ (FPGAs) ਰਵਾਇਤੀ GPUs ਅਤੇ ASICs (ਐਪਲੀਕੇਸ਼ਨ-ਸਪੈਸਿਫਿਕ ਇੰਟੀਗ੍ਰੇਟਿਡ ਸਰਕਟਾਂ) ਦਾ ਇੱਕ ਲਚਕਦਾਰ ਵਿਕਲਪ ਪੇਸ਼ ਕਰਦੇ ਹਨ। FPGAs ਨੂੰ ਨਿਰਮਾਣ ਤੋਂ ਬਾਅਦ ਦੁਬਾਰਾ ਪ੍ਰੋਗਰਾਮ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਉਹਨਾਂ ਨੂੰ ਵੱਖ-ਵੱਖ AI ਮਾਡਲਾਂ ਅਤੇ ਐਲਗੋਰਿਦਮਾਂ ਦੇ ਅਨੁਕੂਲ ਬਣਾਇਆ ਜਾ ਸਕਦਾ ਹੈ। Xilinx (ਹੁਣ AMD ਦਾ ਹਿੱਸਾ) ਅਤੇ Intel ਵਰਗੀਆਂ ਕੰਪਨੀਆਂ ਅਨੁਕੂਲ ਅਤੇ ਕੁਸ਼ਲ ਅਨੁਮਾਨ ਹੱਲ ਪ੍ਰਦਾਨ ਕਰਨ ਲਈ FPGAs ਦਾ ਲਾਭ ਉਠਾ ਰਹੀਆਂ ਹਨ।

  3. ASIC ਵਿਕਾਸ: ASICs ਕਸਟਮ-ਡਿਜ਼ਾਈਨ ਕੀਤੀਆਂ ਚਿਪਸ ਹਨ ਜੋ ਕਿਸੇ ਖਾਸ ਉਦੇਸ਼ ਲਈ ਬਣਾਈਆਂ ਗਈਆਂ ਹਨ। AI ਦੇ ਸੰਦਰਭ ਵਿੱਚ, ASICs ਨੂੰ ਖਾਸ ਅਨੁਮਾਨ ਵਰਕਲੋਡਾਂ ਲਈ ਵੱਧ ਤੋਂ ਵੱਧ ਪ੍ਰਦਰਸ਼ਨ ਅਤੇ ਕੁਸ਼ਲਤਾ ਪ੍ਰਦਾਨ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। Google ਦਾ ਟੈਂਸਰ ਪ੍ਰੋਸੈਸਿੰਗ ਯੂਨਿਟ (TPU), ਜੋ ਕਿ ਇਸਦੇ ਆਪਣੇ ਡੇਟਾ ਸੈਂਟਰਾਂ ਵਿੱਚ ਵਿਆਪਕ ਤੌਰ ‘ਤੇ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ, ਇੱਕ ASIC ਦੀ ਇੱਕ ਪ੍ਰਮੁੱਖ ਉਦਾਹਰਨ ਹੈ ਜੋ ਸਿਖਲਾਈ ਅਤੇ ਅਨੁਮਾਨ ਦੋਵਾਂ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਹੋਰ ਕੰਪਨੀਆਂ ਅਨੁਮਾਨ ਬਾਜ਼ਾਰ ਵਿੱਚ ਮੁਕਾਬਲੇਬਾਜ਼ੀ ਹਾਸਲ ਕਰਨ ਲਈ ASIC ਵਿਕਾਸ ਦਾ ਵੀ ਪਿੱਛਾ ਕਰ ਰਹੀਆਂ ਹਨ।

  4. ਸਥਾਪਿਤ ਚਿੱਪਮੇਕਰ ਆਪਣੀਆਂ AI ਪੇਸ਼ਕਸ਼ਾਂ ਦਾ ਵਿਸਤਾਰ ਕਰ ਰਹੇ ਹਨ: ਰਵਾਇਤੀ ਚਿੱਪਮੇਕਰ, ਜਿਵੇਂ ਕਿ Intel, AMD, ਅਤੇ Qualcomm, ਚੁੱਪ ਨਹੀਂ ਬੈਠੇ ਹਨ। ਉਹ AI ਅਨੁਮਾਨ ਲਈ ਅਨੁਕੂਲਿਤ ਚਿਪਸ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨ ਲਈ ਆਪਣੇ ਉਤਪਾਦ ਪੋਰਟਫੋਲੀਓ ਦਾ ਸਰਗਰਮੀ ਨਾਲ ਵਿਸਤਾਰ ਕਰ ਰਹੇ ਹਨ। Intel, ਉਦਾਹਰਨ ਲਈ, ਆਪਣੀ CPU ਮੁਹਾਰਤ ਦਾ ਲਾਭ ਉਠਾ ਰਿਹਾ ਹੈ ਅਤੇ ਆਪਣੀ ਸਥਿਤੀ ਨੂੰ ਮਜ਼ਬੂਤ ਕਰਨ ਲਈ AI ਐਕਸਲੇਟਰਾਂ ਵਿੱਚ ਮੁਹਾਰਤ ਰੱਖਣ ਵਾਲੀਆਂ ਕੰਪਨੀਆਂ ਨੂੰ ਹਾਸਲ ਕਰ ਰਿਹਾ ਹੈ। AMD ਦੁਆਰਾ Xilinx ਦਾ ਐਕਵਾਇਰ ਇਸਨੂੰ ਅਨੁਮਾਨ ਲਈ ਇੱਕ ਮਜ਼ਬੂਤ FPGA-ਅਧਾਰਿਤ ਪਲੇਟਫਾਰਮ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। Qualcomm, ਮੋਬਾਈਲ ਪ੍ਰੋਸੈਸਰਾਂ ਵਿੱਚ ਇੱਕ ਮੋਹਰੀ, ਸਮਾਰਟਫ਼ੋਨਾਂ ਅਤੇ ਹੋਰ Edge ਉਪਕਰਣਾਂ ‘ਤੇ AI ਐਪਲੀਕੇਸ਼ਨਾਂ ਨੂੰ ਪਾਵਰ ਦੇਣ ਲਈ ਆਪਣੀਆਂ ਚਿਪਸ ਵਿੱਚ AI ਪ੍ਰਵੇਗ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਜੋੜ ਰਿਹਾ ਹੈ।

  5. ਕਲਾਉਡ ਪ੍ਰਦਾਤਾ ਆਪਣੀਆਂ ਖੁਦ ਦੀਆਂ ਚਿਪਸ ਡਿਜ਼ਾਈਨ ਕਰ ਰਹੇ ਹਨ: ਵੱਡੇ ਕਲਾਉਡ ਪ੍ਰਦਾਤਾ, ਜਿਵੇਂ ਕਿ Amazon Web Services (AWS) ਅਤੇ Google Cloud, AI ਵਰਕਲੋਡਾਂ ਲਈ ਆਪਣੀਆਂ ਖੁਦ ਦੀਆਂ ਕਸਟਮ ਚਿਪਸ ਡਿਜ਼ਾਈਨ ਕਰ ਰਹੇ ਹਨ, ਜਿਸ ਵਿੱਚ ਅਨੁਮਾਨ ਵੀ ਸ਼ਾਮਲ ਹੈ। AWS ਦਾ Inferentia ਚਿੱਪ, ਉਦਾਹਰਨ ਲਈ, ਖਾਸ ਤੌਰ ‘ਤੇ ਕਲਾਉਡ ਵਿੱਚ ਅਨੁਮਾਨ ਨੂੰ ਤੇਜ਼ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਹ ਰੁਝਾਨ ਕਲਾਉਡ ਪ੍ਰਦਾਤਾਵਾਂ ਨੂੰ ਉਹਨਾਂ ਦੀਆਂ ਖਾਸ ਲੋੜਾਂ ਲਈ ਉਹਨਾਂ ਦੇ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣ ਅਤੇ ਬਾਹਰੀ ਚਿੱਪ ਵਿਕਰੇਤਾਵਾਂ ‘ਤੇ ਉਹਨਾਂ ਦੀ ਨਿਰਭਰਤਾ ਨੂੰ ਘਟਾਉਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ।

ਅਨੁਮਾਨ ਦਬਦਬੇ ਦੀ ਲੜਾਈ: ਮੁੱਖ ਵਿਚਾਰ

AI ਅਨੁਮਾਨ ਬਾਜ਼ਾਰ ਵਿੱਚ ਮੁਕਾਬਲਾ ਸਿਰਫ਼ ਕੱਚੀ ਪ੍ਰੋਸੈਸਿੰਗ ਪਾਵਰ ਬਾਰੇ ਨਹੀਂ ਹੈ। ਸਫਲਤਾ ਨਿਰਧਾਰਤ ਕਰਨ ਵਿੱਚ ਕਈ ਹੋਰ ਕਾਰਕ ਮਹੱਤਵਪੂਰਨ ਹਨ:

  1. ਸਾਫਟਵੇਅਰ ਈਕੋਸਿਸਟਮ: ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਆਕਰਸ਼ਿਤ ਕਰਨ ਅਤੇ ਕਿਸੇ ਖਾਸ ਚਿੱਪ ‘ਤੇ AI ਮਾਡਲਾਂ ਨੂੰ ਤੈਨਾਤ ਕਰਨਾ ਆਸਾਨ ਬਣਾਉਣ ਲਈ ਇੱਕ ਮਜ਼ਬੂਤ ਸਾਫਟਵੇਅਰ ਈਕੋਸਿਸਟਮ ਜ਼ਰੂਰੀ ਹੈ। Nvidia ਦਾ CUDA ਪਲੇਟਫਾਰਮ, ਇੱਕ ਸਮਾਨਾਂਤਰ ਕੰਪਿਊਟਿੰਗ ਪਲੇਟਫਾਰਮ ਅਤੇ ਪ੍ਰੋਗਰਾਮਿੰਗ ਮਾਡਲ, ਸਿਖਲਾਈ ਬਾਜ਼ਾਰ ਵਿੱਚ ਇੱਕ ਵੱਡਾ ਫਾਇਦਾ ਰਿਹਾ ਹੈ। ਮੁਕਾਬਲੇਬਾਜ਼ ਆਪਣੇ ਹਾਰਡਵੇਅਰ ਦਾ ਸਮਰਥਨ ਕਰਨ ਲਈ ਮਜ਼ਬੂਤ ਸਾਫਟਵੇਅਰ ਟੂਲ ਅਤੇ ਲਾਇਬ੍ਰੇਰੀਆਂ ਵਿਕਸਤ ਕਰਨ ਲਈ ਸਖ਼ਤ ਮਿਹਨਤ ਕਰ ਰਹੇ ਹਨ।

  2. ਪਾਵਰ ਕੁਸ਼ਲਤਾ: ਜਿਵੇਂ ਕਿ ਪਹਿਲਾਂ ਦੱਸਿਆ ਗਿਆ ਹੈ, ਪਾਵਰ ਕੁਸ਼ਲਤਾ ਬਹੁਤ ਸਾਰੇ ਅਨੁਮਾਨ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ, ਖਾਸ ਕਰਕੇ Edge ‘ਤੇ। ਉਹ ਚਿਪਸ ਜੋ ਪ੍ਰਤੀ ਵਾਟ ਉੱਚ ਪ੍ਰਦਰਸ਼ਨ ਪ੍ਰਦਾਨ ਕਰ ਸਕਦੀਆਂ ਹਨ, ਦਾ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਫਾਇਦਾ ਹੋਵੇਗਾ।

  3. ਲਾਗਤ: ਅਨੁਮਾਨ ਚਿਪਸ ਦੀ ਲਾਗਤ ਇੱਕ ਵੱਡਾ ਵਿਚਾਰ ਹੈ, ਖਾਸ ਕਰਕੇ ਵੱਡੇ ਪੈਮਾਨੇ ਦੀਆਂ ਤੈਨਾਤੀਆਂ ਲਈ। ਉਹ ਕੰਪਨੀਆਂ ਜੋ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਬਰਕਰਾਰ ਰੱਖਦੇ ਹੋਏ ਪ੍ਰਤੀਯੋਗੀ ਕੀਮਤ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰ ਸਕਦੀਆਂ ਹਨ, ਚੰਗੀ ਸਥਿਤੀ ਵਿੱਚ ਹੋਣਗੀਆਂ।

  4. ਸਕੇਲੇਬਿਲਟੀ: ਅਨੁਮਾਨ ਤੈਨਾਤੀਆਂ ਨੂੰ ਕੁਸ਼ਲਤਾ ਨਾਲ ਸਕੇਲ ਕਰਨ ਦੀ ਯੋਗਤਾ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਇਸ ਵਿੱਚ ਨਾ ਸਿਰਫ਼ ਵਿਅਕਤੀਗਤ ਚਿਪਸ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਸ਼ਾਮਲ ਹੈ, ਸਗੋਂ ਇੱਕ ਕਲੱਸਟਰ ਵਿੱਚ ਕਈ ਚਿਪਸ ਨੂੰ ਜੋੜਨ ਅਤੇ ਪ੍ਰਬੰਧਨ ਕਰਨ ਦੀ ਯੋਗਤਾ ਵੀ ਸ਼ਾਮਲ ਹੈ।

  5. ਲਚਕਤਾ ਅਤੇ ਪ੍ਰੋਗਰਾਮੇਬਿਲਟੀ: ਜਦੋਂ ਕਿ ASICs ਖਾਸ ਵਰਕਲੋਡਾਂ ਲਈ ਉੱਚ ਪ੍ਰਦਰਸ਼ਨ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦੇ ਹਨ, ਉਹਨਾਂ ਵਿੱਚ GPUs ਅਤੇ FPGAs ਦੀ ਲਚਕਤਾ ਦੀ ਘਾਟ ਹੁੰਦੀ ਹੈ। ਵਿਕਸਤ ਹੋ ਰਹੇ AI ਮਾਡਲਾਂ ਅਤੇ ਐਲਗੋਰਿਦਮਾਂ ਦੇ ਅਨੁਕੂਲ ਹੋਣ ਦੀ ਯੋਗਤਾ ਬਹੁਤ ਸਾਰੇ ਉਪਭੋਗਤਾਵਾਂ ਲਈ ਇੱਕ ਮੁੱਖ ਵਿਚਾਰ ਹੈ।

  6. ਸੁਰੱਖਿਆ: ਸੰਵੇਦਨਸ਼ੀਲ ਐਪਲੀਕੇਸ਼ਨਾਂ, ਜਿਵੇਂ ਕਿ ਸਿਹਤ ਸੰਭਾਲ ਅਤੇ ਵਿੱਤ, ਵਿੱਚ AI ਦੀ ਵੱਧ ਰਹੀ ਵਰਤੋਂ ਦੇ ਨਾਲ, ਸੁਰੱਖਿਆ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਬਣ ਰਹੀ ਹੈ।

ਅਨੁਮਾਨ ਦਾ ਭਵਿੱਖ: ਇੱਕ ਬਹੁ-ਪੱਖੀ ਲੈਂਡਸਕੇਪ

ਅਨੁਮਾਨ ਬਾਜ਼ਾਰ ਮਹੱਤਵਪੂਰਨ ਵਿਕਾਸ ਅਤੇ ਵਿਭਿੰਨਤਾ ਲਈ ਤਿਆਰ ਹੈ। ਇਹ ਸੰਭਾਵਨਾ ਨਹੀਂ ਹੈ ਕਿ ਇੱਕ ਵੀ ਕੰਪਨੀ ਉਸੇ ਤਰ੍ਹਾਂ ਹਾਵੀ ਹੋਵੇਗੀ ਜਿਵੇਂ Nvidia ਨੇ ਸਿਖਲਾਈ ਸਪੇਸ ਵਿੱਚ ਕੀਤਾ ਹੈ। ਇਸ ਦੀ ਬਜਾਏ, ਅਸੀਂ ਖਾਸ ਲੋੜਾਂ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨਾਂ ਨੂੰ ਪੂਰਾ ਕਰਨ ਵਾਲੇ ਵੱਖ-ਵੱਖ ਚਿੱਪ ਆਰਕੀਟੈਕਚਰ ਅਤੇ ਵਿਕਰੇਤਾਵਾਂ ਦੇ ਨਾਲ ਇੱਕ ਬਹੁ-ਪੱਖੀ ਲੈਂਡਸਕੇਪ ਦੇਖਣ ਦੀ ਸੰਭਾਵਨਾ ਹੈ।

ਮੁਕਾਬਲਾ ਭਿਆਨਕ ਹੋਵੇਗਾ, ਨਵੀਨਤਾ ਨੂੰ ਚਲਾਉਣਾ ਅਤੇ AI ਨਾਲ ਸੰਭਵ ਹੋਣ ਵਾਲੀਆਂ ਸੀਮਾਵਾਂ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣਾ। ਇਹ ਅੰਤ ਵਿੱਚ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਲਾਭ ਪਹੁੰਚਾਏਗਾ, ਤੇਜ਼, ਵਧੇਰੇ ਕੁਸ਼ਲ, ਅਤੇ ਵਧੇਰੇ ਕਿਫਾਇਤੀ AI ਹੱਲਾਂ ਵੱਲ ਅਗਵਾਈ ਕਰੇਗਾ। ਅਨੁਮਾਨ ਦਾ ਵਾਧਾ ਸਿਰਫ਼ Nvidia ਦੇ ਦਬਦਬੇ ਨੂੰ ਚੁਣੌਤੀ ਦੇਣ ਬਾਰੇ ਨਹੀਂ ਹੈ; ਇਹ AI ਦੀ ਪੂਰੀ ਸਮਰੱਥਾ ਨੂੰ ਅਨਲੌਕ ਕਰਨ ਅਤੇ ਇਸਨੂੰ ਐਪਲੀਕੇਸ਼ਨਾਂ ਅਤੇ ਉਦਯੋਗਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਲਈ ਪਹੁੰਚਯੋਗ ਬਣਾਉਣ ਬਾਰੇ ਹੈ। ਆਉਣ ਵਾਲੇ ਸਾਲ AI ਚਿੱਪ ਮਾਰਕੀਟ ਦੇ ਇਸ ਮਹੱਤਵਪੂਰਨ ਹਿੱਸੇ ਲਈ ਇੱਕ ਨਿਰਣਾਇਕ ਮਿਆਦ ਹੋਣਗੇ, ਜੋ ਕਿ ਭਵਿੱਖ ਨੂੰ ਆਕਾਰ ਦੇਣਗੇ ਕਿ ਕਿਵੇਂ AI ਨੂੰ ਦੁਨੀਆ ਭਰ ਵਿੱਚ ਤੈਨਾਤ ਅਤੇ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ।