Generative AI ਦਾ ਦੋਰਾਹਾ: ਉੱਚੀਆਂ ਕੀਮਤਾਂ ਬਨਾਮ ਘੱਟ ਲਾਗਤ ਮਾਡਲ

ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਦੀ ਦੁਨੀਆ ਇਸ ਸਮੇਂ ਸਪੱਸ਼ਟ ਵਿਰੋਧਾਭਾਸਾਂ ਦਾ ਮੰਚ ਹੈ। ਇੱਕ ਪਾਸੇ, ਵੱਡੀਆਂ ਤਕਨੀਕੀ ਕੰਪਨੀਆਂ ਵਿੱਚ ਹੈਰਾਨੀਜਨਕ ਰਕਮਾਂ ਲਗਾਈਆਂ ਜਾ ਰਹੀਆਂ ਹਨ, ਜੋ ਬੇਮਿਸਾਲ ਬੋਧਾਤਮਕ ਸ਼ਕਤੀ ਦੀਆਂ ਇੱਛਾਵਾਂ ਨੂੰ ਹਵਾ ਦੇ ਰਹੀਆਂ ਹਨ ਅਤੇ ਇੱਕ ਆਉਣ ਵਾਲੇ ਨਿਵੇਸ਼ ਬੁਲਬੁਲੇ ਬਾਰੇ ਬਹਿਸਾਂ ਛੇੜ ਰਹੀਆਂ ਹਨ। ਅਰਬਾਂ ਡਾਲਰ ਦੀਆਂ ਕੀਮਤਾਂ ਆਮ ਹੋ ਰਹੀਆਂ ਹਨ, ਅਤੇ ਫੰਡਿੰਗ ਦੇ ਦੌਰ ਖਗੋਲੀ ਅੰਕੜਿਆਂ ਤੱਕ ਪਹੁੰਚਣ ਦੀਆਂ ਕਨਸੋਆਂ ਹਨ। ਫਿਰ ਵੀ, ਇੱਕ ਸ਼ਾਂਤ, ਸਮਾਨਾਂਤਰ ਮੰਚ ‘ਤੇ, ਅਕਾਦਮਿਕ ਹਲਕਿਆਂ ਅਤੇ ਓਪਨ-ਸੋਰਸ ਭਾਈਚਾਰਿਆਂ ਵਿੱਚ ਇੱਕ ਕ੍ਰਾਂਤੀ ਪੈਦਾ ਹੋ ਰਹੀ ਹੈ। ਇੱਥੇ, ਖੋਜਕਰਤਾ ਕਮਾਲ ਦੀ ਸਿਰਜਣਾਤਮਕਤਾ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰ ਰਹੇ ਹਨ, ਅਰਬਾਂ ਨਾਲ ਨਹੀਂ, ਸਗੋਂ ਕਈ ਵਾਰ ਸਿਰਫ਼ ਜੇਬ ਖਰਚ ਨਾਲ ਸਮਰੱਥ ਜਨਰੇਟਿਵ AI ਮਾਡਲ ਤਿਆਰ ਕਰ ਰਹੇ ਹਨ, ਜੋ ਇਸ ਪ੍ਰਚਲਿਤ ਧਾਰਨਾ ਨੂੰ ਬੁਨਿਆਦੀ ਤੌਰ ‘ਤੇ ਚੁਣੌਤੀ ਦੇ ਰਹੇ ਹਨ ਕਿ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਦੀ ਸਰਵਉੱਚਤਾ ਦੀ ਦੌੜ ਵਿੱਚ ਹਮੇਸ਼ਾ ਵੱਡਾ ਹੀ ਬਿਹਤਰ ਹੁੰਦਾ ਹੈ।

ਇਹ ਵਖਰੇਵਾਂ ਵੱਧਦਾ ਜਾ ਰਿਹਾ ਹੈ। OpenAI, ChatGPT ਦੇ ਪਿੱਛੇ ਦੀ ਸ਼ਕਤੀ, ਨੂੰ ਵਿਚਾਰੋ, ਜੋ ਕਥਿਤ ਤੌਰ ‘ਤੇ ਹੋਰ ਨਿਵੇਸ਼ ਦੀ ਮੰਗ ਕਰ ਰਿਹਾ ਹੈ ਜੋ ਇਸਦੀ ਕੀਮਤ ਨੂੰ ਹੈਰਾਨ ਕਰਨ ਵਾਲੇ $300 ਬਿਲੀਅਨ ਤੱਕ ਪਹੁੰਚਾ ਸਕਦਾ ਹੈ। ਅਜਿਹੇ ਅੰਕੜੇ, ਤੇਜ਼ੀ ਨਾਲ ਵੱਧ ਰਹੇ ਮਾਲੀਏ ਦੇ ਅਨੁਮਾਨਾਂ ਦੇ ਨਾਲ, ਬੇਲਗਾਮ ਆਸ਼ਾਵਾਦ ਅਤੇ ਤੇਜ਼ੀ ਨਾਲ ਵਿਕਾਸ ਦੀ ਤਸਵੀਰ ਪੇਸ਼ ਕਰਦੇ ਹਨ। ਇਸ ਦੇ ਨਾਲ ਹੀ, ਸਾਵਧਾਨੀ ਦੇ ਝਟਕੇ ਇਸ AI ਉਤਸ਼ਾਹ ਦੀਆਂ ਨੀਂਹਾਂ ਨੂੰ ਹਿਲਾ ਰਹੇ ਹਨ। ਅਖੌਤੀ ‘Magnificent 7’ ਤਕਨਾਲੋਜੀ ਸਟਾਕ, ਜੋ ਲੰਬੇ ਸਮੇਂ ਤੋਂ ਮੁੱਖ ਤੌਰ ‘ਤੇ ਆਪਣੀ AI ਸੰਭਾਵਨਾ ਕਾਰਨ ਬਾਜ਼ਾਰ ਦੇ ਪਸੰਦੀਦਾ ਰਹੇ ਹਨ, ਨੇ ਮਹੱਤਵਪੂਰਨ ਘੱਟ ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਦੌਰ ਦਾ ਅਨੁਭਵ ਕੀਤਾ ਹੈ, ਜੋ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ ਨਿਵੇਸ਼ਕਾਂ ਦੀ ਚਿੰਤਾ ਵਧ ਰਹੀ ਹੈ। ਇਹ ਬੇਚੈਨੀ ਤਜਰਬੇਕਾਰ ਉਦਯੋਗ ਦੇ ਦਿੱਗਜਾਂ, ਜਿਵੇਂ ਕਿ Alibaba ਦੇ ਸਹਿ-ਸੰਸਥਾਪਕ Joe Tsai, ਦੀਆਂ ਚੇਤਾਵਨੀਆਂ ਦੁਆਰਾ ਵਧਾਈ ਜਾਂਦੀ ਹੈ, ਜਿਨ੍ਹਾਂ ਨੇ ਹਾਲ ਹੀ ਵਿੱਚ ਇੱਕ ਸੰਭਾਵੀ AI ਬੁਲਬੁਲੇ ਦੇ ਬਣਨ ਦੇ ਚਿੰਤਾਜਨਕ ਸੰਕੇਤਾਂ ਵੱਲ ਇਸ਼ਾਰਾ ਕੀਤਾ, ਖਾਸ ਕਰਕੇ US ਮਾਰਕੀਟ ਵਿੱਚ। ਲੋੜੀਂਦੇ ਨਿਵੇਸ਼ ਦਾ ਪੂਰਾ ਪੈਮਾਨਾ, ਖਾਸ ਤੌਰ ‘ਤੇ ਇਹਨਾਂ ਗੁੰਝਲਦਾਰ ਮਾਡਲਾਂ ਨੂੰ ਸ਼ਕਤੀ ਦੇਣ ਵਾਲੇ ਵਿਸ਼ਾਲ ਡਾਟਾ ਸੈਂਟਰਾਂ ਲਈ, ਤੀਬਰ ਜਾਂਚ ਦੇ ਅਧੀਨ ਆ ਰਿਹਾ ਹੈ। ਕੀ ਮੌਜੂਦਾ ਖਰਚੇ ਦੇ ਪੱਧਰ ਟਿਕਾਊ ਹਨ, ਜਾਂ ਕੀ ਉਹ ਨੇੜਲੇ-ਮਿਆਦ ਦੀਆਂ ਹਕੀਕਤਾਂ ਤੋਂ ਵੱਖ ਹੋਏ ਇੱਕ ਤਰਕਹੀਣ ਉਤਸ਼ਾਹ ਦਾ ਸੰਕੇਤ ਹਨ?

AI ਬੁਲਬੁਲੇ ਦਾ ਖ਼ਤਰਾ ਮੰਡਰਾ ਰਿਹਾ ਹੈ

AI ਬੁਲਬੁਲੇ ਬਾਰੇ ਚਿੰਤਾਵਾਂ ਸਿਰਫ਼ ਅਮੂਰਤ ਵਿੱਤੀ ਚਿੰਤਾਵਾਂ ਨਹੀਂ ਹਨ; ਉਹ AI ਵਿਕਾਸ ਦੀ ਗਤੀ ਅਤੇ ਦਿਸ਼ਾ ਬਾਰੇ ਡੂੰਘੇ ਸਵਾਲਾਂ ਨੂੰ ਦਰਸਾਉਂਦੀਆਂ ਹਨ। ਬਿਰਤਾਂਤ ਮੁੱਖ ਤੌਰ ‘ਤੇ ਕੁਝ ਵੱਡੇ ਖਿਡਾਰੀਆਂ ਦੁਆਰਾ ਹਾਵੀ ਰਿਹਾ ਹੈ ਜੋ ਵੱਡੇ ਤੋਂ ਵੱਡੇ Large Language Models (LLMs) ਬਣਾਉਣ ਲਈ ਅਰਬਾਂ ਦਾ ਨਿਵੇਸ਼ ਕਰ ਰਹੇ ਹਨ। ਇਸ ਨੇ ਇੱਕ ਅਜਿਹਾ ਮਾਹੌਲ ਬਣਾਇਆ ਹੈ ਜਿੱਥੇ ਮਾਰਕੀਟ ਲੀਡਰਸ਼ਿਪ ਸਭ ਤੋਂ ਡੂੰਘੀਆਂ ਜੇਬਾਂ ਅਤੇ ਸਭ ਤੋਂ ਵਿਆਪਕ ਕੰਪਿਊਟਿੰਗ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ‘ਤੇ ਨਿਰਭਰ ਜਾਪਦੀ ਹੈ।

  • ਮੁਲਾਂਕਣ ਦਾ ਚੱਕਰ (Valuation Vertigo): OpenAI ਦੀ ਸੰਭਾਵੀ $300 ਬਿਲੀਅਨ ਦੀ ਕੀਮਤ, ਜਦੋਂ ਕਿ ਕੁਝ ਨਿਵੇਸ਼ਕਾਂ ਤੋਂ ਬਹੁਤ ਜ਼ਿਆਦਾ ਵਿਸ਼ਵਾਸ ਦਰਸਾਉਂਦੀ ਹੈ, ਸਵਾਲ ਵੀ ਖੜ੍ਹੇ ਕਰਦੀ ਹੈ। ਕੀ ਇਹ ਅੰਕੜਾ ਮੌਜੂਦਾ ਸਮਰੱਥਾਵਾਂ ਅਤੇ ਮਾਲੀਆ ਧਾਰਾਵਾਂ ਦੁਆਰਾ ਜਾਇਜ਼ ਹੈ, ਜਾਂ ਕੀ ਇਹ ਭਵਿੱਖ ਦੇ, ਸ਼ਾਇਦ ਅਨਿਸ਼ਚਿਤ, ਸਫਲਤਾਵਾਂ ਵੱਲ ਬਹੁਤ ਜ਼ਿਆਦਾ ਝੁਕਿਆ ਹੋਇਆ ਹੈ? ਪਿਛਲੇ ਤਕਨੀਕੀ ਉਛਾਲ ਅਤੇ ਗਿਰਾਵਟ, ਜਿਵੇਂ ਕਿ ਡਾਟ-ਕਾਮ ਯੁੱਗ, ਨਾਲ ਇਤਿਹਾਸਕ ਸਮਾਨਤਾਵਾਂ ਲਾਜ਼ਮੀ ਤੌਰ ‘ਤੇ ਸਾਹਮਣੇ ਆਉਂਦੀਆਂ ਹਨ, ਜੋ ਸਾਵਧਾਨੀ ਵਰਤਣ ਲਈ ਪ੍ਰੇਰਿਤ ਕਰਦੀਆਂ ਹਨ।
  • ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਦੇ ਨਿਵੇਸ਼ ਦੀ ਜਾਂਚ (Infrastructure Investment Scrutiny): AI-ਵਿਸ਼ੇਸ਼ ਡਾਟਾ ਸੈਂਟਰਾਂ ਅਤੇ ਵਿਸ਼ੇਸ਼ ਹਾਰਡਵੇਅਰ, ਜਿਵੇਂ ਕਿ ਉੱਚ-ਪੱਧਰੀ GPUs, ਵਿੱਚ ਅਰਬਾਂ ਡਾਲਰ ਲਗਾਏ ਜਾ ਰਹੇ ਹਨ, ਜੋ ਵੱਡੇ ਪੂੰਜੀ ਖਰਚਿਆਂ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ। Joe Tsai ਦੀ ਚੇਤਾਵਨੀ ਅਜਿਹੇ ਵੱਡੇ ਸ਼ੁਰੂਆਤੀ ਨਿਵੇਸ਼ਾਂ ਨਾਲ ਜੁੜੇ ਜੋਖਮ ਨੂੰ ਉਜਾਗਰ ਕਰਦੀ ਹੈ, ਖਾਸ ਤੌਰ ‘ਤੇ ਜੇਕਰ ਮੁਦਰੀਕਰਨ ਦਾ ਰਾਹ ਉਮੀਦ ਨਾਲੋਂ ਲੰਬਾ ਜਾਂ ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਸਾਬਤ ਹੁੰਦਾ ਹੈ। ਇਹਨਾਂ ਨਿਵੇਸ਼ਾਂ ਦੀ ਕੁਸ਼ਲਤਾ ਅਤੇ ਵਾਪਸੀ ਮਹੱਤਵਪੂਰਨ ਚਰਚਾ ਦੇ ਬਿੰਦੂ ਬਣ ਰਹੇ ਹਨ।
  • ਮਾਰਕੀਟ ਸੰਕੇਤ (Market Signals): AI ਵਿੱਚ ਭਾਰੀ ਨਿਵੇਸ਼ ਕਰਨ ਵਾਲੀਆਂ ਤਕਨੀਕੀ ਦਿੱਗਜਾਂ ਦੇ ਉਤਰਾਅ-ਚੜ੍ਹਾਅ ਵਾਲੇ ਪ੍ਰਦਰਸ਼ਨ ਮਾਰਕੀਟ ਦੇ ਸ਼ੱਕ ਦੀ ਇੱਕ ਡਿਗਰੀ ਦਾ ਸੁਝਾਅ ਦਿੰਦੇ ਹਨ। ਜਦੋਂ ਕਿ ਲੰਬੇ ਸਮੇਂ ਦੀ ਸੰਭਾਵਨਾ ਇੱਕ ਮਜ਼ਬੂਤ ਖਿੱਚ ਬਣੀ ਹੋਈ ਹੈ, ਥੋੜ੍ਹੇ ਸਮੇਂ ਦੀ ਅਸਥਿਰਤਾ ਦਰਸਾਉਂਦੀ ਹੈ ਕਿ ਨਿਵੇਸ਼ਕ ਸਰਗਰਮੀ ਨਾਲ ਜੋਖਮ ਦਾ ਮੁੜ ਮੁਲਾਂਕਣ ਕਰ ਰਹੇ ਹਨ ਅਤੇ ਮੌਜੂਦਾ ਵਿਕਾਸ ਦੇ ਰਸਤਿਆਂ ਦੀ ਸਥਿਰਤਾ ‘ਤੇ ਸਵਾਲ ਉਠਾ ਰਹੇ ਹਨ। AI ਸਪੇਸ ਵਿੱਚ ਆਉਣ ਵਾਲੇ IPOs ਦੀ ਕਿਸਮਤ, ਜਿਵੇਂ ਕਿ AI ਚਿੱਪ ਮਾਹਰ CoreWeave ਤੋਂ ਸੰਭਾਵਿਤ ਪੇਸ਼ਕਸ਼, ਨੂੰ ਮਾਰਕੀਟ ਭਾਵਨਾ ਦੇ ਬੈਰੋਮੀਟਰ ਵਜੋਂ ਨੇੜਿਓਂ ਦੇਖਿਆ ਜਾ ਰਿਹਾ ਹੈ। ਕੀ ਇਹ ਉਤਸ਼ਾਹ ਨੂੰ ਮੁੜ ਜਗਾਏਗਾ ਜਾਂ ਅੰਦਰੂਨੀ ਘਬਰਾਹਟ ਦੀ ਪੁਸ਼ਟੀ ਕਰੇਗਾ?
  • ਭੂ-ਰਾਜਨੀਤਿਕ ਪਹਿਲੂ (Geopolitical Dimensions): AI ਦੌੜ ਦੇ ਮਹੱਤਵਪੂਰਨ ਭੂ-ਰਾਜਨੀਤਿਕ ਅਰਥ ਵੀ ਹਨ, ਖਾਸ ਕਰਕੇ US ਅਤੇ ਚੀਨ ਵਿਚਕਾਰ। US ਵਿੱਚ ਭਾਰੀ ਖਰਚਾ ਅੰਸ਼ਕ ਤੌਰ ‘ਤੇ ਮੁਕਾਬਲੇਬਾਜ਼ੀ ਵਿੱਚ ਬੜ੍ਹਤ ਬਣਾਈ ਰੱਖਣ ਦੀ ਇੱਛਾ ਦੁਆਰਾ ਪ੍ਰੇਰਿਤ ਹੈ। ਇਸ ਨਾਲ ਗੁੰਝਲਦਾਰ ਨੀਤੀਗਤ ਬਹਿਸਾਂ ਹੋਈਆਂ ਹਨ, ਜਿਸ ਵਿੱਚ ਚੀਨ ਦੀ ਤਰੱਕੀ ਨੂੰ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਹੌਲੀ ਕਰਨ ਲਈ ਉੱਨਤ ਸੈਮੀਕੰਡਕਟਰ ਤਕਨਾਲੋਜੀ ‘ਤੇ ਸਖ਼ਤ ਨਿਰਯਾਤ ਨਿਯੰਤਰਣ ਦੀ ਮੰਗ ਸ਼ਾਮਲ ਹੈ। ਇਸਦੇ ਉਲਟ, ਵੈਂਚਰ ਕੈਪੀਟਲ ਚੀਨੀ AI ਸਟਾਰਟਅੱਪਸ ਵਿੱਚ ਵਹਿਣਾ ਜਾਰੀ ਰੱਖਦਾ ਹੈ, ਜੋ ਇੱਕ ਗਲੋਬਲ ਮੁਕਾਬਲੇ ਦਾ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ ਜਿੱਥੇ ਤਕਨੀਕੀ ਮੁਹਾਰਤ ਅਤੇ ਆਰਥਿਕ ਰਣਨੀਤੀ ਆਪਸ ਵਿੱਚ ਜੁੜੇ ਹੋਏ ਹਨ।

ਇਹ ਉੱਚ-ਦਾਅ, ਉੱਚ-ਖਰਚ ਵਾਲਾ ਵਾਤਾਵਰਣ ਵਿਘਨਕਾਰੀ ਨਵੀਨਤਾਵਾਂ ਲਈ ਪੜਾਅ ਤੈਅ ਕਰਦਾ ਹੈ ਜੋ ਸਥਾਪਤ ਵਿਵਸਥਾ ਨੂੰ ਚੁਣੌਤੀ ਦਿੰਦੀਆਂ ਹਨ। ਕਾਫ਼ੀ ਸਸਤੇ ਵਿਕਲਪਾਂ ਦਾ ਉਭਾਰ ਇਸ ਗੱਲ ਦਾ ਮੁੜ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਮਜਬੂਰ ਕਰਦਾ ਹੈ ਕਿ ਕੀ ਬੇਰਹਿਮ ਗਣਨਾ ਸ਼ਕਤੀ ਅਤੇ ਵਿਸ਼ਾਲ ਪੈਮਾਨਾ ਹੀ ਅੱਗੇ ਵਧਣ ਦੇ ਇੱਕੋ ਇੱਕ ਰਸਤੇ ਹਨ।

DeepSeek ਦਾ ਵਿਘਨਕਾਰੀ ਦਾਅਵਾ ਅਤੇ ਇਸਦੇ ਪ੍ਰਭਾਵ

ਵਿਸ਼ਾਲ ਖਰਚਿਆਂ ਅਤੇ ਵਧਦੀ ਚਿੰਤਾ ਦੇ ਇਸ ਮਾਹੌਲ ਵਿੱਚ DeepSeek, ਇੱਕ ਚੀਨ-ਅਧਾਰਤ ਸੰਸਥਾ, ਨੇ ਇੱਕ ਹੈਰਾਨ ਕਰਨ ਵਾਲਾ ਦਾਅਵਾ ਕੀਤਾ: ਇਸਨੇ ਆਪਣਾ R1 ਜਨਰੇਟਿਵ AI ਵੱਡਾ ਭਾਸ਼ਾਈ ਮਾਡਲ ਸਿਰਫ਼ $6 ਮਿਲੀਅਨ ਵਿੱਚ ਵਿਕਸਤ ਕੀਤਾ ਸੀ। ਇਹ ਅੰਕੜਾ, ਪੱਛਮੀ ਹਮਰੁਤਬਾ ਦੁਆਰਾ ਮੰਨੇ ਜਾਂਦੇ ਅਰਬਾਂ ਡਾਲਰ ਦੇ ਨਿਵੇਸ਼ਾਂ ਨਾਲੋਂ ਕਈ ਗੁਣਾ ਘੱਟ, ਨੇ ਤੁਰੰਤ ਉਦਯੋਗ ਵਿੱਚ ਹਲਚਲ ਮਚਾ ਦਿੱਤੀ।

ਜਦੋਂ ਕਿ $6 ਮਿਲੀਅਨ ਦੀ ਗਣਨਾ ਬਾਰੇ ਸ਼ੱਕ ਬਰਕਰਾਰ ਹੈ - ਇਹ ਸਵਾਲ ਕਰਦੇ ਹੋਏ ਕਿ ਕਿਹੜੀਆਂ ਲਾਗਤਾਂ ਸ਼ਾਮਲ ਕੀਤੀਆਂ ਗਈਆਂ ਸਨ ਅਤੇ ਕਿਹੜੀਆਂ ਨਹੀਂ - ਘੋਸ਼ਣਾ ਦਾ ਪ੍ਰਭਾਵ ਅਸਵੀਕਾਰਨਯੋਗ ਸੀ। ਇਸਨੇ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਉਤਪ੍ਰੇਰਕ ਵਜੋਂ ਕੰਮ ਕੀਤਾ, ਮਾਰਕੀਟ ਲੀਡਰਾਂ ਦੁਆਰਾ ਵਰਤੀਆਂ ਜਾਂਦੀਆਂ ਲਾਗਤ ਢਾਂਚਿਆਂ ਅਤੇ ਵਿਕਾਸ ਵਿਧੀਆਂ ਦੀ ਇੱਕ ਆਲੋਚਨਾਤਮਕ ਜਾਂਚ ਕਰਨ ਲਈ ਮਜਬੂਰ ਕੀਤਾ। ਜੇਕਰ ਇੱਕ ਵਾਜਬ ਤੌਰ ‘ਤੇ ਸਮਰੱਥ ਮਾਡਲ ਅਸਲ ਵਿੱਚ ਅਰਬਾਂ ਦੀ ਬਜਾਏ ਲੱਖਾਂ ਵਿੱਚ ਬਣਾਇਆ ਜਾ ਸਕਦਾ ਹੈ, ਤਾਂ ਇਸਦਾ ਮੌਜੂਦਾ ਪਹੁੰਚਾਂ ਦੀ ਕੁਸ਼ਲਤਾ ਬਾਰੇ ਕੀ ਮਤਲਬ ਸੀ?

  • ਬਿਰਤਾਂਤ ਨੂੰ ਚੁਣੌਤੀ (Challenging the Narrative): DeepSeek ਦਾ ਦਾਅਵਾ, ਸਹੀ ਹੋਵੇ ਜਾਂ ਨਾ, ਨੇ ਇਸ ਪ੍ਰਚਲਿਤ ਬਿਰਤਾਂਤ ਨੂੰ ਤੋੜ ਦਿੱਤਾ ਕਿ ਅਤਿ-ਆਧੁਨਿਕ AI ਵਿਕਾਸ ਸਿਰਫ਼ ਖਰਬਾਂ-ਡਾਲਰ ਦੀਆਂ ਕੰਪਨੀਆਂ ਦਾ ਖੇਤਰ ਸੀ ਜਿਨ੍ਹਾਂ ਕੋਲ ਬੇਅੰਤ ਸਰੋਤ ਸਨ। ਇਸਨੇ ਇੱਕ ਵਧੇਰੇ ਲੋਕਤੰਤਰੀ ਵਿਕਾਸ ਲੈਂਡਸਕੇਪ ਦੀ ਸੰਭਾਵਨਾ ਪੇਸ਼ ਕੀਤੀ।
  • ਜਾਂਚ ਨੂੰ ਹਵਾ ਦੇਣਾ (Fueling Scrutiny): ਇਸਨੇ Microsoft-ਸਮਰਥਿਤ OpenAI ਵਰਗੀਆਂ ਕੰਪਨੀਆਂ ਦੁਆਰਾ ਕੀਤੇ ਗਏ ਵੱਡੇ ਖਰਚਿਆਂ ‘ਤੇ ਪਹਿਲਾਂ ਹੀ ਪੈ ਰਹੀ ਜਾਂਚ ਨੂੰ ਤੇਜ਼ ਕਰ ਦਿੱਤਾ। ਨਿਵੇਸ਼ਕਾਂ, ਵਿਸ਼ਲੇਸ਼ਕਾਂ ਅਤੇ ਪ੍ਰਤੀਯੋਗੀਆਂ ਨੇ ਸਰੋਤ ਵੰਡ ਅਤੇ ਇਹਨਾਂ ਪੂੰਜੀ-ਸੰਘਣੀ ਪ੍ਰੋਜੈਕਟਾਂ ‘ਤੇ ਨਿਵੇਸ਼ ਦੀ ਵਾਪਸੀ ਬਾਰੇ ਸਖ਼ਤ ਸਵਾਲ ਪੁੱਛਣੇ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤੇ।
  • ਭੂ-ਰਾਜਨੀਤਿਕ ਗੂੰਜ (Geopolitical Resonance): ਇਹ ਦਾਅਵਾ US-ਚੀਨ ਤਕਨੀਕੀ ਦੁਸ਼ਮਣੀ ਦੇ ਸੰਦਰਭ ਵਿੱਚ ਵੀ ਗੂੰਜਿਆ। ਇਸਨੇ ਸੁਝਾਅ ਦਿੱਤਾ ਕਿ AI ਯੋਗਤਾ ਲਈ ਵਿਕਲਪਕ, ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਵਧੇਰੇ ਸਰੋਤ-ਕੁਸ਼ਲ ਮਾਰਗ ਮੌਜੂਦ ਹੋ ਸਕਦੇ ਹਨ, ਤਕਨੀਕੀ ਲੀਡਰਸ਼ਿਪ ਅਤੇ ਰਣਨੀਤਕ ਮੁਕਾਬਲੇ ਬਾਰੇ ਚਰਚਾਵਾਂ ਵਿੱਚ ਜਟਿਲਤਾ ਦੀ ਇੱਕ ਹੋਰ ਪਰਤ ਜੋੜਦੇ ਹੋਏ। ਇਸਨੇ ਚਿੱਪ ਪਾਬੰਦੀਆਂ ਵਰਗੀਆਂ ਨੀਤੀਆਂ ‘ਤੇ ਹੋਰ ਬਹਿਸ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕੀਤਾ, ਜਦੋਂ ਕਿ ਨਾਲ ਹੀ ਵੈਂਚਰ ਪੂੰਜੀਪਤੀਆਂ ਨੂੰ ਚੀਨ ਵਿੱਚ ਉੱਭਰ ਰਹੇ ਖਿਡਾਰੀਆਂ ਨੂੰ ਨੇੜਿਓਂ ਦੇਖਣ ਲਈ ਉਤਸ਼ਾਹਿਤ ਕੀਤਾ ਜੋ ਸ਼ਾਇਦ ਘੱਟ ਵਿਕਾਸ ਮਾਡਲਾਂ ਦੇ ਮਾਲਕ ਹੋ ਸਕਦੇ ਹਨ।

ਸ਼ੱਕ ਦੇ ਬਾਵਜੂਦ, DeepSeek R1 ਦੀ ਰਿਲੀਜ਼, ਖਾਸ ਤੌਰ ‘ਤੇ ਇਸਦੇ ਨਾਲ ਜੁੜੇ ਓਪਨ ਖੋਜ ਭਾਗਾਂ ਨੇ, ਮਹੱਤਵਪੂਰਨ ਸੂਝ ਪ੍ਰਦਾਨ ਕੀਤੀ ਜੋ ਦੂਜਿਆਂ ਨੂੰ ਪ੍ਰੇਰਿਤ ਕਰੇਗੀ। ਇਹ ਸਿਰਫ਼ ਦਾਅਵਾ ਕੀਤੀ ਲਾਗਤ ਨਹੀਂ ਸੀ, ਸਗੋਂ ਸੰਭਾਵੀ ਵਿਧੀਆਂ ਵੱਲ ਇਸ਼ਾਰਾ ਕੀਤਾ ਗਿਆ ਸੀ, ਜਿਸ ਨੇ ਹੋਰ ਥਾਵਾਂ ‘ਤੇ ਉਤਸੁਕਤਾ ਅਤੇ ਨਵੀਨਤਾ ਪੈਦਾ ਕੀਤੀ, ਖਾਸ ਕਰਕੇ ਬਹੁਤ ਵੱਖਰੀਆਂ ਵਿੱਤੀ ਰੁਕਾਵਟਾਂ ਅਧੀਨ ਕੰਮ ਕਰਨ ਵਾਲੀਆਂ ਅਕਾਦਮਿਕ ਲੈਬਾਂ ਵਿੱਚ।

ਅਲਟਰਾ-ਲੀਨ AI ਦਾ ਉਭਾਰ: ਇੱਕ ਯੂਨੀਵਰਸਿਟੀ ਕ੍ਰਾਂਤੀ

ਜਦੋਂ ਕਿ ਕਾਰਪੋਰੇਟ ਦਿੱਗਜ ਅਰਬਾਂ-ਡਾਲਰ ਦੇ ਬਜਟ ਅਤੇ ਮਾਰਕੀਟ ਦਬਾਅ ਨਾਲ ਜੂਝ ਰਹੇ ਸਨ, ਅਕਾਦਮਿਕਤਾ ਦੇ ਹਾਲਾਂ ਵਿੱਚ ਇੱਕ ਵੱਖਰੀ ਕਿਸਮ ਦੀ AI ਕ੍ਰਾਂਤੀ ਚੁੱਪਚਾਪ ਆਕਾਰ ਲੈ ਰਹੀ ਸੀ। ਖੋਜਕਰਤਾ, ਤੁਰੰਤ ਵਪਾਰੀਕਰਨ ਦੀਆਂ ਮੰਗਾਂ ਤੋਂ ਬੇਫਿਕਰ ਪਰ ਫੰਡਿੰਗ ਦੁਆਰਾ ਬੁਰੀ ਤਰ੍ਹਾਂ ਸੀਮਤ, ਨੇ ਘੱਟੋ-ਘੱਟ ਸਰੋਤਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, ਉੱਨਤ AI ਦੇ ਪਿੱਛੇ ਸਿਧਾਂਤਾਂ ਨੂੰ ਦੁਹਰਾਉਣ ਦੇ ਤਰੀਕਿਆਂ ਦੀ ਖੋਜ ਕਰਨੀ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤੀ, ਭਾਵੇਂ ਪੂਰਾ ਪੈਮਾਨਾ ਨਾ ਹੋਵੇ। ਇੱਕ ਪ੍ਰਮੁੱਖ ਉਦਾਹਰਣ University of California, Berkeley ਤੋਂ ਸਾਹਮਣੇ ਆਈ।

Berkeley ਦੀ ਇੱਕ ਟੀਮ, ਹਾਲੀਆ ਤਰੱਕੀਆਂ ਤੋਂ ਉਤਸੁਕ ਪਰ ਉਦਯੋਗ ਲੈਬਾਂ ਦੀ ਭਾਰੀ ਪੂੰਜੀ ਦੀ ਘਾਟ ਕਾਰਨ, TinyZero ਨਾਮਕ ਇੱਕ ਪ੍ਰੋਜੈਕਟ ਸ਼ੁਰੂ ਕੀਤਾ। ਉਹਨਾਂ ਦਾ ਟੀਚਾ ਦਲੇਰਾਨਾ ਸੀ: ਕੀ ਉਹ ਇੱਕ ਬਹੁਤ ਘੱਟ ਕੀਤੇ ਗਏ ਮਾਡਲ ਅਤੇ ਬਜਟ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, ਖਾਸ ਤੌਰ ‘ਤੇ ਉਸ ਕਿਸਮ ਦੀ ਤਰਕਸ਼ੀਲਤਾ ਜੋ ਮਾਡਲਾਂ ਨੂੰ ਜਵਾਬ ਦੇਣ ਤੋਂ ਪਹਿਲਾਂ ‘ਸੋਚਣ’ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ, ਨੂੰ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰ ਸਕਦੇ ਹਨ? ਜਵਾਬ ਇੱਕ ਜ਼ੋਰਦਾਰ ਹਾਂ ਸਾਬਤ ਹੋਇਆ। ਉਹਨਾਂ ਨੇ OpenAI ਅਤੇ DeepSeek ਦੋਵਾਂ ਦੁਆਰਾ ਖੋਜੇ ਗਏ ਤਰਕ ਪੈਰਾਡਾਈਮ ਦੇ ਮੁੱਖ ਪਹਿਲੂਆਂ ਨੂੰ ਇੱਕ ਹੈਰਾਨੀਜਨਕ ਤੌਰ ‘ਤੇ ਘੱਟ ਲਾਗਤ - ਲਗਭਗ $30 ਵਿੱਚ ਸਫਲਤਾਪੂਰਵਕ ਦੁਬਾਰਾ ਪੈਦਾ ਕੀਤਾ।

ਇਹ GPT-4 ਦਾ ਸਿੱਧਾ ਪ੍ਰਤੀਯੋਗੀ ਬਣਾ ਕੇ ਪ੍ਰਾਪਤ ਨਹੀਂ ਕੀਤਾ ਗਿਆ ਸੀ, ਸਗੋਂ ਮਾਡਲ ਅਤੇ ਕਾਰਜ ਦੋਵਾਂ ਦੀ ਜਟਿਲਤਾ ਨੂੰ ਚਲਾਕੀ ਨਾਲ ਘਟਾ ਕੇ ਕੀਤਾ ਗਿਆ ਸੀ।

  • $30 ਦਾ ਪ੍ਰਯੋਗ (The $30 Experiment): ਇਹ ਅੰਕੜਾ ਮੁੱਖ ਤੌਰ ‘ਤੇ ਲੋੜੀਂਦੇ ਸਿਖਲਾਈ ਸਮੇਂ ਲਈ ਇੱਕ ਜਨਤਕ ਕਲਾਉਡ ਪਲੇਟਫਾਰਮ ‘ਤੇ ਦੋ Nvidia H200 GPUs ਕਿਰਾਏ ‘ਤੇ ਲੈਣ ਦੀ ਲਾਗਤ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਇਸਨੇ ਵੱਡੇ ਸ਼ੁਰੂਆਤੀ ਹਾਰਡਵੇਅਰ ਨਿਵੇਸ਼ ਤੋਂ ਬਿਨਾਂ ਅਤਿ-ਆਧੁਨਿਕ ਖੋਜ ਲਈ ਮੌਜੂਦਾ ਕਲਾਉਡ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਦਾ ਲਾਭ ਉਠਾਉਣ ਦੀ ਸੰਭਾਵਨਾ ਨੂੰ ਦਰਸਾਇਆ।
  • ਮਾਡਲ ਸਕੇਲਿੰਗ (Model Scaling): TinyZero ਪ੍ਰੋਜੈਕਟ ਨੇ ਇੱਕ ‘3B’ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕੀਤੀ, ਜੋ ਲਗਭਗ ਤਿੰਨ ਅਰਬ ਪੈਰਾਮੀਟਰਾਂ ਦਾ ਹਵਾਲਾ ਦਿੰਦਾ ਹੈ। ਇਹ ਸਭ ਤੋਂ ਵੱਡੇ LLMs ਨਾਲੋਂ ਕਾਫ਼ੀ ਛੋਟਾ ਹੈ, ਜੋ ਸੈਂਕੜੇ ਅਰਬਾਂ ਜਾਂ ਖਰਬਾਂ ਪੈਰਾਮੀਟਰਾਂ ਦਾ ਮਾਣ ਕਰ ਸਕਦੇ ਹਨ। ਮੁੱਖ ਸੂਝ ਇਹ ਸੀ ਕਿ ਜੇਕਰ ਕਾਰਜ ਨੂੰ ਉਚਿਤ ਢੰਗ ਨਾਲ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਗਿਆ ਹੋਵੇ ਤਾਂ ਛੋਟੇ ਮਾਡਲਾਂ ਵਿੱਚ ਵੀ ਗੁੰਝਲਦਾਰ ਵਿਵਹਾਰ ਉਭਰ ਸਕਦੇ ਹਨ।
  • ਦਿੱਗਜਾਂ ਅਤੇ ਚੁਣੌਤੀ ਦੇਣ ਵਾਲਿਆਂ ਤੋਂ ਪ੍ਰੇਰਨਾ (Inspiration from Giants and Challengers): Jiayi Pan, TinyZero ਪ੍ਰੋਜੈਕਟ ਲੀਡਰ, ਨੇ ਨੋਟ ਕੀਤਾ ਕਿ OpenAI ਤੋਂ ਸਫਲਤਾਵਾਂ, ਖਾਸ ਤੌਰ ‘ਤੇ ਜਵਾਬ ਦੇਣ ਤੋਂ ਪਹਿਲਾਂ ਵਧੇਰੇ ਸਮਾਂ ਪ੍ਰੋਸੈਸਿੰਗ ਕਰਨ ਵਾਲੇ ਮਾਡਲਾਂ ਦੇ ਆਲੇ ਦੁਆਲੇ ਦੀਆਂ ਧਾਰਨਾਵਾਂ, ਇੱਕ ਵੱਡੀ ਪ੍ਰੇਰਨਾ ਸਨ। ਹਾਲਾਂਕਿ, ਇਹ DeepSeek R1 ਦੀ ਓਪਨ ਖੋਜ ਸੀ ਜਿਸ ਨੇ ਇਸ ਸੁਧਰੀ ਹੋਈ ਤਰਕ ਸਮਰੱਥਾ ਨੂੰ ਕਿਵੇਂ ਪ੍ਰਾਪਤ ਕਰਨਾ ਹੈ, ਇਸ ਬਾਰੇ ਇੱਕ ਸੰਭਾਵੀ ਬਲੂਪ੍ਰਿੰਟ ਪ੍ਰਦਾਨ ਕੀਤਾ, ਭਾਵੇਂ DeepSeek ਦੀ ਰਿਪੋਰਟ ਕੀਤੀ $6 ਮਿਲੀਅਨ ਸਿਖਲਾਈ ਲਾਗਤ ਅਜੇ ਵੀ ਯੂਨੀਵਰਸਿਟੀ ਟੀਮ ਦੀ ਪਹੁੰਚ ਤੋਂ ਬਹੁਤ ਪਰੇ ਸੀ।

Berkeley ਟੀਮ ਨੇ ਅਨੁਮਾਨ ਲਗਾਇਆ ਕਿ ਮਾਡਲ ਦੇ ਆਕਾਰ ਅਤੇ ਇਸ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਲੋੜੀਂਦੀ ਸਮੱਸਿਆ ਦੀ ਜਟਿਲਤਾ ਦੋਵਾਂ ਨੂੰ ਘਟਾ ਕੇ, ਉਹ ਅਜੇ ਵੀ ਲੋੜੀਂਦੇ ‘ਉਭਰਦੇ ਤਰਕ ਵਿਵਹਾਰ’ ਨੂੰ ਦੇਖ ਸਕਦੇ ਹਨ। ਇਹ ਘਟਾਉਣ ਵਾਲੀ ਪਹੁੰਚ ਲਾਗਤਾਂ ਨੂੰ ਨਾਟਕੀ ਢੰਗ ਨਾਲ ਘਟਾਉਣ ਦੀ ਕੁੰਜੀ ਸੀ ਜਦੋਂ ਕਿ ਅਜੇ ਵੀ ਕੀਮਤੀ ਵਿਗਿਆਨਕ ਨਿਰੀਖਣ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦੀ ਸੀ।

‘ਆਹਾ ਪਲ’ ਨੂੰ ਡੀਕੋਡ ਕਰਨਾ: ਬਜਟ ‘ਤੇ ਤਰਕ ਕਰਨਾ

TinyZero ਪ੍ਰੋਜੈਕਟ, ਅਤੇ ਇਸ ਤਰ੍ਹਾਂ ਦੀਆਂ ਘੱਟ-ਲਾਗਤ ਪਹਿਲਕਦਮੀਆਂ ਦੀ ਮੁੱਖ ਪ੍ਰਾਪਤੀ, ਜਿਸਨੂੰ ਖੋਜਕਰਤਾ ਅਕਸਰ ‘ਆਹਾ ਪਲ’ ਕਹਿੰਦੇ ਹਨ - ਉਹ ਬਿੰਦੂ ਜਿੱਥੇ ਇੱਕ AI ਮਾਡਲ ਸਿਰਫ਼ ਪੈਟਰਨ ਮੈਚਿੰਗ ਜਾਂ ਸਟੋਰ ਕੀਤੀ ਜਾਣਕਾਰੀ ਨੂੰ ਮੁੜ ਪ੍ਰਾਪਤ ਕਰਨ ਦੀ ਬਜਾਏ, ਅਸਲ ਤਰਕ ਅਤੇ ਸਮੱਸਿਆ-ਹੱਲ ਕਰਨ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਨਾ ਸ਼ੁਰੂ ਕਰਦਾ ਹੈ, ਨੂੰ ਦਰਸਾਉਣ ਵਿੱਚ ਹੈ। ਇਹ ਉੱਭਰਦਾ ਵਿਵਹਾਰ ਸਭ ਤੋਂ ਵੱਡੇ ਮਾਡਲਾਂ ਦੇ ਡਿਵੈਲਪਰਾਂ ਲਈ ਵੀ ਇੱਕ ਮੁੱਖ ਟੀਚਾ ਹੈ।

ਆਪਣੀ ਪਰਿਕਲਪਨਾ ਦੀ ਜਾਂਚ ਕਰਨ ਅਤੇ ਇਸ ਵਿਵਹਾਰ ਨੂੰ ਛੋਟੇ ਪੈਮਾਨੇ ‘ਤੇ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ, Berkeley ਟੀਮ ਨੇ ਇੱਕ ਖਾਸ, ਪ੍ਰਤੀਬੰਧਿਤ ਕਾਰਜ ਲਾਗੂ ਕੀਤਾ: ‘Countdown’ ਨਾਮਕ ਇੱਕ ਗਣਿਤ ਦੀ ਖੇਡ।

  • ਕਾਊਂਟਡਾਊਨ ਗੇਮ (The Countdown Game): ਇਸ ਗੇਮ ਲਈ AI ਨੂੰ ਦਿੱਤੇ ਗਏ ਸ਼ੁਰੂਆਤੀ ਨੰਬਰਾਂ ਅਤੇ ਬੁਨਿਆਦੀ ਗਣਿਤ ਕਾਰਜਾਂ (ਜੋੜ, ਘਟਾਓ, ਗੁਣਾ, ਭਾਗ) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇੱਕ ਟੀਚਾ ਨੰਬਰ ਤੱਕ ਪਹੁੰਚਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ, Countdown ਵਿੱਚ ਸਫਲਤਾ ਪਹਿਲਾਂ ਤੋਂ ਮੌਜੂਦ ਗਣਿਤ ਦੇ ਗਿਆਨ ਦੀ ਵੱਡੀ ਮਾਤਰਾ ਨੂੰ ਯਾਦ ਕਰਨ ਦੀ ਬਜਾਏ, ਰਣਨੀਤਕ ਤਰਕ ਅਤੇ ਯੋਜਨਾਬੰਦੀ - ਵੱਖ-ਵੱਖ ਸੰਜੋਗਾਂ ਅਤੇ ਕਾਰਜਾਂ ਦੇ ਕ੍ਰਮਾਂ ਦੀ ਖੋਜ ਕਰਨ ‘ਤੇ ਵਧੇਰੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ।
  • ਖੇਡ ਦੁਆਰਾ ਸਿੱਖਣਾ (Learning Through Play): ਸ਼ੁਰੂ ਵਿੱਚ, TinyZero ਮਾਡਲ ਨੇ ਖੇਡ ਨੂੰ ਬੇਤਰਤੀਬੇ ਢੰਗ ਨਾਲ ਅਪਣਾਇਆ, ਲਗਭਗ ਬੇਤਰਤੀਬੇ ਸੰਜੋਗਾਂ ਦੀ ਕੋਸ਼ਿਸ਼ ਕੀਤੀ। ਹਾਲਾਂਕਿ, ਸੁਧਾਰ ਸਿਖਲਾਈ (ਅਜ਼ਮਾਇਸ਼ ਅਤੇ ਗਲਤੀ ਅਤੇ ਇਨਾਮਾਂ ਤੋਂ ਸਿੱਖਣਾ) ਦੀ ਪ੍ਰਕਿਰਿਆ ਦੁਆਰਾ, ਇਸਨੇ ਪੈਟਰਨਾਂ ਅਤੇ ਰਣਨੀਤੀਆਂ ਨੂੰ ਸਮਝਣਾ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤਾ। ਇਸਨੇ ਆਪਣੀ ਪਹੁੰਚ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣਾ, ਅਕੁਸ਼ਲ ਮਾਰਗਾਂ ਨੂੰ ਰੱਦ ਕਰਨਾ, ਅਤੇ ਸਹੀ ਹੱਲਾਂ ‘ਤੇ ਤੇਜ਼ੀ ਨਾਲ ਇਕੱਠਾ ਹੋਣਾ ਸਿੱਖਿਆ। ਇਸਨੇ ਜ਼ਰੂਰੀ ਤੌਰ ‘ਤੇ ਖੇਡ ਦੇ ਪਰਿਭਾਸ਼ਿਤ ਨਿਯਮਾਂ ਦੇ ਅੰਦਰ ਕਿਵੇਂ ਤਰਕ ਕਰਨਾ ਹੈ ਸਿੱਖਿਆ।
  • ਸਵੈ-ਪ੍ਰਮਾਣਿਕਤਾ ਉੱਭਰਦੀ ਹੈ (Self-Verification Emerges): ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ, ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਮਾਡਲ ਨੇ ਸਵੈ-ਪ੍ਰਮਾਣਿਕਤਾ ਦੇ ਸੰਕੇਤ ਦਿਖਾਉਣੇ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤੇ - ਇਹ ਨਿਰਧਾਰਤ ਕਰਨ ਲਈ ਆਪਣੇ ਖੁਦ ਦੇ ਵਿਚਕਾਰਲੇ ਕਦਮਾਂ ਅਤੇ ਸੰਭਾਵੀ ਹੱਲਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨਾ ਕਿ ਕੀ ਉਹ ਟੀਚਾ ਨੰਬਰ ਵੱਲ ਲੈ ਜਾ ਰਹੇ ਸਨ। ਅੰਦਰੂਨੀ ਤੌਰ ‘ਤੇ ਮੁਲਾਂਕਣ ਕਰਨ ਅਤੇ ਕੋਰਸ ਨੂੰ ਠੀਕ ਕਰਨ ਦੀ ਇਹ ਯੋਗਤਾ ਵਧੇਰੇ ਉੱਨਤ ਤਰਕ ਦੀ ਇੱਕ ਵਿਸ਼ੇਸ਼ਤਾ ਹੈ।

ਜਿਵੇਂ ਕਿ Jiayi Pan ਨੇ ਸਮਝਾਇਆ, ‘ਅਸੀਂ ਦਿਖਾਉਂਦੇ ਹਾਂ ਕਿ 3B ਜਿੰਨੇ ਛੋਟੇ ਮਾਡਲ ਨਾਲ, ਇਹ ਸਧਾਰਨ ਸਮੱਸਿਆਵਾਂ ਬਾਰੇ ਤਰਕ ਕਰਨਾ ਸਿੱਖ ਸਕਦਾ ਹੈ ਅਤੇ ਸਵੈ-ਪ੍ਰਮਾਣਿਤ ਕਰਨਾ ਅਤੇ ਬਿਹਤਰ ਹੱਲ ਲੱਭਣਾ ਸਿੱਖਣਾ ਸ਼ੁਰੂ ਕਰ ਸਕਦਾ ਹੈ।’ ਇਸਨੇ ਪ੍ਰਦਰਸ਼ਿਤ ਕੀਤਾ ਕਿ ਤਰਕ ਅਤੇ ‘ਆਹਾ ਪਲ’ ਦੇ ਅੰਤਰੀਵ ਬੁਨਿਆਦੀ ਢਾਂਚੇ, ਜੋ ਪਹਿਲਾਂ ਮੁੱਖ ਤੌਰ ‘ਤੇ ਵਿਸ਼ਾਲ, ਮਹਿੰਗੇ ਮਾਡਲਾਂ ਨਾਲ ਜੁੜੇ ਹੋਏ ਸਨ, ਨੂੰ ਇੱਕ ਬਹੁਤ ਹੀ ਸਰੋਤ-ਪ੍ਰਤੀਬੰਧਿਤ ਵਾਤਾਵਰਣ ਵਿੱਚ ਦੁਹਰਾਇਆ ਅਤੇ ਅਧਿਐਨ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। TinyZero ਦੀ ਸਫਲਤਾ ਨੇ ਸਾਬਤ ਕੀਤਾ ਕਿ ਫਰੰਟੀਅਰ AI ਸੰਕਲਪ ਸਿਰਫ਼ ਤਕਨੀਕੀ ਦਿੱਗਜਾਂ ਦਾ ਖੇਤਰ ਨਹੀਂ ਸਨ, ਸਗੋਂ ਸੀਮਤ ਬਜਟ ਵਾਲੇ ਖੋਜਕਰਤਾਵਾਂ, ਇੰਜੀਨੀਅਰਾਂ ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ ਸ਼ੌਕੀਨਾਂ ਲਈ ਵੀ ਪਹੁੰਚਯੋਗ ਬਣਾਏ ਜਾ ਸਕਦੇ ਸਨ, AI ਖੋਜ ਲਈ ਇੱਕ ਵਧੇਰੇ ਸਮਾਵੇਸ਼ੀ ਵਾਤਾਵਰਣ ਪ੍ਰਣਾਲੀ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦੇ ਹੋਏ। ਟੀਮ ਦਾ ਆਪਣੇ ਖੋਜਾਂ ਨੂੰ ਖੁੱਲ੍ਹੇਆਮ ਸਾਂਝਾ ਕਰਨ ਦਾ ਫੈਸਲਾ, ਖਾਸ ਤੌਰ ‘ਤੇ GitHub ਵਰਗੇ ਪਲੇਟਫਾਰਮਾਂ ਰਾਹੀਂ, ਦੂਜਿਆਂ ਨੂੰ ਪ੍ਰਯੋਗਾਂ ਨੂੰ ਦੁਹਰਾਉਣ ਅਤੇ ਕੁਝ ਪੀਜ਼ਾ ਦੀ ਲਾਗਤ ਤੋਂ ਘੱਟ ਵਿੱਚ ਇਸ ‘ਆਹਾ ਪਲ’ ਦਾ ਪਹਿਲੀ ਵਾਰ ਅਨੁਭਵ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੱਤੀ।

Stanford ਝਗੜੇ ਵਿੱਚ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ: ਘੱਟ-ਲਾਗਤ ਸਿਖਲਾਈ ਨੂੰ ਪ੍ਰਮਾਣਿਤ ਕਰਨਾ

TinyZero ਦੁਆਰਾ ਪੈਦਾ ਕੀਤੀਆਂ ਲਹਿਰਾਂ ਤੇਜ਼ੀ ਨਾਲ ਅਕਾਦਮਿਕ AI ਭਾਈਚਾਰੇ ਵਿੱਚ ਫੈਲ ਗਈਆਂ। Stanford University ਦੇ ਖੋਜਕਰਤਾ, ਜੋ ਪਹਿਲਾਂ ਹੀ ਸਮਾਨ ਸੰਕਲਪਾਂ ਦੀ ਖੋਜ ਕਰ ਰਹੇ ਸਨ ਅਤੇ ਪਹਿਲਾਂ ਖੋਜ ਕਾਰਜ ਵਜੋਂ Countdown ਗੇਮ ਵੀ ਪੇਸ਼ ਕਰ ਚੁੱਕੇ ਸਨ, ਨੇ Berkeley ਟੀਮ ਦੇ ਕੰਮ ਨੂੰ ਬਹੁਤ ਢੁਕਵਾਂ ਅਤੇ ਪ੍ਰਮਾਣਿਤ ਪਾਇਆ।

Kanishk Gandhi ਦੀ ਅਗਵਾਈ ਵਿੱਚ, Stanford ਟੀਮ ਇੱਕ ਸਬੰਧਤ, ਬੁਨਿਆਦੀ ਸਵਾਲ ਦੀ ਖੋਜ ਕਰ ਰਹੀ ਸੀ: ਕੁਝ LLMs ਸਿਖਲਾਈ ਦੌਰਾਨ ਆਪਣੀਆਂ ਤਰਕ ਯੋਗਤਾਵਾਂ ਵਿੱਚ ਨਾਟਕੀ, ਲਗਭਗ ਅਚਾਨਕ ਸੁਧਾਰ ਕਿਉਂ ਦਿਖਾਉਂਦੇ ਹਨ, ਜਦੋਂ ਕਿ ਦੂਸਰੇ ਸਥਿਰ ਜਾਪਦੇ ਹਨ? ਯੋਗਤਾ ਵਿੱਚ ਇਹਨਾਂ ਛਾਲਾਂ ਨੂੰ ਚਲਾਉਣ ਵਾਲੇ ਅੰਤਰੀਵ ਢਾਂਚੇ ਨੂੰ ਸਮਝਣਾ ਵਧੇਰੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਅਤੇ ਭਰੋਸੇਮੰਦ AI ਬਣਾਉਣ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ।

  • ਸਾਂਝੀ ਜ਼ਮੀਨ ‘ਤੇ ਨਿਰਮਾਣ (Building on Shared Ground): Gandhi ਨੇ TinyZero ਦੀ ਕੀਮਤ ਨੂੰ ਸਵੀਕਾਰ ਕੀਤਾ, ਇਹ ਦੱਸਦੇ ਹੋਏ ਕਿ ਇਹ ‘ਮਹਾਨ’ ਸੀ ਕਿਉਂਕਿ ਇਸਨੇ ਸਫਲਤਾਪੂਰਵਕ Countdown ਕਾਰਜ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਜਿਸਦਾ ਉਸਦੀ ਆਪਣੀ ਟੀਮ ਅਧਿਐਨ ਕਰ ਰਹੀ ਸੀ। ਇਸ ਇਕਸਾਰਤਾ ਨੇ ਵੱਖ-ਵੱਖ ਖੋਜ ਸਮੂਹਾਂ ਵਿੱਚ ਵਿਚਾਰਾਂ ਦੀ ਤੇਜ਼ੀ ਨਾਲ ਪ੍ਰਮਾਣਿਕਤਾ ਅਤੇ ਦੁਹਰਾਓ ਦੀ ਆਗਿਆ ਦਿੱਤੀ।
  • ਇੰਜੀਨੀਅਰਿੰਗ ਰੁਕਾਵਟਾਂ ਨੂੰ ਪਾਰ ਕਰਨਾ (Overcoming Engineering Hurdles): Stanford ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਇਹ ਵੀ ਉਜਾਗਰ ਕੀਤਾ ਕਿ ਕਿਵੇਂ ਉਹਨਾਂ ਦੀ ਤਰੱਕੀ ਪਹਿਲਾਂ ਇੰਜੀਨੀਅਰਿੰਗ ਚੁਣੌਤੀਆਂ ਦੁਆਰਾ ਰੁਕਾਵਟ ਬਣੀ ਸੀ। ਓਪਨ-ਸੋਰਸ ਟੂਲਸ ਦੀ ਉਪਲਬਧਤਾ ਇਹਨਾਂ ਰੁਕਾਵਟਾਂ ਨੂੰ ਦੂਰ ਕਰਨ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਬਣ ਗਈ।
  • ਓਪਨ ਸੋਰਸ ਟੂਲਸ ਦੀ ਸ਼ਕਤੀ (The Power of Open Source Tools): ਖਾਸ ਤੌਰ ‘ਤੇ, Gandhi ਨੇ Volcano Engine Reinforcement Learning ਸਿਸਟਮ (VERL), ByteDance (TikTok ਦੀ ਮੂਲ ਕੰਪਨੀ) ਦੁਆਰਾ ਵਿਕਸਤ ਇੱਕ ਓਪਨ-ਸੋਰਸ ਪ੍ਰੋਜੈਕਟ, ਨੂੰ ‘ਸਾਡੇ ਪ੍ਰਯੋਗਾਂ ਨੂੰ ਚਲਾਉਣ ਲਈ ਜ਼ਰੂਰੀ’ ਵਜੋਂ ਸਿਹਰਾ ਦਿੱਤਾ। VERL ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਅਤੇ Stanford ਟੀਮ ਦੀਆਂ ਪ੍ਰਯੋਗਾਤਮਕ ਲੋੜਾਂ ਵਿਚਕਾਰ ਇਕਸਾਰਤਾ ਨੇ ਉਹਨਾਂ ਦੇ ਖੋਜ ਚੱਕਰਾਂ ਨੂੰ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ ਤੇਜ਼ ਕੀਤਾ।

ਓਪਨ-ਸੋਰਸ ਭਾਗਾਂ ‘ਤੇ ਇਹ ਨਿਰਭਰਤਾ ਘੱਟ-ਲਾਗਤ AI ਅੰਦੋਲਨ ਦੇ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਪਹਿ