Alibaba ਦਾ AI ਵਾਧਾ: ਗਲੋਬਲ ਖੇਤਰ 'ਚ ਮਲਟੀਮੋਡਲ ਦਾਅਵੇਦਾਰ

ਹਮੇਸ਼ਾ ਤੇਜ਼ ਹੁੰਦਾ AI ਫਰੰਟੀਅਰ

ਤਕਨਾਲੋਜੀ ਦੀ ਤਰੱਕੀ ਦੇ ਨਿਰੰਤਰ ਮੰਚ ‘ਤੇ, ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ‘ਤੇ ਰੌਸ਼ਨੀ ਘੱਟ ਹੀ ਮੱਧਮ ਹੁੰਦੀ ਹੈ। ਹਰ ਹਫ਼ਤਾ ਨਵੇਂ ਐਲਾਨ, ਨਵੀਆਂ ਸਮਰੱਥਾਵਾਂ, ਅਤੇ ਦਬਦਬੇ ਲਈ ਮੁਕਾਬਲਾ ਕਰ ਰਹੇ ਗਲੋਬਲ ਦਿੱਗਜਾਂ ਵਿਚਕਾਰ ਤਿੱਖੀ ਦੁਸ਼ਮਣੀ ਲਿਆਉਂਦਾ ਜਾਪਦਾ ਹੈ। ਬਿਰਤਾਂਤ ਸਿਰਫ਼ ਟੈਕਸਟ-ਅਧਾਰਿਤ ਪਰਸਪਰ ਕ੍ਰਿਆਵਾਂ ਤੋਂ ਵੱਖ-ਵੱਖ ਡਾਟਾ ਕਿਸਮਾਂ ਤੋਂ ਬੁਣੇ ਹੋਏ ਇੱਕ ਅਮੀਰ, ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਤਾਣੇ-ਬਾਣੇ ਵੱਲ ਨਿਰਣਾਇਕ ਤੌਰ ‘ਤੇ ਬਦਲ ਗਿਆ ਹੈ। ਇਸ ਗਤੀਸ਼ੀਲ ਲੈਂਡਸਕੇਪ ਦੇ ਅੰਦਰ ਹੀ ਚੀਨੀ ਤਕਨਾਲੋਜੀ ਸਮੂਹ Alibaba ਨੇ ਆਪਣਾ ਨਵੀਨਤਮ ਰਣਨੀਤਕ ਕਦਮ ਚੁੱਕਿਆ ਹੈ, ਜੋ ਸਿਰਫ਼ ਹਿੱਸਾ ਲੈਣ ਲਈ ਹੀ ਨਹੀਂ, ਸਗੋਂ ਜਨਰੇਟਿਵ AI ਦੇ ਭਵਿੱਖ ਨੂੰ ਆਕਾਰ ਦੇਣ ਲਈ ਆਪਣੀ ਦ੍ਰਿੜਤਾ ਦਾ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ। ਇੱਕ ਆਧੁਨਿਕ ਮਲਟੀਮੋਡਲ ਮਾਡਲ ਦੀ ਸ਼ੁਰੂਆਤ AI ਕੀ ਸਮਝ ਸਕਦਾ ਹੈ ਅਤੇ ਬਣਾ ਸਕਦਾ ਹੈ ਦੀਆਂ ਸੀਮਾਵਾਂ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣ ਲਈ ਇੱਕ ਵਚਨਬੱਧਤਾ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ।

Qwen2.5-Omni-7B ਪੇਸ਼ ਕਰ ਰਿਹਾ ਹੈ: ਇੰਦਰੀਆਂ ਦੀ ਇੱਕ ਸਿੰਫਨੀ

Alibaba Cloud, ਸਮੂਹ ਦੀ ਡਿਜੀਟਲ ਤਕਨਾਲੋਜੀ ਅਤੇ ਖੁਫੀਆ ਰੀੜ੍ਹ ਦੀ ਹੱਡੀ, ਨੇ ਅਧਿਕਾਰਤ ਤੌਰ ‘ਤੇ Qwen2.5-Omni-7B ਤੋਂ ਪਰਦਾ ਹਟਾ ਦਿੱਤਾ ਹੈ। ਇਹ ਸਿਰਫ਼ ਇੱਕ ਹੋਰ ਵਾਧਾ ਅੱਪਡੇਟ ਨਹੀਂ ਹੈ; ਇਹ ਕੰਪਨੀ ਦੇ ਮਲਕੀਅਤ ਵਾਲੇ Qwen ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲ (LLM) ਪਰਿਵਾਰ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਕਦਮ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਵੀਰਵਾਰ ਨੂੰ ਘੋਸ਼ਿਤ ਕੀਤਾ ਗਿਆ, ਇਹ ਨਵਾਂ ਸੰਸਕਰਣ ਇੱਕੋ ਸਮੇਂ ਵੱਖ-ਵੱਖ ਇਨਪੁਟਸ ਦੇ ਵਿਭਿੰਨ ਸਪੈਕਟ੍ਰਮ ਨੂੰ ਸੰਭਾਲਣ ਲਈ ਵਿਸ਼ੇਸ਼ ਤੌਰ ‘ਤੇ ਇੰਜਨੀਅਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਉਸ AI ਨੂੰ ਭੁੱਲ ਜਾਓ ਜੋ ਸਿਰਫ਼ ਟੈਕਸਟ ਨੂੰ ਸਮਝਦਾ ਹੈ; Qwen2.5-Omni-7B ਨੂੰ ਟੈਕਸਟ, ਚਿੱਤਰਾਂ, ਆਡੀਓ ਸਟ੍ਰੀਮਾਂ, ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ ਵੀਡੀਓ ਕ੍ਰਮਾਂ ਵਜੋਂ ਪੇਸ਼ ਕੀਤੀ ਗਈ ਜਾਣਕਾਰੀ ਦੀ ਪ੍ਰਕਿਰਿਆ ਅਤੇ ਵਿਆਖਿਆ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਕਈ ਰੂਪਾਂ ਨੂੰ ਸਮਝਣ ਅਤੇ ਏਕੀਕ੍ਰਿਤ ਕਰਨ ਦੀ ਇਹ ਸਮਰੱਥਾ ਇਸਨੂੰ ਵਧੇਰੇ ਮਨੁੱਖੀ-ਵਰਗੇ AI ਪਰਸਪਰ ਕ੍ਰਿਆ ਦੀ ਖੋਜ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਵਿਕਾਸ ਵਜੋਂ ਦਰਸਾਉਂਦੀ ਹੈ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਮਾਡਲ ਸਿਰਫ਼ ਇੱਕ ਪੈਸਿਵ ਦਰਸ਼ਕ ਨਹੀਂ ਹੈ; ਇਹ ਜਵਾਬ ਪੈਦਾ ਕਰਨ ਲਈ ਬਣਾਇਆ ਗਿਆ ਹੈ, ਟੈਕਸਟ ਫਾਰਮੈਟ ਜਾਂ ਸੰਸ਼ਲੇਸ਼ਿਤ ਆਡੀਓ ਵਿੱਚ ਆਉਟਪੁੱਟ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦਾ ਹੈ, ਡਿਜੀਟਲ ਖੁਫੀਆ ਅਤੇ ਕੁਦਰਤੀ ਮਨੁੱਖੀ ਸੰਚਾਰ ਚੈਨਲਾਂ ਵਿਚਕਾਰ ਪਾੜੇ ਨੂੰ ਪੂਰਾ ਕਰਦਾ ਹੈ।

ਡੂੰਘਾਈ ਵਿੱਚ ਗੋਤਾਖੋਰੀ: ਮਲਟੀਮੋਡੈਲਿਟੀ ਦਾ ਸਾਰ

ਇੱਕ AI ਮਾਡਲ ਲਈ ‘ਮਲਟੀਮੋਡਲ’ ਹੋਣ ਦਾ ਅਸਲ ਵਿੱਚ ਕੀ ਮਤਲਬ ਹੈ? ਸੰਖੇਪ ਵਿੱਚ, ਇਹ ਇੱਕ ਸਿੰਗਲ ਡਾਟਾ ਕਿਸਮ ਦੀਆਂ ਸੀਮਾਵਾਂ ਤੋਂ ਪਰੇ ਕੰਮ ਕਰਨ ਦੀ ਯੋਗਤਾ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਰਵਾਇਤੀ LLMs, ਸ਼ਕਤੀਸ਼ਾਲੀ ਹੋਣ ਦੇ ਬਾਵਜੂਦ, ਮੁੱਖ ਤੌਰ ‘ਤੇ ਮਨੁੱਖੀ ਭਾਸ਼ਾ - ਟੈਕਸਟ ਨੂੰ ਸਮਝਣ ਅਤੇ ਪੈਦਾ ਕਰਨ ਵਿੱਚ ਉੱਤਮ ਸਨ। ਮਲਟੀਮੋਡਲ AI, ਜਿਵੇਂ ਕਿ Qwen2.5-Omni-7B ਦੁਆਰਾ ਉਦਾਹਰਨ ਦਿੱਤੀ ਗਈ ਹੈ, ਦਾ ਉਦੇਸ਼ ਮਨੁੱਖੀ ਧਾਰਨਾ ਨੂੰ ਵਧੇਰੇ ਨੇੜਿਓਂ ਦਰਸਾਉਣਾ ਹੈ। ਅਸੀਂ, ਮਨੁੱਖਾਂ ਵਜੋਂ, ਸੰਸਾਰ ਦਾ ਅਨੁਭਵ ਸਿਰਫ਼ ਟੈਕਸਟ ਰਾਹੀਂ ਨਹੀਂ ਕਰਦੇ; ਅਸੀਂ ਦੇਖਦੇ ਹਾਂ, ਅਸੀਂ ਸੁਣਦੇ ਹਾਂ, ਅਸੀਂ ਪੜ੍ਹਦੇ ਹਾਂ। ਇੱਕ ਮਲਟੀਮੋਡਲ AI ਇਸ ਏਕੀਕ੍ਰਿਤ ਸਮਝ ਲਈ ਕੋਸ਼ਿਸ਼ ਕਰਦਾ ਹੈ।

ਸ਼ਾਮਲ ਗੁੰਝਲਾਂ ‘ਤੇ ਗੌਰ ਕਰੋ:

  • ਚਿੱਤਰ ਸਮਝ: AI ਨੂੰ ਨਾ ਸਿਰਫ਼ ਇੱਕ ਚਿੱਤਰ ਦੇ ਅੰਦਰ ਵਸਤੂਆਂ ਨੂੰ ਪਛਾਣਨਾ ਚਾਹੀਦਾ ਹੈ, ਸਗੋਂ ਸੰਦਰਭ, ਵਸਤੂਆਂ ਵਿਚਕਾਰ ਸਬੰਧਾਂ, ਅਤੇ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਦਰਸਾਏ ਗਏ ਕਾਰਜਾਂ ਜਾਂ ਭਾਵਨਾਵਾਂ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣਾ ਚਾਹੀਦਾ ਹੈ।
  • ਆਡੀਓ ਪ੍ਰੋਸੈਸਿੰਗ: ਇਸ ਵਿੱਚ ਸਧਾਰਨ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਤੋਂ ਵੱਧ ਸ਼ਾਮਲ ਹੈ। ਇਸ ਲਈ ਟੋਨ ਨੂੰ ਸਮਝਣ, ਵੱਖ-ਵੱਖ ਬੋਲਣ ਵਾਲਿਆਂ ਦੀ ਪਛਾਣ ਕਰਨ, ਬੈਕਗ੍ਰਾਉਂਡ ਸ਼ੋਰ ਨੂੰ ਪਛਾਣਨ, ਅਤੇ ਬੋਲੀ ਜਾਣ ਵਾਲੀ ਭਾਸ਼ਾ ਜਾਂ ਸੰਗੀਤ ਦੀਆਂ ਬਾਰੀਕੀਆਂ ਦੀ ਵਿਆਖਿਆ ਕਰਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।
  • ਵੀਡੀਓ ਵਿਸ਼ਲੇਸ਼ਣ: ਇਹ ਸਮੇਂ ਦੇ ਨਾਲ ਚਿੱਤਰ ਅਤੇ ਆਡੀਓ ਸਮਝ ਨੂੰ ਜੋੜਦਾ ਹੈ, ਅੰਦੋਲਨ ਨੂੰ ਟਰੈਕ ਕਰਨ, ਘਟਨਾਵਾਂ ਦੇ ਕ੍ਰਮ ਨੂੰ ਸਮਝਣ, ਅਤੇ ਵਿਜ਼ੂਅਲ ਅਤੇ ਆਡੀਟੋਰੀ ਚੈਨਲਾਂ ਦੋਵਾਂ ਤੋਂ ਜਾਣਕਾਰੀ ਨੂੰ ਸੰਸ਼ਲੇਸ਼ਿਤ ਕਰਨ ਦੀ ਯੋਗਤਾ ਦੀ ਮੰਗ ਕਰਦਾ ਹੈ।
  • ਕਰਾਸ-ਮੋਡਲ ਏਕੀਕਰਣ: ਅਸਲ ਚੁਣੌਤੀ ਜਾਣਕਾਰੀ ਦੀਆਂ ਇਹਨਾਂ ਵੱਖਰੀਆਂ ਧਾਰਾਵਾਂ ਨੂੰ ਏਕੀਕ੍ਰਿਤ ਕਰਨ ਵਿੱਚ ਹੈ। ਇੱਕ ਚਿੱਤਰ ਨਾਲ ਜੁੜੇ ਟੈਕਸਟ ਨਾਲ ਕਿਵੇਂ ਸਬੰਧਤ ਹੈ? ਇੱਕ ਬੋਲਿਆ ਗਿਆ ਕਮਾਂਡ ਇੱਕ ਵੀਡੀਓ ਫੀਡ ਵਿੱਚ ਇੱਕ ਵਸਤੂ ਨਾਲ ਕਿਵੇਂ ਮੇਲ ਖਾਂਦਾ ਹੈ? ਮਲਟੀਮੋਡਲ ਮਾਡਲਾਂ ਨੂੰ ਇਹਨਾਂ ਡਾਟਾ ਕਿਸਮਾਂ ਨੂੰ ਇੱਕ ਇਕਸਾਰ ਸਮਝ ਵਿੱਚ ਮਿਲਾਉਣ ਲਈ ਆਧੁਨਿਕ ਆਰਕੀਟੈਕਚਰ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।

ਇਸ ਪੱਧਰ ਦੇ ਏਕੀਕਰਣ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਨਾ ਕੰਪਿਊਟੇਸ਼ਨਲ ਤੌਰ ‘ਤੇ ਤੀਬਰ ਹੈ ਅਤੇ ਸਿਖਲਾਈ ਲਈ ਵਿਸ਼ਾਲ, ਵਿਭਿੰਨ ਡਾਟਾਸੈਟਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਸ ਡੋਮੇਨ ਵਿੱਚ ਸਫਲਤਾ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਛਾਲ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ, AI ਨੂੰ ਸਮੱਸਿਆਵਾਂ ਨਾਲ ਨਜਿੱਠਣ ਅਤੇ ਸੰਸਾਰ ਨਾਲ ਉਹਨਾਂ ਤਰੀਕਿਆਂ ਨਾਲ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਪਾਉਣ ਦੇ ਯੋਗ ਬਣਾਉਂਦੀ ਹੈ ਜੋ ਪਹਿਲਾਂ ਵਿਗਿਆਨ ਗਲਪ ਤੱਕ ਸੀਮਤ ਸਨ। ਇਹ AI ਨੂੰ ਇੱਕ ਟੈਕਸਟ-ਅਧਾਰਿਤ ਓਰੇਕਲ ਹੋਣ ਤੋਂ ਇੱਕ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਵਧੇਰੇ ਸਮਝਦਾਰ ਅਤੇ ਸੰਦਰਭ-ਜਾਗਰੂਕ ਡਿਜੀਟਲ ਹਸਤੀ ਵੱਲ ਲੈ ਜਾਂਦਾ ਹੈ।

ਰੀਅਲ-ਟਾਈਮ ਜਵਾਬਦੇਹੀ: ਪਰਸਪਰ ਕ੍ਰਿਆ ਦੇ ਪਾੜੇ ਨੂੰ ਘਟਾਉਣਾ

Alibaba ਦੁਆਰਾ ਉਜਾਗਰ ਕੀਤੀ ਗਈ ਇੱਕ ਮੁੱਖ ਵਿਸ਼ੇਸ਼ਤਾ Qwen2.5-Omni-7B ਦੀ ਰੀਅਲ-ਟਾਈਮ ਜਵਾਬ ਸਮਰੱਥਾ ਹੈ। ਗੁੰਝਲਦਾਰ, ਮਲਟੀਮੋਡਲ ਇਨਪੁਟਸ ਦੀ ਪ੍ਰਕਿਰਿਆ ਕਰਨ ਅਤੇ ਟੈਕਸਟ ਜਾਂ ਆਡੀਓ ਵਿੱਚ ਲਗਭਗ-ਤੁਰੰਤ ਜਵਾਬ ਪੈਦਾ ਕਰਨ ਦੀ ਯੋਗਤਾ ਵਿਹਾਰਕ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਲੇਟੈਂਸੀ - ਇਨਪੁਟ ਅਤੇ ਆਉਟਪੁੱਟ ਵਿਚਕਾਰ ਦੇਰੀ - ਅਕਸਰ ਸਹਿਜ ਮਨੁੱਖੀ-AI ਪਰਸਪਰ ਕ੍ਰਿਆ ਵਿੱਚ ਇੱਕ ਰੁਕਾਵਟ ਰਹੀ ਹੈ। ਰੀਅਲ-ਟਾਈਮ ਪ੍ਰਦਰਸ਼ਨ ‘ਤੇ ਜ਼ੋਰ ਦੇ ਕੇ, Alibaba ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ ਇਹ ਮਾਡਲ ਗਤੀਸ਼ੀਲ ਵਾਤਾਵਰਣਾਂ ਅਤੇ ਪਰਸਪਰ ਵਰਤੋਂ ਦੇ ਮਾਮਲਿਆਂ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ।

ਇੱਕ AI ਸਹਾਇਕ ਦੀ ਕਲਪਨਾ ਕਰੋ ਜੋ ਇੱਕ ਉਪਭੋਗਤਾ ਨੂੰ ਇੱਕ ਕਾਰਜ (ਵੀਡੀਓ ਇਨਪੁਟ) ਕਰਦੇ ਹੋਏ ਦੇਖ ਸਕਦਾ ਹੈ, ਉਹਨਾਂ ਦੇ ਬੋਲੇ ​​ਗਏ ਸਵਾਲਾਂ (ਆਡੀਓ ਇਨਪੁਟ) ਨੂੰ ਸੁਣ ਸਕਦਾ ਹੈ, ਇੱਕ ਲਿਖਤੀ ਮੈਨੂਅਲ (ਟੈਕਸਟ ਇਨਪੁਟ) ਦਾ ਹਵਾਲਾ ਦੇ ਸਕਦਾ ਹੈ, ਅਤੇ ਤੁਰੰਤ, ਸੰਬੰਧਿਤ ਬੋਲੀ ਗਈ ਮਾਰਗਦਰਸ਼ਨ (ਆਡੀਓ ਆਉਟਪੁੱਟ) ਪ੍ਰਦਾਨ ਕਰ ਸਕਦਾ ਹੈ। ਜਵਾਬਦੇਹੀ ਦਾ ਇਹ ਪੱਧਰ AI ਦੀ ਸੰਭਾਵੀ ਉਪਯੋਗਤਾ ਨੂੰ ਅਸਿੰਕਰੋਨਸ ਵਿਸ਼ਲੇਸ਼ਣ ਤੋਂ ਸਰਗਰਮ ਭਾਗੀਦਾਰੀ ਅਤੇ ਸਹਾਇਤਾ ਵਿੱਚ ਬਦਲ ਦਿੰਦਾ ਹੈ। ਇਹ ਉਹਨਾਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਰਾਹ ਪੱਧਰਾ ਕਰਦਾ ਹੈ ਜੋ ਵਧੇਰੇ ਕੁਦਰਤੀ ਅਤੇ ਅਨੁਭਵੀ ਮਹਿਸੂਸ ਕਰਦੀਆਂ ਹਨ, ਅਕਸਰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਟੈਕਸਟ-ਅਧਾਰਿਤ ਪ੍ਰਣਾਲੀਆਂ ਨਾਲਪਰਸਪਰ ਪ੍ਰਭਾਵ ਨਾਲ ਜੁੜੇ ਰਗੜ ਨੂੰ ਘਟਾਉਂਦੀਆਂ ਹਨ। ਗਤੀ ‘ਤੇ ਇਹ ਫੋਕਸ ਇਸ ਤਕਨਾਲੋਜੀ ਨੂੰ ਸਿਰਫ਼ ਬੈਕਐਂਡ ਪ੍ਰਣਾਲੀਆਂ ਵਿੱਚ ਹੀ ਨਹੀਂ, ਸਗੋਂ ਉਪਭੋਗਤਾ-ਸਾਹਮਣਾ ਵਾਲੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਕਰਨ ਦੀ ਇੱਛਾ ਦਾ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਜਿੱਥੇ ਤੁਰੰਤਤਾ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਹੈ।

ਓਪਨ ਸੋਰਸ ਦੀ ਰਣਨੀਤਕ ਮਹੱਤਤਾ

ਸ਼ਾਇਦ Qwen2.5-Omni-7B ਲਾਂਚ ਦੇ ਸਭ ਤੋਂ ਮਜਬੂਰ ਕਰਨ ਵਾਲੇ ਪਹਿਲੂਆਂ ਵਿੱਚੋਂ ਇੱਕ Alibaba ਦਾ ਮਾਡਲ ਨੂੰ ਓਪਨ-ਸੋਰਸ ਬਣਾਉਣ ਦਾ ਫੈਸਲਾ ਹੈ। ਇੱਕ ਉਦਯੋਗ ਵਿੱਚ ਜਿੱਥੇ ਮਲਕੀਅਤ ਵਾਲੇ, ਬੰਦ ਮਾਡਲ ਅਕਸਰ ਸੁਰਖੀਆਂ ਵਿੱਚ ਹਾਵੀ ਹੁੰਦੇ ਹਨ (OpenAI ਦੀ GPT ਸੀਰੀਜ਼ ਜਾਂ Anthropic ਦੇ Claude ਬਾਰੇ ਸੋਚੋ), ਇੱਕ ਓਪਨ-ਸੋਰਸ ਰੀਲੀਜ਼ ਦੀ ਚੋਣ ਕਰਨਾ ਮਹੱਤਵਪੂਰਨ ਰਣਨੀਤਕ ਭਾਰ ਰੱਖਦਾ ਹੈ।

ਇੱਕ ਤਕਨੀਕੀ ਦਿੱਗਜ ਅਜਿਹੀ ਉੱਨਤ ਤਕਨਾਲੋਜੀ ਕਿਉਂ ਦੇਵੇਗਾ? ਕਈ ਕਾਰਕ ਸੰਭਾਵਤ ਤੌਰ ‘ਤੇ ਯੋਗਦਾਨ ਪਾਉਂਦੇ ਹਨ:

  1. ਤੇਜ਼ ਨਵੀਨਤਾ: ਓਪਨ-ਸੋਰਸਿੰਗ ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਖੋਜਕਰਤਾਵਾਂ ਦੇ ਇੱਕ ਗਲੋਬਲ ਭਾਈਚਾਰੇ ਨੂੰ ਮਾਡਲ ਤੱਕ ਪਹੁੰਚਣ, ਜਾਂਚ ਕਰਨ, ਸੋਧਣ ਅਤੇ ਉਸ ‘ਤੇ ਨਿਰਮਾਣ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ। ਇਹ ਖਾਮੀਆਂ ਦੀ ਤੇਜ਼ੀ ਨਾਲ ਪਛਾਣ, ਨਵੀਆਂ ਸਮਰੱਥਾਵਾਂ ਦੇ ਵਿਕਾਸ, ਅਤੇ ਵਿਸ਼ੇਸ਼ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਅਨੁਕੂਲਤਾ ਵੱਲ ਲੈ ਜਾ ਸਕਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਦਾ Alibaba ਖੁਦ ਪਿੱਛਾ ਨਹੀਂ ਕਰ ਸਕਦਾ ਹੈ। ਇਹ ਜ਼ਰੂਰੀ ਤੌਰ ‘ਤੇ ਨਵੀਨਤਾ ਨੂੰ ਭੀੜ-ਸਰੋਤ ਕਰਦਾ ਹੈ।
  2. ਵਿਆਪਕ ਅਪਣਾਉਣ ਅਤੇ ਈਕੋਸਿਸਟਮ ਬਿਲਡਿੰਗ: ਮਾਡਲ ਨੂੰ ਮੁਫਤ ਵਿੱਚ ਉਪਲਬਧ ਕਰਾਉਣਾ ਵੱਖ-ਵੱਖ ਪਲੇਟਫਾਰਮਾਂ ਅਤੇ ਉਦਯੋਗਾਂ ਵਿੱਚ ਇਸਨੂੰ ਅਪਣਾਉਣ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦਾ ਹੈ। ਇਹ Qwen ਨੂੰ ਇੱਕ ਬੁਨਿਆਦੀ ਤਕਨਾਲੋਜੀ ਵਜੋਂ ਸਥਾਪਤ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰ ਸਕਦਾ ਹੈ, ਇਸਦੇ ਆਲੇ ਦੁਆਲੇ ਕੇਂਦਰਿਤ ਸਾਧਨਾਂ, ਐਪਲੀਕੇਸ਼ਨਾਂ ਅਤੇ ਮੁਹਾਰਤ ਦਾ ਇੱਕ ਈਕੋਸਿਸਟਮ ਬਣਾ ਸਕਦਾ ਹੈ। ਇਹ ਨੈੱਟਵਰਕ ਪ੍ਰਭਾਵ ਲੰਬੇ ਸਮੇਂ ਵਿੱਚ ਬਹੁਤ ਕੀਮਤੀ ਹੋ ਸਕਦਾ ਹੈ।
  3. ਪਾਰਦਰਸ਼ਤਾ ਅਤੇ ਵਿਸ਼ਵਾਸ: ਓਪਨ-ਸੋਰਸ ਮਾਡਲ ਉਹਨਾਂ ਦੇ ਆਰਕੀਟੈਕਚਰ ਅਤੇ ਸਿਖਲਾਈ ਦੇ ਸਬੰਧ ਵਿੱਚ ਵਧੇਰੇ ਪਾਰਦਰਸ਼ਤਾ ਦੀ ਆਗਿਆ ਦਿੰਦੇ ਹਨ (ਹਾਲਾਂਕਿ ਡਾਟਾਸੈਟ ਅਕਸਰ ਮਲਕੀਅਤ ਵਾਲੇ ਰਹਿੰਦੇ ਹਨ)। ਇਹ ਕੁਝ AI ਪ੍ਰਣਾਲੀਆਂ ਦੇ ‘ਬਲੈਕ ਬਾਕਸ’ ਸੁਭਾਅ ਬਾਰੇ ਚਿੰਤਤ ਉਪਭੋਗਤਾਵਾਂ ਅਤੇ ਡਿਵੈਲਪਰਾਂ ਵਿੱਚ ਵਿਸ਼ਵਾਸ ਪੈਦਾ ਕਰ ਸਕਦਾ ਹੈ।
  4. ਪ੍ਰਤੀਯੋਗੀ ਸਥਿਤੀ: ਸ਼ਕਤੀਸ਼ਾਲੀ ਬੰਦ-ਸਰੋਤ ਪ੍ਰਤੀਯੋਗੀਆਂ ਵਾਲੇ ਬਾਜ਼ਾਰ ਵਿੱਚ, ਇੱਕ ਸਮਰੱਥ ਓਪਨ-ਸੋਰਸ ਵਿਕਲਪ ਦੀ ਪੇਸ਼ਕਸ਼ ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਸੰਗਠਨਾਂ ਨੂੰ ਆਕਰਸ਼ਿਤ ਕਰ ਸਕਦੀ ਹੈ ਜੋ ਵਧੇਰੇ ਨਿਯੰਤਰਣ, ਅਨੁਕੂਲਤਾ, ਜਾਂ ਘੱਟ ਲਾਗਤਾਂ ਦੀ ਮੰਗ ਕਰ ਰਹੇ ਹਨ। ਇਹ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਵਿਭਿੰਨਤਾ ਹੋ ਸਕਦਾ ਹੈ।
  5. ਪ੍ਰਤਿਭਾ ਆਕਰਸ਼ਣ: ਓਪਨ-ਸੋਰਸ ਭਾਈਚਾਰੇ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਯੋਗਦਾਨ ਪਾਉਣਾ ਚੋਟੀ ਦੇ AI ਪ੍ਰਤਿਭਾ ਵਿੱਚ ਇੱਕ ਕੰਪਨੀ ਦੀ ਸਾਖ ਨੂੰ ਵਧਾ ਸਕਦਾ ਹੈ, ਇਸਨੂੰ ਕੰਮ ਕਰਨ ਲਈ ਇੱਕ ਵਧੇਰੇ ਆਕਰਸ਼ਕ ਸਥਾਨ ਬਣਾ ਸਕਦਾ ਹੈ।

ਹਾਲਾਂਕਿ, ਸ਼ਕਤੀਸ਼ਾਲੀ AI ਨੂੰ ਓਪਨ-ਸੋਰਸ ਕਰਨਾ ਸੁਰੱਖਿਆ, ਸੰਭਾਵੀ ਦੁਰਵਰਤੋਂ, ਅਤੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਤੈਨਾਤੀ ਲਈ ਲੋੜੀਂਦੇ ਸਰੋਤਾਂ ਬਾਰੇ ਬਹਿਸ ਨੂੰ ਵੀ ਸੱਦਾ ਦਿੰਦਾ ਹੈ। Alibaba ਦਾ ਕਦਮ ਇਸਨੂੰ ਵਿਆਪਕ ਪਹੁੰਚ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਨ ਵਾਲੇ ਕੈਂਪ ਵਿੱਚ ਮਜ਼ਬੂਤੀ ਨਾਲ ਰੱਖਦਾ ਹੈ, ਇਹ ਸੱਟਾ ਲਗਾਉਂਦਾ ਹੈ ਕਿ ਭਾਈਚਾਰਕ ਸਹਿਯੋਗ ਦੇ ਲਾਭ ਸਖਤ ਨਿਯੰਤਰਣ ਛੱਡਣ ਦੇ ਜੋਖਮਾਂ ਤੋਂ ਵੱਧ ਹਨ।

ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੀ ਕਲਪਨਾ ਕਰਨਾ: ਪਹੁੰਚਯੋਗਤਾ ਤੋਂ ਰਚਨਾਤਮਕਤਾ ਤੱਕ

Alibaba ਨੇ ਖੁਦ ਸੰਭਾਵੀ ਐਪਲੀਕੇਸ਼ਨਾਂ ਵੱਲ ਇਸ਼ਾਰਾ ਕੀਤਾ, ਠੋਸ ਉਦਾਹਰਣਾਂ ਪ੍ਰਦਾਨ ਕੀਤੀਆਂ ਜੋ ਮਾਡਲ ਦੀ ਮਲਟੀਮੋਡਲਸ਼ਕਤੀ ਨੂੰ ਦਰਸਾਉਂਦੀਆਂ ਹਨ। ਇਹ ਸ਼ੁਰੂਆਤੀ ਸੁਝਾਅ ਸੰਭਾਵਨਾਵਾਂ ਦੀ ਇੱਕ ਬਹੁਤ ਵਿਆਪਕ ਸ਼੍ਰੇਣੀ ਦੀ ਕਲਪਨਾ ਕਰਨ ਲਈ ਸਪਰਿੰਗਬੋਰਡ ਵਜੋਂ ਕੰਮ ਕਰਦੇ ਹਨ:

  • ਵਧੀ ਹੋਈ ਪਹੁੰਚਯੋਗਤਾ: ਨੇਤਰਹੀਣ ਉਪਭੋਗਤਾਵਾਂ ਲਈ ਰੀਅਲ-ਟਾਈਮ ਆਡੀਓ ਵਰਣਨ ਪ੍ਰਦਾਨ ਕਰਨ ਦਾ ਵਿਚਾਰ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਉਦਾਹਰਣ ਹੈ। AI ਇੱਕ ਕੈਮਰੇ (ਵੀਡੀਓ/ਚਿੱਤਰ ਇਨਪੁਟ) ਰਾਹੀਂ ਉਪਭੋਗਤਾ ਦੇ ਆਲੇ ਦੁਆਲੇ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰ ਸਕਦਾ ਹੈ ਅਤੇ ਦ੍ਰਿਸ਼ ਦਾ ਵਰਣਨ ਕਰ ਸਕਦਾ ਹੈ, ਵਸਤੂਆਂ ਦੀ ਪਛਾਣ ਕਰ ਸਕਦਾ ਹੈ, ਟੈਕਸਟ ਨੂੰ ਉੱਚੀ ਆਵਾਜ਼ ਵਿੱਚ ਪੜ੍ਹ ਸਕਦਾ ਹੈ, ਜਾਂ ਰੁਕਾਵਟਾਂ (ਆਡੀਓ ਆਉਟਪੁੱਟ) ਦੀ ਚੇਤਾਵਨੀ ਵੀ ਦੇ ਸਕਦਾ ਹੈ। ਇਹ ਸਧਾਰਨ ਸਕ੍ਰੀਨ ਰੀਡਰਾਂ ਤੋਂ ਪਰੇ ਹੈ, ਵਿਜ਼ੂਅਲ ਸੰਸਾਰ ਦੀ ਇੱਕ ਗਤੀਸ਼ੀਲ ਵਿਆਖਿਆ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦਾ ਹੈ।
  • ਇੰਟਰਐਕਟਿਵ ਲਰਨਿੰਗ ਅਤੇ ਮਾਰਗਦਰਸ਼ਨ: ਕਦਮ-ਦਰ-ਕਦਮ ਖਾਣਾ ਪਕਾਉਣ ਦੀ ਹਦਾਇਤ ਦਾ ਦ੍ਰਿਸ਼, ਜਿੱਥੇ AI ਉਪਲਬਧ ਸਮੱਗਰੀ (ਚਿੱਤਰ ਇਨਪੁਟ) ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਦਾ ਹੈ ਅਤੇ ਉਪਭੋਗਤਾ ਨੂੰ ਇੱਕ ਵਿਅੰਜਨ (ਟੈਕਸਟ/ਆਡੀਓ ਆਉਟਪੁੱਟ) ਰਾਹੀਂ ਮਾਰਗਦਰਸ਼ਨ ਕਰਦਾ ਹੈ, ਸਿੱਖਿਆ ਅਤੇ ਹੁਨਰ ਵਿਕਾਸ ਵਿੱਚ ਇਸਦੀ ਸੰਭਾਵਨਾ ਨੂੰ ਉਜਾਗਰ ਕਰਦਾ ਹੈ। ਇਹ DIY ਪ੍ਰੋਜੈਕਟਾਂ, ਉਪਕਰਣਾਂ ਦੀ ਸਾਂਭ-ਸੰਭਾਲ, ਸੰਗੀਤ ਯੰਤਰ ਅਭਿਆਸ, ਜਾਂ ਗੁੰਝਲਦਾਰ ਸੌਫਟਵੇਅਰ ਟਿਊਟੋਰਿਅਲਸ ਤੱਕ ਵਧ ਸਕਦਾ ਹੈ, ਵੀਡੀਓ ਰਾਹੀਂ ਦੇਖੇ ਗਏ ਉਪਭੋਗਤਾ ਕਾਰਜਾਂ ਦੇ ਅਧਾਰ ਤੇ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਂਦਾ ਹੈ।
  • ਰਚਨਾਤਮਕ ਸਹਿਯੋਗ: ਮਲਟੀਮੋਡਲ AI ਕਲਾਕਾਰਾਂ, ਡਿਜ਼ਾਈਨਰਾਂ ਅਤੇ ਸਮੱਗਰੀ ਸਿਰਜਣਹਾਰਾਂ ਲਈ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਸਾਧਨ ਬਣ ਸਕਦਾ ਹੈ। ਇੱਕ ਚਿੱਤਰ ਦੇ ਅਧਾਰ ਤੇ ਸੰਗੀਤ ਤਿਆਰ ਕਰਨ ਦੀ ਕਲਪਨਾ ਕਰੋ, ਇੱਕ ਵਿਸਤ੍ਰਿਤ ਪਾਠ ਵਰਣਨ ਅਤੇ ਤਸਵੀਰਾਂ ਦੇ ਮੂਡ ਬੋਰਡ ਤੋਂ ਚਿੱਤਰ ਬਣਾਉਣਾ, ਜਾਂ ਬੋਲੇ ​​ਗਏ ਕਮਾਂਡਾਂ ਅਤੇ ਪਾਠ ਸਕ੍ਰਿਪਟਾਂ ਦੇ ਅਧਾਰ ਤੇ ਵੀਡੀਓ ਸੰਪਾਦਿਤ ਕਰਨਾ।
  • ਸਮਾਰਟਰ ਨਿੱਜੀ ਸਹਾਇਕ: ਭਵਿੱਖ ਦੇ ਡਿਜੀਟਲ ਸਹਾਇਕ ਕਮਾਂਡਾਂ ਨੂੰ ਵਧੇਰੇ ਸਹੀ ਢੰਗ ਨਾਲ ਸਮਝਣ ਲਈ ਮਲਟੀਮੋਡੈਲਿਟੀ ਦਾ ਲਾਭ ਉਠਾ ਸਕਦੇ ਹਨ (‘ਮੈਨੂੰ ਉਹ ਨੀਲੀ ਕਮੀਜ਼ ਦਿਖਾਓ ਜੋ ਮੈਂ ਪਿਛਲੇ ਹਫ਼ਤੇ ਖਰੀਦੀ ਸੀ’ - ਖਰੀਦ ਇਤਿਹਾਸ ਟੈਕਸਟ ਅਤੇ ਵਿਜ਼ੂਅਲ ਮੈਮੋਰੀ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ) ਅਤੇ ਵਧੇਰੇ ਅਮੀਰੀ ਨਾਲ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਪਾ ਸਕਦੇ ਹਨ (ਮੌਖਿਕ ਤੌਰ ‘ਤੇ ਸਮਝਾਉਂਦੇ ਹੋਏ ਜਾਣਕਾਰੀ ਨੂੰ ਦ੍ਰਿਸ਼ਟੀਗਤ ਰੂਪ ਵਿੱਚ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਨਾ)।
  • ਵਪਾਰਕ ਖੁਫੀਆ ਅਤੇ ਵਿਸ਼ਲੇਸ਼ਣ: ਕੰਪਨੀਆਂ ਅਜਿਹੇ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਵਿਭਿੰਨ ਡਾਟਾ ਸਟ੍ਰੀਮਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਲਈ ਕਰ ਸਕਦੀਆਂ ਹਨ - ਗਾਹਕ ਫੀਡਬੈਕ ਵੀਡੀਓ, ਸੋਸ਼ਲ ਮੀਡੀਆ ਚਿੱਤਰ, ਵਿਕਰੀ ਰਿਪੋਰਟਾਂ (ਟੈਕਸਟ), ਕਾਲ ਸੈਂਟਰ ਰਿਕਾਰਡਿੰਗਾਂ (ਆਡੀਓ) - ਮਾਰਕੀਟ ਰੁਝਾਨਾਂ ਅਤੇ ਗਾਹਕ ਭਾਵਨਾਵਾਂ ਬਾਰੇ ਡੂੰਘੀ, ਵਧੇਰੇ ਸੰਪੂਰਨ ਸਮਝ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ।
  • ਸਿਹਤ ਸੰਭਾਲ ਸਹਾਇਤਾ: ਮਰੀਜ਼ਾਂ ਦੇ ਇਤਿਹਾਸ (ਟੈਕਸਟ) ਦੇ ਨਾਲ ਮੈਡੀਕਲ ਚਿੱਤਰਾਂ (ਐਕਸ-ਰੇ, ਸਕੈਨ) ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨਾ ਅਤੇ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਲੱਛਣਾਂ (ਆਡੀਓ) ਦੇ ਮਰੀਜ਼ਾਂ ਦੇ ਵਰਣਨ ਨੂੰ ਸੁਣਨਾ ਨਿਦਾਨ ਕਰਨ ਵਾਲਿਆਂ ਦੀ ਸਹਾਇਤਾ ਕਰ ਸਕਦਾ ਹੈ। ਰਿਮੋਟ ਮਰੀਜ਼ ਨਿਗਰਾਨੀ ਨੂੰ ਵੀ ਵਧਾਇਆ ਜਾ ਸਕਦਾ ਹੈ।
  • ਇਮਰਸਿਵ ਮਨੋਰੰਜਨ: ਗੇਮਿੰਗ ਅਤੇ ਵਰਚੁਅਲ ਰਿਐਲਿਟੀ ਅਨੁਭਵ ਬਹੁਤ ਜ਼ਿਆਦਾ ਪਰਸਪਰ ਪ੍ਰਭਾਵੀ ਅਤੇ ਜਵਾਬਦੇਹ ਬਣ ਸਕਦੇ ਹਨ, AI ਪਾਤਰ ਖਿਡਾਰੀਆਂ ਦੀਆਂ ਕਾਰਵਾਈਆਂ, ਬੋਲੇ ​​ਗਏ ਸ਼ਬਦਾਂ, ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ ਕੈਮਰੇ ਰਾਹੀਂ ਕੈਪਚਰ ਕੀਤੇ ਚਿਹਰੇ ਦੇ ਹਾਵ-ਭਾਵਾਂ ‘ਤੇ ਯਥਾਰਥਵਾਦੀ ਤੌਰ ‘ਤੇ ਪ੍ਰਤੀਕਿਰਿਆ ਕਰਦੇ ਹਨ।

ਇਹ ਸਿਰਫ਼ ਝਲਕੀਆਂ ਹਨ। ਅਸਲ ਪ੍ਰਭਾਵ ਉਦੋਂ ਸਾਹਮਣੇ ਆਵੇਗਾ ਜਦੋਂ ਡਿਵੈਲਪਰ ਓਪਨ-ਸੋਰਸ ਮਾਡਲ ਨਾਲ ਪ੍ਰਯੋਗ ਕਰਨਗੇ, ਇਸਨੂੰ ਖਾਸ ਉਦਯੋਗ ਦੀਆਂ ਲੋੜਾਂ ਅਨੁਸਾਰ ਤਿਆਰ ਕਰਨਗੇ ਅਤੇ ਅਜੇ ਤੱਕ ਕਲਪਨਾ ਨਾ ਕੀਤੀਆਂ ਗਈਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੀ ਕਾਢ ਕੱਢਣਗੇ।

Qwen ਵਿਰਾਸਤ: ਇੱਕ ਵਿਕਸਤ ਹੋ ਰਿਹਾ ਪਾਵਰਹਾਊਸ

Qwen2.5-Omni-7B ਇੱਕ ਖਲਾਅ ਵਿੱਚ ਮੌਜੂਦ ਨਹੀਂ ਹੈ। ਇਹ Alibaba ਦੇ Qwen ਪਰਿਵਾਰ ਦੇ ਬੁਨਿਆਦੀ ਮਾਡਲਾਂ ਦਾ ਨਵੀਨਤਮ ਵੰਸ਼ਜ ਹੈ। ਇਹ ਵੰਸ਼ ਇੱਕ ਦੁਹਰਾਓ ਵਾਲੀ ਵਿਕਾਸ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਜੋ LLM ਖੇਤਰ ਵਿੱਚ ਤਰੱਕੀ ਦੀ ਤੇਜ਼ ਰਫ਼ਤਾਰ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ।

ਇਸ ਯਾਤਰਾ ਵਿੱਚ ਸਤੰਬਰ 2023 ਵਿੱਚ Qwen2.5 ਮਾਡਲ ਦੀ ਸ਼ੁਰੂਆਤ ਵਰਗੇ ਮੀਲ ਪੱਥਰ ਸ਼ਾਮਲ ਸਨ (ਨੋਟ: ਮੂਲ ਲੇਖ ਵਿੱਚ ਸਤੰਬਰ 2024 ਦੱਸਿਆ ਗਿਆ ਸੀ, ਜੋ ਕਿ ਸੰਭਾਵਤ ਤੌਰ ‘ਤੇ ਇੱਕ ਟਾਈਪੋ ਹੈ, ਆਮ ਰੀਲੀਜ਼ ਕੈਡੈਂਸ ਦੇ ਅਧਾਰ ਤੇ ਸਤੰਬਰ 2023 ਜਾਂ ਫਰਵਰੀ 2024 ਨੂੰ ਮੰਨਦੇ ਹੋਏ), ਜਿਸ ਨੇ ਨੀਂਹ ਰੱਖੀ। ਇਸ ਤੋਂ ਬਾਅਦ ਜਨਵਰੀ 2024 ਵਿੱਚ Qwen2.5-Max ਦੀ ਰਿਲੀਜ਼ ਹੋਈ। ਇਸ Max ਸੰਸਕਰਣ ਨੇ ਜਲਦੀ ਹੀ ਧਿਆਨ ਅਤੇ ਬਾਹਰੀ ਪ੍ਰਮਾਣਿਕਤਾ ਪ੍ਰਾਪਤ ਕੀਤੀ। Chatbot Arena ‘ਤੇ 7ਵਾਂ ਸਥਾਨ ਪ੍ਰਾਪਤ ਕਰਨਾ ਖਾਸ ਤੌਰ ‘ਤੇ ਕਮਾਲ ਦਾ ਹੈ। Chatbot Arena, LMSYS Org ਦੁਆਰਾ ਸੰਚਾਲਿਤ, ਇੱਕ ਸਤਿਕਾਰਤ ਪਲੇਟਫਾਰਮ ਹੈ ਜੋ ਅਸਲ-ਸੰਸਾਰ ਗੱਲਬਾਤ ਵਿੱਚ ਵੱਖ-ਵੱਖ LLMs ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਇੱਕ ਅੰਨ੍ਹੇ, ਭੀੜ-ਸਰੋਤ ਵੋਟਿੰਗ ਪ੍ਰਣਾਲੀ (ਸ਼ਤਰੰਜ ਵਿੱਚ ਵਰਤੀ ਜਾਂਦੀ Elo ਰੇਟਿੰਗ ਪ੍ਰਣਾਲੀ ਦੇ ਅਧਾਰ ਤੇ) ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਇਸ ਲੀਡਰਬੋਰਡ ‘ਤੇ ਚੋਟੀ ਦੇ 10 ਸਥਾਨ ਪ੍ਰਾਪਤ ਕਰਨ ਨੇ ਸੰਕੇਤ ਦਿੱਤਾ ਕਿ Alibaba ਦੇ Qwen ਮਾਡਲ ਸੱਚਮੁੱਚ ਪ੍ਰਤੀਯੋਗੀ ਸਨ, ਵਿਸ਼ਵ ਪੱਧਰ ‘ਤੇ ਮਾਨਤਾ ਪ੍ਰਾਪਤ AI ਲੈਬਾਂ ਦੀਆਂ ਪੇਸ਼ਕਸ਼ਾਂ ਦੇ ਵਿਰੁੱਧ ਆਪਣਾ ਸਥਾਨ ਰੱਖਦੇ ਸਨ।

ਇਹ ਸਥਾਪਿਤ ਟਰੈਕ ਰਿਕਾਰਡ Qwen2.5-Omni-7B ਦੀ ਸ਼ੁਰੂਆਤ ਨੂੰ ਭਰੋਸੇਯੋਗਤਾ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਇਹ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ ਮਲਟੀਮੋਡਲ ਸਮਰੱਥਾਵਾਂ ਇੱਕ ਸਾਬਤ, ਉੱਚ-ਪ੍ਰਦਰਸ਼ਨ ਵਾਲੀ ਬੁਨਿਆਦ ‘ਤੇ ਬਣਾਈਆਂ ਜਾ ਰਹੀਆਂ ਹਨ। ‘Omni’ ਅਹੁਦਾ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ Qwen ਲੜੀ ਦੇ ਅੰਦਰ ਇੱਕ ਸੱਚਮੁੱਚ ਵਿਆਪਕ, ਸਭ-ਸੰਮਲਿਤ ਮਾਡਲ ਬਣਾਉਣ ਦੀ ਇੱਛਾ ਦਾ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ।

ਪ੍ਰਤੀਯੋਗੀ ਪਾਣੀਆਂ ਦਾ ਚਾਰਟ ਬਣਾਉਣਾ: ਇੱਕ ਗਲੋਬਲ ਅਤੇ ਘਰੇਲੂ ਦੌੜ

Qwen2.5-Omni-7B ਦੀ ਰਿਲੀਜ਼ Alibaba ਨੂੰ ਚੀਨ ਦੇ ਅੰਦਰ ਅਤੇ ਗਲੋਬਲ ਪੱਧਰ ‘ਤੇ, ਜਨਰੇਟਿਵ AI ਲੈਂਡਸਕੇਪ ਦੀ ਵਿਸ਼ੇਸ਼ਤਾ ਵਾਲੇ ਭਿਆਨਕ ਮੁਕਾਬਲੇ ਦੇ ਅੰਦਰ ਮਜ਼ਬੂਤੀ ਨਾਲ ਸਥਿਤੀ ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ।

  • ਘਰੇਲੂ ਲੈਂਡਸਕੇਪ: ਚੀਨ ਦੇ ਅੰਦਰ, AI ਦੌੜ ਬਹੁਤ ਗਤੀਸ਼ੀਲ ਹੈ। Alibaba ਦੇ Qwen ਮਾਡਲਾਂ ਦਾ ਅਕਸਰ ਮਹੱਤਵਪੂਰਨ ਖਿਡਾਰੀਆਂ ਵਜੋਂ ਜ਼ਿਕਰ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਜੋ ਹੋਰ ਘਰੇਲੂ ਤਕਨੀਕੀ ਦਿੱਗਜਾਂ ਜਿਵੇਂ ਕਿ Baidu (Ernie Bot), Tencent (Hunyan), ਅਤੇ ਵਿਸ਼ੇਸ਼ AI ਫਰਮਾਂ ਦੇ ਮਾਡਲਾਂ ਨੂੰ ਚੁਣੌਤੀ ਦਿੰਦੇ ਹਨ। ਮੂਲ ਲੇਖ ਨੇ ਖਾਸ ਤੌਰ ‘ਤੇ DeepSeek ਅਤੇ ਇਸਦੇ V3 ਅਤੇ R1 ਮਾਡਲਾਂ ਨੂੰ ਮੁੱਖ ਵਿਕਲਪਾਂ ਵਜੋਂ ਉਜਾਗਰ ਕੀਤਾ, ਜੋ ਸਿੱਧੀ ਪ੍ਰਤੀਯੋਗੀ ਜਾਗਰੂਕਤਾ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। Alibaba ਵਰਗੇ ਕਲਾਉਡ ਪ੍ਰਦਾਤਾਵਾਂ ਲਈ ਮਜ਼ਬੂਤ ​​ਬੁਨਿਆਦੀ ਮਾਡਲ ਹੋਣਾ ਮਹੱਤਵਪੂਰਨ ਹੁੰਦਾ ਜਾ ਰਿਹਾ ਹੈ, ਕਿਉਂਕਿ AI ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਕਲਾਉਡ ਸੇਵਾ ਪੇਸ਼ਕਸ਼ਾਂ ਵਿੱਚ ਤੇਜ਼ੀ ਨਾਲ ਏਕੀਕ੍ਰਿਤ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ। Qwen ਨੂੰ ਓਪਨ-ਸੋਰਸ ਕਰਨਾ ਇਸ ਭੀੜ ਵਾਲੇ ਘਰੇਲੂ ਬਾਜ਼ਾਰ ਵਿੱਚ ਡਿਵੈਲਪਰ ਅਪਣਾਉਣ ਵਿੱਚ ਇੱਕ ਕਿਨਾਰਾ ਹਾਸਲ ਕਰਨ ਦੀ ਇੱਕ ਰਣਨੀਤੀ ਹੋ ਸਕਦੀ ਹੈ।
  • ਗਲੋਬਲ ਸੰਦਰਭ: ਜਦੋਂ ਕਿ ਚੀਨੀ AI ਵਿਕਾਸ ਵਿਲੱਖਣ ਰੈਗੂਲੇਟਰੀ ਅਤੇ ਡਾਟਾ ਲੈਂਡਸਕੇਪਾਂ ਦਾ ਸਾਹਮਣਾ ਕਰਦਾ ਹੈ, Qwen ਵਰਗੇ ਮਾਡਲਾਂ ਨੂੰ OpenAI, Google (Gemini), Meta (Llama - ਖਾਸ ਤੌਰ ‘ਤੇ ਓਪਨ-ਸੋਰਸ ਵੀ), Anthropic, ਅਤੇ ਹੋਰਾਂ ਦੇ ਗਲੋਬਲ ਲੀਡਰਾਂ ਦੇ ਵਿਰੁੱਧ ਤੇਜ਼ੀ ਨਾਲ ਬੈਂਚਮਾਰਕ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ। ਮਲਟੀਮੋਡੈਲਿਟੀ ਵਿਸ਼ਵ ਪੱਧਰ ‘ਤੇ ਇੱਕ ਮੁੱਖ ਲੜਾਈ ਦਾ ਮੈਦਾਨ ਹੈ, ਜਿਸ ਵਿੱਚ Google ਦੇ