AI 'ਓਪਨ ਸੋਰਸ' ਦਾ ਨਕਾਬ: ਇੱਕ ਆਦਰਸ਼ ਦੀ ਲੁੱਟ

‘ਓਪਨ ਸੋਰਸ’ ਸ਼ਬਦ ਕਦੇ ਇੱਕ ਖਾਸ ਸਪੱਸ਼ਟਤਾ ਨਾਲ ਗੂੰਜਦਾ ਸੀ, ਸਾਂਝੇ ਗਿਆਨ ਅਤੇ ਸਹਿਯੋਗੀ ਤਰੱਕੀ ਦਾ ਵਾਅਦਾ ਜਿਸ ਨੇ ਅਣਗਿਣਤ ਵਿਗਿਆਨਕ ਅਤੇ ਤਕਨੀਕੀ ਛਾਲਾਂ ਨੂੰ ਅੱਗੇ ਵਧਾਇਆ। ਇਸ ਨੇ ਭਾਈਚਾਰਿਆਂ ਦੇ ਇਕੱਠੇ ਨਿਰਮਾਣ ਕਰਨ, ਇੱਕ ਦੂਜੇ ਦੇ ਕੰਮ ਦੀ ਜਾਂਚ ਕਰਨ, ਅਤੇ ਦਿੱਗਜਾਂ ਦੇ ਮੋਢਿਆਂ ‘ਤੇ ਖੜ੍ਹੇ ਹੋਣ ਦੀਆਂ ਤਸਵੀਰਾਂ ਪੇਸ਼ ਕੀਤੀਆਂ ਕਿਉਂਕਿ ਬਲੂਪ੍ਰਿੰਟ ਮੁਫਤ ਉਪਲਬਧ ਸਨ। ਹੁਣ, Artificial Intelligence ਦੇ ਲੈਂਡਸਕੇਪ ਵਿੱਚ ਨੈਵੀਗੇਟ ਕਰਦੇ ਹੋਏ, ਇਹ ਸ਼ਬਦ ਵੱਧ ਤੋਂ ਵੱਧ… ਫਿਸਲਣ ਵਾਲਾ ਮਹਿਸੂਸ ਹੁੰਦਾ ਹੈ। ਜਿਵੇਂ ਕਿ Nature ਦੇ ਪੰਨਿਆਂ ਵਿੱਚ ਉਜਾਗਰ ਕੀਤਾ ਗਿਆ ਹੈ ਅਤੇ ਲੈਬਾਂ ਅਤੇ ਬੋਰਡਰੂਮਾਂ ਵਿੱਚ ਕਾਨਾਫੂਸੀ ਕੀਤੀ ਗਈ ਹੈ, AI ਗੋਲਡ ਰਸ਼ ਵਿੱਚ ਖਿਡਾਰੀਆਂ ਦੀ ਇੱਕ ਚਿੰਤਾਜਨਕ ਸੰਖਿਆ ਆਪਣੀਆਂ ਰਚਨਾਵਾਂ ਨੂੰ ‘ਓਪਨ ਸੋਰਸ’ ਦੇ ਪਰਦੇ ਵਿੱਚ ਲਪੇਟ ਰਹੀ ਹੈ ਜਦੋਂ ਕਿ ਅਸਲ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਹਿੱਸਿਆਂ ਨੂੰ ਤਾਲੇ ਅਤੇ ਚਾਬੀ ਹੇਠ ਰੱਖਿਆ ਹੋਇਆ ਹੈ। ਇਹ ਸਿਰਫ਼ ਇੱਕ ਅਰਥ ਸੰਬੰਧੀ ਬਹਿਸ ਨਹੀਂ ਹੈ; ਇਹ ਇੱਕ ਅਭਿਆਸ ਹੈ ਜੋ ਵਿਗਿਆਨਕ ਇਮਾਨਦਾਰੀ ਦੀਆਂ ਨੀਂਹਾਂ ਨੂੰ ਖੋਖਲਾ ਕਰਦਾ ਹੈ ਅਤੇ ਭਵਿੱਖ ਦੀ ਨਵੀਨਤਾ ਦੇ ਮਾਰਗ ਨੂੰ ਅਸਪਸ਼ਟ ਕਰਨ ਦਾ ਖ਼ਤਰਾ ਪੈਦਾ ਕਰਦਾ ਹੈ। ਖੋਜ ਭਾਈਚਾਰਾ, ਉਹੀ ਸਮੂਹ ਜਿਸ ਨੂੰ ਸਭ ਤੋਂ ਵੱਧ ਲਾਭ ਜਾਂ ਨੁਕਸਾਨ ਹੋਣਾ ਹੈ, ਨੂੰ ਇਸ ਨਾਟਕ ਨੂੰ ਪਛਾਣਨ ਦੀ ਲੋੜ ਹੈ ਕਿ ਇਹ ਕੀ ਹੈ ਅਤੇ ਜ਼ੋਰਦਾਰ ਢੰਗ ਨਾਲ AI ਪ੍ਰਣਾਲੀਆਂ ਦੀ ਵਕਾਲਤ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ ਜੋ ਸੱਚਮੁੱਚ ਪਾਰਦਰਸ਼ਤਾ ਅਤੇ ਪ੍ਰਜਨਨਯੋਗਤਾ ਦੇ ਸਿਧਾਂਤਾਂ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ ਜਿਨ੍ਹਾਂ ‘ਤੇ ਅਸੀਂ ਲੰਬੇ ਸਮੇਂ ਤੋਂ ਨਿਰਭਰ ਹਾਂ।

ਖੁੱਲ੍ਹੇਪਣ ਦਾ ਸੁਨਹਿਰੀ ਯੁੱਗ: ਇੱਕ ਵਿਰਾਸਤ ਖਤਰੇ ਵਿੱਚ

ਦਹਾਕਿਆਂ ਤੋਂ, ਓਪਨ-ਸੋਰਸ ਅੰਦੋਲਨ ਵਿਗਿਆਨਕ ਤਰੱਕੀ ਦਾ ਇੱਕ ਅਣਗੌਲਿਆ ਨਾਇਕ ਰਿਹਾ ਹੈ। ਅੰਕੜਾ ਵਿਗਿਆਨ ਲਈ R Studio ਜਾਂ ਤਰਲ ਗਤੀਸ਼ੀਲਤਾ ਦੇ ਮਾਡਲਿੰਗ ਲਈ OpenFOAM ਵਰਗੇ ਜਾਣੇ-ਪਛਾਣੇ ਸਾਧਨਾਂ ਤੋਂ ਪਰੇ ਸੋਚੋ। Linux ਵਰਗੇ ਬੁਨਿਆਦੀ ਪ੍ਰਣਾਲੀਆਂ ‘ਤੇ ਗੌਰ ਕਰੋ, ਜੋ ਇੰਟਰਨੈਟ ਅਤੇ ਵਿਗਿਆਨਕ ਕੰਪਿਊਟਿੰਗ ਕਲੱਸਟਰਾਂ ਦੇ ਵਿਸ਼ਾਲ ਹਿੱਸਿਆਂ ਨੂੰ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ, ਜਾਂ Apache ਵੈੱਬ ਸਰਵਰ, ਸਹਿਯੋਗੀ ਸਾਫਟਵੇਅਰ ਵਿਕਾਸ ਦਾ ਪ੍ਰਮਾਣ। ਫਲਸਫਾ ਸਿੱਧਾ ਸੀ: ਸਰੋਤ ਕੋਡ ਤੱਕ ਪਹੁੰਚ ਪ੍ਰਦਾਨ ਕਰੋ, ਆਗਿਆਕਾਰੀ ਲਾਇਸੈਂਸਾਂ ਦੇ ਤਹਿਤ ਸੋਧ ਅਤੇ ਮੁੜ ਵੰਡ ਦੀ ਆਗਿਆ ਦਿਓ, ਅਤੇ ਇੱਕ ਗਲੋਬਲ ਈਕੋਸਿਸਟਮ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰੋ ਜਿੱਥੇ ਸੁਧਾਰਾਂ ਨਾਲ ਸਾਰਿਆਂ ਨੂੰ ਲਾਭ ਹੋਵੇ।

ਇਹ ਸਿਰਫ਼ ਪਰਉਪਕਾਰ ਨਹੀਂ ਸੀ; ਇਹ ਵਿਹਾਰਕ ਪ੍ਰਤਿਭਾ ਸੀ। ਖੁੱਲ੍ਹੇਪਣ ਨੇ ਖੋਜ ਨੂੰ ਤੇਜ਼ ਕੀਤਾ। ਖੋਜਕਰਤਾ ਪ੍ਰਯੋਗਾਂ ਨੂੰ ਦੁਹਰਾ ਸਕਦੇ ਸਨ, ਖੋਜਾਂ ਨੂੰ ਪ੍ਰਮਾਣਿਤ ਕਰ ਸਕਦੇ ਸਨ, ਅਤੇ ਪਹੀਏ ਨੂੰ ਮੁੜ ਖੋਜਣ ਜਾਂ ਅਪਾਰਦਰਸ਼ੀ ਮਲਕੀਅਤ ਪ੍ਰਣਾਲੀਆਂ ਨੂੰ ਨੈਵੀਗੇਟ ਕੀਤੇ ਬਿਨਾਂ ਮੌਜੂਦਾ ਕੰਮ ‘ਤੇ ਨਿਰਮਾਣ ਕਰ ਸਕਦੇ ਸਨ। ਇਸ ਨੇ ਵਿਸ਼ਵਾਸ ਪੈਦਾ ਕੀਤਾ, ਕਿਉਂਕਿ ਅੰਦਰੂਨੀ ਕਾਰਜ ਨਿਰੀਖਣ ਲਈ ਉਪਲਬਧ ਸਨ, ਜਿਸ ਨਾਲ ਬੱਗਾਂ ਨੂੰ ਲੱਭਿਆ ਅਤੇ ਸਮੂਹਿਕ ਤੌਰ ‘ਤੇ ਠੀਕ ਕੀਤਾ ਜਾ ਸਕਦਾ ਸੀ। ਇਸ ਨੇ ਪਹੁੰਚ ਦਾ ਲੋਕਤੰਤਰੀਕਰਨ ਕੀਤਾ, ਦੁਨੀਆ ਭਰ ਦੇ ਵਿਗਿਆਨੀਆਂ ਅਤੇ ਡਿਵੈਲਪਰਾਂ ਨੂੰ, ਸੰਸਥਾਗਤ ਮਾਨਤਾ ਜਾਂ ਬਜਟ ਦੀ ਪਰਵਾਹ ਕੀਤੇ ਬਿਨਾਂ, ਅਤਿ-ਆਧੁਨਿਕ ਕੰਮ ਵਿੱਚ ਹਿੱਸਾ ਲੈਣ ਦੇ ਯੋਗ ਬਣਾਇਆ। ਇਹ ਸਹਿਯੋਗੀ ਭਾਵਨਾ, ਸਾਂਝੀ ਪਹੁੰਚ ਅਤੇ ਆਪਸੀ ਜਾਂਚ ‘ਤੇ ਬਣੀ, ਵਿਗਿਆਨਕ ਵਿਧੀ ਵਿੱਚ ਹੀ ਡੂੰਘਾਈ ਨਾਲ ਜੜ੍ਹ ਗਈ, ਮਜ਼ਬੂਤੀ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਂਦੀ ਹੈ ਅਤੇ ਵਿਭਿੰਨ ਖੇਤਰਾਂ ਵਿੱਚ ਤੇਜ਼ੀ ਨਾਲ ਤਰੱਕੀ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦੀ ਹੈ। ਵਰਤੇ ਜਾ ਰਹੇ ਸਾਧਨਾਂ ਨੂੰ ਵੱਖ ਕਰਨ, ਸਮਝਣ ਅਤੇ ਸੋਧਣ ਦੀ ਬਹੁਤ ਯੋਗਤਾ ਸਰਵਉੱਚ ਸੀ। ਇਹ ਸਿਰਫ਼ ਸਾਫਟਵੇਅਰ ਦੀ ਵਰਤੋਂ ਕਰਨ ਬਾਰੇ ਨਹੀਂ ਸੀ; ਇਹ ਸਮਝਣ ਬਾਰੇ ਸੀ ਕਿ ਇਹ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ, ਇੱਕ ਖਾਸ ਵਿਗਿਆਨਕ ਕਾਰਜ ਲਈ ਇਸਦੀ ਅਨੁਕੂਲਤਾ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣਾ, ਅਤੇ ਸਮੂਹਿਕ ਗਿਆਨ ਪੂਲ ਵਿੱਚ ਵਾਪਸ ਯੋਗਦਾਨ ਪਾਉਣਾ। ਇਸ ਨੇਕ ਚੱਕਰ ਨੇ ਬੇਮਿਸਾਲ ਰਫ਼ਤਾਰ ਨਾਲ ਨਵੀਨਤਾ ਨੂੰ ਅੱਗੇ ਵਧਾਇਆ।

AI ਦੀ ਡਾਟਾ ਨਿਰਭਰਤਾ: ‘ਕੋਡ ਇਜ਼ ਕਿੰਗ’ ਕਿਉਂ ਘੱਟ ਪੈਂਦਾ ਹੈ

ਵੱਡੇ ਪੈਮਾਨੇ ਦੀ Artificial Intelligence ਦੇ ਯੁੱਗ ਵਿੱਚ ਦਾਖਲ ਹੋਵੋ, ਖਾਸ ਤੌਰ ‘ਤੇ ਬੁਨਿਆਦੀ ਮਾਡਲ ਜੋ ਬਹੁਤ ਜ਼ਿਆਦਾ ਧਿਆਨ ਅਤੇ ਨਿਵੇਸ਼ ਨੂੰ ਹਾਸਲ ਕਰਦੇ ਹਨ। ਇੱਥੇ, ਰਵਾਇਤੀ ਓਪਨ-ਸੋਰਸ ਪੈਰਾਡਾਈਮ, ਮੁੱਖ ਤੌਰ ‘ਤੇ ਸਰੋਤ ਕੋਡ ‘ਤੇ ਕੇਂਦ੍ਰਿਤ, ਇੱਕ ਬੁਨਿਆਦੀ ਬੇਮੇਲਤਾ ਦਾ ਸਾਹਮਣਾ ਕਰਦਾ ਹੈ। ਜਦੋਂ ਕਿ AI ਮਾਡਲ ਨੂੰ ਬਣਾਉਣ ਲਈ ਵਰਤੇ ਗਏ ਐਲਗੋਰਿਦਮ ਅਤੇ ਕੋਡ ਨਿਸ਼ਚਤ ਤੌਰ ‘ਤੇ ਤਸਵੀਰ ਦਾ ਹਿੱਸਾ ਹਨ, ਉਹ ਪੂਰੀ ਕਹਾਣੀ ਤੋਂ ਬਹੁਤ ਦੂਰ ਹਨ। ਆਧੁਨਿਕ AI, ਖਾਸ ਤੌਰ ‘ਤੇ ਡੀਪ ਲਰਨਿੰਗ ਮਾਡਲ, ਡਾਟਾ ਦੇ ਭੁੱਖੇ ਖਪਤਕਾਰ ਹਨ। ਸਿਖਲਾਈ ਡਾਟਾ ਸਿਰਫ਼ ਇੱਕ ਇਨਪੁਟ ਨਹੀਂ ਹੈ; ਇਹ ਦਲੀਲ ਨਾਲ ਮਾਡਲ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ, ਪੱਖਪਾਤਾਂ ਅਤੇ ਸੀਮਾਵਾਂ ਦਾ ਮੁੱਖ ਨਿਰਧਾਰਕ ਹੈ।

ਮਾਡਲ ਦੇ ਕੋਡ, ਜਾਂ ਇੱਥੋਂ ਤੱਕ ਕਿ ਇਸਦੇ ਅੰਤਿਮ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਪੈਰਾਮੀਟਰਾਂ (‘ਵੇਟਸ’) ਨੂੰ ਜਾਰੀ ਕਰਨਾ, ਸਿਖਲਾਈ ਲਈ ਵਰਤੇ ਗਏ ਵਿਸ਼ਾਲ ਡਾਟਾਸੈਟਾਂ ਬਾਰੇ ਸਾਰਥਕ ਪਹੁੰਚ ਜਾਂ ਵਿਸਤ੍ਰਿਤ ਜਾਣਕਾਰੀ ਪ੍ਰਦਾਨ ਕੀਤੇ ਬਿਨਾਂ, ਕਿਸੇ ਨੂੰ ਕਾਰ ਦੀਆਂ ਚਾਬੀਆਂ ਸੌਂਪਣ ਵਰਗਾ ਹੈ ਪਰ ਇਹ ਦੱਸਣ ਤੋਂ ਇਨਕਾਰ ਕਰਨਾ ਕਿ ਇਹ ਕਿਸ ਕਿਸਮ ਦਾ ਬਾਲਣ ਲੈਂਦਾ ਹੈ, ਇਸਨੂੰ ਕਿੱਥੇ ਚਲਾਇਆ ਗਿਆ ਹੈ, ਜਾਂ ਇੰਜਣ ਅਸਲ ਵਿੱਚ ਕਿਵੇਂ ਇਕੱਠਾ ਕੀਤਾ ਗਿਆ ਸੀ। ਤੁਸੀਂ ਇਸਨੂੰ ਚਲਾਉਣ ਦੇ ਯੋਗ ਹੋ ਸਕਦੇ ਹੋ, ਪਰ ਤੁਹਾਡੇ ਕੋਲ ਇਸਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦੀਆਂ ਕਮੀਆਂ ਨੂੰ ਸਮਝਣ, ਸੰਭਾਵੀ ਸਮੱਸਿਆਵਾਂ ਦਾ ਨਿਦਾਨ ਕਰਨ, ਜਾਂ ਨਵੀਆਂ ਯਾਤਰਾਵਾਂ ਲਈ ਇਸਨੂੰ ਭਰੋਸੇਯੋਗ ਢੰਗ ਨਾਲ ਸੋਧਣ ਦੀ ਸੀਮਤ ਯੋਗਤਾ ਹੈ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, ਇਹਨਾਂ ਮਾਡਲਾਂ ਨੂੰ ਸ਼ੁਰੂ ਤੋਂ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਲੋੜੀਂਦੇ ਕੰਪਿਊਟੇਸ਼ਨਲ ਸਰੋਤ ਬਹੁਤ ਜ਼ਿਆਦਾ ਹਨ, ਅਕਸਰ ਇੱਕ ਸਿੰਗਲ ਸਿਖਲਾਈ ਰਨ ਲਈ ਲੱਖਾਂ ਡਾਲਰਾਂ ਵਿੱਚ ਚੱਲਦੇ ਹਨ। ਇਹ ਇੱਕ ਹੋਰ ਰੁਕਾਵਟ ਪੈਦਾ ਕਰਦਾ ਹੈ। ਭਾਵੇਂ ਕੋਡ ਅਤੇ ਡਾਟਾ ਪੂਰੀ ਤਰ੍ਹਾਂ ਉਪਲਬਧ ਹੋਣ, ਸਿਰਫ਼ ਮੁੱਠੀ ਭਰ ਸੰਸਥਾਵਾਂ ਕੋਲ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਦੁਹਰਾਉਣ ਲਈ ਬੁਨਿਆਦੀ ਢਾਂਚਾ ਹੈ। ਇਹ ਹਕੀਕਤ ਰਵਾਇਤੀ ਸਾਫਟਵੇਅਰ ਦੀ ਤੁਲਨਾ ਵਿੱਚ ਗਤੀਸ਼ੀਲਤਾ ਨੂੰ ਬੁਨਿਆਦੀ ਤੌਰ ‘ਤੇ ਬਦਲ ਦਿੰਦੀ ਹੈ, ਜਿੱਥੇ ਕੋਡ ਨੂੰ ਕੰਪਾਇਲ ਕਰਨਾ ਆਮ ਤੌਰ ‘ਤੇ ਜ਼ਿਆਦਾਤਰ ਡਿਵੈਲਪਰਾਂ ਜਾਂ ਖੋਜਕਰਤਾਵਾਂ ਦੀ ਪਹੁੰਚ ਵਿੱਚ ਹੁੰਦਾ ਹੈ। AI ਲਈ, ਸੱਚੀ ਪ੍ਰਜਨਨਯੋਗਤਾ ਅਤੇ ਮੁੜ ਸਿਖਲਾਈ ਦੁਆਰਾ ਪ੍ਰਯੋਗ ਕਰਨ ਦੀ ਯੋਗਤਾ ਅਕਸਰ ਪਹੁੰਚ ਤੋਂ ਬਾਹਰ ਰਹਿੰਦੀ ਹੈ, ਭਾਵੇਂ ਕਿ ਭਾਗਾਂ ਨੂੰ ‘ਓਪਨ’ ਲੇਬਲ ਕੀਤਾ ਗਿਆ ਹੋਵੇ। ਇਸ ਲਈ, ਕੋਡ ਲਈ ਬਣਾਈਆਂ ਗਈਆਂ ਪੁਰਾਣੀਆਂ ਓਪਨ-ਸੋਰਸ ਪਰਿਭਾਸ਼ਾਵਾਂ ਨੂੰ ਲਾਗੂ ਕਰਨਾ ਇਸ ਨਵੇਂ, ਡਾਟਾ-ਕੇਂਦ੍ਰਿਤ ਅਤੇ ਕੰਪਿਊਟ-ਇੰਟੈਂਸਿਵ ਡੋਮੇਨ ਦੀਆਂ ਲੋੜਾਂ ਨੂੰ ਪੂਰਾ ਨਹੀਂ ਕਰਦਾ ਹੈ।

‘ਓਪਨਵਾਸ਼ਿੰਗ’: ਭੇਡ ਦੀ ਖੱਲ ਵਿੱਚ ਇੱਕ ਬਘਿਆੜ

ਰਵਾਇਤੀ ਓਪਨ-ਸੋਰਸ ਸੰਕਲਪਾਂ ਅਤੇ AI ਵਿਕਾਸ ਦੀਆਂ ਹਕੀਕਤਾਂ ਵਿਚਕਾਰ ਇਸ ਪਾੜੇ ਨੇ ‘ਓਪਨਵਾਸ਼ਿੰਗ’ ਵਜੋਂ ਜਾਣੇ ਜਾਂਦੇ ਵਰਤਾਰੇ ਲਈ ਉਪਜਾਊ ਜ਼ਮੀਨ ਤਿਆਰ ਕੀਤੀ ਹੈ। ਕੰਪਨੀਆਂ ਉਤਸੁਕਤਾ ਨਾਲ ਆਪਣੇ AI ਮਾਡਲਾਂ ‘ਤੇ ‘ਓਪਨ ਸੋਰਸ’ ਲੇਬਲ ਲਗਾਉਂਦੀਆਂ ਹਨ, ਇਸ ਸ਼ਬਦ ਨਾਲ ਜੁੜੇ ਜਨਤਕ ਸੰਪਰਕ ਲਾਭਾਂ ਅਤੇ ਸਦਭਾਵਨਾ ਦਾ ਲਾਭ ਉਠਾਉਂਦੀਆਂ ਹਨ, ਜਦੋਂ ਕਿ ਲਾਇਸੈਂਸਾਂ ਜਾਂ ਪਹੁੰਚ ਪਾਬੰਦੀਆਂ ਨੂੰ ਲਾਗੂ ਕਰਦੀਆਂ ਹਨ ਜੋ ਅਸਲ ਖੁੱਲ੍ਹੇਪਣ ਦੀ ਭਾਵਨਾ, ਜੇ ਸਖਤ (ਅਤੇ ਦਲੀਲ ਨਾਲ ਪੁਰਾਣੀ) ਚਿੱਠੀ ਨਹੀਂ, ਨਾਲ ਧੋਖਾ ਕਰਦੀਆਂ ਹਨ।

ਇਹ ਅਭਿਆਸ ਵਿੱਚ ਕਿਹੋ ਜਿਹਾ ਦਿਸਦਾ ਹੈ?

  • ਡਾਟਾ ਤੋਂ ਬਿਨਾਂ ਕੋਡ ਰਿਲੀਜ਼: ਇੱਕ ਕੰਪਨੀ ਮਾਡਲ ਦੇ ਆਰਕੀਟੈਕਚਰ ਕੋਡ ਅਤੇ ਸ਼ਾਇਦ ਪੂਰਵ-ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਵੇਟਸ ਨੂੰ ਜਾਰੀ ਕਰ ਸਕਦੀ ਹੈ, ਜਿਸ ਨਾਲ ਦੂਜਿਆਂ ਨੂੰ ਮਾਡਲ ਨੂੰ ‘ਜਿਵੇਂ ਹੈ’ ਵਰਤਣ ਜਾਂ ਛੋਟੇ ਡਾਟਾਸੈਟਾਂ ‘ਤੇ ਇਸਨੂੰ ਫਾਈਨ-ਟਿਊਨ ਕਰਨ ਦੀ ਆਗਿਆ ਮਿਲਦੀ ਹੈ। ਹਾਲਾਂਕਿ, ਵਿਸ਼ਾਲ, ਬੁਨਿਆਦੀ ਸਿਖਲਾਈ ਡਾਟਾਸੈਟ - ਗੁਪਤ ਚਟਨੀ ਜੋ ਮਾਡਲ ਦੀਆਂ ਮੁੱਖ ਯੋਗਤਾਵਾਂ ਨੂੰ ਪਰਿਭਾਸ਼ਤ ਕਰਦੀ ਹੈ - ਮਲਕੀਅਤ ਅਤੇ ਲੁਕਿਆ ਰਹਿੰਦਾ ਹੈ।
  • ਪ੍ਰਤਿਬੰਧਿਤ ਲਾਇਸੈਂਸਿੰਗ: ਮਾਡਲਾਂ ਨੂੰ ਲਾਇਸੈਂਸਾਂ ਦੇ ਤਹਿਤ ਜਾਰੀ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ਜੋ ਪਹਿਲੀ ਨਜ਼ਰ ਵਿੱਚ ਖੁੱਲ੍ਹੇ ਦਿਖਾਈ ਦਿੰਦੇ ਹਨ ਪਰ ਵਪਾਰਕ ਵਰਤੋਂ ਨੂੰ ਸੀਮਤ ਕਰਨ, ਕੁਝ ਸਥਿਤੀਆਂ ਵਿੱਚ ਤੈਨਾਤੀ ਨੂੰ ਪ੍ਰਤਿਬੰਧਿਤ ਕਰਨ, ਜਾਂ ਖਾਸ ਕਿਸਮਾਂ ਦੀ ਸੋਧ ਜਾਂ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਮਨਾਹੀ ਕਰਨ ਵਾਲੀਆਂ ਧਾਰਾਵਾਂ ਸ਼ਾਮਲ ਹੁੰਦੀਆਂ ਹਨ। ਇਹ ਪਾਬੰਦੀਆਂ ਆਮ ਤੌਰ ‘ਤੇ ਓਪਨ-ਸੋਰਸ ਸਾਫਟਵੇਅਰ ਨਾਲ ਜੁੜੀਆਂ ਆਜ਼ਾਦੀਆਂ ਦੇ ਉਲਟ ਚਲਦੀਆਂ ਹਨ।
  • ਅਸਪਸ਼ਟ ਡਾਟਾ ਖੁਲਾਸਾ: ਡਾਟਾ ਸਰੋਤਾਂ, ਸੰਗ੍ਰਹਿ ਵਿਧੀਆਂ, ਸਫਾਈ ਪ੍ਰਕਿਰਿਆਵਾਂ, ਅਤੇ ਸੰਭਾਵੀ ਪੱਖਪਾਤਾਂ ਬਾਰੇ ਵਿਸਤ੍ਰਿਤ ਜਾਣਕਾਰੀ ਦੀ ਬਜਾਏ, ਕੰਪਨੀਆਂ ਅਸਪਸ਼ਟ ਵਰਣਨ ਪੇਸ਼ ਕਰ ਸਕਦੀਆਂ ਹਨ ਜਾਂ ਮਹੱਤਵਪੂਰਨ ਵੇਰਵਿਆਂ ਨੂੰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਛੱਡ ਸਕਦੀਆਂ ਹਨ। ‘ਡਾਟਾ ਪਾਰਦਰਸ਼ਤਾ’ ਦੀ ਇਹ ਘਾਟ ਮਾਡਲ ਦੀ ਭਰੋਸੇਯੋਗਤਾ ਜਾਂ ਨੈਤਿਕ ਪ੍ਰਭਾਵਾਂ ਦਾ ਪੂਰੀ ਤਰ੍ਹਾਂ ਮੁਲਾਂਕਣ ਕਰਨਾ ਅਸੰਭਵ ਬਣਾ ਦਿੰਦੀ ਹੈ।

ਅਜਿਹੇ ਅਭਿਆਸਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਕਿਉਂ ਹੋਣਾ ਹੈ? ਪ੍ਰੇਰਣਾਵਾਂ ਸੰਭਾਵਤ ਤੌਰ ‘ਤੇ ਵੱਖਰੀਆਂ ਹਨ। ‘ਓਪਨ ਸੋਰਸ’ ਦੇ ਸਕਾਰਾਤਮਕ ਅਰਥ ਪ੍ਰਤਿਭਾ ਨੂੰ ਆਕਰਸ਼ਿਤ ਕਰਨ, ਡਿਵੈਲਪਰ ਭਾਈਚਾਰਿਆਂ (ਭਾਵੇਂ ਪ੍ਰਤਿਬੰਧਿਤ ਹੋਣ) ਬਣਾਉਣ, ਅਤੇ ਅਨੁਕੂਲ ਪ੍ਰੈਸ ਪੈਦਾ ਕਰਨ ਲਈ ਨਿਰਸੰਦੇਹ ਕੀਮਤੀ ਹਨ। ਵਧੇਰੇ ਨਿੰਦਕ ਤੌਰ ‘ਤੇ, ਜਿਵੇਂ ਕਿ Nature ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ, ਰੈਗੂਲੇਟਰੀ ਪ੍ਰੋਤਸਾਹਨ ਹੋ ਸਕਦੇ ਹਨ। ਯੂਰਪੀਅਨ ਯੂਨੀਅਨ ਦਾ ਵਿਆਪਕ 2024 AI ਐਕਟ, ਉਦਾਹਰਨ ਲਈ, ਓਪਨ ਸੋਰਸ ਵਜੋਂ ਸ਼੍ਰੇਣੀਬੱਧ ਪ੍ਰਣਾਲੀਆਂ ਲਈ ਸੰਭਾਵੀ ਛੋਟਾਂ ਜਾਂ ਹਲਕੀਆਂ ਜ਼ਰੂਰਤਾਂ ਸ਼ਾਮਲ ਕਰਦਾ ਹੈ। ਰਣਨੀਤਕ ਤੌਰ ‘ਤੇ ਲੇਬਲ ਦੀ ਵਰਤੋਂ ਕਰਕੇ, ਕੁਝ ਫਰਮਾਂ ਘੱਟ ਰਗੜ ਨਾਲ ਗੁੰਝਲਦਾਰ ਰੈਗੂਲੇਟਰੀ ਲੈਂਡਸਕੇਪਾਂ ਨੂੰ ਨੈਵੀਗੇਟ ਕਰਨ ਦੀ ਉਮੀਦ ਕਰ ਸਕਦੀਆਂ ਹਨ, ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਸ਼ਕਤੀਸ਼ਾਲੀ, ਆਮ-ਉਦੇਸ਼ ਵਾਲੇ AI ਪ੍ਰਣਾਲੀਆਂ ਲਈ ਇਰਾਦੇ ਵਾਲੀ ਜਾਂਚ ਤੋਂ ਬਚ ਸਕਦੀਆਂ ਹਨ। ਇਹ ਰਣਨੀਤਕ ਬ੍ਰਾਂਡਿੰਗ ਅਭਿਆਸ ਓਪਨ-ਸੋਰਸ ਅੰਦੋਲਨ ਦੀ ਇਤਿਹਾਸਕ ਸਦਭਾਵਨਾ ਦਾ ਸ਼ੋਸ਼ਣ ਕਰਦਾ ਹੈ ਜਦੋਂ ਕਿ ਜ਼ਿੰਮੇਵਾਰ AI ਤੈਨਾਤੀ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣ ਦੇ ਯਤਨਾਂ ਨੂੰ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਕਮਜ਼ੋਰ ਕਰਦਾ ਹੈ।

ਖੁੱਲ੍ਹੇਪਣ ਦਾ ਇੱਕ ਸਪੈਕਟ੍ਰਮ: ਪ੍ਰਦਰਸ਼ਨੀਆਂ ਦੀ ਜਾਂਚ

ਇਹ ਪਛਾਣਨਾ ਮਹੱਤਵਪੂਰਨ ਹੈ ਕਿ AI ਵਿੱਚ ਖੁੱਲ੍ਹਾਪਣ ਜ਼ਰੂਰੀ ਤੌਰ ‘ਤੇ ਇੱਕ ਬਾਈਨਰੀ ਸਥਿਤੀ ਨਹੀਂ ਹੈ; ਇਹ ਇੱਕ ਸਪੈਕਟ੍ਰਮ ‘ਤੇ ਮੌਜੂਦ ਹੈ। ਹਾਲਾਂਕਿ, ਮੌਜੂਦਾ ਲੇਬਲਿੰਗ ਅਭਿਆਸ ਅਕਸਰ ਅਸਪਸ਼ਟ ਕਰਦੇ ਹਨ ਕਿ ਇੱਕ ਖਾਸ ਮਾਡਲ ਅਸਲ ਵਿੱਚ ਉਸ ਸਪੈਕਟ੍ਰਮ ‘ਤੇ ਕਿੱਥੇ ਬੈਠਦਾ ਹੈ।

ਇਸ ਸੰਦਰਭ ਵਿੱਚ ਅਕਸਰ ਚਰਚਾ ਕੀਤੇ ਗਏ ਕੁਝ ਪ੍ਰਮੁੱਖ ਉਦਾਹਰਣਾਂ ‘ਤੇ ਗੌਰ ਕਰੋ:

  • Meta ਦਾ Llama ਸੀਰੀਜ਼: ਜਦੋਂ ਕਿ Meta ਨੇ Llama ਮਾਡਲਾਂ ਲਈ ਵੇਟਸ ਅਤੇ ਕੋਡ ਜਾਰੀ ਕੀਤੇ, ਪਹੁੰਚ ਲਈ ਸ਼ੁਰੂ ਵਿੱਚ ਅਰਜ਼ੀ ਦੀ ਲੋੜ ਸੀ, ਅਤੇ ਲਾਇਸੈਂਸ ਵਿੱਚ ਪਾਬੰਦੀਆਂ ਸ਼ਾਮਲ ਸਨ, ਖਾਸ ਤੌਰ ‘ਤੇ ਬਹੁਤ ਵੱਡੀਆਂ ਕੰਪਨੀਆਂ ਦੁਆਰਾ ਵਰਤੋਂ ਅਤੇ ਖਾਸ ਐਪਲੀਕੇਸ਼ਨਾਂ ਬਾਰੇ। ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ, ਅੰਤਰੀਵ ਸਿਖਲਾਈ ਡਾਟਾ ਜਾਰੀ ਨਹੀਂ ਕੀਤਾ ਗਿਆ ਸੀ, ਜਿਸ ਨਾਲ ਪੂਰੀ ਪ੍ਰਜਨਨਯੋਗਤਾ ਅਤੇ ਇਸ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਡੂੰਘੇ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਸੀਮਤ ਕੀਤਾ ਗਿਆ ਸੀ। ਜਦੋਂ ਕਿ ਬਾਅਦ ਦੇ ਸੰਸਕਰਣਾਂ ਨੇ ਸ਼ਰਤਾਂ ਨੂੰ ਵਿਵਸਥਿਤ ਕੀਤਾ ਹੈ, ਡਾਟਾ ਅਪਾਰਦਰਸ਼ਤਾ ਦਾ ਮੁੱਖ ਮੁੱਦਾ ਅਕਸਰ ਬਣਿਆ ਰਹਿੰਦਾ ਹੈ।
  • Microsoft ਦਾ Phi-2: Microsoft ਨੇ Phi-2 ਨੂੰ ਇੱਕ ‘ਓਪਨ-ਸੋਰਸ’ ਛੋਟੇ ਭਾਸ਼ਾ ਮਾਡਲ ਵਜੋਂ ਪੇਸ਼ ਕੀਤਾ। ਜਦੋਂ ਕਿ ਮਾਡਲ ਵੇਟਸ ਉਪਲਬਧ ਹਨ, ਲਾਇਸੈਂਸ ਵਿੱਚ ਖਾਸ ਵਰਤੋਂ ਦੀਆਂ ਸੀਮਾਵਾਂ ਹਨ, ਅਤੇ ਇਸਦੇ ਸਿਖਲਾਈ ਡਾਟਾਸੈਟ ਬਾਰੇ ਵਿਸਤ੍ਰਿਤ ਜਾਣਕਾਰੀ, ਇਸਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਅਤੇ ਸੰਭਾਵੀ ਪੱਖਪਾਤਾਂ ਨੂੰ ਸਮਝਣ ਲਈ ਮਹੱਤਵਪੂਰਨ (ਖਾਸ ਕਰਕੇ ‘ਸਿੰਥੈਟਿਕ’ ਡਾਟਾ ‘ਤੇ ਇਸਦੀ ਸਿਖਲਾਈ ਦੇ ਮੱਦੇਨਜ਼ਰ), ਪੂਰੀ ਤਰ੍ਹਾਂ ਪਾਰਦਰਸ਼ੀ ਨਹੀਂ ਹੈ।
  • Mistral AI ਦਾ Mixtral: ਇਹ ਮਾਡਲ, ਇੱਕ ਪ੍ਰਮੁੱਖ ਯੂਰਪੀਅਨ AI ਸਟਾਰਟਅੱਪ ਦੁਆਰਾ ਜਾਰੀ ਕੀਤਾ ਗਿਆ, ਇਸਦੇ ਪ੍ਰਦਰਸ਼ਨ ਲਈ ਧਿਆਨ ਖਿੱਚਿਆ। ਜਦੋਂ ਕਿ ਭਾਗਾਂ ਨੂੰ ਇੱਕ ਆਗਿਆਕਾਰੀ Apache 2.0 ਲਾਇਸੈਂਸ (ਕੋਡ/ਵੇਟਸ ਲਈ ਇੱਕ ਸੱਚਮੁੱਚ ਖੁੱਲ੍ਹਾ ਲਾਇਸੈਂਸ) ਦੇ ਤਹਿਤ ਜਾਰੀ ਕੀਤਾ ਗਿਆ ਸੀ, ਸਿਖਲਾਈ ਡਾਟਾ ਰਚਨਾ ਅਤੇ ਕਿਊਰੇਸ਼ਨ ਪ੍ਰਕਿਰਿਆ ਬਾਰੇ ਪੂਰੀ ਪਾਰਦਰਸ਼ਤਾ ਸੀਮਤ ਰਹਿੰਦੀ ਹੈ, ਜੋ ਡੂੰਘੀ ਵਿਗਿਆਨਕ ਜਾਂਚ ਵਿੱਚ ਰੁਕਾਵਟ ਪਾਉਂਦੀ ਹੈ।

ਇਹਨਾਂ ਦੀ ਤੁਲਨਾ ਰਵਾਇਤੀ ਓਪਨ-ਸੋਰਸ ਸਿਧਾਂਤਾਂ ਨਾਲ ਵਧੇਰੇ ਇਕਸਾਰਤਾ ਲਈ ਯਤਨਸ਼ੀਲ ਪਹਿਲਕਦਮੀਆਂ ਨਾਲ ਕਰੋ:

  • Allen Institute for AI ਦਾ OLMo: ਇਸ ਪ੍ਰੋਜੈਕਟ ਦਾ ਸਪੱਸ਼ਟ ਉਦੇਸ਼ ਇੱਕ ਸੱਚਮੁੱਚ ਖੁੱਲ੍ਹਾ ਭਾਸ਼ਾ ਮਾਡਲ ਬਣਾਉਣਾ ਸੀ, ਨਾ ਸਿਰਫ਼ ਮਾਡਲ ਵੇਟਸ ਅਤੇ ਕੋਡ ਨੂੰ ਜਾਰੀ ਕਰਨ ਨੂੰ ਤਰਜੀਹ ਦਿੰਦੇ ਹੋਏ, ਬਲਕਿ ਸਿਖਲਾਈ ਡਾਟਾ (Dolma ਡਾਟਾਸੈਟ) ਅਤੇ ਵਿਸਤ੍ਰਿਤ ਸਿਖਲਾਈ ਲੌਗਸ ਨੂੰ ਵੀ। ਇਹ ਵਚਨਬੱਧਤਾ ਵਿਆਪਕ ਖੋਜ ਭਾਈਚਾਰੇ ਦੁਆਰਾ ਬੇਮਿਸਾਲ ਪੱਧਰ ਦੀ ਪ੍ਰਜਨਨਯੋਗਤਾ ਅਤੇ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ।
  • LLM360 ਦਾ CrystalCoder: ਇਹ ਭਾਈਚਾਰਾ-ਸੰਚਾਲਿਤ ਯਤਨ ਇਸੇ ਤਰ੍ਹਾਂ ਮਾਡਲ ਵਿਕਾਸ ਜੀਵਨ ਚੱਕਰ ਦੇ ਸਾਰੇ ਭਾਗਾਂ ਨੂੰ ਜਾਰੀ ਕਰਨ ‘ਤੇ ਜ਼ੋਰ ਦਿੰਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਵਿਚਕਾਰਲੇ ਚੈਕਪੁਆਇੰਟ ਅਤੇ ਡਾਟਾ ਅਤੇ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਬਾਰੇ ਵਿਸਤ੍ਰਿਤ ਦਸਤਾਵੇਜ਼ ਸ਼ਾਮਲ ਹਨ, ਪਾਰਦਰਸ਼ਤਾ ਦੇ ਪੱਧਰ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦੇ ਹਨ ਜੋ ਅਕਸਰ ਕਾਰਪੋਰੇਟ ਰਿਲੀਜ਼ਾਂ ਵਿੱਚ ਗੁੰਮ ਹੁੰਦਾ ਹੈ।

ਇਹ ਵਿਪਰੀਤ ਉਦਾਹਰਣਾਂ ਉਜਾਗਰ ਕਰਦੀਆਂ ਹਨ ਕਿ AI ਵਿੱਚ ਅਸਲ ਖੁੱਲ੍ਹਾਪਣ ਸੰਭਵ ਹੈ, ਪਰ ਇਸ ਲਈ ਸਿਰਫ਼ ਕੋਡ ਜਾਂ ਵੇਟਸ ਜਾਰੀ ਕਰਨ ਤੋਂ ਪਰੇ ਇੱਕ ਜਾਣਬੁੱਝ ਕੇ ਵਚਨਬੱਧਤਾ ਦੀ ਲੋੜ ਹੈ। ਇਹ ਡਾਟਾ ਅਤੇ ਪ੍ਰਕਿਰਿਆ ਬਾਰੇ ਪਾਰਦਰਸ਼ਤਾ ਦੀ ਮੰਗ ਕਰਦਾ ਹੈ, ਇਸਦੇ ਨਾਲ ਆਉਣ ਵਾਲੀ ਜਾਂਚ ਨੂੰ ਅਪਣਾਉਂਦਾ ਹੈ। ‘ਓਪਨਵਾਸ਼ਿੰਗ’ ਦੁਆਰਾ ਪੈਦਾ ਕੀਤੀ ਮੌਜੂਦਾ ਅਸਪਸ਼ਟਤਾ ਖੋਜਕਰਤਾਵਾਂ ਲਈ ਇਹ ਪਤਾ ਲਗਾਉਣਾ ਔਖਾ ਬਣਾਉਂਦੀ ਹੈ ਕਿ ਕਿਹੜੇ ਸਾਧਨ ਸੱਚਮੁੱਚ ਖੁੱਲ੍ਹੀ ਵਿਗਿਆਨਕ ਜਾਂਚ ਦਾ ਸਮਰਥਨ ਕਰਦੇ ਹਨ।

ਵਿਸ਼ਵਾਸ ਦਾ ਖੋਰਾ: ਵਿਗਿਆਨਕ ਇਮਾਨਦਾਰੀ ਦਾਅ ‘ਤੇ

ਇਸ ਵਿਆਪਕ ‘ਓਪਨਵਾਸ਼ਿੰਗ’ ਦੇ ਪ੍ਰਭਾਵ ਸਿਰਫ਼ ਬ੍ਰਾਂਡਿੰਗ ਤੋਂ ਕਿਤੇ ਵੱਧ ਹਨ। ਜਦੋਂ ਖੋਜਕਰਤਾ AI ਮਾਡਲਾਂ ‘ਤੇ ਨਿਰਭਰ ਕਰਦੇ ਹਨ ਜਿਨ੍ਹਾਂ ਦੇ ਅੰਦਰੂਨੀ ਕਾਰਜ, ਖਾਸ ਤੌਰ ‘ਤੇ ਜਿਸ ਡਾਟਾ ‘ਤੇ ਉਹਨਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ, ਅਪਾਰਦਰਸ਼ੀ ਹੁੰਦੇ ਹਨ, ਤਾਂ ਇਹ ਵਿਗਿਆਨਕ ਵਿਧੀ ਦੇ ਦਿਲ ‘ਤੇ ਸੱਟ ਮਾਰਦਾ ਹੈ।

  • ਪ੍ਰਜਨਨਯੋਗਤਾ ਕਮਜ਼ੋਰ: ਵਿਗਿਆਨਕ ਵੈਧਤਾ ਦਾ ਇੱਕ ਆਧਾਰ ਸੁਤੰਤਰ ਖੋਜਕਰਤਾਵਾਂ ਦੁਆਰਾ ਨਤੀਜਿਆਂ ਨੂੰ ਦੁਬਾਰਾ ਪੈਦਾ ਕਰਨ ਦੀ ਯੋਗਤਾ ਹੈ। ਜੇਕਰ ਸਿਖਲਾਈ ਡਾਟਾ ਅਤੇ ਸਹੀ ਸਿਖਲਾਈ ਵਿਧੀਆਂ ਅਣਜਾਣ ਹਨ, ਤਾਂ ਸੱਚੀ ਪ੍ਰਤੀਕ੍ਰਿਤੀ ਅਸੰਭਵ ਹੋ ਜਾਂਦੀ ਹੈ। ਖੋਜਕਰਤਾ ਇੱਕ ਪੂਰਵ-ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦੇ ਹਨ, ਪਰ ਉਹ ਇਸਦੇ ਨਿਰਮਾਣ ਦੀ ਪੁਸ਼ਟੀ ਨਹੀਂ ਕਰ ਸਕਦੇ ਜਾਂ ਲੁਕੇ ਹੋਏ ਡਾਟਾ ਤੋਂ ਪ੍ਰਾਪਤ ਇਸਦੇ ਬੁਨਿਆਦੀ ਗੁਣਾਂ ਦੀ ਜਾਂਚ ਨਹੀਂ ਕਰ ਸਕਦੇ।
  • ਤਸਦੀਕ ਵਿੱਚ ਰੁਕਾਵਟ: ਵਿਗਿਆਨੀ ਇੱਕ ਮਾਡਲ ਦੇ ਆਉਟਪੁੱਟ ‘ਤੇ ਕਿਵੇਂ ਭਰੋਸਾ ਕਰ ਸਕਦੇ ਹਨ ਜੇਕਰ ਉਹ ਉਸ ਡਾਟਾ ਦੀ ਜਾਂਚ ਨਹੀਂ ਕਰ ਸਕਦੇ ਜਿਸ ਤੋਂ ਇਸਨੇ ਸਿੱਖਿਆ ਹੈ? ਸਿਖਲਾਈ ਡਾਟਾ ਵਿੱਚ ਸ਼ਾਮਲ ਲੁਕੇ ਹੋਏ ਪੱਖਪਾਤ, ਅਸ਼ੁੱਧੀਆਂ, ਜਾਂ ਨੈਤਿਕ ਚਿੰਤਾਵਾਂ ਲਾਜ਼ਮੀ ਤੌਰ ‘ਤੇ ਮਾਡਲ ਦੇ ਵਿਵਹਾਰ ਵਿੱਚ ਪ੍ਰਗਟ ਹੋਣਗੀਆਂ, ਫਿਰ ਵੀ ਪਾਰਦਰਸ਼ਤਾ ਤੋਂ ਬਿਨਾਂ, ਇਹਨਾਂ ਖਾਮੀਆਂ ਦਾ ਪਤਾ ਲਗਾਉਣਾ, ਨਿਦਾਨ ਕਰਨਾ ਜਾਂ ਘੱਟ ਕਰਨਾ ਮੁਸ਼ਕਲ ਹੈ। ਵਿਗਿਆਨਕ ਖੋਜ ਲਈ ਅਜਿਹੇ ਬਲੈਕ ਬਾਕਸਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨਾ ਅਸਵੀਕਾਰਨਯੋਗ ਪੱਧਰ ਦੀ ਅਨਿਸ਼ਚਿਤਤਾ ਪੇਸ਼ ਕਰਦਾ ਹੈ।
  • ਨਵੀਨਤਾ ਰੁਕੀ: ਵਿਗਿਆਨ ਪਿਛਲੇ ਕੰਮ ‘ਤੇ ਨਿਰਮਾਣ ਕਰਕੇ ਤਰੱਕੀ ਕਰਦਾ ਹੈ। ਜੇਕਰ ਬੁਨਿਆਦੀ ਮਾਡਲਾਂ ਨੂੰ ਪਾਬੰਦੀਆਂ ਨਾਲ ਜਾਂ ਲੋੜੀਂਦੀ ਪਾਰਦਰਸ਼ਤਾ (ਖਾਸ ਕਰਕੇ ਡਾਟਾ ਬਾਰੇ) ਤੋਂ ਬਿਨਾਂ ਜਾਰੀ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਇਹ ਦੂਜਿਆਂ ਦੀ ਨਵੀਨਤਾ ਕਰਨ, ਵਿਕਲਪਕ ਸਿਖਲਾਈ ਪ੍ਰਣਾਲੀਆਂ ਨਾਲ ਪ੍ਰਯੋਗ ਕਰਨ, ਜਾਂ ਨਾਵਲ ਵਿਗਿਆਨਕ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਮਾਡਲਾਂ ਨੂੰ ਉਹਨਾਂ ਤਰੀਕਿਆਂ ਨਾਲ ਢਾਲਣ ਦੀ ਯੋਗਤਾ ਵਿੱਚ ਰੁਕਾਵਟ ਪਾਉਂਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਦੀ ਮੂਲ ਸਿਰਜਣਹਾਰਾਂ ਨੇ ਕਲਪਨਾ ਨਹੀਂ ਕੀਤੀ ਹੋ ਸਕਦੀ। ਤਰੱਕੀ ਇਹਨਾਂ ਅਰਧ-ਅਪਾਰਦਰਸ਼ੀ ਪ੍ਰਣਾਲੀਆਂ ਦੇ ਪ੍ਰਦਾਤਾਵਾਂ ਦੁਆਰਾ ਗੇਟ ਕੀਤੀ ਜਾਂਦੀ ਹੈ।

ਬੰਦ ਜਾਂ ਅੰਸ਼ਕ ਤੌਰ ‘ਤੇ ਬੰਦ ਕਾਰਪੋਰੇਟ ਪ੍ਰਣਾਲੀਆਂ ‘ਤੇ ਨਿਰਭਰਤਾ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਸਰਗਰਮ ਭਾਗੀਦਾਰਾਂ ਅਤੇ ਨਵੀਨਤਾਕਾਰਾਂ ਦੀ ਬਜਾਏ ਇੱਕ ਪੈਸਿਵ ਖਪਤਕਾਰ ਦੀ ਭੂਮਿਕਾ ਵਿੱਚ ਮਜਬੂਰ ਕਰਦੀ ਹੈ। ਇਹ ਇੱਕ ਅਜਿਹਾ ਭਵਿੱਖ ਬਣਾਉਣ ਦਾ ਜੋਖਮ ਪੈਦਾ ਕਰਦਾ ਹੈ ਜਿੱਥੇ ਮਹੱਤਵਪੂਰਨ ਵਿਗਿਆਨਕ ਬੁਨਿਆਦੀ ਢਾਂਚਾ ਕੁਝ ਵੱਡੀਆਂ ਸੰਸਥਾਵਾਂ ਦੁਆਰਾ ਨਿਯੰਤਰਿਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਖੁੱਲ੍ਹੀ ਵਿਗਿਆਨਕ ਜਾਂਚ ਦੀਆਂ ਲੋੜਾਂ ਨਾਲੋਂ ਵਪਾਰਕ ਹਿੱਤਾਂ ਨੂੰ ਤਰਜੀਹ ਦਿੰਦਾ ਹੈ। ਪਾਰਦਰਸ਼ਤਾ ਦਾ ਇਹ ਖੋਰਾ ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਆਧੁਨਿਕ ਖੋਜ ਨੂੰ ਆਧਾਰ ਬਣਾਉਣ ਵਾਲੇ ਸਾਧਨਾਂ ਵਿੱਚ ਵਿਸ਼ਵਾਸ ਦੇ ਖੋਰੇ ਵਿੱਚ ਬਦਲ ਜਾਂਦਾ ਹੈ।

ਮਾਰਕੀਟ ਇਕਾਗਰਤਾ ਅਤੇ ਨਵੀਨਤਾ ‘ਤੇ ਠੰਡਾ ਪ੍ਰਭਾਵ

ਵਿਗਿਆਨਕ ਅਭਿਆਸ ‘ਤੇ ਤੁਰੰਤ ਪ੍ਰਭਾਵ ਤੋਂ ਪਰੇ, AI ਵਿੱਚ ਨਕਲੀ ਓਪਨ ਸੋਰਸ ਦਾ ਪ੍ਰਚਲਨ ਮਹੱਤਵਪੂਰਨ ਆਰਥਿਕ ਅਤੇ ਮਾਰਕੀਟ ਪ੍ਰਭਾਵ ਰੱਖਦਾ ਹੈ। ਵੱਡੇ ਬੁਨਿਆਦੀ ਮਾਡਲਾਂ ਦੇ ਵਿਕਾਸ ਲਈ ਨਾ ਸਿਰਫ਼ ਮਹੱਤਵਪੂਰਨ ਮੁਹਾਰਤ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ ਬਲਕਿ ਵਿਸ਼ਾਲ ਡਾਟਾਸੈਟਾਂ ਅਤੇ ਭਾਰੀ ਕੰਪਿਊਟੇਸ਼ਨਲ ਸ਼ਕਤੀ ਤੱਕ ਪਹੁੰਚ ਦੀ ਵੀ ਲੋੜ ਹੁੰਦੀ ਹੈ - ਸਰੋਤ ਜੋ ਵੱਡੀਆਂ ਤਕਨਾਲੋਜੀ ਕਾਰਪੋਰੇਸ਼ਨਾਂ ਕੋਲ ਅਸਪਸ਼ਟ ਤੌਰ ‘ਤੇ ਹੁੰਦੇ ਹਨ।

ਜਦੋਂ ਇਹ ਕਾਰਪੋਰੇਸ਼ਨਾਂ ‘ਓਪਨ ਸੋਰਸ’ ਬੈਨਰ ਹੇਠ ਮਾਡਲ ਜਾਰੀ ਕਰਦੀਆਂ ਹਨ ਪਰ ਮਹੱਤਵਪੂਰਨ ਸਿਖਲਾਈ ਡਾਟਾ ‘ਤੇ ਨਿਯੰਤਰਣ ਬਰਕਰਾਰ ਰੱਖਦੀਆਂ ਹਨ ਜਾਂ ਪ੍ਰਤਿਬੰਧਿਤ ਲਾਇਸੈਂਸ ਲਗਾਉਂਦੀਆਂ ਹਨ, ਤਾਂ ਇਹ ਇੱਕ ਅਸਮਾਨ ਖੇਡ ਦਾ ਮੈਦਾਨ