AI 'ਓਪਨ ਸੋਰਸ' ਧੋਖਾ: ਵਿਗਿਆਨਕ ਇਮਾਨਦਾਰੀ ਦੀ ਲੋੜ

ਇੱਕ ਬੁਨਿਆਦੀ ਸੰਕਲਪ ਦਾ ਮੁੱਲ ਘਟਾਉਣਾ: ‘ਓਪਨ ਸੋਰਸ’ ਦਾ ਖੋਰਾ

‘ਓਪਨ ਸੋਰਸ’ ਸ਼ਬਦ ਕਦੇ ਤਕਨੀਕੀ ਅਤੇ ਵਿਗਿਆਨਕ ਖੇਤਰਾਂ ਵਿੱਚ ਇੱਕ ਰੋਸ਼ਨੀ ਦਾ ਪ੍ਰਤੀਕ ਸੀ। ਇਹ ਪਾਰਦਰਸ਼ਤਾ, ਬੇਰੋਕ ਪਹੁੰਚ, ਸਹਿਯੋਗੀ ਸੁਧਾਰ, ਅਤੇ ਪੁਨਰ-ਉਤਪਾਦਨ ਦੇ ਬੁਨਿਆਦੀ ਸਿਧਾਂਤ ‘ਤੇ ਅਧਾਰਤ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਨੈਤਿਕਤਾ ਨੂੰ ਦਰਸਾਉਂਦਾ ਸੀ। ਖੋਜਕਰਤਾਵਾਂ ਅਤੇ ਡਿਵੈਲਪਰਾਂ ਦੀਆਂ ਪੀੜ੍ਹੀਆਂ ਲਈ, ਇਸਨੇ ਸਾਂਝੇ ਗਿਆਨ ਅਤੇ ਸਮੂਹਿਕ ਤਰੱਕੀ ਪ੍ਰਤੀ ਵਚਨਬੱਧਤਾ ਦਾ ਸੰਕੇਤ ਦਿੱਤਾ। R Studio ਵਰਗੇ ਵਾਤਾਵਰਣਾਂ ਵਿੱਚ ਪਾਏ ਜਾਣ ਵਾਲੇ ਬੁਨਿਆਦੀ ਅੰਕੜਾ ਸਾਧਨਾਂ ਤੋਂ, ਜੋ ਅਨੇਕਾਂ ਵਿਸ਼ਿਆਂ ਵਿੱਚ ਅਣਗਿਣਤ ਵਿਸ਼ਲੇਸ਼ਣਾਂ ਨੂੰ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ, OpenFOAM ਵਰਗੇ ਗੁੰਝਲਦਾਰ ਸਿਮੂਲੇਸ਼ਨ ਪਲੇਟਫਾਰਮਾਂ ਤੱਕ, ਜੋ ਤਰਲ ਗਤੀਸ਼ੀਲਤਾ ਦੀਆਂ ਜਟਿਲਤਾਵਾਂ ਨੂੰ ਖੋਲ੍ਹਣ ਲਈ ਵਰਤੇ ਜਾਂਦੇ ਹਨ, ਓਪਨ-ਸੋਰਸ ਸਾਫਟਵੇਅਰ ਨਵੀਨਤਾ ਲਈ ਇੱਕ ਲਾਜ਼ਮੀ ਉਤਪ੍ਰੇਰਕ ਰਿਹਾ ਹੈ। ਇਸਨੇ ਵਿਸ਼ਵ ਪੱਧਰ ‘ਤੇ ਵਿਗਿਆਨੀਆਂ ਨੂੰ ਇੱਕ ਦੂਜੇ ਦੇ ਕੰਮ ਦੀ ਜਾਂਚ, ਤਸਦੀਕ, ਸੋਧ ਅਤੇ ਉਸ ‘ਤੇ ਨਿਰਮਾਣ ਕਰਨ ਦੀ ਆਗਿਆ ਦੇ ਕੇ ਖੋਜ ਨੂੰ ਤੇਜ਼ ਕੀਤਾ, ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦੇ ਹੋਏ ਕਿ ਖੋਜਾਂ ਨੂੰ ਦੁਹਰਾਇਆ ਅਤੇ ਪ੍ਰਮਾਣਿਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ - ਵਿਗਿਆਨਕ ਵਿਧੀ ਦਾ ਅਸਲ ਆਧਾਰ।

ਹਾਲਾਂਕਿ, ਹੁਣ ਇਸ ਭਰੋਸੇਯੋਗ ਅਹੁਦੇ ‘ਤੇ ਇੱਕ ਪਰਛਾਵਾਂ ਮੰਡਰਾ ਰਿਹਾ ਹੈ, ਜੋ ਕਿ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ (AI) ਦੇ ਵਧ ਰਹੇ ਖੇਤਰ ਦੁਆਰਾ ਪਾਇਆ ਗਿਆ ਹੈ। ਜਿਵੇਂ ਕਿ ਹਾਲ ਹੀ ਦੀਆਂ ਆਲੋਚਨਾਤਮਕ ਚਰਚਾਵਾਂ ਵਿੱਚ ਉਜਾਗਰ ਕੀਤਾ ਗਿਆ ਹੈ, ਜਿਸ ਵਿੱਚ Nature ਵਰਗੇ ਪ੍ਰਕਾਸ਼ਨਾਂ ਦੁਆਰਾ ਨੋਟ ਕੀਤੇ ਗਏ ਹਨ, ਇੱਕ ਚਿੰਤਾਜਨਕ ਰੁਝਾਨ ਸਾਹਮਣੇ ਆਇਆ ਹੈ ਜਿੱਥੇ ਪ੍ਰਮੁੱਖ AI ਡਿਵੈਲਪਰ ਆਪਣੇ ਮਾਡਲਾਂ ਲਈ ‘ਓਪਨ ਸੋਰਸ’ ਲੇਬਲ ਅਪਣਾਉਂਦੇ ਹਨ ਜਦੋਂ ਕਿ ਅਸਲ ਖੁੱਲ੍ਹੇਪਣ ਲਈ ਜ਼ਰੂਰੀ ਮਹੱਤਵਪੂਰਨ ਭਾਗਾਂ ਨੂੰ ਰੋਕਦੇ ਹਨ। ਇਹ ਅਭਿਆਸ ਸ਼ਬਦ ਦੇ ਅਰਥ ਨੂੰ ਪਤਲਾ ਕਰਨ ਦਾ ਖ਼ਤਰਾ ਪੈਦਾ ਕਰਦਾ ਹੈ, ਇਸਨੂੰ ਪਾਰਦਰਸ਼ਤਾ ਦੇ ਪ੍ਰਤੀਕ ਤੋਂ ਇੱਕ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਗੁੰਮਰਾਹਕੁੰਨ ਮਾਰਕੀਟਿੰਗ ਨਾਅਰੇ ਵਿੱਚ ਬਦਲਦਾ ਹੈ। ਮੁੱਖ ਮੁੱਦਾ ਅਕਸਰ ਆਧੁਨਿਕ AI ਪ੍ਰਣਾਲੀਆਂ ਦੀ ਵਿਲੱਖਣ ਪ੍ਰਕਿਰਤੀ ਵਿੱਚ ਹੁੰਦਾ ਹੈ। ਰਵਾਇਤੀ ਸਾਫਟਵੇਅਰ ਦੇ ਉਲਟ ਜਿੱਥੇ ਸੋਰਸ ਕੋਡ ਸਰਵਉੱਚ ਹੁੰਦਾ ਹੈ, ਵੱਡੇ AI ਮਾਡਲਾਂ ਦੀ ਸ਼ਕਤੀ ਅਤੇ ਵਿਵਹਾਰ ਉਹਨਾਂ ਦੀ ਸਿਖਲਾਈ ਲਈ ਵਰਤੇ ਗਏ ਵਿਸ਼ਾਲ ਡੇਟਾਸੈਟਾਂ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨ ਵਾਲੇ ਗੁੰਝਲਦਾਰ ਆਰਕੀਟੈਕਚਰ ਨਾਲ ਅਟੁੱਟ ਤੌਰ ‘ਤੇ ਜੁੜੇ ਹੋਏ ਹਨ। ਜਦੋਂ ਇਸ ਸਿਖਲਾਈ ਡੇਟਾ ਜਾਂ ਮਾਡਲ ਦੇ ਨਿਰਮਾਣ ਅਤੇ ਵਜ਼ਨ ਬਾਰੇ ਵਿਸਤ੍ਰਿਤ ਜਾਣਕਾਰੀ ਤੱਕ ਪਹੁੰਚ ਪ੍ਰਤਿਬੰਧਿਤ ਹੁੰਦੀ ਹੈ, ਤਾਂ ‘ਓਪਨ ਸੋਰਸ’ ਹੋਣ ਦਾ ਦਾਅਵਾ ਖੋਖਲਾ ਲੱਗਦਾ ਹੈ, ਭਾਵੇਂ ਮਾਡਲ ਦੇ ਕੋਡ ਦਾ ਕੁਝ ਹਿੱਸਾ ਉਪਲਬਧ ਕਰਵਾਇਆ ਗਿਆ ਹੋਵੇ। ਇਹ ਅੰਤਰ ਓਪਨ-ਸੋਰਸ ਫਲਸਫੇ ਦੇ ਦਿਲ ‘ਤੇ ਹਮਲਾ ਕਰਦਾ ਹੈ, ਪਹੁੰਚਯੋਗਤਾ ਦਾ ਭਰਮ ਪੈਦਾ ਕਰਦਾ ਹੈ ਜਦੋਂ ਕਿ ਸੁਤੰਤਰ ਜਾਂਚ ਅਤੇ ਪ੍ਰਤੀਕ੍ਰਿਤੀ ਲਈ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਤੱਤਾਂ ਨੂੰ ਅਸਪਸ਼ਟ ਕਰਦਾ ਹੈ।

ਵਿਗਿਆਨਕ AI ਵਿੱਚ ਸੱਚੀ ਖੁੱਲ੍ਹ ਦੀ ਲਾਜ਼ਮੀਅਤ

AI ਵਿੱਚ, ਖਾਸ ਤੌਰ ‘ਤੇ ਵਿਗਿਆਨਕ ਖੇਤਰ ਵਿੱਚ, ਸੱਚੀ ਖੁੱਲ੍ਹ ਨੂੰ ਬਣਾਈ ਰੱਖਣ ਨਾਲ ਜੁੜੇ ਦਾਅ ਇਸ ਤੋਂ ਵੱਧ ਨਹੀਂ ਹੋ ਸਕਦੇ। ਵਿਗਿਆਨ ਨਤੀਜਿਆਂ ਦੀ ਸੁਤੰਤਰ ਤੌਰ ‘ਤੇ ਪੁਸ਼ਟੀ ਕਰਨ, ਕਾਰਜਪ੍ਰਣਾਲੀਆਂ ਨੂੰ ਸਮਝਣ ਅਤੇ ਪਿਛਲੇ ਕੰਮ ‘ਤੇ ਨਿਰਮਾਣ ਕਰਨ ਦੀ ਯੋਗਤਾ ‘ਤੇ ਵਧਦਾ-ਫੁੱਲਦਾ ਹੈ। ਜਦੋਂ ਸਾਧਨ ਖੁਦ - ਵੱਧ ਤੋਂ ਵੱਧ ਗੁੰਝਲਦਾਰ AI ਮਾਡਲ - ਬਲੈਕ ਬਾਕਸ ਬਣ ਜਾਂਦੇ ਹਨ, ਤਾਂ ਇਹ ਬੁਨਿਆਦੀ ਪ੍ਰਕਿਰਿਆ ਖਤਰੇ ਵਿੱਚ ਪੈ ਜਾਂਦੀ ਹੈ। AI ਪ੍ਰਣਾਲੀਆਂ ‘ਤੇ ਭਰੋਸਾ ਕਰਨਾ ਜਿਨ੍ਹਾਂ ਦੇ ਅੰਦਰੂਨੀ ਕਾਰਜ, ਸਿਖਲਾਈ ਡੇਟਾ ਪੱਖਪਾਤ, ਜਾਂ ਸੰਭਾਵੀ ਅਸਫਲਤਾ ਮੋਡ ਅਪਾਰਦਰਸ਼ੀ ਹਨ, ਖੋਜ ਵਿੱਚ ਅਸਵੀਕਾਰਨਯੋਗ ਪੱਧਰ ਦੀ ਅਨਿਸ਼ਚਿਤਤਾ ਪੇਸ਼ ਕਰਦਾ ਹੈ। ਇੱਕ ਵਿਗਿਆਨੀ ਭਰੋਸੇ ਨਾਲ AI ਦੇ ਆਉਟਪੁੱਟ ‘ਤੇ ਸਿੱਟੇ ਕਿਵੇਂ ਕੱਢ ਸਕਦਾ ਹੈ ਜੇਕਰ ਉਸ ਆਉਟਪੁੱਟ ਨੂੰ ਆਕਾਰ ਦੇਣ ਵਾਲੇ ਕਾਰਕ ਅਣਜਾਣ ਜਾਂ ਅਪ੍ਰਮਾਣਿਤ ਹਨ? ਭਾਈਚਾਰਾ ਮਲਕੀਅਤ ਪ੍ਰਣਾਲੀਆਂ ਦੁਆਰਾ ਤਿਆਰ ਕੀਤੇ ਗਏ ਖੋਜਾਂ ‘ਤੇ ਕਿਵੇਂ ਭਰੋਸਾ ਕਰ ਸਕਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਦਾ ਸੁਤੰਤਰ ਤੌਰ ‘ਤੇ ਆਡਿਟ ਜਾਂ ਪ੍ਰਤੀਕ੍ਰਿਤੀ ਨਹੀਂ ਕੀਤੀ ਜਾ ਸਕਦੀ?

ਵਿਗਿਆਨ ਵਿੱਚ ਓਪਨ-ਸੋਰਸ ਸਾਫਟਵੇਅਰ ਦੀ ਇਤਿਹਾਸਕ ਸਫਲਤਾ ਇੱਕ ਸਪੱਸ਼ਟ ਵਿਪਰੀਤ ਅਤੇ ਇੱਕ ਸਪੱਸ਼ਟ ਬੈਂਚਮਾਰਕ ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ। ਰਵਾਇਤੀ ਓਪਨ-ਸੋਰਸ ਪ੍ਰੋਜੈਕਟਾਂ ਵਿੱਚ ਮੌਜੂਦ ਪਾਰਦਰਸ਼ਤਾ ਨੇ ਵਿਸ਼ਵਾਸ ਨੂੰ ਵਧਾਇਆ ਅਤੇ ਮਜ਼ਬੂਤ ਪੀਅਰ ਸਮੀਖਿਆ ਨੂੰ ਸਮਰੱਥ ਬਣਾਇਆ। ਖੋਜਕਰਤਾ ਐਲਗੋਰਿਦਮ ਦੀ ਜਾਂਚ ਕਰ ਸਕਦੇ ਹਨ, ਉਹਨਾਂ ਦੀਆਂ ਸੀਮਾਵਾਂ ਨੂੰ ਸਮਝ ਸਕਦੇ ਹਨ, ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਖਾਸ ਲੋੜਾਂ ਲਈ ਅਨੁਕੂਲ ਬਣਾ ਸਕਦੇ ਹਨ। ਇਸ ਸਹਿਯੋਗੀ ਵਾਤਾਵਰਣ ਪ੍ਰਣਾਲੀ ਨੇ ਬਾਇਓਇਨਫੋਰਮੈਟਿਕਸ ਤੋਂ ਲੈ ਕੇ ਐਸਟ੍ਰੋਫਿਜ਼ਿਕਸ ਤੱਕ ਦੇ ਖੇਤਰਾਂ ਵਿੱਚ ਤਰੱਕੀ ਨੂੰ ਤੇਜ਼ ਕੀਤਾ। ਵਿਗਿਆਨਕ ਖੋਜ ਵਿੱਚ ਕ੍ਰਾਂਤੀ ਲਿਆਉਣ ਦੀ AI ਦੀ ਸੰਭਾਵਨਾ ਬਹੁਤ ਜ਼ਿਆਦਾ ਹੈ, ਗੁੰਝਲਦਾਰ ਡੇਟਾਸੈਟਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ, ਪਰਿਕਲਪਨਾਵਾਂ ਪੈਦਾ ਕਰਨ, ਅਤੇ ਬੇਮਿਸਾਲ ਪੈਮਾਨਿਆਂ ‘ਤੇ ਗੁੰਝਲਦਾਰ ਪ੍ਰਕਿਰਿਆਵਾਂ ਦੀ ਨਕਲ ਕਰਨ ਦਾ ਵਾਅਦਾ ਕਰਦੀ ਹੈ। ਹਾਲਾਂਕਿ, ਇਸ ਸੰਭਾਵਨਾ ਨੂੰ ਸਾਕਾਰ ਕਰਨਾ ਪਾਰਦਰਸ਼ਤਾ ਅਤੇ ਪੁਨਰ-ਉਤਪਾਦਨ ਦੇ ਉਹੀ ਸਿਧਾਂਤਾਂ ਨੂੰ ਬਣਾਈ ਰੱਖਣ ‘ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਨੇ ਹਮੇਸ਼ਾ ਵਿਗਿਆਨਕ ਤਰੱਕੀ ਨੂੰ ਆਧਾਰ ਦਿੱਤਾ ਹੈ। ਬੰਦ, ਮਲਕੀਅਤ ਵਾਲੇ AI ਪ੍ਰਣਾਲੀਆਂ ਵੱਲ ਇੱਕ ਤਬਦੀਲੀ, ਭਾਵੇਂ ਉਹ ‘ਖੁੱਲ੍ਹੇ’ ਵਜੋਂ ਭੇਸ ਵਿੱਚ ਹੋਣ, ਖੋਜ ਭਾਈਚਾਰੇ ਨੂੰ ਵੰਡਣ, ਸਹਿਯੋਗ ਵਿੱਚ ਰੁਕਾਵਟ ਪਾਉਣ, ਅਤੇ ਅੰਤ ਵਿੱਚ ਸਮਝ ਅਤੇ ਪ੍ਰਮਾਣਿਕਤਾ ਵਿੱਚ ਰੁਕਾਵਟਾਂ ਖੜ੍ਹੀਆਂ ਕਰਕੇ ਖੋਜ ਦੀ ਗਤੀ ਨੂੰ ਹੌਲੀ ਕਰਨ ਦਾ ਖ਼ਤਰਾ ਹੈ। ਵਿਗਿਆਨਕ ਯਤਨਾਂ ਲਈ ਅਜਿਹੇ ਸਾਧਨਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ ਜੋ ਸਿਰਫ਼ ਸ਼ਕਤੀਸ਼ਾਲੀ ਹੀ ਨਹੀਂ, ਸਗੋਂ ਪਾਰਦਰਸ਼ੀ ਅਤੇ ਭਰੋਸੇਮੰਦ ਵੀ ਹੋਣ।

ਡਾਟਾ ਦੀ ਗੁੰਝਲ: AI ਦੀ ਪਾਰਦਰਸ਼ਤਾ ਚੁਣੌਤੀ

AI ਵਿੱਚ ‘ਓਪਨ ਸੋਰਸ’ ਬਹਿਸ ਦੇ ਕੇਂਦਰ ਵਿੱਚ ਸਿਖਲਾਈ ਡਾਟਾ ਦਾ ਨਾਜ਼ੁਕ ਮੁੱਦਾ ਹੈ। ਰਵਾਇਤੀ ਸਾਫਟਵੇਅਰ ਦੇ ਉਲਟ ਜੋ ਮੁੱਖ ਤੌਰ ‘ਤੇ ਇਸਦੇ ਕੋਡ ਦੁਆਰਾ ਪਰਿਭਾਸ਼ਿਤ ਹੁੰਦਾ ਹੈ, ਵੱਡੇ ਭਾਸ਼ਾਈ ਮਾਡਲ (LLMs) ਅਤੇ ਹੋਰ ਬੁਨਿਆਦੀ AI ਪ੍ਰਣਾਲੀਆਂ ਮੂਲ ਰੂਪ ਵਿੱਚ ਉਹਨਾਂ ਵਿਸ਼ਾਲ ਡੇਟਾਸੈਟਾਂ ਦੁਆਰਾ ਆਕਾਰ ਦਿੱਤੀਆਂ ਜਾਂਦੀਆਂ ਹਨ ਜੋ ਉਹ ਆਪਣੇ ਵਿਕਾਸ ਦੌਰਾਨ ਗ੍ਰਹਿਣ ਕਰਦੇ ਹਨ। ਇਸ ਡਾਟਾ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ, ਪੱਖਪਾਤ ਅਤੇ ਉਤਪਤੀ ਮਾਡਲ ਦੇ ਵਿਵਹਾਰ, ਇਸਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਅਤੇ ਇਸਦੀਆਂ ਸੰਭਾਵੀ ਸੀਮਾਵਾਂ ਨੂੰ ਡੂੰਘਾਈ ਨਾਲ ਪ੍ਰਭਾਵਤ ਕਰਦੀਆਂ ਹਨ। ਇਸ ਲਈ, AI ਵਿੱਚ ਸੱਚੀ ਖੁੱਲ੍ਹ ਲਈ ਇਸ ਡਾਟਾ ਦੇ ਸਬੰਧ ਵਿੱਚ ਪਾਰਦਰਸ਼ਤਾ ਦੇ ਇੱਕ ਪੱਧਰ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ ਜੋ ਸਿਰਫ਼ ਮਾਡਲ ਵਜ਼ਨ ਜਾਂ ਅਨੁਮਾਨ ਕੋਡ ਜਾਰੀ ਕਰਨ ਤੋਂ ਕਿਤੇ ਵੱਧ ਹੈ।

ਵਰਤਮਾਨ ਵਿੱਚ ‘ਓਪਨ ਸੋਰਸ’ ਛਤਰੀ ਹੇਠ ਮਾਰਕੀਟ ਕੀਤੇ ਗਏ ਬਹੁਤ ਸਾਰੇ ਮਾਡਲ ਇਸ ਮੋਰਚੇ ‘ਤੇ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਘੱਟ ਹਨ। Meta ਦੀ Llama ਸੀਰੀਜ਼, Microsoft ਦਾ Phi-2, ਜਾਂ Mistral AI ਦਾ Mixtral ਵਰਗੇ ਪ੍ਰਮੁੱਖ ਉਦਾਹਰਣਾਂ ‘ਤੇ ਗੌਰ ਕਰੋ। ਜਦੋਂ ਕਿ ਇਹ ਕੰਪਨੀਆਂ ਕੁਝ ਭਾਗ ਜਾਰੀ ਕਰਦੀਆਂ ਹਨ, ਜਿਸ ਨਾਲ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਮਾਡਲਾਂ ਨੂੰ ਚਲਾਉਣ ਜਾਂ ਫਾਈਨ-ਟਿਊਨ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਮਿਲਦੀ ਹੈ, ਉਹ ਅਕਸਰ ਮਹੱਤਵਪੂਰਨ ਪਾਬੰਦੀਆਂ ਲਗਾਉਂਦੀਆਂ ਹਨ ਜਾਂ ਅੰਤਰੀਵ ਸਿਖਲਾਈ ਡਾਟਾ ਬਾਰੇ ਬਹੁਤ ਘੱਟ ਵੇਰਵੇ ਪ੍ਰਦਾਨ ਕਰਦੀਆਂ ਹਨ। ਸ਼ਾਮਲ ਡੇਟਾਸੈਟ ਵਿਸ਼ਾਲ, ਮਲਕੀਅਤ ਵਾਲੇ, ਬਹੁਤ ਘੱਟ ਕਯੂਰੇਸ਼ਨ ਨਾਲ ਵੈੱਬ ਤੋਂ ਸਕ੍ਰੈਪ ਕੀਤੇ ਗਏ, ਜਾਂ ਲਾਇਸੈਂਸਿੰਗ ਪਾਬੰਦੀਆਂ ਦੇ ਅਧੀਨ ਹੋ ਸਕਦੇ ਹਨ, ਜਿਸ ਨਾਲ ਪੂਰੀ ਜਨਤਕ ਰਿਲੀਜ਼ ਚੁਣੌਤੀਪੂਰਨ ਜਾਂ ਅਸੰਭਵ ਹੋ ਜਾਂਦੀ ਹੈ। ਹਾਲਾਂਕਿ, ਇਸ ਬਾਰੇ ਵਿਆਪਕ ਜਾਣਕਾਰੀ ਤੋਂ ਬਿਨਾਂ:

  • ਡਾਟਾ ਸਰੋਤ: ਜਾਣਕਾਰੀ ਕਿੱਥੋਂ ਆਈ? ਕੀ ਇਹ ਮੁੱਖ ਤੌਰ ‘ਤੇ ਟੈਕਸਟ, ਚਿੱਤਰ, ਕੋਡ ਸੀ? ਕਿਹੜੀਆਂ ਵੈੱਬਸਾਈਟਾਂ, ਕਿਤਾਬਾਂ ਜਾਂ ਡਾਟਾਬੇਸ ਤੋਂ?
  • ਡਾਟਾ ਕਯੂਰੇਸ਼ਨ: ਡਾਟਾ ਨੂੰ ਕਿਵੇਂ ਫਿਲਟਰ, ਸਾਫ਼ ਅਤੇ ਪ੍ਰੋਸੈਸ ਕੀਤਾ ਗਿਆ ਸੀ? ਜਾਣਕਾਰੀ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨ ਜਾਂ ਬਾਹਰ ਕੱਢਣ ਲਈ ਕਿਹੜੇ ਮਾਪਦੰਡ ਵਰਤੇ ਗਏ ਸਨ?
  • ਡਾਟਾ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ: ਡਾਟਾ ਦੇ ਅੰਦਰ ਜਾਣੇ-ਪਛਾਣੇ ਪੱਖਪਾਤ ਕੀ ਹਨ (ਉਦਾਹਰਨ ਲਈ, ਜਨਸੰਖਿਆ, ਸੱਭਿਆਚਾਰਕ, ਭਾਸ਼ਾਈ)? ਇਹ ਕਿਸ ਸਮੇਂ ਦੀ ਮਿਆਦ ਨੂੰ ਕਵਰ ਕਰਦਾ ਹੈ?
  • ਪ੍ਰੀਪ੍ਰੋਸੈਸਿੰਗ ਕਦਮ: ਸਿਖਲਾਈ ਤੋਂ ਪਹਿਲਾਂ ਡਾਟਾ ‘ਤੇ ਕਿਹੜੇ ਪਰਿਵਰਤਨ ਲਾਗੂ ਕੀਤੇ ਗਏ ਸਨ?

…ਸੁਤੰਤਰ ਖੋਜਕਰਤਾਵਾਂ ਲਈ ਮਾਡਲ ਦੇ ਵਿਵਹਾਰ ਨੂੰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਸਮਝਣਾ, ਇਸਦੇ ਵਿਕਾਸ ਨੂੰ ਦੁਹਰਾਉਣਾ, ਜਾਂ ਇਸਦੇ ਸੰਭਾਵੀ ਪੱਖਪਾਤ ਅਤੇ ਅਸਫਲਤਾ ਬਿੰਦੂਆਂ ਦਾ ਆਲੋਚਨਾਤਮਕ ਮੁਲਾਂਕਣ ਕਰਨਾ ਬਹੁਤ ਮੁਸ਼ਕਲ ਹੋ ਜਾਂਦਾ ਹੈ। ਡਾਟਾ ਪਾਰਦਰਸ਼ਤਾ ਦੀ ਇਹ ਘਾਟ ਮੁੱਖ ਕਾਰਨ ਹੈ ਕਿ ਬਹੁਤ ਸਾਰੀਆਂ ਮੌਜੂਦਾ ‘ਓਪਨ ਸੋਰਸ’ AI ਰਿਲੀਜ਼ਾਂ ਸਾਫਟਵੇਅਰ ਸੰਸਾਰ ਵਿੱਚ ਸਥਾਪਤ ਅਸਲ ਖੁੱਲ੍ਹੇਪਣ ਦੀ ਭਾਵਨਾ, ਜੇ ਪੱਤਰ ਨਹੀਂ, ਨੂੰ ਪੂਰਾ ਕਰਨ ਵਿੱਚ ਅਸਫਲ ਰਹਿੰਦੀਆਂ ਹਨ। ਇਸਦੇ ਉਲਟ, Allen Institute for AI ਦੇ OLMo ਮਾਡਲ ਵਰਗੀਆਂ ਪਹਿਲਕਦਮੀਆਂ ਜਾਂ LLM360 ਦੇ CrystalCoder ਵਰਗੇ ਭਾਈਚਾਰੇ ਦੁਆਰਾ ਸੰਚਾਲਿਤ ਯਤਨਾਂ ਨੇ ਆਪਣੇ ਡਾਟਾ ਅਤੇ ਸਿਖਲਾਈ ਵਿਧੀਆਂ ਦੇ ਸਬੰਧ ਵਿੱਚ ਵਧੇਰੇ ਪਾਰਦਰਸ਼ਤਾ ਪ੍ਰਦਾਨ ਕਰਨ ਲਈ ਵਧੇਰੇ ਠੋਸ ਯਤਨ ਕੀਤੇ ਹਨ, ਇੱਕ ਉੱਚ ਮਿਆਰ ਸਥਾਪਤ ਕੀਤਾ ਹੈ ਜੋ ਰਵਾਇਤੀ ਓਪਨ-ਸੋਰਸ ਮੁੱਲਾਂ ਨਾਲ ਵਧੇਰੇ ਮੇਲ ਖਾਂਦਾ ਹੈ।

‘ਓਪਨਵਾਸ਼ਿੰਗ’: ਰਣਨੀਤਕ ਲੇਬਲਿੰਗ ਜਾਂ ਰੈਗੂਲੇਟਰੀ ਸਾਈਡਸਟੈਪ?

ਉਹਨਾਂ ਸੰਸਥਾਵਾਂ ਦੁਆਰਾ ‘ਓਪਨ ਸੋਰਸ’ ਲੇਬਲ ਦੀ ਵਰਤੋਂ ਜੋ ਇਸਦੇ ਸਿਧਾਂਤਾਂ ਨੂੰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਨਹੀਂ ਅਪਣਾਉਂਦੀਆਂ, ਨੇ ‘ਓਪਨਵਾਸ਼ਿੰਗ’ ਬਾਰੇ ਚਿੰਤਾਵਾਂ ਪੈਦਾ ਕੀਤੀਆਂ ਹਨ। ਇਹ ਸ਼ਬਦ ਜਨਤਕ ਸੰਬੰਧਾਂ ਦੇ ਲਾਭਾਂ ਜਾਂ ਰਣਨੀਤਕ ਲਾਭ ਲਈ ਖੁੱਲ੍ਹੇਪਣ ਦੇ ਸਕਾਰਾਤਮਕ ਅਰਥਾਂ ਦਾ ਲਾਭ ਉਠਾਉਣ ਦੇ ਅਭਿਆਸ ਦਾ ਵਰਣਨ ਕਰਦਾ ਹੈ, ਬਿਨਾਂ ਪਾਰਦਰਸ਼ਤਾ ਅਤੇ ਪਹੁੰਚਯੋਗਤਾ ਦੇ ਸੰਬੰਧਿਤ ਪੱਧਰ ਪ੍ਰਤੀ ਵਚਨਬੱਧ ਹੋਏ। ਕੰਪਨੀਆਂ ਇਸ ਵਿੱਚ ਕਿਉਂ ਸ਼ਾਮਲ ਹੋ ਸਕਦੀਆਂ ਹਨ? ਕਈ ਕਾਰਕ ਕੰਮ ਕਰ ਸਕਦੇ ਹਨ। ‘ਓਪਨ ਸੋਰਸ’ ਬ੍ਰਾਂਡ ਮਹੱਤਵਪੂਰਨ ਸਦਭਾਵਨਾ ਰੱਖਦਾ ਹੈ, ਭਾਈਚਾਰੇ ਅਤੇ ਸਾਂਝੀ ਤਰੱਕੀ ਪ੍ਰਤੀ ਵਚਨਬੱਧਤਾ ਦਾ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ, ਜੋ ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਗਾਹਕਾਂ ਲਈ ਆਕਰਸ਼ਕ ਹੋ ਸਕਦਾ ਹੈ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, ਜਿਵੇਂ ਕਿ Nature ਅਤੇ ਹੋਰ ਨਿਰੀਖਕਾਂ ਦੁਆਰਾ ਨੋਟ ਕੀਤਾ ਗਿਆ ਹੈ, ਰੈਗੂਲੇਟਰੀ ਲੈਂਡਸਕੇਪ ਅਣਜਾਣੇ ਵਿੱਚ ਅਜਿਹੇ ਵਿਵਹਾਰ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰ ਸਕਦੇ ਹਨ। ਯੂਰਪੀਅਨ ਯੂਨੀਅਨ ਦਾ ਇਤਿਹਾਸਕ AI ਐਕਟ, ਜਿਸਨੂੰ 2024 ਵਿੱਚ ਅੰਤਿਮ ਰੂਪ ਦਿੱਤਾ ਗਿਆ ਸੀ, ਵਿੱਚ ਅਜਿਹੇ ਪ੍ਰਬੰਧ ਸ਼ਾਮਲ ਹਨ ਜੋ ਉੱਚ-ਜੋਖਮ ਅਤੇ ਆਮ-ਉਦੇਸ਼ ਵਾਲੇ AI ਪ੍ਰਣਾਲੀਆਂ ‘ਤੇ ਸਖ਼ਤ ਲੋੜਾਂ ਲਾਗੂ ਕਰਦੇ ਹਨ। ਹਾਲਾਂਕਿ, ਇਸ ਵਿੱਚ ਓਪਨ-ਸੋਰਸ ਲਾਇਸੈਂਸਾਂ ਦੇ ਤਹਿਤ ਜਾਰੀ ਕੀਤੇ ਗਏ AI ਮਾਡਲਾਂ ਲਈ ਸੰਭਾਵੀ ਛੋਟਾਂ ਜਾਂ ਹਲਕੀਆਂ ਲੋੜਾਂ ਵੀ ਸ਼ਾਮਲ ਹਨ। ਇਹ ਇੱਕ ਸੰਭਾਵੀ ਕਮਜ਼ੋਰੀ ਪੈਦਾ ਕਰਦਾ ਹੈ ਜਿੱਥੇ ਕੰਪਨੀਆਂ ਰਣਨੀਤਕ ਤੌਰ ‘ਤੇ ਆਪਣੇ ਮਾਡਲਾਂ ਨੂੰ ‘ਓਪਨ ਸੋਰਸ’ ਵਜੋਂ ਲੇਬਲ ਕਰ ਸਕਦੀਆਂ ਹਨ - ਭਾਵੇਂ ਸਿਖਲਾਈ ਡਾਟਾ ਵਰਗੇ ਮੁੱਖ ਭਾਗ ਪ੍ਰਤਿਬੰਧਿਤ ਰਹਿਣ - ਖਾਸ ਤੌਰ ‘ਤੇ ਰੈਗੂਲੇਟਰੀ ਰੁਕਾਵਟਾਂ ਨੂੰ ਨੈਵੀਗੇਟ ਕਰਨ ਅਤੇ ਵਧੇਰੇ ਸਖ਼ਤ ਪਾਲਣਾ ਜ਼ਿੰਮੇਵਾਰੀਆਂ ਤੋਂ ਬਚਣ ਲਈ।

ਰੈਗੂਲੇਟਰੀ ਆਰਬਿਟਰੇਜ ਦੀ ਇਹ ਸੰਭਾਵਨਾ ਡੂੰਘੀ ਚਿੰਤਾਜਨਕ ਹੈ। ਜੇਕਰ ‘ਓਪਨਵਾਸ਼ਿੰਗ’ ਸ਼ਕਤੀਸ਼ਾਲੀ AI ਪ੍ਰਣਾਲੀਆਂ ਨੂੰ ਸੁਰੱਖਿਆ, ਨਿਰਪੱਖਤਾ ਅਤੇ ਜਵਾਬਦੇਹੀ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣ ਦੇ ਉਦੇਸ਼ ਨਾਲ ਜਾਂਚ ਤੋਂ ਬਚਣ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ, ਤਾਂ ਇਹ ਨਿਯਮ ਦੇ ਅਸਲ ਉਦੇਸ਼ ਨੂੰ ਕਮਜ਼ੋਰ ਕਰਦੀ ਹੈ। ਇਹ ਵਿਗਿਆਨਕ ਭਾਈਚਾਰੇ ਨੂੰ ਵੀ ਇੱਕ ਅਸਥਿਰ ਸਥਿਤੀ ਵਿੱਚ ਰੱਖਦਾ ਹੈ। ਖੋਜਕਰਤਾ ਪੂਰੀ ਤਰ੍ਹਾਂ ਬੰਦ ਵਪਾਰਕ ਪੇਸ਼ਕਸ਼ਾਂ ਦੀ ਤੁਲਨਾ ਵਿੱਚ ਉਹਨਾਂ ਦੀ ਪਹੁੰਚਯੋਗਤਾ ਦੇ ਕਾਰਨ ਇਹਨਾਂ ਨਾਮਾਤਰ ‘ਖੁੱਲ੍ਹੇ’ ਪ੍ਰਣਾਲੀਆਂ ਵੱਲ ਖਿੱਚੇ ਜਾ ਸਕਦੇ ਹਨ, ਸਿਰਫ ਆਪਣੇ ਆਪ ਨੂੰ ਉਹਨਾਂ ਸਾਧਨਾਂ ‘ਤੇ ਨਿਰਭਰ ਪਾਉਣ ਲਈ ਜਿਨ੍ਹਾਂ ਦੀਆਂ ਕਾਰਜਪ੍ਰਣਾਲੀਆਂ ਅਪਾਰਦਰਸ਼ੀ ਅਤੇ ਅਪ੍ਰਮਾਣਿਤ ਰਹਿੰਦੀਆਂ ਹਨ। ਇਹ ਨਿਰਭਰਤਾ ਵਿਗਿਆਨਕ ਇਮਾਨਦਾਰੀ ਨਾਲ ਸਮਝੌਤਾ ਕਰਨ ਦਾ ਖ਼ਤਰਾ ਪੈਦਾ ਕਰਦੀ ਹੈ, ਜਿਸ ਨਾਲ ਇਹ ਯਕੀਨੀ ਬਣਾਉਣਾ ਔਖਾ ਹੋ ਜਾਂਦਾ ਹੈ ਕਿ ਖੋਜ ਪੁਨਰ-ਉਤਪਾਦਨਯੋਗ, ਨਿਰਪੱਖ ਹੈ, ਅਤੇ ਇੱਕ ਠੋਸ, ਸਮਝਣ ਯੋਗ ਨੀਂਹ ‘ਤੇ ਬਣੀ ਹੈ। ਇੱਕ ਜਾਣੇ-ਪਛਾਣੇ ਲੇਬਲ ਦਾ ਲਾਲਚ ਅੰਤਰੀਵ ਪਾਬੰਦੀਆਂ ਨੂੰ ਛੁਪਾ ਸਕਦਾ ਹੈ ਜੋ ਅਸਲ ਵਿਗਿਆਨਕ ਜਾਂਚ ਵਿੱਚ ਰੁਕਾਵਟ ਪਾਉਂਦੀਆਂ ਹਨ।

AI ਯੁੱਗ ਲਈ ਖੁੱਲ੍ਹੇਪਣ ਨੂੰ ਮੁੜ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨਾ: OSAID ਫਰੇਮਵਰਕ

AI ਦੁਆਰਾ ਪੈਦਾ ਹੋਈਆਂ ਵਿਲੱਖਣ ਚੁਣੌਤੀਆਂ ਲਈ ਰਵਾਇਤੀ ਓਪਨ-ਸੋਰਸ ਪਰਿਭਾਸ਼ਾਵਾਂ ਦੀ ਅਯੋਗਤਾ ਨੂੰ ਪਛਾਣਦੇ ਹੋਏ, Open Source Initiative (OSI) - ਓਪਨ-ਸੋਰਸ ਸਿਧਾਂਤਾਂ ਦਾ ਇੱਕ ਲੰਬੇ ਸਮੇਂ ਤੋਂ ਪ੍ਰਬੰਧਕ - ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਵਿਸ਼ਵਵਿਆਪੀ ਯਤਨ ਸ਼ੁਰੂ ਕਰ ਰਿਹਾ ਹੈ। ਉਹਨਾਂ ਦਾ ਟੀਚਾ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਲਈ ਵਿਸ਼ੇਸ਼ ਤੌਰ ‘ਤੇ ਤਿਆਰ ਕੀਤੀ ਗਈ ਇੱਕ ਸਪੱਸ਼ਟ, ਮਜ਼ਬੂਤ ਪਰਿਭਾਸ਼ਾ ਸਥਾਪਤ ਕਰਨਾ ਹੈ: Open Source AI Definition (OSAID 1.0)। ਇਹ ਪਹਿਲਕਦਮੀ AI ਦੇ ਸੰਦਰਭ ਵਿੱਚ ‘ਖੁੱਲ੍ਹੇ’ ਦੇ ਅਰਥ ਨੂੰ ਮੁੜ ਪ੍ਰਾਪਤ ਕਰਨ ਅਤੇ ਪਾਰਦਰਸ਼ਤਾ ਅਤੇ ਜਵਾਬਦੇਹੀ ਲਈ ਸਪੱਸ਼ਟ ਮਿਆਰ ਨਿਰਧਾਰਤ ਕਰਨ ਵੱਲ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਕਦਮ ਦਰਸਾਉਂਦੀ ਹੈ।

ਪ੍ਰਸਤਾਵਿਤ OSAID ਫਰੇਮਵਰਕ ਦੇ ਅੰਦਰ ਇੱਕ ਮੁੱਖ ਨਵੀਨਤਾ ‘ਡਾਟਾ ਜਾਣਕਾਰੀ’ ਦੀ ਧਾਰਨਾ ਹੈ। ਇਹ ਸਵੀਕਾਰ ਕਰਦੇ ਹੋਏ ਕਿ ਵਿਸ਼ਾਲ ਸਿਖਲਾਈ ਡੇਟਾਸੈਟਾਂ ਦੀ ਪੂਰੀ ਰਿਲੀਜ਼ ਅਕਸਰ ਗੋਪਨੀਯਤਾ ਦੀਆਂ ਚਿੰਤਾਵਾਂ, ਕਾਪੀਰਾਈਟ ਪਾਬੰਦੀਆਂ, ਜਾਂ ਸਿਰਫ਼ ਪੈਮਾਨੇ ਦੇ ਕਾਰਨ ਅਵਿਵਹਾਰਕ ਜਾਂ ਕਾਨੂੰਨੀ ਤੌਰ ‘ਤੇ ਵਰਜਿਤ ਹੋ ਸਕਦੀ ਹੈ, OSAID ਡਾਟਾ ਬਾਰੇ ਵਿਆਪਕ ਖੁਲਾਸੇ ਨੂੰ ਲਾਜ਼ਮੀ ਕਰਨ ‘ਤੇ ਕੇਂਦ੍ਰਤ ਕਰਦਾ ਹੈ। ਇਸ ਵਿੱਚ ਡਿਵੈਲਪਰਾਂ ਲਈ ਇਸ ਸਬੰਧ ਵਿੱਚ ਵਿਸਤ੍ਰਿਤ ਜਾਣਕਾਰੀ ਪ੍ਰਦਾਨ ਕਰਨ ਦੀਆਂ ਲੋੜਾਂ ਸ਼ਾਮਲ ਹਨ:

  1. ਸਰੋਤ ਅਤੇ ਰਚਨਾ: ਸਿਖਲਾਈ ਡਾਟਾ ਦੇ ਮੂਲ ਦੀ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਪਛਾਣ ਕਰਨਾ।
  2. ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ: ਡਾਟਾ ਦੇ ਅੰਦਰ ਜਾਣੀਆਂ-ਪਛਾਣੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ, ਸੀਮਾਵਾਂ ਅਤੇ ਸੰਭਾਵੀ ਪੱਖਪਾਤਾਂ ਦਾ ਦਸਤਾਵੇਜ਼ੀਕਰਨ ਕਰਨਾ।
  3. ਤਿਆਰੀ ਦੇ ਢੰਗ: ਸਿਖਲਾਈ ਲਈ ਡਾਟਾ ਨੂੰ ਸਾਫ਼ ਕਰਨ, ਫਿਲਟਰ ਕਰਨ ਅਤੇ ਤਿਆਰ ਕਰਨ ਲਈ ਵਰਤੀਆਂ ਜਾਂਦੀਆਂ ਪ੍ਰਕਿਰਿਆਵਾਂ ਦੀ ਵਿਆਖਿਆ ਕਰਨਾ।

ਭਾਵੇਂ ਕੱਚਾ ਡਾਟਾ ਸਾਂਝਾ ਨਹੀਂ ਕੀਤਾ ਜਾ ਸਕਦਾ, ਇਹ ਮੈਟਾਡੇਟਾ ਪ੍ਰਦਾਨ ਕਰਨਾ ਖੋਜਕਰਤਾਵਾਂ ਅਤੇ ਆਡੀਟਰਾਂ ਨੂੰ ਉਹਨਾਂ ਕਾਰਕਾਂ ਬਾਰੇ ਮਹੱਤਵਪੂਰਨ ਸਮਝ ਪ੍ਰਾਪਤ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਨੇ AI ਮਾਡਲ ਨੂੰ ਆਕਾਰ ਦਿੱਤਾ ਹੈ। ਇਹ ਸੰਭਾਵੀ ਪੱਖਪਾਤਾਂ ਦੀ ਬਿਹਤਰ ਸਮਝ ਦੀ ਸਹੂਲਤ ਦਿੰਦਾ ਹੈ, ਵਧੇਰੇ ਸੂਚਿਤ ਜੋਖਮ ਮੁਲਾਂਕਣਾਂ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦਾ ਹੈ, ਅਤੇ ਪ੍ਰਤੀਕ੍ਰਿਤੀ ਜਾਂ ਤੁਲਨਾਤਮਕ ਅਧਿਐਨਾਂ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਨ ਲਈ ਇੱਕ ਆਧਾਰ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।

ਡਾਟਾ ਜਾਣਕਾਰੀ ਤੋਂ ਪਰੇ, OSI ਦਾ ਯਤਨ, Open Future ਵਰਗੀਆਂ ਸੰਸਥਾਵਾਂ ਦੀ ਵਕਾਲਤ ਦੇ ਨਾਲ, ਇੱਕ ‘ਡਾਟਾ-ਕਾਮਨਜ਼’ ਮਾਡਲ ਵੱਲ ਇੱਕ ਵਿਆਪਕ ਤਬਦੀਲੀ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦਾ ਹੈ। ਇਹ ਇੱਕ ਅਜਿਹੇ ਭਵਿੱਖ ਦੀ ਕਲਪਨਾ ਕਰਦਾ ਹੈ ਜਿੱਥੇ AI ਸਿਖਲਾਈ ਲਈ ਜ਼ਰੂਰੀ ਡੇਟਾਸੈਟਾਂ ਨੂੰ ਵਧੇਰੇ ਖੁੱਲ੍ਹੇ ਅਤੇ ਬਰਾਬਰੀ ਨਾਲ ਤਿਆਰ ਅਤੇ ਉਪਲਬਧ ਕਰਵਾਇਆ ਜਾਂਦਾ ਹੈ, AI ਵਿਕਾਸ ਲਈ ਇੱਕ ਵਧੇਰੇ ਪਾਰਦਰਸ਼ੀ ਅਤੇ ਸਹਿਯੋਗੀ ਵਾਤਾਵਰਣ ਪ੍ਰਣਾਲੀ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦਾ ਹੈ, ਖਾਸ ਕਰਕੇ ਖੋਜ ਭਾਈਚਾਰੇ ਦੇ ਅੰਦਰ। OSAID ਪਰਿਭਾਸ਼ਾ ਦਾ ਉਦੇਸ਼ ਇੱਕ ਸਪੱਸ਼ਟ ਬੈਂਚਮਾਰਕ ਪ੍ਰਦਾਨ ਕਰਨਾ ਹੈ ਜਿਸ ਦੇ ਵਿਰੁੱਧ AI ਪ੍ਰਣਾਲੀਆਂ ਦਾ ਮੁਲਾਂਕਣ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ, ਸਤਹੀ ਲੇਬਲਾਂ ਤੋਂ ਪਰੇ ਜਾ ਕੇ ਖੁੱਲ੍ਹੇਪਣ ਪ੍ਰਤੀ ਅਸਲ ਵਚਨਬੱਧਤਾ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨਾ।

ਇੱਕ ਸਮੂਹਿਕ ਜ਼ਿੰਮੇਵਾਰੀ: ਅਸਲ AI ਪਾਰਦਰਸ਼ਤਾ ਨੂੰ ਚਲਾਉਣਾ

AI ਵਿੱਚ ਅਸਲ ਖੁੱਲ੍ਹ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣ ਦੀ ਚੁਣੌਤੀ ਨੂੰ ਸਿਰਫ਼ ਪਰਿਭਾਸ਼ਾਵਾਂ ਦੁਆਰਾ ਹੱਲ ਨਹੀਂ ਕੀਤਾ ਜਾ ਸਕਦਾ; ਇਸ ਲਈ ਕਈ ਹਿੱਸੇਦਾਰਾਂ ਤੋਂ ਠੋਸ ਕਾਰਵਾਈ ਦੀ ਲੋੜ ਹੈ। ਵਿਗਿਆਨਕ ਭਾਈਚਾਰਾ, ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਗੁੰਝਲਦਾਰ AI ਸਾਧਨਾਂ ਦੇ ਪ੍ਰਾਇਮਰੀ ਉਪਭੋਗਤਾਵਾਂ ਦੋਵਾਂ ਵਜੋਂ, ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਜ਼ਿੰਮੇਵਾਰੀ ਰੱਖਦਾ ਹੈ। ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ OSAID 1.0 ਵਰਗੀਆਂ ਪਹਿਲਕਦਮੀਆਂ ਨਾਲ ਸਰਗਰਮੀ ਨਾਲ ਜੁੜਨਾ ਚਾਹੀਦਾ ਹੈ, ਇਸਦੇ ਸਿਧਾਂਤਾਂ ਨੂੰ ਸਮਝਣਾ ਚਾਹੀਦਾ ਹੈ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਅਪਣਾਉਣ ਦੀ ਵਕਾਲਤ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ। ਉਹਨਾਂ ਨੂੰ ਉਹਨਾਂ AI ਮਾਡਲਾਂ ਦੇ ‘ਖੁੱਲ੍ਹੇਪਣ’ ਦੇ ਦਾਅਵਿਆਂ ਦਾ ਆਲੋਚਨਾਤਮਕ ਮੁਲਾਂਕਣ ਕਰਨ ਦੀ ਲੋੜ ਹੈ ਜਿਨ੍ਹਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨ ਬਾਰੇ ਉਹ ਵਿਚਾਰ ਕਰਦੇ ਹਨ, ਉਹਨਾਂ ਨੂੰ ਤਰਜੀਹ ਦਿੰਦੇ ਹਨ ਜੋ ਸਿਖਲਾਈ ਡਾਟਾ ਅਤੇ ਕਾਰਜਪ੍ਰਣਾਲੀਆਂ ਦੇ ਸਬੰਧ ਵਿੱਚ ਵਧੇਰੇ ਪਾਰਦਰਸ਼ਤਾ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦੇ ਹਨ, ਭਾਵੇਂ ਇਸ ਲਈ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਸੁਵਿਧਾਜਨਕ ਪਰ ਅਪਾਰਦਰਸ਼ੀ ਪ੍ਰਣਾਲੀਆਂ ਦੇ ਲਾਲਚ ਦਾ ਵਿਰੋਧ ਕਰਨ ਦੀ ਲੋੜ ਹੋਵੇ। ਪ੍ਰਕਾਸ਼ਨਾਂ, ਕਾਨਫਰੰਸਾਂ ਅਤੇ ਸੰਸਥਾਗਤ ਵਿਚਾਰ-ਵਟਾਂਦਰੇ ਵਿੱਚ ਪ੍ਰਮਾਣਿਤ, ਪੁਨਰ-ਉਤਪਾਦਨਯੋਗ AI ਸਾਧਨਾਂ ਦੀ ਲੋੜ ਨੂੰ ਆਵਾਜ਼ ਦੇਣਾ ਸਰਵਉੱਚ ਹੈ।

ਜਨਤਕ ਫੰਡਿੰਗ ਏਜੰਸੀਆਂ ਅਤੇ ਸਰਕਾਰੀ ਸੰਸਥਾਵਾਂ ਦੀ ਵੀ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਭੂਮਿਕਾ ਹੈ। ਉਹ ਗ੍ਰਾਂਟ ਲੋੜਾਂ ਅਤੇ ਖਰੀਦ ਨੀਤੀਆਂ ਦੁਆਰਾ ਕਾਫ਼ੀ ਪ੍ਰਭਾਵ ਪਾਉਂਦੇ ਹਨ। US National Institutes of Health (NIH) ਵਰਗੀਆਂ ਸੰਸਥਾਵਾਂ, ਜੋ ਪਹਿਲਾਂ ਹੀ ਇਸਦੀ ਫੰਡਿੰਗ ਦੁਆਰਾ ਤਿਆਰ ਕੀਤੇ ਗਏ ਖੋਜ ਡਾਟਾ ਲਈ ਓਪਨ ਲਾਇਸੈਂਸਿੰਗ ਨੂੰ ਲਾਜ਼ਮੀ ਕਰਦੀਆਂ ਹਨ, ਇੱਕ ਕੀਮਤੀ ਮਿਸਾਲ ਪ੍ਰਦਾਨ ਕਰਦੀਆਂ ਹਨ। ਇਸੇ ਤਰ੍ਹਾਂ, ਇਟਲੀ ਦੀ ਜਨਤਕ ਪ੍ਰਸ਼ਾਸਨ ਸੰਸਥਾਵਾਂ ਲਈ ਓਪਨ-ਸੋਰਸ ਸਾਫਟਵੇਅਰ ਨੂੰ ਤਰਜੀਹ ਦੇਣ ਦੀ ਲੋੜ ਵਰਗੀਆਂ ਉਦਾਹਰਣਾਂ ਦਰਸਾਉਂਦੀਆਂ ਹਨ ਕਿ ਨੀਤੀ ਕਿਵੇਂ ਅਪਣਾਉਣ ਨੂੰ ਚਲਾ ਸਕਦੀ ਹੈ। ਇਹਨਾਂ ਸਿਧਾਂਤਾਂ ਨੂੰ AI ਦੇ ਖੇਤਰ ਤੱਕ ਵਧਾਇਆ ਜਾ ਸਕਦਾ ਹੈ ਅਤੇ ਵਧਾਇਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ। ਸਰਕਾਰਾਂ ਅਤੇ ਫੰਡਿੰਗ ਸੰਸਥਾਵਾਂ ਨੂੰ ਵਿਚਾਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ:

  • ਜਨਤਕ ਤੌਰ ‘ਤੇ ਫੰਡ ਕੀਤੇ AI ਖੋਜ ਅਤੇ ਵਿਕਾਸ ਲਈ ਮਜ਼ਬੂਤ ਓਪਨ ਸੋਰਸ AI ਮਿਆਰਾਂ (ਜਿਵੇਂ ਕਿ OSAID) ਦੀ ਪਾਲਣਾ ਨੂੰ ਲਾਜ਼ਮੀ ਕਰਨਾ।
  • ਖੋਜ-ਕੇਂਦ੍ਰਿਤ AI ਮਾਡਲਾਂ ਦੀ ਸਿਖਲਾਈ ਲਈ ਢੁਕਵੇਂ, ਸੱਚਮੁੱਚ ਖੁੱਲ੍ਹੇ, ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਡੇਟਾਸੈਟਾਂ - ਇੱਕ ‘ਡਾਟਾ ਕਾਮਨਜ਼’ - ਦੀ ਸਿਰਜਣਾ ਵਿੱਚ ਨਿਵੇਸ਼ ਕਰਨਾ।
  • **ਇਹ ਯਕੀਨੀ ਬਣਾਉਣਾ ਕਿ EU AI ਐਕਟ ਵਰਗੇ ਨਿਯਮਾਂ ਨੂੰ ਇਸ ਤਰੀਕੇ ਨਾਲ ਲਾਗੂ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਜੋ ‘ਓਪਨਵਾਸ਼ਿੰਗ