ਖੁੱਲ੍ਹੇਪਣ ਦਾ ਖੋਰਾ: 'ਓਪਨ ਸੋਰਸ' AI ਅਕਸਰ ਕਿਉਂ ਨਹੀਂ ਹੁੰਦਾ

‘ਓਪਨ ਸੋਰਸ’ ਸ਼ਬਦ ਤਕਨਾਲੋਜੀ ਦੀ ਦੁਨੀਆ ਵਿੱਚ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਗੂੰਜ ਰੱਖਦਾ ਹੈ। ਇਹ ਸਹਿਯੋਗੀ ਨਵੀਨਤਾ, ਸਾਂਝੇ ਗਿਆਨ, ਅਤੇ ਪਾਰਦਰਸ਼ਤਾ ਵਿੱਚ ਇੱਕ ਬੁਨਿਆਦੀ ਵਿਸ਼ਵਾਸ ਦੀਆਂ ਤਸਵੀਰਾਂ ਉਭਾਰਦਾ ਹੈ। ਇਹ ਭਾਵਨਾ ਅੱਧੀ ਸਦੀ ਪਹਿਲਾਂ Menlo Park, California ਵਿੱਚ Homebrew Computer Club ਦੇ ਗਠਨ ਨਾਲ ਸਪਸ਼ਟ ਰੂਪ ਵਿੱਚ ਪ੍ਰਗਟ ਹੋਈ ਸੀ। ਉਤਸ਼ਾਹੀਆਂ ਅਤੇ ਟਿੰਕਰਰਾਂ ਦੇ ਇਸ ਸਮੂਹ ਨੇ ਸਿਰਫ਼ ਮਸ਼ੀਨਾਂ ਹੀ ਨਹੀਂ ਬਣਾਈਆਂ; ਉਨ੍ਹਾਂ ਨੇ ਵਿਚਾਰਾਂ ਅਤੇ ਸਾਫਟਵੇਅਰ ਦੇ ਮੁਕਤ ਆਦਾਨ-ਪ੍ਰਦਾਨ ‘ਤੇ ਅਧਾਰਤ ਇੱਕ ਸੱਭਿਆਚਾਰ ਬਣਾਇਆ, ਜਿਸ ਨੇ ਓਪਨ-ਸੋਰਸ ਅੰਦੋਲਨ ਲਈ ਬੁਨਿਆਦੀ ਪੱਥਰ ਰੱਖੇ ਜੋ ਕੰਪਿਊਟਿੰਗ ਵਿੱਚ ਕ੍ਰਾਂਤੀ ਲਿਆਵੇਗਾ। ਫਿਰ ਵੀ, ਅੱਜ, ਇਹ ਮੁਸ਼ਕਲ ਨਾਲ ਜਿੱਤੀ ਵਿਰਾਸਤ ਅਤੇ ਖੁੱਲ੍ਹੇਪਣ ਦੀ ਪਰਿਭਾਸ਼ਾ ਨੂੰ ਇੱਕ ਸੂਖਮ ਪਰ ਮਹੱਤਵਪੂਰਨ ਚੁਣੌਤੀ ਦਾ ਸਾਹਮਣਾ ਕਰਨਾ ਪੈ ਰਿਹਾ ਹੈ, ਖਾਸ ਕਰਕੇ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਦੇ ਤੇਜ਼ੀ ਨਾਲ ਫੈਲ ਰਹੇ ਖੇਤਰ ਵਿੱਚ। ਵਧੀਆ AI ਮਾਡਲਾਂ ਨੂੰ ਵਿਕਸਤ ਕਰਨ ਵਾਲੀਆਂ ਕੰਪਨੀਆਂ ਦੀ ਵੱਧ ਰਹੀ ਗਿਣਤੀ ਆਪਣੀਆਂ ਰਚਨਾਵਾਂ ਨੂੰ ‘ਓਪਨ ਸੋਰਸ’ ਵਜੋਂ ਉਤਸ਼ਾਹ ਨਾਲ ਬ੍ਰਾਂਡ ਕਰ ਰਹੀ ਹੈ, ਪਰ ਇੱਕ ਨੇੜਿਓਂ ਨਜ਼ਰ ਮਾਰਨ ਨਾਲ ਪਤਾ ਚੱਲਦਾ ਹੈ ਕਿ ਇਹ ਲੇਬਲ ਅਕਸਰ ਸਤਹੀ ਤੌਰ ‘ਤੇ ਲਾਗੂ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਇੱਕ ਅਜਿਹੀ ਹਕੀਕਤ ਨੂੰ ਛੁਪਾਉਂਦਾ ਹੈ ਜੋ ਅੰਦੋਲਨ ਦੇ ਮੂਲ ਸਿਧਾਂਤਾਂ ਤੋਂ ਘੱਟ ਹੈ। ਅਰਥਾਂ ਦੀ ਇਹ ਕਮਜ਼ੋਰੀ ਸਿਰਫ਼ ਇੱਕ ਸ਼ਬਦਾਵਲੀ ਦੀ ਬਹਿਸ ਨਹੀਂ ਹੈ; ਇਹ ਪਾਰਦਰਸ਼ਤਾ ਅਤੇ ਪ੍ਰਤੀਕ੍ਰਿਤੀ ਦੇ ਸਿਧਾਂਤਾਂ ਲਈ ਇੱਕ ਅਸਲ ਖ਼ਤਰਾ ਪੈਦਾ ਕਰਦੀ ਹੈ ਜੋ ਖਾਸ ਕਰਕੇ ਵਿਗਿਆਨਕ ਭਾਈਚਾਰੇ ਵਿੱਚ ਬਹੁਤ ਮਹੱਤਵਪੂਰਨ ਹਨ।

ਸੱਚੀ ਸਹਿਯੋਗੀ ਭਾਵਨਾ ਨੂੰ ਸਮਝਣਾ

ਮੌਜੂਦਾ ਮੁਸ਼ਕਲ ਨੂੰ ਸਮਝਣ ਲਈ, ਪਹਿਲਾਂ ਇਹ ਸਮਝਣਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ‘ਓਪਨ ਸੋਰਸ’ ਅਸਲ ਵਿੱਚ ਕੀ ਦਰਸਾਉਂਦਾ ਹੈ। ਇਹ ਸਿਰਫ਼ ਮੁਫ਼ਤ ਸਾਫਟਵੇਅਰ ਤੋਂ ਵੱਧ ਹੈ; ਇਹ ਸਮੂਹਿਕ ਤਰੱਕੀ ਅਤੇ ਪ੍ਰਮਾਣਿਤ ਵਿਸ਼ਵਾਸ ਵਿੱਚ ਜੜ੍ਹਾਂ ਵਾਲਾ ਇੱਕ ਦਰਸ਼ਨ ਹੈ। ਇਸ ਦਰਸ਼ਨ ਦਾ ਆਧਾਰ ਚਾਰ ਜ਼ਰੂਰੀ ਆਜ਼ਾਦੀਆਂ ‘ਤੇ ਟਿਕਿਆ ਹੋਇਆ ਹੈ:

  1. ਕਿਸੇ ਵੀ ਉਦੇਸ਼ ਲਈ ਪ੍ਰੋਗਰਾਮ ਨੂੰ ਚਲਾਉਣ ਦੀ ਆਜ਼ਾਦੀ
  2. ਪ੍ਰੋਗਰਾਮ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ, ਇਸਦਾ ਅਧਿਐਨ ਕਰਨ ਦੀ ਆਜ਼ਾਦੀ ਅਤੇ ਇਸਨੂੰ ਬਦਲਣ ਦੀ ਆਜ਼ਾਦੀ ਤਾਂ ਜੋ ਇਹ ਤੁਹਾਡੀ ਇੱਛਾ ਅਨੁਸਾਰ ਤੁਹਾਡੀ ਕੰਪਿਊਟਿੰਗ ਕਰੇ। ਇਸ ਲਈ ਸੋਰਸ ਕੋਡ ਤੱਕ ਪਹੁੰਚ ਇੱਕ ਪੂਰਵ ਸ਼ਰਤ ਹੈ।
  3. ਕਾਪੀਆਂ ਨੂੰ ਮੁੜ ਵੰਡਣ ਦੀ ਆਜ਼ਾਦੀ ਤਾਂ ਜੋ ਤੁਸੀਂ ਦੂਜਿਆਂ ਦੀ ਮਦਦ ਕਰ ਸਕੋ।
  4. ਤੁਹਾਡੇ ਸੋਧੇ ਹੋਏ ਸੰਸਕਰਣਾਂ ਦੀਆਂ ਕਾਪੀਆਂ ਦੂਜਿਆਂ ਨੂੰ ਵੰਡਣ ਦੀ ਆਜ਼ਾਦੀ। ਅਜਿਹਾ ਕਰਕੇ ਤੁਸੀਂ ਪੂਰੇ ਭਾਈਚਾਰੇ ਨੂੰ ਤੁਹਾਡੀਆਂ ਤਬਦੀਲੀਆਂ ਤੋਂ ਲਾਭ ਉਠਾਉਣ ਦਾ ਮੌਕਾ ਦੇ ਸਕਦੇ ਹੋ। ਇਸ ਲਈ ਸੋਰਸ ਕੋਡ ਤੱਕ ਪਹੁੰਚ ਇੱਕ ਪੂਰਵ ਸ਼ਰਤ ਹੈ।

ਇਹ ਆਜ਼ਾਦੀਆਂ, ਆਮ ਤੌਰ ‘ਤੇ GNU General Public License (GPL), MIT License, ਜਾਂ Apache License ਵਰਗੇ ਲਾਇਸੈਂਸਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਹੁੰਦੀਆਂ ਹਨ, ਇਤਿਹਾਸਕ ਤੌਰ ‘ਤੇ ਸੋਰਸ ਕੋਡ ‘ਤੇ ਕੇਂਦਰਿਤ ਰਹੀਆਂ ਹਨ। ਸੋਰਸ ਕੋਡ - ਪ੍ਰੋਗਰਾਮਰਾਂ ਦੁਆਰਾ ਲਿਖੀਆਂ ਮਨੁੱਖੀ-ਪੜ੍ਹਨਯੋਗ ਹਦਾਇਤਾਂ - ਰਵਾਇਤੀ ਸਾਫਟਵੇਅਰ ਦਾ ਬਲੂਪ੍ਰਿੰਟ ਹੈ। ਇਸ ਕੋਡ ਨੂੰ ਖੁੱਲ੍ਹੇਆਮ ਉਪਲਬਧ ਕਰਾਉਣਾ ਕਿਸੇ ਨੂੰ ਵੀ ਇਸਦੀ ਜਾਂਚ ਕਰਨ, ਇਸਦੇ ਤਰਕ ਨੂੰ ਸਮਝਣ, ਸੰਭਾਵੀ ਖਾਮੀਆਂ ਦੀ ਪਛਾਣ ਕਰਨ, ਇਸਨੂੰ ਨਵੀਆਂ ਲੋੜਾਂ ਅਨੁਸਾਰ ਢਾਲਣ, ਅਤੇ ਉਹਨਾਂ ਸੁਧਾਰਾਂ ਨੂੰ ਸਾਂਝਾ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ।

ਇਹ ਮਾਡਲ ਨਵੀਨਤਾ ਅਤੇ ਵਿਗਿਆਨਕ ਤਰੱਕੀ ਲਈ ਇੱਕ ਅਸਾਧਾਰਨ ਉਤਪ੍ਰੇਰਕ ਰਿਹਾ ਹੈ। ਦੁਨੀਆ ਭਰ ਦੇ ਖੋਜਕਰਤਾਵਾਂ ਲਈ ਆਸਾਨੀ ਨਾਲ ਉਪਲਬਧ ਸਾਧਨਾਂ ਦੇ ਪ੍ਰਭਾਵ ‘ਤੇ ਵਿਚਾਰ ਕਰੋ:

  • ਅੰਕੜਾ ਵਿਸ਼ਲੇਸ਼ਣ: R Studio ਵਰਗਾ ਸਾਫਟਵੇਅਰ ਅੰਕੜਾ ਕੰਪਿਊਟਿੰਗ ਅਤੇ ਗ੍ਰਾਫਿਕਸ ਲਈ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ, ਪਾਰਦਰਸ਼ੀ, ਅਤੇ ਵਿਸਤਾਰਯੋਗ ਵਾਤਾਵਰਣ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਜੋ ਅਣਗਿਣਤ ਵਿਗਿਆਨਕ ਖੇਤਰਾਂ ਵਿੱਚ ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਦਾ ਇੱਕ ਆਧਾਰ ਬਣ ਗਿਆ ਹੈ। ਇਸਦਾ ਖੁੱਲ੍ਹਾਪਣ ਤਰੀਕਿਆਂ ਦੀ ਪੀਅਰ ਸਮੀਖਿਆ ਅਤੇ ਵਿਸ਼ੇਸ਼ ਪੈਕੇਜਾਂ ਦੇ ਵਿਕਾਸ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ।
  • ਕੰਪਿਊਟੇਸ਼ਨਲ ਫਲੂਇਡ ਡਾਇਨਾਮਿਕਸ: OpenFOAM ਤਰਲ ਪ੍ਰਵਾਹਾਂ ਦੀ ਨਕਲ ਕਰਨ ਲਈ ਇੱਕ ਵਧੀਆ ਲਾਇਬ੍ਰੇਰੀ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦਾ ਹੈ, ਜੋ ਏਰੋਸਪੇਸ ਇੰਜੀਨੀਅਰਿੰਗ ਤੋਂ ਲੈ ਕੇ ਵਾਤਾਵਰਣ ਵਿਗਿਆਨ ਤੱਕ ਦੇ ਖੇਤਰਾਂ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਇਸਦੀ ਖੁੱਲ੍ਹੀ ਪ੍ਰਕਿਰਤੀ ਗੁੰਝਲਦਾਰ ਸਿਮੂਲੇਸ਼ਨਾਂ ਦੀ ਕਸਟਮਾਈਜ਼ੇਸ਼ਨ ਅਤੇ ਤਸਦੀਕ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦੀ ਹੈ।
  • ਓਪਰੇਟਿੰਗ ਸਿਸਟਮ: Linux ਅਤੇ ਹੋਰ ਓਪਨ-ਸੋਰਸ ਓਪਰੇਟਿੰਗ ਸਿਸਟਮ ਦੁਨੀਆ ਦੇ ਬਹੁਤ ਸਾਰੇ ਕੰਪਿਊਟਿੰਗ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਦੀ ਰੀੜ੍ਹ ਦੀ ਹੱਡੀ ਬਣਾਉਂਦੇ ਹਨ, ਜਿਸ ਵਿੱਚ ਵਿਗਿਆਨਕ ਉੱਚ-ਪ੍ਰਦਰਸ਼ਨ ਕੰਪਿਊਟਿੰਗ ਕਲੱਸਟਰ ਸ਼ਾਮਲ ਹਨ, ਜੋ ਉਹਨਾਂ ਦੀ ਸਥਿਰਤਾ, ਲਚਕਤਾ ਅਤੇ ਪਾਰਦਰਸ਼ਤਾ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹਨ।

ਲਾਭ ਸਿਰਫ਼ ਲਾਗਤ ਬਚਤ ਤੋਂ ਕਿਤੇ ਵੱਧ ਹਨ। ਓਪਨ ਸੋਰਸ ਪ੍ਰਤੀਕ੍ਰਿਤੀ (reproducibility) ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦਾ ਹੈ, ਜੋ ਵਿਗਿਆਨਕ ਵਿਧੀ ਦਾ ਇੱਕ ਆਧਾਰ ਹੈ। ਜਦੋਂ ਖੋਜ ਵਿੱਚ ਵਰਤੇ ਗਏ ਸਾਧਨ ਅਤੇ ਕੋਡ ਖੁੱਲ੍ਹੇ ਹੁੰਦੇ ਹਨ, ਤਾਂ ਦੂਜੇ ਵਿਗਿਆਨੀ ਪ੍ਰਯੋਗਾਂ ਨੂੰ ਦੁਹਰਾ ਸਕਦੇ ਹਨ, ਨਤੀਜਿਆਂ ਦੀ ਪੁਸ਼ਟੀ ਕਰ ਸਕਦੇ ਹਨ, ਅਤੇ ਵਿਸ਼ਵਾਸ ਨਾਲ ਕੰਮ ਨੂੰ ਅੱਗੇ ਵਧਾ ਸਕਦੇ ਹਨ। ਇਹ ਵਿਸ਼ਵਵਿਆਪੀ ਸਹਿਯੋਗ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦਾ ਹੈ, ਰੁਕਾਵਟਾਂ ਨੂੰ ਤੋੜਦਾ ਹੈ ਅਤੇ ਵਿਭਿੰਨ ਪਿਛੋਕੜਾਂ ਅਤੇ ਸੰਸਥਾਵਾਂ ਦੇ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਸਾਂਝੀਆਂ ਚੁਣੌਤੀਆਂ ਵਿੱਚ ਯੋਗਦਾਨ ਪਾਉਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ। ਇਹ ਲੰਬੀ ਉਮਰ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਂਦਾ ਹੈ ਅਤੇ ਵਿਕਰੇਤਾ ਲਾਕ-ਇਨ ਤੋਂ ਬਚਾਉਂਦਾ ਹੈ, ਮਲਕੀਅਤੀ ਸਾਫਟਵੇਅਰ ਕੰਪਨੀਆਂ ਦੀਆਂ ਮਨਮਾਨੀਆਂ ਤੋਂ ਖੋਜ ਨਿਵੇਸ਼ਾਂ ਦੀ ਰੱਖਿਆ ਕਰਦਾ ਹੈ। ਇਹ ਨਵੇਂ ਵਿਚਾਰਾਂ ਅਤੇ ਤਕਨੀਕਾਂ ਦੇ ਤੇਜ਼ੀ ਨਾਲ ਪ੍ਰਸਾਰ ਅਤੇ ਦੁਹਰਾਓ ਦੀ ਆਗਿਆ ਦੇ ਕੇ ਖੋਜ ਨੂੰ ਤੇਜ਼ ਕਰਦਾ ਹੈ। ਓਪਨ-ਸੋਰਸ ਨੈਤਿਕਤਾ ਮੂਲ ਰੂਪ ਵਿੱਚ ਪਾਰਦਰਸ਼ਤਾ, ਜਾਂਚ, ਅਤੇ ਸਾਂਝੀ ਤਰੱਕੀ ਦੁਆਰਾ ਗਿਆਨ ਦੀ ਵਿਗਿਆਨਕ ਖੋਜ ਨਾਲ ਜੁੜੀ ਹੋਈ ਹੈ।

ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ: ਇੱਕ ਬਿਲਕੁਲ ਵੱਖਰਾ ਜਾਨਵਰ

ਸਥਾਪਿਤ ਓਪਨ-ਸੋਰਸ ਪੈਰਾਡਾਈਮ, ਜੋ ਸੋਰਸ ਕੋਡ ਦੀ ਪਹੁੰਚਯੋਗਤਾ ਦੇ ਆਲੇ-ਦੁਆਲੇ ਸੁਰੱਖਿਅਤ ਢੰਗ ਨਾਲ ਬਣਾਇਆ ਗਿਆ ਹੈ, ਜਦੋਂ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਦੇ ਖੇਤਰ ਵਿੱਚ ਲਾਗੂ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਖਾਸ ਕਰਕੇ ਬੁਨਿਆਦੀ ਵੱਡੇ ਭਾਸ਼ਾਈ ਮਾਡਲਾਂ (LLMs) ਵਰਗੇ ਵੱਡੇ ਪੈਮਾਨੇ ਦੇ ਮਾਡਲਾਂ ਵਿੱਚ, ਮਹੱਤਵਪੂਰਨ ਉਥਲ-ਪੁਥਲ ਦਾ ਸਾਹਮਣਾ ਕਰਦਾ ਹੈ। ਜਦੋਂ ਕਿ ਇਹ AI ਸਿਸਟਮ ਨਿਸ਼ਚਿਤ ਤੌਰ ‘ਤੇ ਕੋਡ ਸ਼ਾਮਲ ਕਰਦੇ ਹਨ, ਉਹਨਾਂ ਦੀ ਕਾਰਜਕੁਸ਼ਲਤਾ ਅਤੇ ਵਿਵਹਾਰ ਕਿਤੇ ਜ਼ਿਆਦਾ ਗੁੰਝਲਦਾਰ ਅਤੇ ਅਕਸਰ ਅਪਾਰਦਰਸ਼ੀ ਤੱਤਾਂ ਦੁਆਰਾ ਆਕਾਰ ਦਿੱਤੇ ਜਾਂਦੇ ਹਨ। ਇੱਕ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਲਈ ਸਿਰਫ਼ ਆਰਕੀਟੈਕਚਰਲ ਕੋਡ ਜਾਰੀ ਕਰਨਾ ਰਵਾਇਤੀ ਸਾਫਟਵੇਅਰ ਲਈ ਅਸਲ ਖੁੱਲ੍ਹੇਪਣ ਦੇ ਬਰਾਬਰ ਨਹੀਂ ਹੈ।

ਇੱਕ AI ਮਾਡਲ, ਖਾਸ ਕਰਕੇ ਇੱਕ ਡੀਪ ਲਰਨਿੰਗ ਮਾਡਲ, ਆਮ ਤੌਰ ‘ਤੇ ਕਈ ਮੁੱਖ ਤੱਤਾਂ ਦਾ ਬਣਿਆ ਹੁੰਦਾ ਹੈ:

  1. ਮਾਡਲ ਆਰਕੀਟੈਕਚਰ: ਇਹ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਦਾ ਢਾਂਚਾਗਤ ਡਿਜ਼ਾਈਨ ਹੈ - ਪਰਤਾਂ, ਨਿਊਰੋਨਸ, ਅਤੇ ਕੁਨੈਕਸ਼ਨਾਂ ਦੀ ਵਿਵਸਥਾ। ਕੰਪਨੀਆਂ ਅਕਸਰ ਇਸ ਜਾਣਕਾਰੀ ਨੂੰ ਜਾਰੀ ਕਰਦੀਆਂ ਹਨ, ਇਸਨੂੰ ਖੁੱਲ੍ਹੇਪਣ ਦੇ ਸਬੂਤ ਵਜੋਂ ਪੇਸ਼ ਕਰਦੀਆਂ ਹਨ। ਇਹ ਇੱਕ ਇੰਜਣ ਦੇ ਬਲੂਪ੍ਰਿੰਟ ਨੂੰ ਸਾਂਝਾ ਕਰਨ ਦੇ ਸਮਾਨ ਹੈ।
  2. ਮਾਡਲ ਵੇਟਸ (ਪੈਰਾਮੀਟਰ): ਇਹ ਨੈੱਟਵਰਕ ਦੇ ਅੰਦਰ ਸੰਖਿਆਤਮਕ ਮੁੱਲ ਹਨ, ਅਕਸਰ ਅਰਬਾਂ ਦੀ ਗਿਣਤੀ ਵਿੱਚ, ਜਿਨ੍ਹਾਂ ਨੂੰ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਦੌਰਾਨ ਐਡਜਸਟ ਕੀਤਾ ਗਿਆ ਹੈ। ਉਹ ਸਿਖਲਾਈ ਡਾਟਾ ਤੋਂ ਕੱਢੇ ਗਏ ਸਿੱਖੇ ਪੈਟਰਨ ਅਤੇ ਗਿਆਨ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ। ਵੇਟਸ ਜਾਰੀ ਕਰਨਾ ਦੂਜਿਆਂ ਨੂੰ ਪਹਿਲਾਂ ਤੋਂ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ। ਇਹ ਪੂਰੀ ਤਰ੍ਹਾਂ ਅਸੈਂਬਲ ਕੀਤੇ ਇੰਜਣ ਨੂੰ ਪ੍ਰਦਾਨ ਕਰਨ ਵਰਗਾ ਹੈ, ਜੋ ਚੱਲਣ ਲਈ ਤਿਆਰ ਹੈ।
  3. ਟ੍ਰੇਨਿੰਗ ਡਾਟਾ: ਇਹ ਸ਼ਾਇਦ ਸਭ ਤੋਂ ਨਾਜ਼ੁਕ ਅਤੇ ਸਭ ਤੋਂ ਵੱਧ ਅਕਸਰ ਛੁਪਾਇਆ ਜਾਣ ਵਾਲਾ ਹਿੱਸਾ ਹੈ। ਬੁਨਿਆਦੀ ਮਾਡਲਾਂ ਨੂੰ ਵਿਸ਼ਾਲ ਡਾਟਾਸੈਟਾਂ ‘ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ, ਅਕਸਰ ਇੰਟਰਨੈਟ ਤੋਂ ਸਕ੍ਰੈਪ ਕੀਤੇ ਜਾਂਦੇ ਹਨ ਜਾਂ ਮਲਕੀਅਤੀ ਜਾਂ ਨਿੱਜੀ ਸੰਗ੍ਰਹਿ (ਜਿਵੇਂ ਕਿ ਮੈਡੀਕਲ ਰਿਕਾਰਡ, ਜੋ ਮਹੱਤਵਪੂਰਨ ਗੋਪਨੀਯਤਾ ਚਿੰਤਾਵਾਂ ਪੈਦਾ ਕਰਦੇ ਹਨ) ਤੋਂ ਪ੍ਰਾਪਤ ਕੀਤੇ ਜਾਂਦੇ ਹਨ। ਇਸ ਡਾਟਾ ਦੇ ਅੰਦਰ ਰਚਨਾ, ਕਿਊਰੇਸ਼ਨ, ਫਿਲਟਰਿੰਗ, ਅਤੇ ਸੰਭਾਵੀ ਪੱਖਪਾਤ ਮਾਡਲ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ, ਸੀਮਾਵਾਂ, ਅਤੇ ਨੈਤਿਕ ਵਿਵਹਾਰ ਨੂੰ ਡੂੰਘਾਈ ਨਾਲ ਪ੍ਰਭਾਵਤ ਕਰਦੇ ਹਨ। ਟ੍ਰੇਨਿੰਗ ਡਾਟਾ ਬਾਰੇ ਵਿਸਤ੍ਰਿਤ ਜਾਣਕਾਰੀ ਤੋਂ ਬਿਨਾਂ, ਇਹ ਸਮਝਣਾ ਕਿ ਇੱਕ ਮਾਡਲ ਕਿਉਂ ਇਸ ਤਰ੍ਹਾਂ ਵਿਵਹਾਰ ਕਰਦਾ ਹੈ, ਜਾਂ ਖਾਸ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਇਸਦੀ ਅਨੁਕੂਲਤਾ ਅਤੇ ਸੁਰੱਖਿਆ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨਾ, ਬਹੁਤ ਮੁਸ਼ਕਲ ਹੋ ਜਾਂਦਾ ਹੈ। ਇਹ ਗੁਪਤ ਈਂਧਨ ਮਿਸ਼ਰਣ ਅਤੇ ਉਹ ਸਹੀ ਸਥਿਤੀਆਂ ਹਨ ਜਿਨ੍ਹਾਂ ਦੇ ਤਹਿਤ ਇੰਜਣ ਨੂੰ ਚਲਾਇਆ ਗਿਆ ਸੀ।
  4. ਟ੍ਰੇਨਿੰਗ ਕੋਡ ਅਤੇ ਪ੍ਰਕਿਰਿਆ: ਇਸ ਵਿੱਚ ਸਿਖਲਾਈ ਲਈ ਵਰਤੇ ਗਏ ਖਾਸ ਐਲਗੋਰਿਦਮ, ਓਪਟੀਮਾਈਜੇਸ਼ਨ ਤਕਨੀਕਾਂ, ਚੁਣੇ ਗਏ ਹਾਈਪਰਪੈਰਾਮੀਟਰ (ਸੈਟਿੰਗਾਂ ਜੋ ਸਿੱਖਣ ਦੀ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਨਿਯੰਤਰਿਤ ਕਰਦੀਆਂ ਹਨ), ਵਰਤਿਆ ਗਿਆ ਕੰਪਿਊਟੇਸ਼ਨਲ ਬੁਨਿਆਦੀ ਢਾਂਚਾ, ਅਤੇ ਖਪਤ ਕੀਤੀ ਗਈ ਮਹੱਤਵਪੂਰਨ ਊਰਜਾ ਸ਼ਾਮਲ ਹੈ। ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਮਾਮੂਲੀ ਭਿੰਨਤਾਵਾਂ ਵੱਖ-ਵੱਖ ਮਾਡਲ ਵਿਵਹਾਰਾਂ ਦਾ ਕਾਰਨ ਬਣ ਸਕਦੀਆਂ ਹਨ, ਜਿਸ ਨਾਲ ਪ੍ਰਤੀਕ੍ਰਿਤੀ ਚੁਣੌਤੀਪੂਰਨ ਬਣ ਜਾਂਦੀ ਹੈ ਭਾਵੇਂ ਆਰਕੀਟੈਕਚਰ ਅਤੇ ਡਾਟਾ ਜਾਣਿਆ ਜਾਂਦਾ ਹੋਵੇ। ਇਹ ਇੰਜਣ ਨੂੰ ਬਣਾਉਣ ਅਤੇ ਟਿਊਨ ਕਰਨ ਲਈ ਵਰਤੀਆਂ ਗਈਆਂ ਵਿਸਤ੍ਰਿਤ ਇੰਜੀਨੀਅਰਿੰਗ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ, ਟੂਲਿੰਗ, ਅਤੇ ਫੈਕਟਰੀ ਸਥਿਤੀਆਂ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ।

ਵਰਤਮਾਨ ਵਿੱਚ ‘ਓਪਨ ਸੋਰਸ’ AI ਵਜੋਂ ਮਾਰਕੀਟ ਕੀਤੇ ਗਏ ਬਹੁਤ ਸਾਰੇ ਸਿਸਟਮ ਮੁੱਖ ਤੌਰ ‘ਤੇ ਮਾਡਲ ਆਰਕੀਟੈਕਚਰ ਅਤੇ ਪਹਿਲਾਂ ਤੋਂ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਵੇਟਸ ਤੱਕ ਪਹੁੰਚ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦੇ ਹਨ। ਜਦੋਂ ਕਿ ਇਹ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਮਾਡਲ ਚਲਾਉਣ ਅਤੇ ਸ਼ਾਇਦ ਇਸਨੂੰ ਛੋਟੇ ਡਾਟਾਸੈਟਾਂ ‘ਤੇ ਫਾਈਨ-ਟਿਊਨ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ, ਇਹ ਸਿਖਲਾਈ ਡਾਟਾ ਅਤੇ ਪ੍ਰਕਿਰਿਆ ਦੇ ਸੰਬੰਧ ਵਿੱਚ ਲੋੜੀਂਦੀ ਪਾਰਦਰਸ਼ਤਾ ਪ੍ਰਦਾਨ ਕਰਨ ਵਿੱਚ ਗੰਭੀਰ ਤੌਰ ‘ਤੇ ਅਸਫਲ ਰਹਿੰਦਾ ਹੈ। ਇਹ ਮਾਡਲ ਦੀਆਂ ਬੁਨਿਆਦੀ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦਾ ਸੱਚਮੁੱਚ ਅਧਿਐਨ ਕਰਨ ਜਾਂ ਇਸਨੂੰ ਡੂੰਘੇ ਅਰਥਪੂਰਨ ਤਰੀਕਿਆਂ ਨਾਲ ਸੋਧਣ ਦੀ ਯੋਗਤਾ ਨੂੰ ਬੁਰੀ ਤਰ੍ਹਾਂ ਘਟਾਉਂਦਾ ਹੈ ਜਿਸ ਲਈ ਮੁੜ ਸਿਖਲਾਈ ਜਾਂ ਇਸਦੇ ਮੂਲ ਨੂੰ ਸਮਝਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਅਧਿਐਨ ਕਰਨ ਅਤੇ ਸੋਧਣ ਦੀਆਂ ਆਜ਼ਾਦੀਆਂ, ਜੋ ਓਪਨ-ਸੋਰਸ ਪਰਿਭਾਸ਼ਾ ਦੇ ਕੇਂਦਰ ਵਿੱਚ ਹਨ, ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ ਰੁਕਾਵਟ ਬਣ ਜਾਂਦੀਆਂ ਹਨ ਜਦੋਂ ਡਾਟਾ ਅਤੇ ਸਿਖਲਾਈ ਵਿਧੀ ਦੇ ਮਹੱਤਵਪੂਰਨ ਤੱਤ ਲੁਕੇ ਰਹਿੰਦੇ ਹਨ। ਮਾਡਲ ਦੀ ਸਿਰਜਣਾ ਨੂੰ ਸ਼ੁਰੂ ਤੋਂ ਦੁਹਰਾਉਣਾ - ਵਿਗਿਆਨਕ ਸਮਝ ਅਤੇ ਤਸਦੀਕ ਦੀ ਇੱਕ ਮੁੱਖ ਪ੍ਰੀਖਿਆ - ਲਗਭਗ ਅਸੰਭਵ ਹੋ ਜਾਂਦਾ ਹੈ।

AI ਵਿੱਚ ‘ਓਪਨਵਾਸ਼ਿੰਗ’ ਦਾ ਪਰੇਸ਼ਾਨ ਕਰਨ ਵਾਲਾ ਰੁਝਾਨ

ਲੇਬਲ ਅਤੇ ਹਕੀਕਤ ਵਿਚਕਾਰ ਇਸ ਪਾੜੇ ਨੇ ‘ਓਪਨਵਾਸ਼ਿੰਗ’ ਵਜੋਂ ਜਾਣੀ ਜਾਂਦੀ ਇੱਕ ਪ੍ਰਥਾ ਨੂੰ ਜਨਮ ਦਿੱਤਾ ਹੈ। ਇਹ ਸ਼ਬਦ ਕੰਪਨੀਆਂ ਦੁਆਰਾ ਮਾਰਕੀਟਿੰਗ ਅਤੇ ਰਣਨੀਤਕ ਲਾਭ ਲਈ ‘ਓਪਨ ਸੋਰਸ’ ਦੀ ਸਕਾਰਾਤਮਕ ਪ੍ਰਤਿਸ਼ਠਾ ਅਤੇ ਸਮਝੇ ਗਏ ਲਾਭਾਂ ਦਾ ਲਾਭ ਉਠਾਉਣ ਦੇ ਕੰਮ ਦਾ ਵਰਣਨ ਕਰਦਾ ਹੈ, ਜਦੋਂ ਕਿ ਨਾਲ ਹੀ ਵਿਸਤ੍ਰਿਤ ਸਿਖਲਾਈ ਡਾਟਾ ਜਾਣਕਾਰੀ ਜਾਂ ਸਿਖਲਾਈ ਲਈ ਵਰਤੇ ਗਏ ਕੋਡ ਵਰਗੇ ਨਾਜ਼ੁਕ ਹਿੱਸਿਆਂ ਤੱਕ ਪਹੁੰਚ ਨੂੰ ਰੋਕਦਾ ਹੈ। ਉਹ ਪਾਰਦਰਸ਼ਤਾ ਅਤੇ ਭਾਈਚਾਰਕ ਪਹੁੰਚ ਦੇ ਇਸਦੇ ਮੰਗ ਵਾਲੇ ਸਿਧਾਂਤਾਂ ਨੂੰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਅਪਣਾਏ ਬਿਨਾਂ ਆਪਣੇ ਸਿਸਟਮਾਂ ਨੂੰ ਖੁੱਲ੍ਹੇਪਣ ਦੀ ਭਾਸ਼ਾ ਵਿੱਚ ਲਪੇਟਦੇ ਹਨ।

ਕਈ ਪ੍ਰਮੁੱਖ AI ਮਾਡਲ, ਵਿਆਪਕ ਤੌਰ ‘ਤੇ ਵਰਤੇ ਜਾਣ ਅਤੇ ਕਈ ਵਾਰ ‘ਓਪਨ’ ਅਹੁਦਾ ਰੱਖਣ ਦੇ ਬਾਵਜੂਦ, ਜਦੋਂ Open Source Initiative (OSI) ਵਰਗੀਆਂ ਸੰਸਥਾਵਾਂ ਦੁਆਰਾ ਚੈਂਪੀਅਨ ਓਪਨ ਸੋਰਸ ਦੀ ਵਿਆਪਕ ਪਰਿਭਾਸ਼ਾ ਦੇ ਵਿਰੁੱਧ ਮਾਪਿਆ ਜਾਂਦਾ ਹੈ ਤਾਂ ਘੱਟ ਹੁੰਦੇ ਹਨ। OSI ਦੁਆਰਾ ਇੱਕ ਵਿਸ਼ਲੇਸ਼ਣ, ਜੋ ਕਿ 2022 ਤੋਂ AI ਸੰਦਰਭ ਵਿੱਚ ਓਪਨ ਸੋਰਸ ਦੇ ਅਰਥਾਂ ਨੂੰ ਸਪੱਸ਼ਟ ਕਰਨ ਲਈ ਲਗਨ ਨਾਲ ਕੰਮ ਕਰ ਰਿਹਾ ਹੈ, ਨੇ ਕਈ ਪ੍ਰਸਿੱਧ ਮਾਡਲਾਂ ਨਾਲ ਚਿੰਤਾਵਾਂ ਨੂੰ ਉਜਾਗਰ ਕੀਤਾ:

  • Llama 2 & Llama 3.x (Meta): ਜਦੋਂ ਕਿ ਮਾਡਲ ਵੇਟਸ ਅਤੇ ਆਰਕੀਟੈਕਚਰ ਉਪਲਬਧ ਹਨ, ਵਰਤੋਂ ‘ਤੇ ਪਾਬੰਦੀਆਂ ਅਤੇ ਪੂਰੇ ਸਿਖਲਾਈ ਡਾਟਾਸੈਟ ਅਤੇ ਪ੍ਰਕਿਰਿਆ ਦੇ ਸੰਬੰਧ ਵਿੱਚ ਅਧੂਰੀ ਪਾਰਦਰਸ਼ਤਾ ਰਵਾਇਤੀ ਓਪਨ-ਸੋਰਸ ਮੁੱਲਾਂ ਨਾਲ ਉਹਨਾਂ ਦੇ ਇਕਸਾਰਤਾ ਨੂੰ ਸੀਮਤ ਕਰਦੀ ਹੈ।
  • Grok (X): ਇਸੇ ਤਰ੍ਹਾਂ, ਜਦੋਂ ਕਿ ਉਪਲਬਧ ਕਰਵਾਇਆ ਗਿਆ ਹੈ, ਇਸਦੇ ਸਿਖਲਾਈ ਡਾਟਾ ਅਤੇ ਵਿਧੀ ਬਾਰੇ ਵਿਆਪਕ ਜਾਣਕਾਰੀ ਦੀ ਘਾਟ ਇਸਦੇ ਅਸਲ ਖੁੱਲ੍ਹੇਪਣ ਬਾਰੇ ਸਵਾਲ ਖੜ੍ਹੇ ਕਰਦੀ ਹੈ।
  • Phi-2 (Microsoft): ਅਕਸਰ ‘ਓਪਨ ਮਾਡਲ’ ਵਜੋਂ ਵਰਣਨ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਇਸਦੀ ਸਿਰਜਣਾ ਪ੍ਰਕਿਰਿਆ ਅਤੇ ਡਾਟਾ ਦੇ ਸੰਬੰਧ ਵਿੱਚ ਪੂਰੀ ਪਾਰਦਰਸ਼ਤਾ ਸੀਮਤ ਰਹਿੰਦੀ ਹੈ।
  • Mixtral (Mistral AI): ਹਾਲਾਂਕਿ ਹਿੱਸੇ ਜਾਰੀ ਕੀਤੇ ਗਏ ਹਨ, ਇਹ ਅਧਿਐਨ ਅਤੇ ਸੋਧ ਲਈ ਸਾਰੇ ਲੋੜੀਂਦੇ ਹਿੱਸਿਆਂ ਤੱਕ ਪਹੁੰਚ ਵਿੱਚ ਸੀਮਾਵਾਂ ਦੇ ਕਾਰਨ ਓਪਨ ਸੋਰਸ ਲਈ ਪੂਰੇ ਮਾਪਦੰਡਾਂ ਨੂੰ ਪੂਰਾ ਨਹੀਂ ਕਰਦਾ ਹੈ।

ਇਹ ਉਦਾਹਰਣਾਂ ਉਹਨਾਂ ਯਤਨਾਂ ਦੇ ਉਲਟ ਹਨ ਜੋ ਓਪਨ-ਸੋਰਸ ਸਿਧਾਂਤਾਂ ਦੀ ਵਧੇਰੇ ਪਾਲਣਾ ਲਈ ਯਤਨਸ਼ੀਲ ਹਨ:

  • OLMo (Allen Institute for AI): ਇੱਕ ਗੈਰ-ਮੁਨਾਫ਼ਾ ਖੋਜ ਸੰਸਥਾ ਦੁਆਰਾ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ, OLMo ਸਪਸ਼ਟ ਤੌਰ ‘ਤੇ ਖੁੱਲ੍ਹੇਪਣ ਨੂੰ ਧਿਆਨ ਵਿੱਚ ਰੱਖ ਕੇ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਸੀ, ਜਿਸ ਵਿੱਚ ਨਾ ਸਿਰਫ਼ ਵੇਟਸ ਬਲਕਿ ਸਿਖਲਾਈ ਕੋਡ ਅਤੇ ਵਰਤੇ ਗਏ ਡਾਟਾ ਬਾਰੇ ਵੇਰਵੇ ਵੀ ਜਾਰੀ ਕੀਤੇ ਗਏ ਸਨ।
  • LLM360’s CrystalCoder: ਇੱਕ ਕਮਿਊਨਿਟੀ-ਸੰਚਾਲਿਤ ਪ੍ਰੋਜੈਕਟ ਜਿਸਦਾ ਉਦੇਸ਼ ਮਾਡਲ ਦੇ ਜੀਵਨ ਚੱਕਰ ਵਿੱਚ ਪੂਰੀ ਪਾਰਦਰਸ਼ਤਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਡਾਟਾ, ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆਵਾਂ, ਅਤੇ ਮੁਲਾਂਕਣ ਮੈਟ੍ਰਿਕਸ ਸ਼ਾਮਲ ਹਨ।

ਓਪਨਵਾਸ਼ਿੰਗ ਵਿੱਚ ਸ਼ਾਮਲ ਕਿਉਂ ਹੋਣਾ ਹੈ? ਪ੍ਰੇਰਣਾਵਾਂ ਬਹੁਪੱਖੀ ਹਨ:

  1. ਮਾਰਕੀਟਿੰਗ ਅਤੇ ਧਾਰਨਾ: ‘ਓਪਨ ਸੋਰਸ’ ਲੇਬਲ ਮਹੱਤਵਪੂਰਨ ਸਦਭਾਵਨਾ ਰੱਖਦਾ ਹੈ। ਇਹ ਸਹਿਯੋਗ, ਨੈਤਿਕ ਅਭਿਆਸਾਂ, ਅਤੇ ਵਿਆਪਕ ਭਾਈਚਾਰੇ ਪ੍ਰਤੀ ਵਚਨਬੱਧਤਾ ਦਾ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ, ਜੋ ਉਪਭੋਗਤਾਵਾਂ, ਡਿਵੈਲਪਰਾਂ, ਅਤੇ ਸਕਾਰਾਤਮਕ ਪ੍ਰੈਸ ਨੂੰ ਆਕਰਸ਼ਿਤ ਕਰ ਸਕਦਾ ਹੈ।
  2. ਈਕੋਸਿਸਟਮ ਬਿਲਡਿੰਗ: ਮਾਡਲ ਵੇਟਸ ਜਾਰੀ ਕਰਨਾ, ਭਾਵੇਂ ਪੂਰੀ ਪਾਰਦਰਸ਼ਤਾ ਤੋਂ ਬਿਨਾਂ, ਡਿਵੈਲਪਰਾਂ ਨੂੰ AI ਸਿਸਟਮ ਦੇ ਸਿਖਰ ‘ਤੇ ਐਪਲੀਕੇਸ਼ਨ ਬਣਾਉਣ ਲਈ ਉਤਸ਼ਾਹਿਤ ਕਰਦਾ ਹੈ, ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਇੱਕ ਨਿਰਭਰ ਈਕੋਸਿਸਟਮ ਬਣਾਉਂਦਾ ਹੈ ਜੋ ਮੂਲ ਕੰਪਨੀ ਨੂੰ ਲਾਭ ਪਹੁੰਚਾਉਂਦਾ ਹੈ।
  3. ਰੈਗੂਲੇਟਰੀ ਆਰਬਿਟਰੇਜ: ਇਹ ਇੱਕ ਖਾਸ ਤੌਰ ‘ਤੇ ਚਿੰਤਾਜਨਕ ਡਰਾਈਵਰ ਹੈ। ਆਉਣ ਵਾਲੇ ਨਿਯਮ, ਜਿਵੇਂ ਕਿ European Union’s AI Act (2024), ਕੁਝ ਉੱਚ-ਜੋਖਮ ਵਾਲੇ AI ਸਿਸਟਮਾਂ ‘ਤੇ ਸਖ਼ਤ ਲੋੜਾਂ ਲਾਗੂ ਕਰਨ ਦੀ ਉਮੀਦ ਹੈ। ਹਾਲਾਂਕਿ, ‘ਮੁਫ਼ਤ ਅਤੇ ਓਪਨ-ਸੋਰਸ ਸਾਫਟਵੇਅਰ’ ਲਈ ਛੋਟਾਂ ਜਾਂ ਹਲਕੀ ਜਾਂਚ ਅਕਸਰ ਪ੍ਰਸਤਾਵਿਤ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ‘ਓਪਨ ਸੋਰਸ’ ਲੇਬਲ ਲਾਗੂ ਕਰਕੇ - ਭਾਵੇਂ ਸਥਾਪਿਤ ਪਰਿਭਾਸ਼ਾਵਾਂ ਅਨੁਸਾਰ ਗਲਤ ਤਰੀਕੇ ਨਾਲ - ਕੰਪਨੀਆਂ ਇਹਨਾਂ ਨਿਯਮਾਂ ਨੂੰ ਵਧੇਰੇ ਆਸਾਨੀ ਨਾਲ ਨੈਵੀਗੇਟ ਕਰਨ ਦੀ ਉਮੀਦ ਕਰ ਸਕਦੀਆਂ ਹਨ, ਮਲਕੀਅਤੀ, ਉੱਚ-ਜੋਖਮ ਵਾਲੇ ਸਿਸਟਮਾਂ ਨਾਲ ਜੁੜੇ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਮਹਿੰਗੇ ਪਾਲਣਾ ਬੋਝ ਤੋਂ ਬਚਦੀਆਂ ਹਨ। ਇਹ ਰਣਨੀਤਕ ਲੇਬਲਿੰਗ ਇੱਕ ਸੰਭਾਵੀ ਕਮਜ਼ੋਰੀ ਦਾ ਸ਼ੋਸ਼ਣ ਕਰਦੀ ਹੈ, ਸੁਰੱਖਿਆ ਅਤੇ ਪਾਰਦਰਸ਼ਤਾ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣ ਦੇ ਨਿਯਮ ਦੇ ਇਰਾਦੇ ਨੂੰ ਕਮਜ਼ੋਰ ਕਰਦੀ ਹੈ।

ਇਹ ਅਭਿਆਸ ਅੰਤ ਵਿੱਚ ‘ਓਪਨ ਸੋਰਸ’ ਸ਼ਬਦ ਦਾ ਮੁੱਲ ਘਟਾਉਂਦਾ ਹੈ ਅਤੇ ਉਲਝਣ ਪੈਦਾ ਕਰਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਉਪਭੋਗਤਾਵਾਂ, ਡਿਵੈਲਪਰਾਂ, ਅਤੇ ਖੋਜਕਰਤਾਵਾਂ ਲਈ ਇਹ ਪਤਾ ਲਗਾਉਣਾ ਔਖਾ ਹੋ ਜਾਂਦਾ ਹੈ ਕਿ ਕਿਹੜੇ AI ਸਿਸਟਮ ਅਸਲ ਵਿੱਚ ਪਾਰਦਰਸ਼ਤਾ ਅਤੇ ਆਜ਼ਾਦੀਆਂ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦੇ ਹਨ ਜਿਨ੍ਹਾਂ ਦਾ ਲੇਬਲ ਮਤਲਬ ਹੈ।

ਵਿਗਿਆਨ ਲਈ ਸੱਚਾ ਖੁੱਲ੍ਹਾਪਣ ਤੁਰੰਤ ਕਿਉਂ ਮਾਇਨੇ ਰੱਖਦਾ ਹੈ

ਵਿਗਿਆਨਕ ਭਾਈਚਾਰੇ ਲਈ, ਇਸ ਬਹਿਸ ਵਿੱਚ ਦਾਅ ਬਹੁਤ ਉੱਚੇ ਹਨ। ਵਿਗਿਆਨ ਪਾਰਦਰਸ਼ਤਾ, ਪ੍ਰਤੀਕ੍ਰਿਤੀ, ਅਤੇ ਸੁਤੰਤਰ ਤਸਦੀਕ ਦੀ ਯੋਗਤਾ ‘ਤੇ ਵਧਦਾ-ਫੁੱਲਦਾ ਹੈ। ਖੋਜ ਵਿੱਚ AI ਦਾ ਵੱਧ ਰਿਹਾ ਏਕੀਕਰਣ - ਜੀਨੋਮਿਕ ਡਾਟਾ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਅਤੇ ਜਲਵਾਯੂ ਤਬਦੀਲੀ ਦਾ ਮਾਡਲਿੰਗ ਕਰਨ ਤੋਂ ਲੈ ਕੇ ਨਵੀਆਂ ਸਮੱਗਰੀਆਂ ਦੀ ਖੋਜ ਕਰਨ ਅਤੇ ਗੁੰਝਲਦਾਰ ਜੀਵ-ਵਿਗਿਆਨਕ ਪ੍ਰਣਾਲੀਆਂ ਨੂੰ ਸਮਝਣ ਤੱਕ - ਇਹਨਾਂ AI ਸਾਧਨਾਂ ਦੀ ਪ੍ਰਕਿਰਤੀ ਨੂੰ ਨਾਜ਼ੁਕ ਤੌਰ ‘ਤੇ ਮਹੱਤਵਪੂਰਨ ਬਣਾਉਂਦਾ ਹੈ। ‘ਬਲੈਕ ਬਾਕਸ’ AI ਸਿਸਟਮਾਂ ‘ਤੇ ਭਰੋਸਾ ਕਰਨਾ, ਜਾਂ ਉਹ ਜੋ ਅਸਲ ਪਾਰਦਰਸ਼ਤਾ ਪ੍ਰਦਾਨ ਕੀਤੇ ਬਿਨਾਂ ਖੁੱਲ੍ਹੇ ਹੋਣ ਦਾ ਦਿਖਾਵਾ ਕਰਦੇ ਹਨ, ਡੂੰਘੇ ਜੋਖਮ ਪੇਸ਼ ਕਰਦੇ ਹਨ:

  • ਖਰਾਬ ਪ੍ਰਤੀਕ੍ਰਿਤੀ: ਜੇਕਰ ਖੋਜਕਰਤਾ ਕਿਸੇ ਅਧਿਐਨ ਵਿੱਚ ਵਰਤੇ ਗਏ AI ਮਾਡਲ ਦੇ ਪਿੱਛੇ ਸਿਖਲਾਈ ਡਾਟਾ ਅਤੇ ਵਿਧੀ ਤੱਕ ਪਹੁੰਚ ਜਾਂ ਸਮਝ ਨਹੀਂ ਸਕਦੇ, ਤਾਂ ਨਤੀਜਿਆਂ ਨੂੰ ਦੁਹਰਾਉਣਾ ਅਸੰਭਵ ਹੋ ਜਾਂਦਾ ਹੈ। ਇਹ ਮੂਲ ਰੂਪ ਵਿੱਚ ਵਿਗਿਆਨਕ ਵਿਧੀ ਦੇ ਇੱਕ ਮੁੱਖ ਥੰਮ੍ਹ ਨੂੰ ਕਮਜ਼ੋਰ ਕਰਦਾ ਹੈ। ਨਤੀਜਿਆਂ ‘ਤੇ ਕਿਵੇਂ ਭਰੋਸਾ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ਜਾਂ ਉਹਨਾਂ ‘ਤੇ ਨਿਰਮਾਣ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ਜੇਕਰ ਉਹਨਾਂ ਦੀ ਸੁਤੰਤਰ ਤੌਰ ‘ਤੇ ਪੁਸ਼ਟੀ ਨਹੀਂ ਕੀਤੀ ਜਾ ਸਕਦੀ?
  • ਲੁਕੇ ਹੋਏ ਪੱਖਪਾਤ ਅਤੇ ਸੀਮਾਵਾਂ: ਸਾਰੇ AI ਮਾਡਲ ਆਪਣੇ ਸਿਖਲਾਈ ਡਾਟਾ ਅਤੇ ਡਿਜ਼ਾਈਨ ਵਿਕਲਪਾਂ ਤੋਂ ਪੱਖਪਾਤ ਪ੍ਰਾਪਤ ਕਰਦੇ ਹਨ। ਪਾਰਦਰਸ਼ਤਾ ਤੋਂ ਬਿਨਾਂ, ਖੋਜਕਰਤਾ ਇਹਨਾਂ ਪੱਖਪਾਤਾਂ ਦਾ ਸਹੀ ਢੰਗ ਨਾਲ ਮੁਲਾਂਕਣ ਨਹੀਂ ਕਰ ਸਕਦੇ ਜਾਂ ਮਾਡਲ ਦੀਆਂ ਸੀਮਾਵਾਂ ਨੂੰ ਨਹੀਂ ਸਮਝ ਸਕਦੇ। ਅਣਜਾਣੇ ਵਿੱਚ ਇੱਕ ਪੱਖਪਾਤੀ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰਨ ਨਾਲ ਗਲਤ ਨਤੀਜੇ, ਨੁਕਸਦਾਰ ਸਿੱਟੇ, ਅਤੇ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਨੁਕਸਾਨਦੇਹ ਅਸਲ-ਸੰਸਾਰ ਦੇ ਨਤੀਜੇ ਨਿਕਲ ਸਕਦੇ ਹਨ, ਖਾਸ ਕਰਕੇ ਮੈਡੀਕਲ ਖੋਜ ਜਾਂ ਸਮਾਜਿਕ ਵਿਗਿਆਨ ਵਰਗੇ ਸੰਵੇਦਨਸ਼ੀਲ ਖੇਤਰਾਂ ਵਿੱਚ।
  • ਜਾਂਚ ਦੀ ਘਾਟ: ਅਪਾਰਦਰਸ਼ੀ ਮਾਡਲ ਸਖ਼ਤ ਪੀਅਰ ਸਮੀਖਿਆ ਤੋਂ ਬਚਦੇ ਹਨ। ਵਿਗਿਆਨਕ ਭਾਈਚਾਰਾ ਮਾਡਲ ਦੇ ਅੰਦਰੂਨੀ ਕੰਮਕਾਜ ਦੀ ਪੂਰੀ ਤਰ੍ਹਾਂ ਪੁੱਛਗਿੱਛ ਨਹੀਂ ਕਰ ਸਕਦਾ, ਇਸਦੇ ਤਰਕ ਵਿੱਚ ਸੰਭਾਵੀ ਗਲਤੀਆਂ ਦੀ ਪਛਾਣ ਨਹੀਂ ਕਰ ਸਕਦਾ, ਜਾਂ ਇਸਦੀਆਂ ਭਵਿੱਖਬਾਣੀਆਂ ਨਾਲ ਜੁੜੀਆਂ ਅਨਿਸ਼ਚਿਤਤਾਵਾਂ ਨੂੰ ਨਹੀਂ ਸਮਝ ਸਕਦਾ। ਇਹ ਵਿਗਿਆਨਕ ਜਾਂਚ ਦੀ ਸਵੈ-ਸੁਧਾਰਕ ਪ੍ਰਕਿਰਤੀ ਵਿੱਚ ਰੁਕਾਵਟ ਪਾਉਂਦਾ ਹੈ।
  • ਕਾਰਪੋਰੇਟ ਸਿਸਟਮਾਂ ‘ਤੇ ਨਿਰਭਰਤਾ: ਕਾਰਪੋਰੇ