IBM Granite 4.0 Tiny: ਝਲਕ

IBM ਨੇ ਹਾਲ ਹੀ ਵਿੱਚ Granite 4.0 Tiny ਦੀ ਝਲਕ ਰਿਲੀਜ਼ ਕਰਨ ਦਾ ਐਲਾਨ ਕੀਤਾ ਹੈ, ਜੋ ਕਿ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਦੀ ਆਉਣ ਵਾਲੀ Granite 4.0 ਸੀਰੀਜ਼ ਵਿੱਚ ਸਭ ਤੋਂ ਸੰਖੇਪ ਦੁਹਰਾਓ ਹੈ। Apache 2.0 ਲਾਇਸੈਂਸ ਦੇ ਅਧੀਨ ਵੰਡਿਆ ਗਿਆ, ਇਹ ਮਾਡਲ ਲੰਬੇ-ਸੰਦਰਭ ਪ੍ਰੋਸੈਸਿੰਗ ਅਤੇ ਨਿਰਦੇਸ਼-ਸੰਚਾਲਿਤ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੋਵਾਂ ਲਈ ਬੜੀ ਬਾਰੀਕੀ ਨਾਲ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ, ਸਰੋਤ ਕੁਸ਼ਲਤਾ, ਖੁੱਲ੍ਹੀ ਪਹੁੰਚਯੋਗਤਾ, ਅਤੇ ਮਜ਼ਬੂਤ ​​ਕਾਰਗੁਜ਼ਾਰੀ ਨੂੰ ਧਿਆਨ ਨਾਲ ਸੰਤੁਲਿਤ ਕਰਦਾ ਹੈ। ਇਹ ਲਾਂਚ ਬੁਨਿਆਦੀ ਮਾਡਲਾਂ ਦੇ ਵਿਕਾਸ ਅਤੇ ਤਾਇਨਾਤੀ ਲਈ IBM ਦੀ ਨਿਰੰਤਰ ਵਚਨਬੱਧਤਾ ਨੂੰ ਰੇਖਾਂਕਿਤ ਕਰਦਾ ਹੈ ਜੋ ਨਾ ਸਿਰਫ਼ ਖੁੱਲ੍ਹੇ ਅਤੇ ਪਾਰਦਰਸ਼ੀ ਹਨ, ਸਗੋਂ ਖਾਸ ਤੌਰ ‘ਤੇ ਐਂਟਰਪ੍ਰਾਈਜ਼-ਗ੍ਰੇਡ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਤਿਆਰ ਕੀਤੇ ਗਏ ਹਨ।

Granite 4.0 Tiny Preview ਵਿੱਚ ਦੋ ਵੱਖਰੇ ਸੰਸਕਰਣ ਸ਼ਾਮਲ ਹਨ: Base-Preview, ਇੱਕ ਨਵੀਨਤਾਕਾਰੀ ਡੀਕੋਡਰ-ਓਨਲੀ ਆਰਕੀਟੈਕਚਰ ਨੂੰ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਦਾ ਹੈ, ਅਤੇ Tiny-Preview (Instruct), ਜਿਸਨੂੰ ਗੱਲਬਾਤ ਅਤੇ ਬਹੁਭਾਸ਼ਾਈ ਦੋਵਾਂ ਪਰਸਪਰ ਕ੍ਰਿਆਵਾਂ ਲਈ ਸੁਧਾਰਿਆ ਗਿਆ ਹੈ। ਇਸਦੀ ਘੱਟੋ-ਘੱਟ ਪੈਰਾਮੀਟਰ ਗਿਣਤੀ ਦੇ ਬਾਵਜੂਦ, Granite 4.0 Tiny ਤਰਕ ਅਤੇ ਉਤਪਾਦਨ ਬੈਂਚਮਾਰਕਾਂ ਦੀ ਇੱਕ ਸੀਮਾ ਵਿੱਚ ਪ੍ਰਤੀਯੋਗੀ ਨਤੀਜੇ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ, ਇਸਦੇ ਹਾਈਬ੍ਰਿਡ ਡਿਜ਼ਾਈਨ ਦੀ ਪ੍ਰਭਾਵਸ਼ੀਲਤਾ ਨੂੰ ਉਜਾਗਰ ਕਰਦਾ ਹੈ।

ਆਰਕੀਟੈਕਚਰ ਡੀਪ ਡਾਈਵ: ਮਾਂਬਾ-2-ਪ੍ਰੇਰਿਤ ਡਾਇਨਾਮਿਕਸ ਨਾਲ ਇੱਕ ਹਾਈਬ੍ਰਿਡ ਮਿਕਸਚਰ-ਆਫ਼-ਐਕਸਪਰਟਸ ਫਰੇਮਵਰਕ

Granite 4.0 Tiny ਦੇ ਦਿਲ ਵਿੱਚ ਇੱਕ ਵਧੀਆ ਹਾਈਬ੍ਰਿਡ ਮਿਕਸਚਰ-ਆਫ਼-ਐਕਸਪਰਟਸ (MoE) ਆਰਕੀਟੈਕਚਰ ਹੈ, ਜਿਸ ਵਿੱਚ ਕੁੱਲ 7 ਬਿਲੀਅਨ ਪੈਰਾਮੀਟਰ ਸ਼ਾਮਲ ਹਨ, ਜਿਸ ਵਿੱਚੋਂ ਸਿਰਫ਼ 1 ਬਿਲੀਅਨ ਪੈਰਾਮੀਟਰ ਹਰੇਕ ਫਾਰਵਰਡ ਪਾਸ ਦੌਰਾਨ ਸਰਗਰਮੀ ਨਾਲ ਜੁੜੇ ਹੋਏ ਹਨ। ਇਹ ਅੰਦਰੂਨੀ ਵਿਰਲਾਪਨ ਮਾਡਲ ਨੂੰ ਕੰਪਿਊਟੇਸ਼ਨਲ ਮੰਗਾਂ ਨੂੰ ਕਾਫ਼ੀ ਹੱਦ ਤੱਕ ਘਟਾਉਂਦੇ ਹੋਏ ਸਕੇਲੇਬਲ ਪ੍ਰਦਰਸ਼ਨ ਪ੍ਰਦਾਨ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਇਹ ਖਾਸ ਤੌਰ ‘ਤੇ ਸਰੋਤ-ਸੀਮਤ ਵਾਤਾਵਰਨ ਵਿੱਚ ਤਾਇਨਾਤੀ ਅਤੇ ਐਜ-ਅਧਾਰਤ ਅਨੁਮਾਨ ਦ੍ਰਿਸ਼ਾਂ ਲਈ ਢੁਕਵਾਂ ਬਣ ਜਾਂਦਾ ਹੈ।

Base-Preview ਵੇਰੀਐਂਟ Mamba-2-ਸ਼ੈਲੀ ਲੇਅਰਾਂ ਨਾਲ ਵਧੇ ਹੋਏ ਡੀਕੋਡਰ-ਓਨਲੀ ਆਰਕੀਟੈਕਚਰ ਦਾ ਲਾਭ ਉਠਾਉਂਦਾ ਹੈ, ਜੋ ਕਿ ਰਵਾਇਤੀ ਧਿਆਨ ਵਿਧੀ ਲਈ ਇੱਕ ਰੇਖਿਕ ਆਵਰਤੀ ਵਿਕਲਪ ਪੇਸ਼ ਕਰਦਾ ਹੈ। ਇਹ ਆਰਕੀਟੈਕਚਰਲ ਨਵੀਨਤਾ ਮਾਡਲ ਨੂੰ ਇਨਪੁਟ ਲੰਬਾਈ ਵਧਾਉਣ ਦੇ ਨਾਲ ਵਧੇਰੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਸਕੇਲ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ, ਜਿਸ ਨਾਲ ਡੂੰਘਾਈ ਨਾਲ ਦਸਤਾਵੇਜ਼ ਵਿਸ਼ਲੇਸ਼ਣ, ਵਿਆਪਕ ਸੰਵਾਦ ਸੰਖੇਪ, ਅਤੇ ਗਿਆਨ-ਗਹਿਰਾਈ ਵਾਲੇ ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ ਦੇਣ ਵਰਗੇ ਲੰਬੇ-ਸੰਦਰਭ ਕਾਰਜਾਂ ਵਿੱਚ ਇਸਦੀ ਪ੍ਰਭਾਵਸ਼ੀਲਤਾ ਨੂੰ ਵਧਾਇਆ ਜਾ ਸਕੇ।

ਇੱਕ ਹੋਰ ਧਿਆਨ ਦੇਣ ਯੋਗ ਆਰਕੀਟੈਕਚਰਲ ਫੈਸਲਾ NoPE (ਕੋਈ ਸਥਿਤੀਗਤ ਏਨਕੋਡਿੰਗ ਨਹੀਂ) ਦਾ ਲਾਗੂਕਰਨ ਹੈ। ਫਿਕਸਡ ਜਾਂ ਸਿੱਖੀਆਂ ਹੋਈਆਂ ਸਥਿਤੀਗਤ ਏਮਬੈਡਿੰਗਾਂ ‘ਤੇ ਨਿਰਭਰ ਕਰਨ ਦੀ ਬਜਾਏ, ਮਾਡਲ ਸਥਿਤੀ ਜਾਣਕਾਰੀ ਨੂੰ ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਇਸਦੇ ਲੇਅਰ ਡਾਇਨਾਮਿਕਸ ਵਿੱਚ ਸ਼ਾਮਲ ਕਰਦਾ ਹੈ। ਇਹ ਪਹੁੰਚ ਵੱਖ-ਵੱਖ ਇਨਪੁਟ ਲੰਬਾਈਆਂ ਵਿੱਚ ਸੁਧਾਰੀ ਜਨਰਲਾਈਜ਼ੇਸ਼ਨ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦੀ ਹੈ ਅਤੇ ਲੰਬੇ-ਲੜੀ ਉਤਪਾਦਨ ਦੌਰਾਨ ਇਕਸਾਰਤਾ ਬਣਾਈ ਰੱਖਣ ਵਿੱਚ ਮਦਦ ਕਰਦੀ ਹੈ।

ਬੈਂਚਮਾਰਕ ਪ੍ਰਦਰਸ਼ਨ: ਸਮਰੱਥਾ ਨਾਲ ਸਮਝੌਤਾ ਕੀਤੇ ਬਿਨਾਂ ਕੁਸ਼ਲਤਾ

ਭਾਵੇਂ ਕਿ ਇੱਕ ਝਲਕ ਰਿਲੀਜ਼ ਦੇ ਤੌਰ ‘ਤੇ, Granite 4.0 Tiny ਪਹਿਲਾਂ ਹੀ IBM ਦੀ Granite ਸੀਰੀਜ਼ ਦੇ ਪਿਛਲੇ ਮਾਡਲਾਂ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਪ੍ਰਦਰਸ਼ਨ ਸੁਧਾਰਾਂ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਬੈਂਚਮਾਰਕ ਮੁਲਾਂਕਣਾਂ ਵਿੱਚ, Base-Preview ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਦਾ ਹੈ:

  • DROP (ਪੈਰਾਗ੍ਰਾਫਾਂ ਉੱਤੇ ਵੱਖਰਾ ਤਰਕ) ‘ਤੇ 5.6-ਪੁਆਇੰਟ ਦਾ ਵਾਧਾ, ਮਲਟੀ-ਹੌਪ ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ ਦੇਣ ਲਈ ਇੱਕ ਵਿਆਪਕ ਤੌਰ ‘ਤੇ ਮਾਨਤਾ ਪ੍ਰਾਪਤ ਬੈਂਚਮਾਰਕ ਜੋ ਜਵਾਬ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਟੈਕਸਟ ਦੇ ਕਈ ਹਿੱਸਿਆਂ ਵਿੱਚ ਤਰਕ ਕਰਨ ਦੀ ਮਾਡਲ ਦੀ ਯੋਗਤਾ ਦਾ ਮੁਲਾਂਕਣ ਕਰਦਾ ਹੈ।
  • AGIEval ‘ਤੇ 3.8-ਪੁਆਇੰਟ ਦਾ ਸੁਧਾਰ, ਇੱਕ ਵਿਆਪਕ ਬੈਂਚਮਾਰਕ ਜੋ ਆਮ ਭਾਸ਼ਾ ਦੀ ਸਮਝ ਅਤੇ ਤਰਕ ਸਮਰੱਥਾਵਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਭਾਸ਼ਾਈ ਅਤੇ ਬੋਧਾਤਮਕ ਕਾਰਜਾਂ ਦੇ ਇੱਕ ਵਿਆਪਕ ਸਪੈਕਟ੍ਰਮ ਨੂੰ ਕਵਰ ਕਰਦਾ ਹੈ।

ਇਹ ਪ੍ਰਦਰਸ਼ਨ ਲਾਭ ਮਾਡਲ ਦੇ ਉੱਨਤ ਆਰਕੀਟੈਕਚਰ ਅਤੇ ਇਸਦੇ ਵਿਆਪਕ ਪ੍ਰੀਟ੍ਰੇਨਿੰਗ ਰੈਜੀਮ ਦੋਵਾਂ ਨੂੰ ਦਿੱਤਾ ਜਾ ਸਕਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਕਥਿਤ ਤੌਰ ‘ਤੇ ਵਿਭਿੰਨ ਡੋਮੇਨਾਂ ਅਤੇ ਭਾਸ਼ਾਈ ਢਾਂਚਿਆਂ ਤੋਂ ਲਏ ਗਏ 2.5 ਟ੍ਰਿਲੀਅਨ ਟੋਕਨ ਦੀ ਪ੍ਰੋਸੈਸਿੰਗ ਸ਼ਾਮਲ ਹੈ। ਇਹ ਵਿਆਪਕ ਪ੍ਰੀਟ੍ਰੇਨਿੰਗ ਮਾਡਲ ਨੂੰ ਡੇਟਾ ਦੇ ਅੰਦਰ ਪੈਟਰਨਾਂ ਅਤੇ ਸਬੰਧਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਨੂੰ ਕੈਪਚਰ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ, ਜਿਸ ਨਾਲ ਵੱਖ-ਵੱਖ ਕਾਰਜਾਂ ਵਿੱਚ ਸੁਧਾਰੀ ਜਨਰਲਾਈਜ਼ੇਸ਼ਨ ਅਤੇ ਪ੍ਰਦਰਸ਼ਨ ਹੁੰਦਾ ਹੈ।

ਨਿਰਦੇਸ਼-ਟਿਊਨਡ ਵੇਰੀਐਂਟ: ਗੱਲਬਾਤ, ਸਪਸ਼ਟਤਾ ਅਤੇ ਵਿਆਪਕ ਬਹੁਭਾਸ਼ਾਈ ਸਹਾਇਤਾ ਲਈ ਤਿਆਰ

Granite-4.0-Tiny-Preview (Instruct) ਵੇਰੀਐਂਟ ਸੁਪਰਵਾਈਜ਼ਡ ਫਾਈਨ-ਟਿਊਨਿੰਗ (SFT) ਅਤੇ ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ (RL) ਦੇ ਸੁਮੇਲ ਦੁਆਰਾ ਬੇਸ ਮਾਡਲ ‘ਤੇ ਬਣਾਇਆ ਗਿਆ ਹੈ, ਇੱਕ ਟੂਲੂ-ਸ਼ੈਲੀ ਡੇਟਾਸੈਟ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਜਿਸ ਵਿੱਚ ਖੁੱਲ੍ਹੇ ਅਤੇ ਸਿੰਥੈਟਿਕ ਤੌਰ ‘ਤੇ ਤਿਆਰ ਕੀਤੇ ਗਏ ਸੰਵਾਦ ਦੋਵੇਂ ਸ਼ਾਮਲ ਹਨ। ਇਹ ਅਨੁਕੂਲਿਤ ਪਹੁੰਚ ਨਿਰਦੇਸ਼-ਪਾਲਣਾ ਅਤੇ ਪਰਸਪਰ ਕ੍ਰਿਆਵਾਂ ਵਾਲੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਮਾਡਲ ਨੂੰ ਅਨੁਕੂਲਿਤ ਕਰਦੀ ਹੈ।

8,192 ਟੋਕਨ ਇਨਪੁਟ ਵਿੰਡੋਜ਼ ਅਤੇ 8,192 ਟੋਕਨ ਉਤਪਾਦਨ ਲੰਬਾਈਆਂ ਦਾ ਸਮਰਥਨ ਕਰਦੇ ਹੋਏ, ਮਾਡਲ ਵਿਸਤ੍ਰਿਤ ਪਰਸਪਰ ਕ੍ਰਿਆਵਾਂ ਵਿੱਚ ਇਕਸਾਰਤਾ ਅਤੇ ਵਫ਼ਾਦਾਰੀ ਬਣਾਈ ਰੱਖਦਾ ਹੈ। ਐਨਕੋਡਰ-ਡੀਕੋਡਰ ਹਾਈਬ੍ਰਿਡਾਂ ਦੇ ਉਲਟ, ਜੋ ਅਕਸਰ ਪ੍ਰਦਰਸ਼ਨ ਲਾਭਾਂ ਲਈ ਵਿਆਖਿਆਯੋਗਤਾ ਦੀ ਕੁਰਬਾਨੀ ਕਰਦੇ ਹਨ, ਇੱਥੇ ਡੀਕੋਡਰ-ਓਨਲੀ ਸੈੱਟਅੱਪ ਸਪੱਸ਼ਟ ਅਤੇ ਵਧੇਰੇ ਟਰੇਸੇਬਲ ਆਉਟਪੁੱਟ ਦਿੰਦਾ ਹੈ, ਇਸ ਨੂੰ ਵਿਸ਼ੇਸ਼ ਤੌਰ ‘ਤੇ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਅਤੇ ਸੁਰੱਖਿਆ-ਨਾਜ਼ੁਕ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਕੀਮਤੀ ਬਣਾਉਂਦਾ ਹੈ ਜਿੱਥੇ ਪਾਰਦਰਸ਼ਤਾ ਅਤੇ ਭਵਿੱਖਬਾਣੀ ਮਹੱਤਵਪੂਰਨ ਹਨ।

ਵਿਸਤ੍ਰਿਤ ਮੁਲਾਂਕਣ ਮੈਟ੍ਰਿਕਸ:

  • IFEval ‘ਤੇ 86.1, ਨਿਰਦੇਸ਼-ਪਾਲਣਾ ਬੈਂਚਮਾਰਕਾਂ ਵਿੱਚ ਮਜ਼ਬੂਤ ​​ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਜੋ ਕਿ ਮਾਡਲ ਦੀ ਗੁੰਝਲਦਾਰ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਸਹੀ ਅਤੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਲਾਗੂ ਕਰਨ ਦੀ ਯੋਗਤਾ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ।
  • GSM8K ‘ਤੇ 70.05, ਗ੍ਰੇਡ-ਸਕੂਲ ਗਣਿਤ ਦੀ ਸਮੱਸਿਆ ਹੱਲ ਕਰਨ ‘ਤੇ ਕੇਂਦ੍ਰਿਤ ਇੱਕ ਬੈਂਚਮਾਰਕ, ਮਾਡਲ ਦੀ ਗਿਣਾਤਮਕ ਤਰਕ ਅਤੇ ਗਣਿਤਕ ਕਾਰਵਾਈਆਂ ਲਈ ਰੁਝਾਨ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ।
  • HumanEval ‘ਤੇ 82.41, Python ਕੋਡ ਉਤਪਾਦਨ ਸ਼ੁੱਧਤਾ ਨੂੰ ਮਾਪਦਾ ਹੈ, ਸਿੰਟੈਕਸਿਕ ਤੌਰ ‘ਤੇ ਸਹੀ ਅਤੇ ਅਰਥਪੂਰਨ ਕੋਡ ਸਨਿੱਪਟ ਤਿਆਰ ਕਰਨ ਵਿੱਚ ਮਾਡਲ ਦੀ ਮੁਹਾਰਤ ਨੂੰ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਦਾ ਹੈ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, ਨਿਰਦੇਸ਼ ਮਾਡਲ 12 ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਬਹੁਭਾਸ਼ਾਈ ਪਰਸਪਰ ਕ੍ਰਿਆਵਾਂ ਦਾ ਸਮਰਥਨ ਕਰਦਾ ਹੈ, ਗਾਹਕ ਸੇਵਾ, ਐਂਟਰਪ੍ਰਾਈਜ਼ ਆਟੋਮੇਸ਼ਨ, ਅਤੇ ਵਿਦਿਅਕ ਸਾਧਨਾਂ ਵਿੱਚ ਗਲੋਬਲ ਤਾਇਨਾਤੀਆਂ ਦੀ ਸਹੂਲਤ ਦਿੰਦਾ ਹੈ। ਇਹ ਬਹੁਭਾਸ਼ਾਈ ਸਮਰੱਥਾ ਮਾਡਲ ਦੀ ਪਹੁੰਚ ਅਤੇ ਉਪਯੋਗਤਾ ਦਾ ਵਿਸਤਾਰ ਕਰਦੀ ਹੈ, ਇਸ ਨੂੰ ਵੱਖ-ਵੱਖ ਭਾਸ਼ਾਈ ਸੰਦਰਭਾਂ ਵਿੱਚ ਉਪਭੋਗਤਾਵਾਂ ਅਤੇ ਉਪਯੋਗਤਾਵਾਂ ਦੀ ਵਿਭਿੰਨ ਸ਼੍ਰੇਣੀ ਨੂੰ ਪੂਰਾ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦੀ ਹੈ। ਸਮਰਥਿਤ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਅੰਗਰੇਜ਼ੀ, ਸਪੈਨਿਸ਼, ਫ੍ਰੈਂਚ, ਜਰਮਨ, ਇਤਾਲਵੀ, ਪੁਰਤਗਾਲੀ, ਡੱਚ, ਰੂਸੀ, ਚੀਨੀ, ਜਾਪਾਨੀ, ਕੋਰੀਆਈ ਅਤੇ ਅਰਬੀ ਸ਼ਾਮਲ ਹਨ, ਜੋ ਦੁਨੀਆ ਦੀ ਆਬਾਦੀ ਦੇ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਹਿੱਸੇ ਨੂੰ ਕਵਰ ਕਰਦੀਆਂ ਹਨ।

ਓਪਨ-ਸੋਰਸ ਉਪਲਬਧਤਾ ਦਾ ਮਹੱਤਵ

IBM ਦਾ ਦੋਵੇਂ Granite 4.0 Tiny ਮਾਡਲਾਂ ਨੂੰ Apache 2.0 ਲਾਇਸੈਂਸ ਦੇ ਅਧੀਨ ਰਿਲੀਜ਼ ਕਰਨ ਦਾ ਫੈਸਲਾ AI ਕਮਿਊਨਿਟੀ ਵਿੱਚ ਪਾਰਦਰਸ਼ਤਾ ਅਤੇ ਸਹਿਯੋਗ ਨੂੰ ਵਧਾਉਣ ਵੱਲ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਕਦਮ ਹੈ। ਮਾਡਲ ਵਜ਼ਨ, ਸੰਰਚਨਾ ਫਾਈਲਾਂ, ਅਤੇ ਨਮੂਨਾ ਵਰਤੋਂ ਸਕ੍ਰਿਪਟਾਂ ਤੱਕ ਖੁੱਲ੍ਹੀ ਪਹੁੰਚ ਪ੍ਰਦਾਨ ਕਰਕੇ, IBM ਖੋਜਕਰਤਾਵਾਂ, ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਸੰਸਥਾਵਾਂ ਨੂੰ ਆਪਣੇ NLP ਵਰਕਫਲੋ ਵਿੱਚ ਮਾਡਲਾਂ ਨੂੰ ਸੁਤੰਤਰ ਰੂਪ ਵਿੱਚ ਪ੍ਰਯੋਗ ਕਰਨ, ਫਾਈਨ-ਟਿਊਨ ਕਰਨ ਅਤੇ ਏਕੀਕ੍ਰਿਤ ਕਰਨ ਲਈ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਇਹ ਓਪਨ-ਸੋਰਸ ਪਹੁੰਚ ਨਾ ਸਿਰਫ਼ ਨਵੀਨਤਾ ਨੂੰ ਤੇਜ਼ ਕਰਦੀ ਹੈ ਸਗੋਂ ਮਾਡਲ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਅਤੇ ਸੀਮਾਵਾਂ ਦੀ ਡੂੰਘੀ ਸਮਝ ਨੂੰ ਵੀ ਉਤਸ਼ਾਹਿਤ ਕਰਦੀ ਹੈ।

Apache 2.0 ਲਾਇਸੈਂਸ ਵਿਸ਼ੇਸ਼ ਤੌਰ ‘ਤੇ ਫਾਇਦੇਮੰਦ ਹੈ ਕਿਉਂਕਿ ਇਹ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਕਿਸੇ ਵੀ ਸੋਧ ਜਾਂ ਡੈਰੀਵੇਟਿਵ ਕੰਮਾਂ ਦਾ ਖੁਲਾਸਾ ਕਰਨ ਦੀ ਲੋੜ ਤੋਂ ਬਿਨਾਂ, ਸੌਫਟਵੇਅਰ ਦੀ ਵਪਾਰਕ ਅਤੇ ਗੈਰ-ਵਪਾਰਕ ਵਰਤੋਂ ਦੋਵਾਂ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ। ਇਹ ਇਜਾਜ਼ਤ ਵਾਲਾ ਲਾਇਸੈਂਸ ਵਿਆਪਕ ਗੋਦ ਲੈਣ ਅਤੇ ਪ੍ਰਯੋਗ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦਾ ਹੈ, Granite 4.0 Tiny ਮਾਡਲਾਂ ਦੇ ਆਲੇ ਦੁਆਲੇ ਇੱਕ ਜੀਵੰਤ ਈਕੋਸਿਸਟਮ ਨੂੰ ਵਧਾਉਂਦਾ ਹੈ। ਇਸ ਤੋਂ ਇਲਾਵਾ, Hugging Face ‘ਤੇ ਮਾਡਲਾਂ ਦੀ ਉਪਲਬਧਤਾ, ਪ੍ਰੀ-ਟ੍ਰੇਨਡ ਮਾਡਲਾਂ ਨੂੰ ਸਾਂਝਾ ਕਰਨ ਅਤੇ ਖੋਜਣ ਲਈ ਇੱਕ ਪ੍ਰਸਿੱਧ ਪਲੇਟਫਾਰਮ, ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦਾ ਹੈ ਕਿ ਉਹ ਵਿਆਪਕ ਦਰਸ਼ਕਾਂ ਲਈ ਆਸਾਨੀ ਨਾਲ ਪਹੁੰਚਯੋਗ ਹਨ।

Granite 4.0 Tiny ਦੀ ਓਪਨ-ਸੋਰਸ ਉਪਲਬਧਤਾ ਜ਼ਿੰਮੇਵਾਰ AI ਵਿਕਾਸ ਲਈ IBM ਦੀ ਵਿਆਪਕ ਵਚਨਬੱਧਤਾ ਨਾਲ ਵੀ ਮੇਲ ਖਾਂਦੀ ਹੈ। ਮਾਡਲਾਂ ਨੂੰ ਪਾਰਦਰਸ਼ੀ ਅਤੇ ਆਡੀਟੇਬਲ ਬਣਾ ਕੇ, IBM ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਉਨ੍ਹਾਂ ਦੇ ਵਿਵਹਾਰ ਦੀ ਜਾਂਚ ਕਰਨ, ਸੰਭਾਵੀ ਪੱਖਪਾਤਾਂ ਦੀ ਪਛਾਣ ਕਰਨ, ਅਤੇ ਇਹ ਯਕੀਨੀ ਬਣਾਉਣ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ ਕਿ ਉਹਨਾਂ ਦੀ ਵਰਤੋਂ ਸੁਰੱਖਿਅਤ ਅਤੇ ਨੈਤਿਕ ਤਰੀਕੇ ਨਾਲ ਕੀਤੀ ਜਾ ਰਹੀ ਹੈ। AI ਪ੍ਰਣਾਲੀਆਂ ਵਿੱਚ ਵਿਸ਼ਵਾਸ ਪੈਦਾ ਕਰਨ ਅਤੇ ਵੱਖ-ਵੱਖ ਡੋਮੇਨਾਂ ਵਿੱਚ ਉਹਨਾਂ ਦੀ ਜ਼ਿੰਮੇਵਾਰ ਤਾਇਨਾਤੀ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਨ ਲਈ ਪਾਰਦਰਸ਼ਤਾ ਪ੍ਰਤੀ ਇਹ ਵਚਨਬੱਧਤਾ ਮਹੱਤਵਪੂਰਨ ਹੈ।

Granite 4.0 ਲਈ ਨੀਂਹ ਰੱਖਣਾ: ਭਵਿੱਖ ਦੀ ਇੱਕ ਝਲਕ

Granite 4.0 Tiny Preview IBM ਦੀ ਆਪਣੀ ਅਗਲੀ-ਪੀੜ੍ਹੀ ਦੀ ਭਾਸ਼ਾ ਮਾਡਲ ਸੂਟ ਲਈ ਵਿਆਪਕ ਰਣਨੀਤੀ ਦਾ ਇੱਕ ਸ਼ੁਰੂਆਤੀ ਸੰਕੇਤ ਪੇਸ਼ ਕਰਦਾ ਹੈ। ਕੁਸ਼ਲ MoE ਆਰਕੀਟੈਕਚਰ, ਮਜ਼ਬੂਤ ​​ਲੰਬੇ-ਸੰਦਰਭ ਸਹਾਇਤਾ, ਅਤੇ ਨਿਰਦੇਸ਼-ਕੇਂਦ੍ਰਿਤ ਟਿਊਨਿੰਗ ਨੂੰ ਏਕੀਕ੍ਰਿਤ ਕਰਕੇ, Granite 4.0 ਮਾਡਲ ਪਰਿਵਾਰ ਇੱਕ ਪ੍ਰਬੰਧਨਯੋਗ ਅਤੇ ਸਰੋਤ-ਅਨੁਕੂਲਿਤ ਪੈਕੇਜ ਵਿੱਚ ਅਤਿ-ਆਧੁਨਿਕ ਸਮਰੱਥਾਵਾਂ ਪ੍ਰਦਾਨ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦਾ ਹੈ। ਇਹ ਪਹੁੰਚ AI ਹੱਲਾਂ ਨੂੰ ਵਿਕਸਤ ਕਰਨ ਲਈ IBM ਦੀ ਵਚਨਬੱਧਤਾ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ ਜੋ ਨਾ ਸਿਰਫ਼ ਸ਼ਕਤੀਸ਼ਾਲੀ ਹਨ ਸਗੋਂ ਵਿਹਾਰਕ ਅਤੇ ਪਹੁੰਚਯੋਗ ਵੀ ਹਨ।

ਇਹਨਾਂ ਤਿੰਨ ਮੁੱਖ ਤੱਤਾਂ ਦਾ ਸੁਮੇਲ - ਕੁਸ਼ਲ ਆਰਕੀਟੈਕਚਰ, ਲੰਬੇ-ਸੰਦਰਭ ਸਹਾਇਤਾ, ਅਤੇ ਨਿਰਦੇਸ਼-ਕੇਂਦ੍ਰਿਤ ਟਿਊਨਿੰਗ - Granite 4.0 ਨੂੰ ਕਈ ਤਰ੍ਹਾਂ ਦੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਢੁਕਵਾਂ ਇੱਕ ਬਹੁਮੁਖੀ ਅਤੇ ਅਨੁਕੂਲ ਭਾਸ਼ਾ ਮਾਡਲ ਬਣਾਉਂਦਾ ਹੈ। ਕੁਸ਼ਲ MoE ਆਰਕੀਟੈਕਚਰ ਮਾਡਲ ਨੂੰ ਵਧ ਰਹੇ ਡੇਟਾ ਅਤੇ ਜਟਿਲਤਾ ਦੇ ਨਾਲ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਸਕੇਲ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ, ਜਦੋਂ ਕਿ ਲੰਬੇ-ਸੰਦਰਭ ਸਹਾਇਤਾ ਇਸਨੂੰ ਲੰਬੇ ਦਸਤਾਵੇਜ਼ਾਂ ਅਤੇ ਗੱਲਬਾਤਾਂ ਨੂੰ ਪ੍ਰੋਸੈਸ ਕਰਨ ਅਤੇ ਸਮਝਣ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ। ਦੂਜੇ ਪਾਸੇ, ਨਿਰਦੇਸ਼-ਕੇਂਦ੍ਰਿਤ ਟਿਊਨਿੰਗ, ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦੀ ਹੈ ਕਿ ਮਾਡਲ ਸਹੀ ਅਤੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਗੁੰਝਲਦਾਰ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਲਾਗੂ ਕਰ ਸਕਦਾ ਹੈ, ਇਸਨੂੰ ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ ਦੇਣ, ਟੈਕਸਟ ਸੰਖੇਪ ਕਰਨ, ਅਤੇ ਕੋਡ ਤਿਆਰ ਕਰਨ ਵਰਗੇ ਕਾਰਜਾਂ ਲਈ ਆਦਰਸ਼ ਬਣਾਉਂਦਾ ਹੈ।

ਜਿਵੇਂ ਕਿ Granite 4.0 ਦੇ ਹੋਰ ਰੂਪਾਂ ਨੂੰ ਪੇਸ਼ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਅਸੀਂ ਅਨੁਮਾਨ ਲਗਾ ਸਕਦੇ ਹਾਂ ਕਿ IBM ਜ਼ਿੰਮੇਵਾਰ ਅਤੇ ਖੁੱਲ੍ਹੀ AI ਵਿੱਚ ਆਪਣੇ ਨਿਵੇਸ਼ ਨੂੰ ਹੋਰ ਮਜ਼ਬੂਤ ​​ਕਰੇਗਾ, ਆਪਣੇ ਆਪ ਨੂੰ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਅਤੇ ਖੋਜ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੋਵਾਂ ਲਈ ਪਾਰਦਰਸ਼ੀ ਅਤੇ ਉੱਚ-ਪ੍ਰਦਰਸ਼ਨ ਵਾਲੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਦੇ ਮਾਰਗ ਨੂੰ ਆਕਾਰ ਦੇਣ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਤਾਕਤ ਵਜੋਂ ਸਥਾਪਿਤ ਕਰੇਗਾ। ਇਹ ਨਿਰੰਤਰ ਨਿਵੇਸ਼ IBM ਦੇ ਇਸ ਵਿਸ਼ਵਾਸ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ AI ਨੂੰ ਇੱਕ ਅਜਿਹੇ ਤਰੀਕੇ ਨਾਲ ਵਿਕਸਤ ਅਤੇ ਤਾਇਨਾਤ ਕੀਤਾ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ ਜੋ ਨੈਤਿਕ ਅਤੇ ਸਮਾਜ ਲਈ ਲਾਭਦਾਇਕ ਹੋਵੇ। ਪਾਰਦਰਸ਼ਤਾ, ਜਵਾਬਦੇਹੀ ਅਤੇ ਨਿਰਪੱਖਤਾ ਨੂੰ ਤਰਜੀਹ ਦੇ ਕੇ, IBM ਦਾ ਉਦੇਸ਼ AI ਪ੍ਰਣਾਲੀਆਂ ਬਣਾਉਣਾ ਹੈ ਜੋ ਨਾ ਸਿਰਫ਼ ਸ਼ਕਤੀਸ਼ਾਲੀ ਹਨ ਸਗੋਂ ਭਰੋਸੇਯੋਗ ਅਤੇ ਮਨੁੱਖੀ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨਾਲ ਇਕਸਾਰ ਵੀ ਹਨ।

Granite 4.0 ਸੀਰੀਜ਼ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਦੇ ਵਿਕਾਸ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਕਦਮ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ, ਜੋ ਪ੍ਰਦਰਸ਼ਨ, ਕੁਸ਼ਲਤਾ ਅਤੇ ਪਾਰਦਰਸ਼ਤਾ ਦਾ ਇੱਕ ਦਿਲਚਸਪ ਸੁਮੇਲ ਪੇਸ਼ ਕਰਦੀ ਹੈ। ਜਿਵੇਂ ਕਿ IBM ਇਸ ਖੇਤਰ ਵਿੱਚ ਨਵੀਨਤਾ ਕਰਨਾ ਜਾਰੀ ਰੱਖਦਾ ਹੈ, ਅਸੀਂ ਹੋਰ ਵੀ ਜ਼ਬਰਦਸਤ ਵਿਕਾਸ ਦੇਖਣ ਦੀ ਉਮੀਦ ਕਰ ਸਕਦੇ ਹਾਂ ਜੋ ਸਾਡੇ AI ਨਾਲ ਪਰਸਪਰ ਕ੍ਰਿਆ ਕਰਨ ਅਤੇ ਇਸਦੀ ਵਰਤੋਂ ਕਰਨ ਦੇ ਤਰੀਕੇ ਨੂੰ ਹੋਰ ਬਦਲ ਦੇਣਗੇ। Granite 4.0 Tiny Preview ਸਿਰਫ਼ ਇੱਕ ਸ਼ੁਰੂਆਤ ਹੈ, ਅਤੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਦਾ ਭਵਿੱਖ ਪਹਿਲਾਂ ਨਾਲੋਂ ਕਿਤੇ ਜ਼ਿਆਦਾ ਉਜਵਲ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ। ਖਾਸ ਤੌਰ ‘ਤੇ, ਲੰਬੇ-ਸੰਦਰਭ ਸਮਰੱਥਾਵਾਂ ‘ਤੇ ਜ਼ੋਰ ਵਿਗਿਆਨਕ ਖੋਜ, ਕਾਨੂੰਨੀ ਵਿਸ਼ਲੇਸ਼ਣ, ਅਤੇ ਇਤਿਹਾਸਕ ਦਸਤਾਵੇਜ਼ ਵਿਸ਼ਲੇਸ਼ਣ ਵਰਗੇ ਡੋਮੇਨਾਂ ਵਿੱਚ AI ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਨਵੀਆਂ ਸੰਭਾਵਨਾਵਾਂ ਖੋਲ੍ਹਦਾ ਹੈ, ਜਿੱਥੇ ਲੰਬੇ ਅਤੇ ਗੁੰਝਲਦਾਰ ਟੈਕਸਟਾਂ ਨੂੰ ਪ੍ਰੋਸੈਸ ਕਰਨ ਅਤੇ ਸਮਝਣ ਦੀ ਯੋਗਤਾ ਮਹੱਤਵਪੂਰਨ ਹੈ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, Granite 4.0 ਮਾਡਲਾਂ ਦੀ ਬਹੁਭਾਸ਼ਾਈ ਸਮਰੱਥਾ ਉਹਨਾਂ ਨੂੰ ਗਾਹਕ ਸੇਵਾ ਤੋਂ ਲੈ ਕੇ ਸਿੱਖਿਆ ਤੱਕ ਕਈ ਉਦਯੋਗਾਂ ਵਿੱਚ ਗਲੋਬਲ ਤਾਇਨਾਤੀਆਂ ਲਈ ਬਹੁਤ ਢੁਕਵਾਂ ਬਣਾਉਂਦੀ ਹੈ। ਭਾਸ਼ਾਵਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਦਾ ਸਮਰਥਨ ਕਰਕੇ, IBM ਇਹ ਯਕੀਨੀ ਬਣਾ ਰਿਹਾ ਹੈ ਕਿ ਇਸਦੇ AI ਹੱਲ ਉਹਨਾਂ ਦੀ ਮੂਲ ਭਾਸ਼ਾ ਦੀ ਪਰਵਾਹ ਕੀਤੇ ਬਿਨਾਂ, ਵਿਭਿੰਨ ਦਰਸ਼ਕਾਂ ਲਈ ਪਹੁੰਚਯੋਗ ਹਨ। AI ਨੂੰ ਵਿਆਪਕ ਰੂਪ ਵਿੱਚ ਅਪਣਾਉਣ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਨ ਅਤੇ ਇਹ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਕਿ ਇਸਦੇ ਲਾਭ ਸਾਰਿਆਂ ਦੁਆਰਾ ਸਾਂਝੇ ਕੀਤੇ ਜਾਣ, ਸਮਾਵੇਸ਼ ਪ੍ਰਤੀ ਇਹ ਵਚਨਬੱਧਤਾ ਜ਼ਰੂਰੀ ਹੈ।

ਇਸਦੀਆਂ ਤਕਨੀਕੀ ਸਮਰੱਥਾਵਾਂ ਤੋਂ ਇਲਾਵਾ, Granite 4.0 ਸੀਰੀਜ਼ ਜ਼ਿੰਮੇਵਾਰ AI ਵਿਕਾਸ ਲਈ IBM ਦੀ ਵਚਨਬੱਧਤਾ ਨੂੰ ਵੀ ਦਰਸਾਉਂਦੀ ਹੈ। ਪਾਰਦਰਸ਼ਤਾ, ਜਵਾਬਦੇਹੀ ਅਤੇ ਨਿਰਪੱਖਤਾ ਨੂੰ ਤਰਜੀਹ ਦੇ ਕੇ, IBM AI ਪ੍ਰਣਾਲੀਆਂ ਬਣਾ ਰਿਹਾ ਹੈ ਜੋ ਨਾ ਸਿਰਫ਼ ਸ਼ਕਤੀਸ਼ਾਲੀ ਹਨ ਸਗੋਂ ਭਰੋਸੇਯੋਗ ਅਤੇ ਮਨੁੱਖੀ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨਾਲ ਇਕਸਾਰ ਵੀ ਹਨ। ਜ਼ਿੰਮੇਵਾਰ AI ਪ੍ਰਤੀ ਇਹ ਵਚਨਬੱਧਤਾ AI ਵਿੱਚ ਜਨਤਕ ਵਿਸ਼ਵਾਸ ਪੈਦਾ ਕਰਨ ਅਤੇ ਇਹ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ ਕਿ ਇਸਦੀ ਵਰਤੋਂ ਸਮਾਜ ਦੇ ਲਾਭ ਲਈ ਕੀਤੀ ਜਾਵੇ।