ਐਨਵੀਡੀਆ ਦੀਆਂ ਨਵੀਨਤਾਵਾਂ: ਲਾਮਾ ਨੇਮੇਟ੍ਰੋਨ ਅਲਟਰਾ ਅਤੇ ਪੈਰਾਕੀਟ

ਐਨਵੀਡੀਆ ਤੋਂ ਜੋਈ ਕਨਵੇਅ ਦੇ ਨਾਲ ਇੱਕ ਖਾਸ ਗੱਲਬਾਤ ਵਿੱਚ, ਕੰਪਨੀ ਦੇ ਓਪਨ-ਸੋਰਸ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ (LLMs) ਅਤੇ ਆਟੋਮੈਟਿਕ ਸਪੀਚ ਰਿਕੋਗਨੀਸ਼ਨ (ASR) ਵਿੱਚ ਤਾਜ਼ਾ ਤਰੱਕੀ ‘ਤੇ ਡੂੰਘਾਈ ਨਾਲ ਵਿਚਾਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਵਿਚਾਰ-ਵਟਾਂਦਰਾ ਲਾਮਾ ਨੇਮੇਟ੍ਰੋਨ ਅਲਟਰਾ ਅਤੇ ਪੈਰਾਕੀਟ ‘ਤੇ ਕੇਂਦਰਤ ਹੈ, ਦੋ ਮਹੱਤਵਪੂਰਨ ਪ੍ਰੋਜੈਕਟ ਜੋ ਐਨਵੀਡੀਆ ਦੀ AI ਤਕਨਾਲੋਜੀ ਦੀਆਂ ਸੀਮਾਵਾਂ ਨੂੰ ਵਧਾਉਣ ਦੀ ਵਚਨਬੱਧਤਾ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ।

ਐਨਵੀਡੀਆ ਦੀ ਓਪਨ ਸੋਰਸ ਰਣਨੀਤੀ

ਐਨਵੀਡੀਆ ਤੇਜ਼ੀ ਨਾਲ ਓਪਨ-ਸੋਰਸ AI ਖੇਤਰ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਤਾਕਤ ਵਜੋਂ ਉੱਭਰ ਰਿਹਾ ਹੈ। ਲਾਮਾ ਨੇਮੇਟ੍ਰੋਨ ਅਲਟਰਾ ਅਤੇ ਪੈਰਾਕੀਟ ਟੀਡੀਟੀ ਵਰਗੇ ਉੱਨਤ ਮਾਡਲਾਂ ਦੀ ਰਿਲੀਜ਼ AI ਤਕਨਾਲੋਜੀ ਨੂੰ ਲੋਕਤੰਤਰੀ ਬਣਾਉਣ ਅਤੇ ਕਮਿਊਨਿਟੀ ਵਿੱਚ ਨਵੀਨਤਾ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਨ ਲਈ ਇੱਕ ਰਣਨੀਤਕ ਕਦਮ ਦਰਸਾਉਂਦੀ ਹੈ। ਇਹਨਾਂ ਅਤਿ ਆਧੁਨਿਕ ਸਾਧਨਾਂ ਨੂੰ ਉਪਲਬਧ ਕਰਵਾ ਕੇ, ਐਨਵੀਡੀਆ ਦਾ ਉਦੇਸ਼ ਵੱਖ-ਵੱਖ ਉਦਯੋਗਾਂ ਵਿੱਚ AI ਹੱਲਾਂ ਦੀ ਖੋਜ, ਵਿਕਾਸ ਅਤੇ ਤਾਇਨਾਤੀ ਨੂੰ ਤੇਜ਼ ਕਰਨਾ ਹੈ।

ਲਾਮਾ ਨੇਮੇਟ੍ਰੋਨ ਅਲਟਰਾ: ਕੁਸ਼ਲਤਾ ਅਤੇ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਮੁੜ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨਾ

ਲਾਮਾ ਨੇਮੇਟ੍ਰੋਨ ਅਲਟਰਾ, ਇੱਕ 253 ਬਿਲੀਅਨ ਪੈਰਾਮੀਟਰ ਮਾਡਲ, ਐਨਵੀਡੀਆ ਦੀ ਇੰਜੀਨੀਅਰਿੰਗ ਮੁਹਾਰਤ ਦਾ ਪ੍ਰਮਾਣ ਹੈ। ਇਸਨੂੰ ਕੀ ਵੱਖਰਾ ਬਣਾਉਂਦਾ ਹੈ, ਉਹ ਹੈ ਇਸਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਨੂੰ ਇਸਦੇ ਆਕਾਰ ਤੋਂ ਦੁੱਗਣੇ ਮਾਡਲਾਂ ਦੇ ਮੁਕਾਬਲੇ ਕਰਨ ਦੀ ਯੋਗਤਾ, ਜਿਵੇਂ ਕਿ ਲਾਮਾ 405B ਅਤੇ DeepSeek R1। ਇਹ ਕਮਾਲ ਦੀ ਪ੍ਰਾਪਤੀ ਇਸਨੂੰ ਇੱਕ ਸਿੰਗਲ 8x H100 ਨੋਡ ‘ਤੇ ਤਾਇਨਾਤ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ, ਜਿਸ ਨਾਲ ਇਹ ਉਪਭੋਗਤਾਵਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਲਈ ਪਹੁੰਚਯੋਗ ਹੋ ਜਾਂਦੀ ਹੈ।

ਗੁਪਤ ਸਾਸ: ਐਫਐਫਐਨ ਫਿਊਜ਼ਨ

ਲਾਮਾ ਨੇਮੇਟ੍ਰੋਨ ਅਲਟਰਾ ਦੀ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਕੁਸ਼ਲਤਾ ਦਾ ਵੱਡਾ ਹਿੱਸਾ ਇੱਕ ਨਵੀਨਤਾਕਾਰੀ ਤਕਨੀਕ ਨੂੰ ਮੰਨਿਆ ਜਾਂਦਾ ਹੈ ਜਿਸਨੂੰ ਐਫਐਫਐਨ (ਫੀਡ-ਫਾਰਵਰਡ ਨੈਟਵਰਕ) ਫਿਊਜ਼ਨ ਕਹਿੰਦੇ ਹਨ। ਇਹ ਅਨੁਕੂਲਤਾ ਰਣਨੀਤੀ, ਐਨਵੀਡੀਆ ਦੇ ਪਹੇਲੀ ਨਿਊਰਲ ਆਰਕੀਟੈਕਚਰ ਖੋਜ ਦੁਆਰਾ ਖੋਜੀ ਗਈ, ਬੇਲੋੜੀ ਧਿਆਨ ਪਰਤਾਂ ਨੂੰ ਘਟਾ ਕੇ ਮਾਡਲ ਦੇ ਆਰਕੀਟੈਕਚਰ ਨੂੰ ਸੁਚਾਰੂ ਬਣਾਉਂਦੀ ਹੈ।

ਕ੍ਰਮ ਵਿੱਚ FFN ਪਰਤਾਂ ਨੂੰ ਇਕਸਾਰ ਕਰਕੇ, ਤਕਨੀਕ GPUs ‘ਤੇ ਵਧੇਰੇ ਸਮਾਨਾਂਤਰ ਗਣਨਾ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦੀ ਹੈ। ਬਾਕੀ ਪਰਤਾਂ ਨੂੰ ਮਿਲਾਉਣ ਜਾਂ ਫਿਊਜ਼ਿੰਗ ਕਰਨ ਨਾਲ ਕੁਸ਼ਲਤਾ ਵੱਧ ਤੋਂ ਵੱਧ ਹੋ ਜਾਂਦੀ ਹੈ, ਖਾਸ ਕਰਕੇ Meta’s Llama 3.1 - 405B ‘ਤੇ ਆਧਾਰਿਤ ਵੱਡੇ ਮਾਡਲਾਂ ਲਈ ਲਾਹੇਵੰਦ ਹੈ। FFN ਫਿਊਜ਼ਨ ਦੇ ਦੋ ਫਾਇਦੇ ਹਨ: ਇਹ ਥਰੂਪੁੱਟ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਸੁਧਾਰ ਕਰਦਾ ਹੈ, 3 ਤੋਂ 5x ਦੀ ਰੇਂਜ ਵਿੱਚ ਸਪੀਡਅੱਪ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ, ਅਤੇ ਮਾਡਲ ਦੇ ਮੈਮੋਰੀ ਫੁੱਟਪ੍ਰਿੰਟ ਨੂੰ ਘਟਾਉਂਦਾ ਹੈ। ਘਟਿਆ ਆਕਾਰ ਇੱਕ ਵੱਡੇ KV ਕੈਸ਼ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ, ਮਾਡਲ ਨੂੰ ਵੱਡੀਆਂ ਸੰਦਰਭ ਲੰਬਾਈਆਂ ਨੂੰ ਸੰਭਾਲਣ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ।

ਆਨ ਡਿਮਾਂਡ ‘ਤੇ ਤਰਕ ਕਰਨਾ: ਇੱਕ ਗੇਮ ਬਦਲਣ ਵਾਲੀ ਵਿਸ਼ੇਸ਼ਤਾ

ਲਾਮਾ ਨੇਮੇਟ੍ਰੋਨ ਅਲਟਰਾ ਦੀ ਸਭ ਤੋਂ ਵਿਲੱਖਣ ਅਤੇ ਕੀਮਤੀ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਵਿੱਚੋਂ ਇੱਕ ਇਸਦੀ "ਤਰਕ ਚਾਲੂ/ਬੰਦ" ਸਮਰੱਥਾ ਹੈ। ਇਹ ਮਾਡਲ ਦੀ ਤਰਕ ਪ੍ਰਕਿਰਿਆ ‘ਤੇ ਬੇਮਿਸਾਲ ਨਿਯੰਤਰਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ, ਉਤਪਾਦਨ ਤੈਨਾਤੀਆਂ ਅਤੇ ਲਾਗਤ ਅਨੁਕੂਲਤਾ ਲਈ ਮਹੱਤਵਪੂਰਨ ਫਾਇਦੇ ਪੇਸ਼ ਕਰਦਾ ਹੈ।

ਸਿਸਟਮ ਪ੍ਰੋਂਪਟ ਦੁਆਰਾ ਤਰਕ ਨੂੰ ਚਾਲੂ ਅਤੇ ਬੰਦ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਉੱਦਮਾਂ ਨੂੰ ਸ਼ੁੱਧਤਾ ਨੂੰ ਲੇਟੈਂਸੀ ਅਤੇ ਲਾਗਤ ਨਾਲ ਸੰਤੁਲਿਤ ਕਰਨ ਦੀ ਲਚਕਤਾ ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ। ਤਰਕ, ਗੁੰਝਲਦਾਰ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੋਣ ਦੇ ਨਾਲ, ਵਧੇਰੇ ਟੋਕਨ ਤਿਆਰ ਕਰਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਉੱਚ ਲੇਟੈਂਸੀ ਅਤੇ ਲਾਗਤ ਹੁੰਦੀ ਹੈ। ਸਪਸ਼ਟ ਨਿਯੰਤਰਣ ਪ੍ਰਦਾਨ ਕਰਕੇ, NVIDIA ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਇਸ ਬਾਰੇ ਸੂਚਿਤ ਫੈਸਲੇ ਲੈਣ ਲਈ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ ਕਿ ਕਦੋਂ ਤਰਕ ਦੀ ਵਰਤੋਂ ਕਰਨੀ ਹੈ, ਇਸ ਤਰ੍ਹਾਂ ਪ੍ਰਦਰਸ਼ਨ ਅਤੇ ਸਰੋਤ ਉਪਯੋਗਤਾ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਇਆ ਜਾਂਦਾ ਹੈ।

ਇਸ ਵਿਸ਼ੇਸ਼ਤਾ ਨੂੰ ਲਾਗੂ ਕਰਨ ਲਈ, NVIDIA ਨੇ ਸਪਸ਼ਟ ਤੌਰ ‘ਤੇ ਮਾਡਲ ਨੂੰ ਸਿਖਾਇਆ ਕਿ ਨਿਗਰਾਨੀ ਵਾਲੇ ਵਧੀਆ-ਟਿਊਨਿੰਗ ਪ

ੜਾਅ ਦੌਰਾਨ ਕਦੋਂ ਤਰਕ ਕਰਨਾ ਹੈ ਅਤੇ ਕਦੋਂ ਨਹੀਂ। ਇਸ ਵਿੱਚ ਦੋ ਵੱਖ-ਵੱਖ ਜਵਾਬਾਂ ਦੇ ਨਾਲ ਇੱਕੋ ਜਿਹੇ ਸਵਾਲ ਨੂੰ ਪੇਸ਼ ਕਰਨਾ ਸ਼ਾਮਲ ਸੀ: ਇੱਕ ਵੇਰਵੇ ਸਹਿਤ ਤਰਕ ਦੇ ਨਾਲ ਅਤੇ ਦੂਜਾ ਬਿਨਾਂ, ਅਸਲ ਵਿੱਚ ਇਸ ਖਾਸ ਉਦੇਸ਼ ਲਈ ਡੇਟਾਸੈਟ ਨੂੰ ਦੁੱਗਣਾ ਕਰਨਾ। ਨਤੀਜਾ ਇੱਕ ਸਿੰਗਲ ਮਾਡਲ ਹੈ ਜਿੱਥੇ ਉਪਭੋਗਤਾ ਸਿਰਫ਼ ਪ੍ਰੋਂਪਟ ਵਿੱਚ "ਵੇਰਵੇ ਸਹਿਤ ਸੋਚ ਦੀ ਵਰਤੋਂ ਚਾਲੂ" ਜਾਂ "ਵੇਰਵੇ ਸਹਿਤ ਸੋਚ ਦੀ ਵਰਤੋਂ ਬੰਦ" ਸ਼ਾਮਲ ਕਰਕੇ ਤਰਕ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਨਿਯੰਤਰਿਤ ਕਰ ਸਕਦੇ ਹਨ।

ਪੈਰਾਕੀਟ ਟੀਡੀਟੀ ਨਾਲ ਭਾਸ਼ਣ ਪਛਾਣ ਵਿੱਚ ਕ੍ਰਾਂਤੀ ਲਿਆਉਣਾ

ਪੈਰਾਕੀਟ ਟੀਡੀਟੀ, ਐਨਵੀਡੀਆ ਦਾ ਅਤਿ-ਆਧੁਨਿਕ ASR ਮਾਡਲ, ਨੇ ਸਪੀਚ ਰਿਕੋਗਨੀਸ਼ਨ ਵਿੱਚ ਸਪੀਡ ਅਤੇ ਸ਼ੁੱਧਤਾ ਲਈ ਬੈਂਚਮਾਰਕਾਂ ਨੂੰ ਮੁੜ ਪਰਿਭਾਸ਼ਿਤ ਕੀਤਾ ਹੈ। ਇਹ ਇੱਕ ਘੰਟੇ ਦੀ ਆਡੀਓ ਨੂੰ ਸਿਰਫ਼ ਇੱਕ ਸਕਿੰਟ ਵਿੱਚ ਇੱਕ ਕਮਾਲ ਦੀ 6% ਸ਼ਬਦ ਗਲਤੀ ਦਰ ਨਾਲ ਲਿਖ ਸਕਦਾ ਹੈ - ਦੂਜੇ ਓਪਨ-ਸੋਰਸ ਵਿਕਲਪਾਂ ਨਾਲੋਂ 50 ਗੁਣਾ ਤੇਜ਼।

ਆਰਕੀਟੈਕਚਰਲ ਨਵੀਨਤਾਵਾਂ: ਪੈਰਾਕੀਟ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਦਾ "ਕਿਵੇਂ"

ਪੈਰਾਕੀਟ ਟੀਡੀਟੀ ਦੀ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਕਾਰਗੁਜ਼ਾਰੀ ਆਰਕੀਟੈਕਚਰਲ ਵਿਕਲਪਾਂ ਅਤੇ ਖਾਸ ਅਨੁਕੂਲਤਾਵਾਂ ਦੇ ਸੁਮੇਲ ਦਾ ਨਤੀਜਾ ਹੈ। ਇਹ ਇੱਕ ਫਾਸਟ ਕਨਫਾਰਮਰ ਆਰਕੀਟੈਕਚਰ ‘ਤੇ ਆਧਾਰਿਤ ਹੈ, ਜਿਸ ਵਿੱਚ ਡੂੰਘਾਈ-ਵਾਰ ਵੱਖ ਕਰਨ ਯੋਗ ਕਨਵੋਲਿਊਸ਼ਨਲ ਡਾਊਨਸੈਂਪਲਿੰਗ ਅਤੇ ਸੀਮਤ ਸੰਦਰਭ ਧਿਆਨ ਵਰਗੀਆਂ ਤਕਨੀਕਾਂ ਨਾਲ ਸੁਧਾਰ ਕੀਤਾ ਗਿਆ ਹੈ।

ਇਨਪੁਟ ਸਟੇਜ ‘ਤੇ ਡੂੰਘਾਈ-ਵਾਰ ਵੱਖ ਕਰਨ ਯੋਗ ਕਨਵੋਲਿਊਸ਼ਨ ਡਾਊਨਸੈਂਪਲਿੰਗ ਪ੍ਰੋਸੈਸਿੰਗ ਲਈ ਗਣਨਾਤਮਕ ਲਾਗਤ ਅਤੇ ਮੈਮੋਰੀ ਲੋੜਾਂ ਨੂੰ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ ਘਟਾਉਂਦੀ ਹੈ। ਸੀਮਤ ਸੰਦਰਭ ਧਿਆਨ, ਆਡੀਓ ਦੇ ਛੋਟੇ, ਓਵਰਲੈਪਿੰਗ ਹਿੱਸਿਆਂ ‘ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਕੇ, ਪ੍ਰੋਸੈਸਿੰਗ ਵਿੱਚ ਸਪੀਡਅੱਪ ਪ੍ਰਾਪਤ ਕਰਦੇ ਹੋਏ ਸ਼ੁੱਧਤਾ ਨੂੰ ਬਣਾਈ ਰੱਖਦਾ ਹੈ। ਐਨਕੋਡਰ ਸਾਈਡ ‘ਤੇ, ਇੱਕ ਸਲਾਈਡਿੰਗ ਵਿੰਡੋ ਧਿਆਨ ਤਕਨੀਕ ਮਾਡਲ ਨੂੰ ਲੰਬੇ ਆਡੀਓ ਫਾਈਲਾਂ ਨੂੰ ਛੋਟੇ ਹਿੱਸਿਆਂ ਵਿੱਚ ਵੰਡੇ ਬਿਨਾਂ ਪ੍ਰੋਸੈਸ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ, ਜੋ ਕਿ ਲੰਬੇ ਫਾਰਮ ਆਡੀਓ ਨੂੰ ਸੰਭਾਲਣ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ।

ਟੋਕਨ ਡਿਊਰੇਸ਼ਨ ਟ੍ਰਾਂਸਡਿਊਸਰ (TDT): ਸਪੀਡ ਦੀ ਕੁੰਜੀ

ਕਨਫਾਰਮਰ ਆਰਕੀਟੈਕਚਰ ਤੋਂ ਇਲਾਵਾ, ਪੈਰਾਕੀਟ ਟੀਡੀਟੀ ਵਿੱਚ ਇੱਕ ਟੋਕਨ ਅਤੇ ਡਿਊਰੇਸ਼ਨ ਟ੍ਰਾਂਸਡਿਊਸਰ (ਟੀਡੀਟੀ) ਸ਼ਾਮਲ ਹੈ। ਰਵਾਇਤੀ ਰੀਕਰੈਂਟ ਨਿਊਰਲ ਨੈੱਟਵਰਕ (ਆਰਐਨਐਨ) ਟ੍ਰਾਂਸਡਿਊਸਰ ਤਕਨਾਲੋਜੀ ਆਡੀਓ ਫਰੇਮ ਦੁਆਰਾ ਫਰੇਮ ਦੀ ਪ੍ਰਕਿਰਿਆ ਕਰਦੀ ਹੈ। ਟੀਡੀਟੀ ਮਾਡਲ ਨੂੰ ਟੋਕਨਾਂ ਅਤੇ ਉਨ੍ਹਾਂ ਟੋਕਨਾਂ ਦੀ ਅਨੁਮਾਨਿਤ ਮਿਆਦ ਦੋਵਾਂ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਇਹ ਬੇਲੋੜੇ ਫਰੇਮਾਂ ਨੂੰ ਛੱਡ ਸਕਦਾ ਹੈ ਅਤੇ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ ਤੇਜ਼ ਕਰ ਸਕਦਾ ਹੈ।

ਇਹ ਟੀਡੀਟੀ ਨਵੀਨਤਾ ਇਕੱਲੇ ਹੀ ਲਗਭਗ 1.5 ਤੋਂ 2x ਸਪੀਡਅੱਪ ਵਿੱਚ ਯੋਗਦਾਨ ਪਾਉਂਦੀ ਹੈ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਇੱਕ ਲੇਬਲ ਲੂਪਿੰਗ ਐਲਗੋਰਿਦਮ ਬੈਚ ਇਨਫਰੈਂਸ ਦੌਰਾਨ ਵੱਖ-ਵੱਖ ਨਮੂਨਿਆਂ ਲਈ ਟੋਕਨਾਂ ਦੇ ਸੁਤੰਤਰ ਤੌਰ ‘ਤੇ ਵਧਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਡੀਕੋਡਿੰਗ ਪ੍ਰਕਿਰਿਆ ਹੋਰ ਤੇਜ਼ ਹੋ ਜਾਂਦੀ ਹੈ। ਡੀਕੋਡਰ ਸਾਈਡ ‘ਤੇ ਕੁਝ ਗਣਨਾ ਨੂੰ CUDA ਗ੍ਰਾਫ ਵਿੱਚ ਲਿਜਾਣ ਨਾਲ ਇੱਕ ਹੋਰ 3x ਸਪੀਡ ਬੂਸਟ ਮਿਲਦਾ ਹੈ। ਇਹ ਨਵੀਨਤਾਵਾਂ ਪੈਰਾਕੀਟ ਟੀਡੀਟੀ ਨੂੰ ਕਨੈਕਸ਼ਨਿਸਟ ਟੈਂਪੋਰਲ ਕਲਾਸੀਫਿਕੇਸ਼ਨ (ਸੀਟੀਸੀ) ਡੀਕੋਡਰਾਂ ਦੇ ਮੁਕਾਬਲੇ ਸਪੀਡ ਹਾਸਲ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦੀਆਂ ਹਨ, ਜੋ ਆਪਣੀ ਸਪੀਡ ਲਈ ਜਾਣੇ ਜਾਂਦੇ ਹਨ, ਜਦੋਂ ਕਿ ਉੱਚ ਸ਼ੁੱਧਤਾ ਨੂੰ ਬਣਾਈ ਰੱਖਦੇ ਹਨ।

ਓਪਨ ਡਾਟਾ ਨਾਲ AI ਨੂੰ ਲੋਕਤੰਤਰੀ ਬਣਾਉਣਾ

ਓਪਨ-ਸੋਰਸ ਭਾਈਚਾਰੇ ਲਈ ਐਨਵੀਡੀਆ ਦੀ ਵਚਨਬੱਧਤਾ ਮਾਡਲ ਰਿਲੀਜ਼ ਤੋਂ ਅੱਗੇ ਭਾਸ਼ਾ ਅਤੇ ਭਾਸ਼ਣ ਦੋਵਾਂ ਲਈ ਵਿਸ਼ਾਲ, ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਡੇਟਾਸੈੱਟਾਂ ਦੀ ਸਾਂਝਾਕਰਨ ਨੂੰ ਸ਼ਾਮਲ ਕਰਦੀ ਹੈ। ਡਾਟਾ ਕਿਊਰੇਸ਼ਨ ਪ੍ਰਤੀ ਕੰਪਨੀ ਦੀ ਪਹੁੰਚ ਪਾਰਦਰਸ਼ਤਾ ਅਤੇ ਖੁੱਲੇਪਣ ‘ਤੇ ਜ਼ੋਰ ਦਿੰਦੀ ਹੈ, ਜਿਸਦਾ ਟੀਚਾ ਇਸਦੇ ਡੇਟਾ, ਤਕਨੀਕਾਂ ਅਤੇ ਟੂਲਿੰਗ ਬਾਰੇ ਜਿੰਨਾ ਸੰਭਵ ਹੋ ਸਕੇ ਸਾਂਝਾ ਕਰਨਾ ਹੈ ਤਾਂ ਜੋ ਭਾਈਚਾਰਾ ਉਹਨਾਂ ਨੂੰ ਸਮਝ ਸਕੇ ਅਤੇ ਵਰਤ ਸਕੇ।

ਲਾਮਾ ਨੇਮੇਟ੍ਰੋਨ ਅਲਟਰਾ ਲਈ ਡਾਟਾ ਕਿਊਰੇਸ਼ਨ

ਲਾਮਾ ਨੇਮੇਟ੍ਰੋਨ ਅਲਟਰਾ ਲਈ ਡਾਟਾ ਕਿਊਰੇਸ਼ਨ ਦਾ ਮੁੱਖ ਟੀਚਾ ਕਈ ਮੁੱਖ ਡੋਮੇਨਾਂ ਵਿੱਚ ਸ਼ੁੱਧਤਾ ਵਿੱਚ ਸੁਧਾਰ ਕਰਨਾ ਸੀ, ਜਿਸ ਵਿੱਚ ਗਣਿਤ ਅਤੇ ਕੋਡਿੰਗ ਵਰਗੇ ਤਰਕ ਦੇ ਕੰਮਾਂ ਦੇ ਨਾਲ ਨਾਲ ਟੂਲ ਕਾਲਿੰਗ, ਹਿਦਾਇਤਾਂ ਦੀ ਪਾਲਣਾ ਅਤੇ ਚੈਟ ਵਰਗੇ ਗੈਰ-ਤਰਕ ਵਾਲੇ ਕੰਮ ਸ਼ਾਮਲ ਹਨ।

ਰਣਨੀਤੀ ਵਿੱਚ ਇਹਨਾਂ ਖੇਤਰਾਂ ਵਿੱਚ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਵਧਾਉਣ ਲਈ ਖਾਸ ਡੇਟਾਸੈੱਟਾਂ ਨੂੰ ਕਿਊਰੇਟ ਕਰਨਾ ਸ਼ਾਮਲ ਸੀ। ਨਿਗਰਾਨੀ ਵਾਲੀ ਵਧੀਆ-ਟਿਊਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਦੇ ਅੰਦਰ, NVIDIA ਨੇ "ਤਰਕ ਚਾਲੂ" ਅਤੇ "ਤਰਕ ਬੰਦ" ਸਥਿਤੀਆਂ ਵਿੱਚ ਅੰਤਰ ਕੀਤਾ। ਭਾਈਚਾਰੇ ਦੇ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਮਾਡਲਾਂ ਨੂੰ ਖਾਸ ਡੋਮੇਨਾਂ ਵਿੱਚ "ਮਾਹਿਰਾਂ" ਵਜੋਂ ਵਰਤਿਆ ਗਿਆ। ਉਦਾਹਰਨ ਲਈ, DeepSeek R-1 ਦੀ ਵਰਤੋਂ ਵਿਆਪਕ ਤੌਰ ‘ਤੇ ਤਰਕ-ਗੰਭੀਰ ਗਣਿਤ ਅਤੇ ਕੋਡਿੰਗ ਕਾਰਜਾਂ ਲਈ ਕੀਤੀ ਗਈ ਸੀ, ਜਦੋਂ ਕਿ ਲਾਮਾ ਅਤੇ ਕਿਊਵੇਨ ਵਰਗੇ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਗੈਰ-ਤਰਕ ਵਾਲੇ ਕੰਮਾਂ ਜਿਵੇਂ ਕਿ ਬੁਨਿਆਦੀ ਗਣਿਤ, ਕੋਡਿੰਗ, ਚੈਟ ਅਤੇ ਟੂਲ ਕਾਲਿੰਗ ਲਈ ਕੀਤੀ ਗਈ ਸੀ। ਇਸ ਕਿਊਰੇਟਡ ਡੇਟਾਸੈੱਟ, ਜਿਸ ਵਿੱਚ ਲਗਭਗ 30 ਮਿਲੀਅਨ ਸਵਾਲ-ਜਵਾਬ ਜੋੜੇ ਹਨ, ਨੂੰ ਜਨਤਕ ਤੌਰ ‘ਤੇ ਹੱਗਿੰਗ ਫੇਸ ‘ਤੇ ਉਪਲਬਧ ਕਰਵਾਇਆ ਗਿਆ ਹੈ।

ਡਾਟਾ ਗੁਣਵੱਤਾ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣਾ: ਇੱਕ ਬਹੁ-ਪਰਤੀ ਪਹੁੰਚ

ਇਹ ਦਿੱਤੇ ਜਾਣ ‘ਤੇ ਕਿ ਡੇਟਾ ਦਾ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਹਿੱਸਾ ਹੋਰ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਸੀ, NVIDIA ਨੇ ਇੱਕ ਸਖ਼ਤ ਬਹੁ-ਪਰਤੀ ਗੁਣਵੱਤਾ ਭਰੋਸਾ ਪ੍ਰਕਿਰਿਆ ਲਾਗੂ ਕੀਤੀ। ਇਸ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ:

  • ਹਰੇਕ ਮਾਹਿਰ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇੱਕੋ ਜਿਹੇ ਪ੍ਰੋਂਪਟ ਲਈ ਕਈ ਉਮੀਦਵਾਰ ਜਵਾਬ ਤਿਆਰ ਕਰਨਾ।
  • ਸਹੀਤਾ, ਇਕਸਾਰਤਾ ਅਤੇ ਪ੍ਰੋਂਪਟ ਦੀ ਪਾਲਣਾ ਦੇ ਆਧਾਰ ‘ਤੇ ਇਨ੍ਹਾਂ ਉਮੀਦਵਾਰਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ "ਆਲੋਚਕ" ਮਾਡਲਾਂ ਦਾ ਇੱਕ ਵੱਖਰਾ ਸਮੂਹ ਨਿਯੁਕਤ ਕਰਨਾ।
  • ਇੱਕ ਸਕੋਰਿੰਗ ਵਿਧੀ ਨੂੰ ਲਾਗੂ ਕਰਨਾ ਜਿੱਥੇ ਹਰੇਕ ਤਿਆਰ ਸਵਾਲ-ਜਵਾਬ ਜੋੜੇ ਨੂੰ ਆਲੋਚਕ ਮਾਡਲ ਦੇ ਮੁਲਾਂਕਣ ਦੇ ਆਧਾਰ ‘ਤੇ ਇੱਕ ਗੁਣਵੱਤਾ ਸਕੋਰ ਪ੍ਰਾਪਤ ਹੋਇਆ, ਜਿਸ ਵਿੱਚ ਸਵੀਕ੍ਰਿਤੀ ਲਈ ਇੱਕ ਉੱਚ ਥਰੈਸ਼ਹੋਲਡ ਨਿਰਧਾਰਤ ਕੀਤਾ ਗਿਆ।
  • ਵੱਖ-ਵੱਖ ਪੜਾਵਾਂ ‘ਤੇ ਮਨੁੱਖੀ ਸਮੀਖਿਆ ਨੂੰ ਏਕੀਕ੍ਰਿਤ ਕਰਨਾ, ਡਾਟਾ ਵਿਗਿਆਨੀਆਂ ਅਤੇ ਇੰਜੀਨੀਅਰਾਂ ਦੁਆਰਾ ਤਿਆਰ ਡੇਟਾ ਦੇ ਨਮੂਨਿਆਂ ਦਾ ਹੱਥੀਂ ਨਿਰੀਖਣ ਕਰਨਾ ਤਾਂ ਜੋ ਕਿਸੇ ਵੀ ਯੋਜਨਾਬੱਧ ਗਲਤੀਆਂ, ਪੱਖਪਾਤਾਂ, ਜਾਂ ਹਲੂਸੀਨੇਸ਼ਨ ਦੇ ਉਦਾਹਰਣਾਂ ਦੀ ਪਛਾਣ ਕੀਤੀ ਜਾ ਸਕੇ।
  • ਹਰੇਕ ਡੋਮੇਨ ਦੇ ਅੰਦਰ ਉਦਾਹਰਣਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਤਿਆਰ ਡੇਟਾ ਦੀ ਵਿਭਿੰਨਤਾ ‘ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਨਾ।
  • ਇਸ ਕਿਊਰੇਟਡ ਡੇਟਾ ‘ਤੇ ਲਾਮਾ ਨੇਮੇਟ੍ਰੋਨ ਅਲਟਰਾ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਤੋਂ ਬਾਅਦ ਬੈਂਚਮਾਰਕ ਡੇਟਾਸੈੱਟਾਂ ਅਤੇ ਅਸਲ-ਸੰਸਾਰ ਵਰਤੋਂ ਦੇ ਮਾਮਲਿਆਂ ਦੇ ਵਿਰੁੱਧ ਵਿਆਪਕ ਮੁਲਾਂਕਣ ਕਰਵਾਉਣਾ।

ਪੈਰਾਕੀਟ ਟੀਡੀਟੀ ਲਈ ਇੱਕ ਸਪੀਚ ਡੇਟਾਸੈੱਟ ਨੂੰ ਓਪਨ-ਸੋਰਸ ਕਰਨਾ

ਐਨਵੀਡੀਆ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਸਪੀਚ ਡੇਟਾਸੈੱਟ, ਲਗਭਗ 100,000 ਘੰਟੇ, ਨੂੰ ਓਪਨ-ਸੋਰਸ ਕਰਨ ਦੀ ਯੋਜਨਾ ਬਣਾ ਰਿਹਾ ਹੈ, ਜਿਸਨੂੰ ਅਸਲ-ਸੰਸਾਰ ਵਿਭਿੰਨਤਾ ਨੂੰ ਦਰਸਾਉਣ ਲਈ ਧਿਆਨ ਨਾਲ ਕਿਊਰੇਟ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਸ ਡੇਟਾਸੈੱਟ ਵਿੱਚ ਧੁਨੀ ਪੱਧਰਾਂ, ਸਿਗਨਲ-ਟੂ-ਸ਼ੋਰ ਅਨੁਪਾਤ, ਬੈਕਗ੍ਰਾਊਂਡ ਸ਼ੋਰ ਕਿਸਮਾਂ ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ ਕਾਲ ਸੈਂਟਰਾਂ ਲਈ ਢੁਕਵੇਂ ਟੈਲੀਫੋਨ ਆਡੀਓ ਫਾਰਮੈਟਾਂ ਵਿੱਚ ਭਿੰਨਤਾਵਾਂ ਸ਼ਾਮਲ ਹੋਣਗੀਆਂ। ਟੀਚਾ ਭਾਈਚਾਰੇ ਨੂੰ ਉੱਚ-ਗੁਣਵੱਤਾ, ਵਿਭਿੰਨ ਡੇਟਾ ਪ੍ਰਦਾਨ ਕਰਨਾ ਹੈ ਜੋ ਮਾਡਲਾਂ ਨੂੰ ਅਸਲ-ਸੰਸਾਰ ਦੇ ਦ੍ਰਿਸ਼ਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਵਿੱਚ ਚੰਗਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ।

ਭਵਿੱਖ ਦੀਆਂ ਦਿਸ਼ਾਵਾਂ: ਛੋਟੇ ਮਾਡਲ, ਬਹੁਭਾਸ਼ਾਈ ਸਹਾਇਤਾ, ਅਤੇ ਰੀਅਲ-ਟਾਈਮ ਸਟ੍ਰੀਮਿੰਗ

ਭਵਿੱਖ ਲਈ ਐਨਵੀਡੀਆ ਦੇ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਵਿੱਚ ਬਹੁਭਾਸ਼ਾਈ ਸਹਾਇਤਾ ਵਿੱਚ ਹੋਰ ਤਰੱਕੀ, ਹੋਰ ਵੀ ਛੋਟੇ ਐਜ-ਅਨੁਕੂਲਿਤ ਮਾਡਲ, ਅਤੇ ਸਪੀਚ ਰਿਕੋਗਨੀਸ਼ਨ ਲਈ ਰੀਅਲ-ਟਾਈਮ ਸਟ੍ਰੀਮਿੰਗ ਵਿੱਚ ਸੁਧਾਰ ਸ਼ਾਮਲ ਹਨ।

ਬਹੁਭਾਸ਼ਾਈ ਸਮਰੱਥਾਵਾਂ

ਵੱਡੇ ਉੱਦਮਾਂ ਲਈ ਕਈ ਭਾਸ਼ਾਵਾਂ ਦਾ ਸਮਰਥਨ ਕਰਨਾ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਐਨਵੀਡੀਆ ਦਾ ਉਦੇਸ਼ ਕੁਝ ਮੁੱਖ ਭਾਸ਼ਾਵਾਂ ‘ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਨਾ ਅਤੇ ਉਨ੍ਹਾਂ ਦੇ ਅੰਦਰ ਤਰਕ, ਟੂਲ ਕਾਲਿੰਗ ਅਤੇ ਚੈਟ ਲਈ ਵਿਸ਼ਵ-ਪੱਧਰੀ ਸ਼ੁੱਧਤਾ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣਾ ਹੈ। ਇਹ ਸ਼ਾਇਦ ਵਿਕਸਤ ਕਰਨ ਲਈ ਅਗਲਾ ਵੱਡਾ ਖੇਤਰ ਹੈ।

ਐਜ-ਅਨੁਕੂਲਿਤ ਮਾਡਲ

ਐਨਵੀਡੀਆ ਲਗਭਗ 50 ਮਿਲੀਅਨ ਪੈਰਾਮੀਟਰਾਂ ਤੱਕ ਦੇ ਮਾਡਲਾਂ ‘ਤੇ ਵਿਚਾਰ ਕਰ ਰਿਹਾ ਹੈ ਤਾਂ ਜੋ ਐੱਜ ‘ਤੇ ਵਰਤੋਂ ਦੇ ਮਾਮਲਿਆਂ ਨੂੰ ਹੱਲ ਕੀਤਾ ਜਾ ਸਕੇ ਜਿੱਥੇ ਇੱਕ ਛੋਟੇ ਫੁੱਟਪ੍ਰਿੰਟ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਜਿਵੇਂ ਕਿ ਰੌਲੇ-ਰੱਪੇ ਵਾਲੇ ਵਾਤਾਵਰਣਾਂ ਵਿੱਚ ਰੋਬੋਟਾਂ ਲਈ ਰੀਅਲ-ਟਾਈਮ ਆਡੀਓ ਪ੍ਰੋਸੈਸਿੰਗ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਣਾ।

ਪੈਰਾਕੀਟ ਟੀਡੀਟੀ ਲਈ ਰੀਅਲ-ਟਾਈਮ ਸਟ੍ਰੀਮਿੰਗ

ਤਕਨੀਕੀ ਤੌਰ ‘ਤੇ, ਐਨਵੀਡੀਆ ਲਾਈਵ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਣ ਲਈ ਟੀਡੀਟੀ ਲਈ ਸਟ੍ਰੀਮਿੰਗ ਸਮਰੱਥਾਵਾਂ ‘ਤੇ ਕੰਮ ਕਰਨ ਦੀ ਯੋਜਨਾ ਬਣਾ ਰਿਹਾ ਹੈ।

ਉਤਪਾਦਨ-ਤਿਆਰ AI: ਅਸਲ-ਸੰਸਾਰ ਤਾਇਨਾਤੀ ਲਈ ਡਿਜ਼ਾਈਨ ਕਰਨਾ

ਲਾਮਾ ਨੇਮੇਟ੍ਰੋਨ ਅਲਟਰਾ ਅਤੇ ਪੈਰਾਕੀਟ ਟੀਡੀਟੀ ਦੋਵੇਂ ਅਸਲ-ਸੰਸਾਰ ਤਾਇਨਾਤੀ ਚੁਣੌਤੀਆਂ ਨੂੰ ਧਿਆਨ ਵਿੱਚ ਰੱਖਦੇ ਹੋਏ ਡਿਜ਼ਾਈਨ ਕੀਤੇ ਗਏ ਹਨ, ਸ਼ੁੱਧਤਾ, ਕੁਸ਼ਲਤਾ ਅਤੇ ਲਾਗਤ-ਪ੍ਰਭਾਵਸ਼ੀਲਤਾ ‘ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਦੇ ਹਨ।

ਸਕੇਲੇਬਿਲਟੀ ਅਤੇ ਲਾਗਤ ਕੁਸ਼ਲਤਾ ਲਈ ਤਰਕ ਚਾਲੂ/ਬੰਦ

ਬਹੁਤ ਜ਼ਿਆਦਾ ਤਰਕ ਉਤਪਾਦਨ ਵਾਤਾਵਰਣ ਵਿੱਚ ਸਕੇਲੇਬਿਲਟੀ ਮੁੱਦਿਆਂ ਅਤੇ ਵਧੀ ਹੋਈ ਲੇਟੈਂਸੀ ਦਾ ਕਾਰਨ ਬਣ ਸਕਦਾ ਹੈ। ਲਾਮਾ ਨੇਮੇਟ੍ਰੋਨ ਅਲਟਰਾ ਵਿੱਚ ਪੇਸ਼ ਕੀਤੀ ਗਈ ਤਰਕ ਚਾਲੂ/ਬੰਦ ਵਿਸ਼ੇਸ਼ਤਾ ਪ੍ਰਤੀ-ਪੁੱਛਗਿੱਛ ਦੇ ਅਧਾਰ ‘ਤੇ ਤਰਕ ਨੂੰ ਨਿਯੰਤਰਿਤ ਕਰਨ ਦੀ ਲਚਕਤਾ ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ, ਜਿਸ ਨਾਲ ਕਈ ਉਤਪਾਦਨ ਵਰਤੋਂ ਦੇ ਮਾਮਲੇ ਸਮਰੱਥ ਹੋ ਜਾਂਦੇ ਹਨ।

ਸ਼ੁੱਧਤਾ ਅਤੇ ਕੁਸ਼ਲਤਾ ਨੂੰ ਸੰਤੁਲਿਤ ਕਰਨਾ

ਸ਼ੁੱਧਤਾ ਅਤੇ ਕੁਸ਼ਲਤਾ ਨੂੰ ਸੰਤੁਲਿਤ ਕਰਨਾ ਇੱਕ ਨਿਰੰਤਰ ਚੁਣੌਤੀ ਹੈ। ਐਨਵੀਡੀਆ ਦੀ ਪਹੁੰਚ ਵਿੱਚ ਸਿਖਲਾਈ ਦੌਰਾਨ ਹਰੇਕ ਹੁਨਰ ਲਈ ਯੁੱਗਾਂ ਦੀ ਗਿਣਤੀ ‘ਤੇ ਧਿਆਨ ਨਾਲ ਵਿਚਾਰ ਕਰਨਾ ਸ਼ਾਮਲ ਹੈ ਅਤੇ ਸ਼ੁੱਧਤਾ ਨੂੰ ਲਗਾਤਾਰ ਮਾਪਣਾ ਸ਼ਾਮਲ ਹੈ। ਟੀਚਾ ਸਾਰੇ ਮੁੱਖ ਖੇਤਰਾਂ ਵਿੱਚ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣਾ ਹੈ।

ਓਪਨ-ਸੋਰਸ ਈਕੋਸਿਸਟਮ ਵਿੱਚ NVIDIA ਦੇ ਮਾਡਲਾਂ ਦੀ ਭੂਮਿਕਾ

ਐਨਵੀਡੀਆ ਵਿਆਪਕ ਓਪਨ-ਸੋਰਸ ਅਤੇ LLM ਈਕੋਸਿਸਟਮ ਦੇ ਅੰਦਰ ਲਾਮਾ ਨੇਮੇਟ੍ਰੋਨ ਅਲਟਰਾ ਅਤੇ ਪੈਰਾਕੀਟ ਟੀਡੀਟੀ ਦੀ ਭੂਮਿਕਾ ਨੂੰ ਮੌਜੂਦਾ ਬੁਨਿਆਦਾਂ ‘ਤੇ ਉਸਾਰੀ ਕਰਨ ਅਤੇ ਮਹੱਤਵਪੂਰਨ ਮੁੱਲ ਜੋੜਨ ਲਈ ਖਾਸ ਖੇਤਰਾਂ ‘ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਨ ਵਜੋਂ ਦੇਖਦਾ ਹੈ। ਕੰਪਨੀ ਦਾ ਉਦੇਸ਼ ਖਾਸ ਖੇਤਰਾਂ ਦੀ ਪਛਾਣ ਕਰਨਾ ਜਾਰੀ ਰੱਖਣਾ ਹੈ ਜਿੱਥੇ ਇਹ ਯੋਗਦਾਨ ਪਾ ਸਕਦੀ ਹੈ, ਜਦੋਂ ਕਿ ਦੂਸਰੇ ਉੱਦਮ ਉਤਪਾਦਨ ਲਈ ਢੁਕਵੇਂ ਸ਼ਾਨਦਾਰ ਆਮ-ਮਕਸਦ ਮਾਡਲਾਂ ਦਾ ਨਿਰਮਾਣ ਜਾਰੀ ਰੱਖਦੇ ਹਨ।

ਮੁੱਖ ਗੱਲਾਂ: ਓਪਨ ਸੋਰਸ, ਫਾਸਟ, ਹਾਈ-ਥਰੂਪੁੱਟ, ਲਾਗਤ-ਪ੍ਰਭਾਵਸ਼ਾਲੀ

ਲਾਮਾ ਨੇਮੇਟ੍ਰੋਨ ਅਲਟਰਾ ਅਤੇ ਪੈਰਾਕੀਟ ਟੀਡੀਟੀ ‘ਤੇ ਐਨਵੀਡੀਆ ਦੇ ਕੰਮ ਦੀਆਂ ਮੁੱਖ ਗੱਲਾਂ ਸਭ ਕੁਝ ਓਪਨ-ਸੋਰਸਿੰਗ ਕਰਨ ਦੀ ਵਚਨਬੱਧਤਾ, ਅਤਿ-ਆਧੁਨਿਕ ਸ਼ੁੱਧਤਾ ਪ੍ਰਾਪਤ ਕਰਨਾ, ਲੇਟੈਂਸੀ ਅਤੇ ਥਰੂਪੁੱਟ ਦੇ ਮਾਮਲੇ ਵਿੱਚ ਕੁਸ਼ਲ GPU ਉਪਯੋਗਤਾ ਲਈ ਫੁੱਟਪ੍ਰਿੰਟਾਂ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣਾ ਅਤੇ ਭਾਈਚਾਰੇ ਨੂੰ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਨਾ ਹੈ।

ਸਾਰੇ ਮਾਡਲ ਅਤੇ ਡੇਟਾਸੈੱਟ ਹੱਗਿੰਗ ਫੇਸ ‘ਤੇ ਉਪਲਬਧ ਹਨ। ਉਹਨਾਂ ਨੂੰ ਚਲਾਉਣ ਲਈ ਸਾਫਟਵੇਅਰ ਸਟੈਕ NVIDIA ਤੋਂ ਆਉਂਦਾ ਹੈ ਅਤੇ NGC, ਇਸਦੇ ਸਮੱਗਰੀ ਰਿਪੋਜ਼ਟਰੀ ‘ਤੇ ਉਪਲਬਧ ਹੈ। ਬਹੁਤੇ ਅੰਡਰਲਾਈੰਗ ਸਾਫਟਵੇਅਰ ਵੀ ਓਪਨ-ਸੋਰਸ ਹੈ ਅਤੇ ਗਿਟਹੱਬ ‘ਤੇ ਪਾਇਆ ਜਾ ਸਕਦਾ ਹੈ। ਨੇਮੋ ਫਰੇਮਵਰਕ ਇਸ ਸਾਫਟਵੇਅਰ ਸਟੈਕ ਦੇ ਬਹੁਤ ਸਾਰੇ ਹਿੱਸਿਆਂ ਲਈ ਕੇਂਦਰੀ ਹੱਬ ਹੈ।