ਫੌਕਸਕਾਨ ਦਾ ਫੌਕਸਬ੍ਰੇਨ: ਰਵਾਇਤੀ ਚੀਨੀ LLMs

ਤੇਜ਼ੀ ਨਾਲ ਵਾਧਾ: ਕੁਸ਼ਲ ਸਿਖਲਾਈ ਅਤੇ ਸਥਾਨਕ ਮੁਹਾਰਤ

ਫੌਕਸਬ੍ਰੇਨ ਦਾ ਵਿਕਾਸ ਕਮਾਲ ਦੀ ਕੁਸ਼ਲਤਾ ਦੀ ਕਹਾਣੀ ਹੈ। ਸਿਰਫ਼ ਚਾਰ ਹਫ਼ਤਿਆਂ ਵਿੱਚ, ਫੌਕਸਕਾਨ ਦੀ ਟੀਮ ਨੇ ਇਸ ਗੁੰਝਲਦਾਰ LLM ਨੂੰ ਜੀਵਨ ਵਿੱਚ ਲਿਆਂਦਾ। ਇਹ ਤੇਜ਼ ਵਿਕਾਸ ਚੱਕਰ ਇੱਕ ਰਣਨੀਤਕ ਪਹੁੰਚ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ ਜੋ ਸਿਰਫ਼ ਕੰਪਿਊਟੇਸ਼ਨਲ ਸ਼ਕਤੀ ਨੂੰ ਸਮੱਸਿਆ ‘ਤੇ ਸੁੱਟਣ ਦੀ ਬਜਾਏ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣ ‘ਤੇ ਕੇਂਦ੍ਰਿਤ ਹੈ। ਡਾ. ਯੁੰਗ-ਹੁਈ ਲੀ, Hon Hai ਰਿਸਰਚ ਇੰਸਟੀਚਿਊਟ ਦੇ AI ਰਿਸਰਚ ਸੈਂਟਰ ਦੇ ਡਾਇਰੈਕਟਰ, ਇਸ ਗੱਲ ‘ਤੇ ਜ਼ੋਰ ਦਿੰਦੇ ਹਨ, “ਸਾਡੇ ਫੌਕਸਬ੍ਰੇਨ ਮਾਡਲ ਨੇ ਇੱਕ ਬਹੁਤ ਹੀ ਕੁਸ਼ਲ ਸਿਖਲਾਈ ਰਣਨੀਤੀ ਅਪਣਾਈ, ਜੋ ਕਿ ਅੰਨ੍ਹੇਵਾਹ ਕੰਪਿਊਟਿੰਗ ਸ਼ਕਤੀ ਨੂੰ ਇਕੱਠਾ ਕਰਨ ਦੀ ਬਜਾਏ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣ ‘ਤੇ ਕੇਂਦ੍ਰਿਤ ਹੈ।”

ਇਹ ਕੁਸ਼ਲਤਾ ਸਮਰੱਥਾ ਦੀ ਕੀਮਤ ‘ਤੇ ਨਹੀਂ ਆਉਂਦੀ। ਫੌਕਸਬ੍ਰੇਨ ਵਿਸ਼ੇਸ਼ ਤੌਰ ‘ਤੇ ਰਵਾਇਤੀ ਚੀਨੀ ਦੀਆਂ ਬਾਰੀਕੀਆਂ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਸਥਾਨਕ ਭਾਸ਼ਾ ਦੇ ਪੈਟਰਨਾਂ ਲਈ ਅਨੁਕੂਲਿਤ ਮਜ਼ਬੂਤ ਤਰਕ ਯੋਗਤਾਵਾਂ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ। ਸਥਾਨਕਕਰਨ ‘ਤੇ ਇਹ ਧਿਆਨ ਮਹੱਤਵਪੂਰਨ ਹੈ, ਜਿਸ ਨਾਲ ਮਾਡਲ ਭਾਸ਼ਾ ਦੀਆਂ ਜਟਿਲਤਾਵਾਂ ਨੂੰ ਸਮਝ ਸਕਦਾ ਹੈ ਅਤੇ ਉਹਨਾਂ ਦਾ ਜਵਾਬ ਦੇ ਸਕਦਾ ਹੈ ਜਿਸ ਤਰ੍ਹਾਂ ਆਮ ਮਾਡਲ ਸ਼ਾਇਦ ਸੰਘਰਸ਼ ਕਰ ਸਕਦੇ ਹਨ।

ਅੰਦਰੂਨੀ ਐਪਲੀਕੇਸ਼ਨਾਂ ਤੋਂ ਪਰੇ: ਇੱਕ ਓਪਨ-ਸੋਰਸ ਵਿਜ਼ਨ

ਜਦੋਂ ਕਿ ਸ਼ੁਰੂ ਵਿੱਚ ਫੌਕਸਕਾਨ ਦੇ ਅੰਦਰੂਨੀ ਕਾਰਜਾਂ ਨੂੰ ਸੁਚਾਰੂ ਬਣਾਉਣ ਲਈ ਕਲਪਨਾ ਕੀਤੀ ਗਈ ਸੀ, ਜਿਸ ਵਿੱਚ ਡੇਟਾ ਵਿਸ਼ਲੇਸ਼ਣ, ਫੈਸਲੇ ਦਾ ਸਮਰਥਨ, ਦਸਤਾਵੇਜ਼ ਸਹਿਯੋਗ, ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ ਕੋਡ ਉਤਪਾਦਨ ਵਰਗੇ ਕੰਮ ਸ਼ਾਮਲ ਹਨ। ਇਹ ਗਣਿਤ, ਤਰਕ ਅਤੇ ਸਮੱਸਿਆ ਹੱਲ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਸੀ। ਫੌਕਸਬ੍ਰੇਨ ਦੀ ਕਿਸਮਤ ਕੰਪਨੀ ਦੀਆਂ ਕੰਧਾਂ ਤੋਂ ਕਿਤੇ ਵੱਧ ਫੈਲੀ ਹੋਈ ਹੈ। ਫੌਕਸਕਾਨ ਨੇ ਮਾਡਲ ਨੂੰ ਓਪਨ-ਸੋਰਸ ਤਕਨਾਲੋਜੀ ਵਜੋਂ ਜਾਰੀ ਕਰਨ ਦੇ ਆਪਣੇ ਇਰਾਦੇ ਦਾ ਦਲੇਰੀ ਨਾਲ ਐਲਾਨ ਕੀਤਾ ਹੈ। ਇਹ ਕਦਮ ਉੱਨਤ AI ਸਮਰੱਥਾਵਾਂ ਤੱਕ ਪਹੁੰਚ ਨੂੰ ਜਮਹੂਰੀਅਤ ਬਣਾਉਣ ਲਈ ਤਿਆਰ ਹੈ, ਤਾਈਵਾਨ ਅਤੇ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਇਸ ਤੋਂ ਬਾਹਰ ਦੇ ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਫੌਕਸਬ੍ਰੇਨ ਦੀ ਸੰਭਾਵਨਾ ਦਾ ਲਾਭ ਉਠਾਉਣ ਲਈ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।

ਓਪਨ ਸੋਰਸ ਪ੍ਰਤੀ ਇਹ ਵਚਨਬੱਧਤਾ AI ਭਾਈਚਾਰੇ ਵਿੱਚ ਇੱਕ ਵਿਆਪਕ ਰੁਝਾਨ ਦੇ ਨਾਲ ਮੇਲ ਖਾਂਦੀ ਹੈ, ਇਹ ਮੰਨਦੇ ਹੋਏ ਕਿ ਸਹਿਯੋਗ ਅਤੇ ਸਾਂਝਾ ਗਿਆਨ ਨਵੀਨਤਾ ਦੇ ਮੁੱਖ ਚਾਲਕ ਹਨ। ਫੌਕਸਬ੍ਰੇਨ ਨੂੰ ਵਿਸ਼ਾਲ ਭਾਈਚਾਰੇ ਲਈ ਉਪਲਬਧ ਕਰਵਾ ਕੇ, ਫੌਕਸਕਾਨ ਨਾ ਸਿਰਫ਼ AI ਦੀ ਤਰੱਕੀ ਵਿੱਚ ਯੋਗਦਾਨ ਪਾ ਰਿਹਾ ਹੈ, ਸਗੋਂ ਸਾਂਝੀ ਤਰੱਕੀ ਦੀ ਭਾਵਨਾ ਨੂੰ ਵੀ ਉਤਸ਼ਾਹਿਤ ਕਰ ਰਿਹਾ ਹੈ।

ਭਾਈਵਾਲੀ ਦੀ ਸ਼ਕਤੀ: Nvidia ਦੀ ਮੁਹਾਰਤ ਦਾ ਲਾਭ ਉਠਾਉਣਾ

ਫੌਕਸਬ੍ਰੇਨ ਦੀ ਸਿਰਜਣਾ ਇੱਕ ਸਹਿਯੋਗੀ ਯਤਨ ਸੀ, ਜਿਸ ਵਿੱਚ Nvidia ਨੇ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਭੂਮਿਕਾ ਨਿਭਾਈ। ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਨੇ 120 Nvidia H100 GPUs ਦੀ ਸ਼ਕਤੀ ਦਾ ਇਸਤੇਮਾਲ ਕੀਤਾ, ਜੋ Nvidia ਦੀ Quantum-2 InfiniBand ਨੈੱਟਵਰਕਿੰਗ ਤਕਨਾਲੋਜੀ ਰਾਹੀਂ ਆਪਸ ਵਿੱਚ ਜੁੜੇ ਹੋਏ ਹਨ। ਇਸ ਸੈੱਟਅੱਪ ਨੇ ਹਾਈ-ਸਪੀਡ ਡੇਟਾ ਟ੍ਰਾਂਸਫਰ ਨੂੰ ਸਮਰੱਥ ਬਣਾਇਆ, ਜੋ ਕਿ ਇਸ ਪੈਮਾਨੇ ਦੇ ਮਾਡਲਨੂੰ ਕੁਸ਼ਲਤਾ ਨਾਲ ਸਿਖਲਾਈ ਦੇਣ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਕਾਰਕ ਹੈ।

Nvidia ਦਾ ਸਮਰਥਨ ਸਿਰਫ਼ ਹਾਰਡਵੇਅਰ ਪ੍ਰਦਾਨ ਕਰਨ ਤੋਂ ਅੱਗੇ ਵਧਿਆ। ਕੰਪਨੀ ਦੀ Taipei-1 ਸੁਪਰਕੰਪਿਊਟਰ ਸਹੂਲਤ ਅਤੇ ਤਕਨੀਕੀ ਸਲਾਹ-ਮਸ਼ਵਰੇ ਨੇ ਫੌਕਸਕਾਨ ਨੂੰ Nvidia ਦੇ NeMo ਫਰੇਮਵਰਕ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਣ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਭੂਮਿਕਾ ਨਿਭਾਈ, ਜੋ ਕਿ AI ਮਾਡਲਾਂ ਨੂੰ ਬਣਾਉਣ ਅਤੇ ਅਨੁਕੂਲਿਤ ਕਰਨ ਲਈ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਟੂਲਕਿੱਟ ਹੈ। ਇਹ ਭਾਈਵਾਲੀ ਹਾਰਡਵੇਅਰ ਅਤੇ ਸੌਫਟਵੇਅਰ ਮੁਹਾਰਤ ਦੇ ਵਿਚਕਾਰ ਤਾਲਮੇਲ ਦੀ ਮਿਸਾਲ ਦਿੰਦੀ ਹੈ, AI ਵਿਕਾਸ ਦੀਆਂ ਸੀਮਾਵਾਂ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣ ਵਿੱਚ ਸਹਿਯੋਗ ਦੀ ਮਹੱਤਤਾ ਨੂੰ ਉਜਾਗਰ ਕਰਦੀ ਹੈ।

ਇੱਕ ਠੋਸ ਬੁਨਿਆਦ ‘ਤੇ ਨਿਰਮਾਣ: Llama 3.1 ਆਰਕੀਟੈਕਚਰ

ਫੌਕਸਬ੍ਰੇਨ ਦਾ ਆਰਕੀਟੈਕਚਰ Meta ਦੇ Llama 3.1 ਵਿੱਚ ਜੜ੍ਹਿਆ ਹੋਇਆ ਹੈ, ਜੋ ਓਪਨ-ਸੋਰਸ ਸਹਿਯੋਗ ਦੀ ਸ਼ਕਤੀ ਦਾ ਪ੍ਰਮਾਣ ਹੈ। ਇਹ ਬੁਨਿਆਦ ਇੱਕ ਮਜ਼ਬੂਤ ਅਤੇ ਚੰਗੀ ਤਰ੍ਹਾਂ ਪਰਖਿਆ ਗਿਆ ਫਰੇਮਵਰਕ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ 70 ਬਿਲੀਅਨ ਪੈਰਾਮੀਟਰ ਸ਼ਾਮਲ ਹਨ। ਇਹ ਪੈਰਾਮੀਟਰ ਅਡਜੱਸਟੇਬਲ ਮੁੱਲ ਹਨ ਜਿਨ੍ਹਾਂ ਨੂੰ AI ਸਿਸਟਮ ਡੇਟਾ ਤੋਂ ਸਿੱਖਣ ਦੇ ਨਾਲ-ਨਾਲ ਵਧੀਆ ਬਣਾਉਂਦਾ ਹੈ, ਜੋ ਮਾਡਲ ਦੇ ਇਕੱਠੇ ਹੋਏ ਗਿਆਨ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ।

ਸ਼ੁਰੂਆਤੀ ਬਿੰਦੂ ਵਜੋਂ Llama 3.1 ਦੀ ਚੋਣ ਇੱਕ ਰਣਨੀਤਕ ਫੈਸਲੇ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ ਜੋ ਪਹੀਏ ਨੂੰ ਮੁੜ ਖੋਜਣ ਦੀ ਬਜਾਏ ਮੌਜੂਦਾ, ਸਾਬਤ ਤਕਨਾਲੋਜੀ ਦਾ ਲਾਭ ਉਠਾਉਂਦੀ ਹੈ। ਇਹ ਪਹੁੰਚ ਫੌਕਸਕਾਨ ਨੂੰ ਰਵਾਇਤੀ ਚੀਨੀ ਦੀਆਂ ਖਾਸ ਲੋੜਾਂ ਅਨੁਸਾਰ ਮਾਡਲ ਨੂੰ ਤਿਆਰ ਕਰਨ ਅਤੇ ਇਸਦੇ ਉਦੇਸ਼ਿਤ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਇਸਦੇ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣ ‘ਤੇ ਆਪਣੇ ਯਤਨਾਂ ਨੂੰ ਕੇਂਦਰਿਤ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ।

ਮੁਕਾਬਲੇ ਨੂੰ ਪਛਾੜਨਾ: ਫੌਕਸਬ੍ਰੇਨ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਦੀ ਬੈਂਚਮਾਰਕਿੰਗ

ਫੌਕਸਕਾਨ ਦੀ ਅੰਦਰੂਨੀ ਜਾਂਚ ਦੱਸਦੀ ਹੈ ਕਿ ਫੌਕਸਬ੍ਰੇਨ ਕਈ ਮੁੱਖ ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ Llama-3-Taiwan-70B, ਇੱਕ ਹੋਰ ਰਵਾਇਤੀ ਚੀਨੀ ਭਾਸ਼ਾ ਮਾਡਲ, ਤੋਂ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ। ਇਹ ਉੱਤਮ ਪ੍ਰਦਰਸ਼ਨ ਫੌਕਸਕਾਨ ਦੀਆਂ ਸਿਖਲਾਈ ਰਣਨੀਤੀਆਂ ਅਤੇ ਸਥਾਨਕਕਰਨ ‘ਤੇ ਇਸਦੇ ਧਿਆਨ ਦੀ ਪ੍ਰਭਾਵਸ਼ੀਲਤਾ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ।

ਖਾਸ ਤੌਰ ‘ਤੇ, ਫੌਕਸਬ੍ਰੇਨ ਬੇਸ Meta Llama 3.1 ਮਾਡਲ ਦੇ ਮੁਕਾਬਲੇ ਗਣਿਤਿਕ ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਸੁਧਾਰਾਂ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ। ਇਹ ਵਧੀ ਹੋਈ ਗਣਿਤਿਕ ਸਮਰੱਥਾ ਖਾਸ ਤੌਰ ‘ਤੇ ਨਿਰਮਾਣ, ਸਪਲਾਈ ਚੇਨ ਪ੍ਰਬੰਧਨ, ਅਤੇ ਹੋਰ ਖੇਤਰਾਂ ਵਿੱਚ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਢੁਕਵੀਂ ਹੈ ਜੋ ਮਾਤਰਾਤਮਕ ਵਿਸ਼ਲੇਸ਼ਣ ‘ਤੇ ਨਿਰਭਰ ਕਰਦੇ ਹਨ।

ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ ਇੱਕ ਡੂੰਘੀ ਡੁਬਕੀ: TMMLU+ ਬੈਂਚਮਾਰਕ

ਫੌਕਸਬ੍ਰੇਨ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਦਾ ਸਖ਼ਤੀ ਨਾਲ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ, ਫੌਕਸਕਾਨ ਨੇ TMMLU+ ਬੈਂਚਮਾਰਕ ਦੀ ਵਰਤੋਂ ਕੀਤੀ, ਇੱਕ ਵਿਆਪਕ ਟੈਸਟ ਜੋ ਗਿਆਨ ਦੇ ਖੇਤਰਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਵਿੱਚ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਮਾਪਦਾ ਹੈ। ਨਤੀਜੇ ਗਣਿਤ ਅਤੇ ਤਰਕਪੂਰਨ ਤਰਕ ਵਿੱਚ ਫੌਕਸਬ੍ਰੇਨ ਦੀਆਂ ਸ਼ਕਤੀਆਂ ਨੂੰ ਉਜਾਗਰ ਕਰਦੇ ਹਨ, ਅਸਲ-ਸੰਸਾਰ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਇਸਦੀ ਸੰਭਾਵਨਾ ਨੂੰ ਹੋਰ ਪ੍ਰਮਾਣਿਤ ਕਰਦੇ ਹਨ।

TMMLU+ ਬੈਂਚਮਾਰਕ ਫੌਕਸਬ੍ਰੇਨ ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦੀ ਤੁਲਨਾ ਦੂਜੇ ਮਾਡਲਾਂ ਨਾਲ ਕਰਨ ਦਾ ਇੱਕ ਮਾਨਕੀਕ੍ਰਿਤ ਤਰੀਕਾ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਜੋ ਇਸਦੀਆਂ ਸ਼ਕਤੀਆਂ ਅਤੇ ਸੰਭਾਵੀ ਸੁਧਾਰ ਲਈ ਖੇਤਰਾਂ ਦੀ ਇੱਕ ਸਪੱਸ਼ਟ ਤਸਵੀਰ ਪੇਸ਼ ਕਰਦਾ ਹੈ। ਉਦੇਸ਼ ਮੁਲਾਂਕਣ ਪ੍ਰਤੀ ਇਹ ਵਚਨਬੱਧਤਾ ਪਾਰਦਰਸ਼ਤਾ ਅਤੇ ਨਿਰੰਤਰ ਸੁਧਾਰ ਲਈ ਫੌਕਸਕਾਨ ਦੇ ਸਮਰਪਣ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ।

ਡੇਟਾ ਵਾਧੇ ਦੀ ਕਲਾ: ਸਿਖਲਾਈ ਕਾਰਪਸ ਦਾ ਵਿਸਤਾਰ ਕਰਨਾ

ਫੌਕਸਬ੍ਰੇਨ ਦੀ ਸਫਲਤਾ ਵਿੱਚ ਇੱਕ ਮੁੱਖ ਤੱਤ ਇਸਦੀ ਸੂਝਵਾਨ ਡੇਟਾ ਵਾਧਾ ਰਣਨੀਤੀ ਹੈ। ਇਸ ਵਿੱਚ ਸਿਖਲਾਈ ਡੇਟਾ ਦਾ ਵਿਸਤਾਰ ਅਤੇ ਵਾਧਾ ਕਰਨ ਲਈ ਤਕਨੀਕਾਂ ਦੀ ਵਰਤੋਂ ਸ਼ਾਮਲ ਹੈ, ਇਹ ਸੁਨਿਸ਼ਚਿਤ ਕਰਨਾ ਕਿ ਮਾਡਲ ਭਾਸ਼ਾਈ ਪੈਟਰਨਾਂ ਦੀ ਇੱਕ ਵਿਭਿੰਨ ਅਤੇ ਪ੍ਰਤੀਨਿਧ ਸ਼੍ਰੇਣੀ ਦੇ ਸੰਪਰਕ ਵਿੱਚ ਹੈ।

ਫੌਕਸਕਾਨ ਦੀ ਟੀਮ ਨੇ 24 ਵੱਖ-ਵੱਖ ਵਿਸ਼ਾ ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ ਮਲਕੀਅਤ ਡੇਟਾ ਵਾਧਾ ਵਿਧੀਆਂ ਵਿਕਸਤ ਕੀਤੀਆਂ, ਜਿਸਦੇ ਨਤੀਜੇ ਵਜੋਂ ਰਵਾਇਤੀ ਚੀਨੀ ਲਈ 98 ਬਿਲੀਅਨ ਟੋਕਨਾਂ ਦਾ ਇੱਕ ਵਿਸ਼ਾਲ ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਡੇਟਾਸੈੱਟ ਬਣਿਆ। ਟੋਕਨ ਟੈਕਸਟ ਦੀਆਂ ਇਕਾਈਆਂ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ ਜਿਨ੍ਹਾਂ ਨੂੰ AI ਸਿਸਟਮ ਪ੍ਰੋਸੈਸ ਕਰਦਾ ਹੈ, ਆਮ ਤੌਰ ‘ਤੇ ਸ਼ਬਦਾਂ ਜਾਂ ਸ਼ਬਦਾਂ ਦੇ ਹਿੱਸਿਆਂ ਦੇ ਹੁੰਦੇ ਹਨ। ਇਹ ਵਿਆਪਕ ਡੇਟਾਸੈੱਟ ਇੱਕ ਅਜਿਹੇ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ ਜੋ ਭਾਸ਼ਾਈ ਬਾਰੀਕੀਆਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਕਿਸਮ ਨੂੰ ਸਮਝ ਸਕਦਾ ਹੈ ਅਤੇ ਜਵਾਬ ਦੇ ਸਕਦਾ ਹੈ।

ਸੰਦਰਭ ਰਾਜਾ ਹੈ: ਸਮਝ ਲਈ ਇੱਕ ਵਿਸ਼ਾਲ ਵਿੰਡੋ

ਫੌਕਸਬ੍ਰੇਨ 128,000 ਟੋਕਨਾਂ ਦੀ ਇੱਕ ਸੰਦਰਭ ਵਿੰਡੋ ਦਾ ਮਾਣ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ। ਇਹ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਸਮਰੱਥਾ ਇਹ ਨਿਰਧਾਰਤ ਕਰਦੀ ਹੈ ਕਿ ਮਾਡਲ ਇੱਕ ਵਾਰ ਵਿੱਚ ਕਿੰਨੀ ਜਾਣਕਾਰੀ ‘ਤੇ ਵਿਚਾਰ ਕਰ ਸਕਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਇਹ ਵਿਆਪਕ ਗੱਲਬਾਤ ਇਤਿਹਾਸ ਜਾਂ ਦਸਤਾਵੇਜ਼ ਸਮੱਗਰੀ ਬਾਰੇ ਜਾਗਰੂਕਤਾ ਬਣਾਈ ਰੱਖ ਸਕਦਾ ਹੈ। ਇਹ ਛੋਟੀਆਂ ਸੰਦਰਭ ਵਿੰਡੋਜ਼ ਵਾਲੇ ਮਾਡਲਾਂ ਦੇ ਮੁਕਾਬਲੇ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਫਾਇਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਫੌਕਸਬ੍ਰੇਨ ਗੱਲਬਾਤ ਜਾਂ ਟੈਕਸਟ ਦੇ ਵਿਆਪਕ ਸੰਦਰਭ ਨੂੰ ਸਮਝ ਸਕਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਵਧੇਰੇ ਤਾਲਮੇਲ ਵਾਲੇ ਅਤੇ ਢੁਕਵੇਂ ਜਵਾਬ ਮਿਲਦੇ ਹਨ।

ਇੱਕ ਵੱਡੀ ਸੰਦਰਭ ਵਿੰਡੋ ਖਾਸ ਤੌਰ ‘ਤੇ ਉਹਨਾਂ ਕੰਮਾਂ ਲਈ ਲਾਭਦਾਇਕ ਹੈ ਜਿਨ੍ਹਾਂ ਲਈ ਟੈਕਸਟ ਦੇ ਵੱਖ-ਵੱਖ ਹਿੱਸਿਆਂ ਵਿਚਕਾਰ ਗੁੰਝਲਦਾਰ ਸਬੰਧਾਂ ਨੂੰ ਸਮਝਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਜਿਵੇਂ ਕਿ ਲੰਬੇ ਦਸਤਾਵੇਜ਼ਾਂ ਦਾ ਸਾਰ ਦੇਣਾ ਜਾਂ ਉਹਨਾਂ ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ ਦੇਣਾ ਜਿਨ੍ਹਾਂ ਲਈ ਕਈ ਸਰੋਤਾਂ ਤੋਂ ਜਾਣਕਾਰੀ ਨੂੰ ਏਕੀਕ੍ਰਿਤ ਕਰਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।

ਮੁੱਖ ਨਵੀਨਤਾਵਾਂ: ਤਕਨੀਕੀ ਪ੍ਰਾਪਤੀਆਂ ਦਾ ਸਾਰ

ਫੌਕਸਕਾਨ ਦੁਆਰਾ ਫੌਕਸਬ੍ਰੇਨ ਦਾ ਵਿਕਾਸ ਕਈ ਮੁੱਖ ਨਵੀਨਤਾਵਾਂ ਦੁਆਰਾ ਚਿੰਨ੍ਹਿਤ ਕੀਤਾ ਗਿਆ ਹੈ:

  • ਮਲਕੀਅਤ ਡੇਟਾ ਵਾਧਾ: 24 ਵਿਸ਼ਾ ਸ਼੍ਰੇਣੀਆਂ ਲਈ ਵਿਲੱਖਣ ਡੇਟਾ ਵਾਧਾ ਅਤੇ ਗੁਣਵੱਤਾ ਮੁਲਾਂਕਣ ਤਕਨੀਕਾਂ ਦੀ ਸਿਰਜਣਾ ਨੇ ਸਿਖਲਾਈ ਡੇਟਾ ਨੂੰ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ ਅਮੀਰ ਬਣਾਇਆ।
  • ਕੁਸ਼ਲ GPU ਉਪਯੋਗਤਾ: ਮਾਡਲ ਨੂੰ ਕੁੱਲ 2,688 GPU ਦਿਨਾਂ ਵਿੱਚ 120 Nvidia H100 GPUs ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ, ਜੋ ਕੰਪਿਊਟੇਸ਼ਨਲ ਸਰੋਤਾਂ ਦੀ ਬਹੁਤ ਹੀ ਕੁਸ਼ਲ ਵਰਤੋਂ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ।
  • ਮਲਟੀ-ਨੋਡ ਪੈਰਲਲ ਟ੍ਰੇਨਿੰਗ: ਅਨੁਕੂਲ ਪ੍ਰਦਰਸ਼ਨ ਅਤੇ ਸਿਸਟਮ ਸਥਿਰਤਾ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਇੱਕ ਮਲਟੀ-ਨੋਡ ਪੈਰਲਲ ਟ੍ਰੇਨਿੰਗ ਫਰੇਮਵਰਕ ਲਾਗੂ ਕੀਤਾ ਗਿਆ ਸੀ, ਜਿਸ ਨਾਲ ਮਾਡਲ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਸਕੇਲ ਕਰ ਸਕਦਾ ਹੈ।
  • ਅਡੈਪਟਿਵ ਰੀਜ਼ਨਿੰਗ ਰਿਫਲੈਕਸ਼ਨ: ਮਾਡਲ ਦੀਆਂ ਖੁਦਮੁਖਤਿਆਰ ਤਰਕ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਵਧਾਉਣ ਲਈ ਇੱਕ ਨਵੀਨਤਾਕਾਰੀ ਅਡੈਪਟਿਵ ਰੀਜ਼ਨਿੰਗ ਰਿਫਲੈਕਸ਼ਨ ਵਿਧੀ ਪੇਸ਼ ਕੀਤੀ ਗਈ ਸੀ, ਜਿਸ ਨਾਲ ਇਹ ਸਮੇਂ ਦੇ ਨਾਲ ਆਪਣੀ ਤਰਕ ਦੇ ਹੁਨਰ ਨੂੰ ਸਿੱਖ ਸਕਦਾ ਹੈ ਅਤੇ ਸੁਧਾਰ ਸਕਦਾ ਹੈ।

ਭਵਿੱਖ ਵਿੱਚ ਇੱਕ ਝਲਕ: ਨਿਰੰਤਰ ਸੁਧਾਰ ਅਤੇ ਸਹਿਯੋਗ

ਡਾ. ਯੁੰਗ-ਹੁਈ ਲੀ ਸਵੀਕਾਰ ਕਰਦੇ ਹਨ ਕਿ ਜਦੋਂ ਕਿ ਫੌਕਸਬ੍ਰੇਨ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ, ਅਜੇ ਵੀ ਵਿਕਾਸ ਦੀ ਗੁੰਜਾਇਸ਼ ਹੈ। ਉਹ ਡੀਪਸੀਕ ਦੇ ਡਿਸਟਿਲੇਸ਼ਨ ਮਾਡਲ, ਇੱਕ ਹੋਰ AI ਸਿਸਟਮ ਜੋ ਕੁਸ਼ਲ ਗਿਆਨ ਟ੍ਰਾਂਸਫਰ’ਤੇ ਕੇਂਦ੍ਰਿਤ ਹੈ, ਦੇ ਮੁਕਾਬਲੇ ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ ਅੰਤਰ ਨੂੰ ਨੋਟ ਕਰਦੇ ਹਨ। ਹਾਲਾਂਕਿ, ਉਹ ਇਸ ਗੱਲ ‘ਤੇ ਜ਼ੋਰ ਦਿੰਦੇ ਹਨ ਕਿ ਫੌਕਸਬ੍ਰੇਨ ਦਾ ਪ੍ਰਦਰਸ਼ਨ “ਵਿਸ਼ਵ-ਪ੍ਰਮੁੱਖ ਮਾਪਦੰਡਾਂ” ਦੇ ਨੇੜੇ ਹੈ।

ਨਿਰੰਤਰ ਸੁਧਾਰ ਪ੍ਰਤੀ ਇਹ ਵਚਨਬੱਧਤਾ ਫੌਕਸਕਾਨ ਦੀ ਪਹੁੰਚ ਦੀ ਪਛਾਣ ਹੈ। ਕੰਪਨੀ ਫੌਕਸਬ੍ਰੇਨ ਨੂੰ ਸੁਧਾਰਨਾ ਜਾਰੀ ਰੱਖਣ, ਨਵੀਆਂ ਤਕਨੀਕਾਂ ਦੀ ਖੋਜ ਕਰਨ ਅਤੇ ਇਸਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਹੋਰ ਵਧਾਉਣ ਲਈ ਓਪਨ-ਸੋਰਸ ਭਾਈਚਾਰੇ ਤੋਂ ਫੀਡਬੈਕ ਦਾ ਲਾਭ ਉਠਾਉਣ ਦੀ ਯੋਜਨਾ ਬਣਾਉਂਦੀ ਹੈ।

ਦੂਰੀਆਂ ਦਾ ਵਿਸਤਾਰ: ਸਹਿਯੋਗੀ ਐਪਲੀਕੇਸ਼ਨ

ਜਦੋਂ ਕਿ ਸ਼ੁਰੂ ਵਿੱਚ ਅੰਦਰੂਨੀ ਵਰਤੋਂ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਸੀ, ਫੌਕਸਕਾਨ ਇੱਕ ਅਜਿਹੇ ਭਵਿੱਖ ਦੀ ਕਲਪਨਾ ਕਰਦਾ ਹੈ ਜਿੱਥੇ ਫੌਕਸਬ੍ਰੇਨ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਇਸਦੇ ਆਪਣੇ ਕਾਰਜਾਂ ਤੋਂ ਕਿਤੇ ਵੱਧ ਫੈਲੀਆਂ ਹੋਣ। ਕੰਪਨੀ ਨਵੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੀ ਖੋਜ ਕਰਨ ਅਤੇ ਨਿਰਮਾਣ, ਸਪਲਾਈ ਚੇਨ ਪ੍ਰਬੰਧਨ, ਅਤੇ ਫੈਸਲੇ ਲੈਣ ਦੀਆਂ ਪ੍ਰਕਿਰਿਆਵਾਂ ਵਿੱਚ AI ਦੀ ਵਰਤੋਂ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਨ ਲਈ ਤਕਨਾਲੋਜੀ ਭਾਈਵਾਲਾਂ ਨਾਲ ਸਰਗਰਮੀ ਨਾਲ ਸਹਿਯੋਗ ਕਰਨ ਦੀ ਯੋਜਨਾ ਬਣਾਉਂਦੀ ਹੈ।

ਇਹ ਸਹਿਯੋਗੀ ਪਹੁੰਚ ਫੌਕਸਕਾਨ ਦੇ ਓਪਨ-ਸੋਰਸ ਫਲਸਫੇ ਦੇ ਨਾਲ ਮੇਲ ਖਾਂਦੀ ਹੈ, ਇਹ ਮੰਨਦੇ ਹੋਏ ਕਿ AI ਦੀ ਅਸਲ ਸੰਭਾਵਨਾ ਨੂੰ ਸਿਰਫ਼ ਸਾਂਝੇ ਗਿਆਨ ਅਤੇ ਸਮੂਹਿਕ ਯਤਨਾਂ ਦੁਆਰਾ ਹੀ ਖੋਲ੍ਹਿਆ ਜਾ ਸਕਦਾ ਹੈ। ਹੋਰ ਸੰਸਥਾਵਾਂ ਨਾਲ ਭਾਈਵਾਲੀ ਕਰਕੇ, ਫੌਕਸਕਾਨ ਦਾ ਉਦੇਸ਼ AI ਨੂੰ ਅਪਣਾਉਣ ਵਿੱਚ ਤੇਜ਼ੀ ਲਿਆਉਣਾ ਅਤੇ ਵੱਖ-ਵੱਖ ਉਦਯੋਗਾਂ ਵਿੱਚ ਨਵੀਨਤਾ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣਾ ਹੈ।

ਨਵੀਨਤਾ ਦਾ ਪ੍ਰਦਰਸ਼ਨ: Nvidia GTC 2025 ਵਿੱਚ ਪੇਸ਼ਕਾਰੀ

ਵਿਆਪਕ AI ਭਾਈਚਾਰੇ ਨਾਲ ਆਪਣੀਆਂ ਤਰੱਕੀਆਂ ਨੂੰ ਸਾਂਝਾ ਕਰਨ ਲਈ ਫੌਕਸਕਾਨ ਦੀ ਵਚਨਬੱਧਤਾ Nvidia GTC 2025 ਕਾਨਫਰੰਸ ਵਿੱਚ ਇਸਦੀ ਯੋਜਨਾਬੱਧ ਪੇਸ਼ਕਾਰੀ ਦੁਆਰਾ ਹੋਰ ਪ੍ਰਦਰਸ਼ਿਤ ਕੀਤੀ ਗਈ ਹੈ। “ਓਪਨ ਸੋਰਸ ਤੋਂ ਫਰੰਟੀਅਰ AI ਤੱਕ: ਬਿਲਡ, ਕਸਟਮਾਈਜ਼ ਅਤੇ ਐਕਸਟੈਂਡ ਫਾਊਂਡੇਸ਼ਨ ਮਾਡਲ” ਸਿਰਲੇਖ ਵਾਲਾ ਸੈਸ਼ਨ, ਫੌਕਸਬ੍ਰੇਨ ਦੇ ਵਿਕਾਸ ਨੂੰ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਨ ਅਤੇ ਓਪਨ-ਸੋਰਸ AI ਦੇ ਵਿਆਪਕ ਪ੍ਰਭਾਵਾਂ ‘ਤੇ ਚਰਚਾ ਕਰਨ ਲਈ ਇੱਕ ਪਲੇਟਫਾਰਮ ਪ੍ਰਦਾਨ ਕਰੇਗਾ।

ਇਹ ਪੇਸ਼ਕਾਰੀ ਪਾਰਦਰਸ਼ਤਾ ਲਈ ਫੌਕਸਕਾਨ ਦੀ ਵਚਨਬੱਧਤਾ ਅਤੇ AI ਦੇ ਭਵਿੱਖ ਦੇ ਆਲੇ ਦੁਆਲੇ ਚੱਲ ਰਹੀ ਗੱਲਬਾਤ ਵਿੱਚ ਯੋਗਦਾਨ ਪਾਉਣ ਦੀ ਇੱਛਾ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ। ਆਪਣੇ ਤਜ਼ਰਬਿਆਂ ਅਤੇ ਸੂਝ-ਬੂਝ ਨੂੰ ਸਾਂਝਾ ਕਰਕੇ, ਫੌਕਸਕਾਨ ਦਾ ਉਦੇਸ਼ AI ਭਾਈਚਾਰੇ ਵਿੱਚ ਹੋਰ ਨਵੀਨਤਾ ਅਤੇ ਸਹਿਯੋਗ ਨੂੰ ਪ੍ਰੇਰਿਤ ਕਰਨਾ ਹੈ। ਇਹ ਪੇਸ਼ਕਾਰੀ 20 ਮਾਰਚ ਨੂੰ ਹੋਈ ਸੀ।