ਮਾਈਕਰੋਸਾਫਟ ਫਾਈ: ਛੋਟੇ ਭਾਸ਼ਾ ਮਾਡਲ AI ਵਿੱਚ ਛਾਲ ਮਾਰਦੇ ਹਨ

ਮਾਈਕਰੋਸਾਫਟ ਨੇ Azure AI Foundry ‘ਤੇ Phi-3 ਜਾਰੀ ਕਰਕੇ ਛੋਟੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ (SLMs) ਦੀ ਆਪਣੀ ਰੇਂਜ ਪੇਸ਼ ਕਰਨ ਤੋਂ ਇੱਕ ਸਾਲ ਬਾਅਦ, ਆਪਣੀ ਅਗਲੀ ਪੀੜ੍ਹੀ ਦੇ ਮਾਡਲ ਪੇਸ਼ ਕੀਤੇ ਹਨ: Phi-4-reasoning, Phi-4-reasoning-plus, ਅਤੇ Phi-4-mini-reasoning। ਇਹ ਨਵੀਨਤਾਵਾਂ SLMs ਲਈ ਇੱਕ ਮੋੜ ਹਨ, ਜੋ ਸੰਖੇਪ ਅਤੇ ਕੁਸ਼ਲ AI ਨਾਲ ਪ੍ਰਾਪਤ ਕੀਤੇ ਜਾ ਸਕਦੇ ਹਨ ਨੂੰ ਮੁੜ ਪਰਿਭਾਸ਼ਿਤ ਕਰਦੇ ਹਨ।

ਫਾਈ-ਰੀਜ਼ਨਿੰਗ ਮਾਡਲਾਂ ਦੀ ਸ਼ੁਰੂਆਤ

ਨਵੇਂ ਫਾਈ-ਰੀਜ਼ਨਿੰਗ ਮਾਡਲ ਗੁੰਝਲਦਾਰ ਕੰਮਾਂ ਲਈ ਅਨੁਮਾਨ-ਸਮੇਂ ਦੇ ਸਕੇਲਿੰਗ ਨੂੰ ਵਰਤਣ ਲਈ ਇੰਜੀਨੀਅਰ ਕੀਤੇ ਗਏ ਹਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਬਹੁ-ਪੜਾਵੀ ਡੀਕੰਪੋਜ਼ੀਸ਼ਨ ਅਤੇ ਅੰਦਰੂਨੀ ਪ੍ਰਤੀਬਿੰਬ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਹ ਮਾਡਲ ਗਣਿਤਿਕ ਤਰਕ ਵਿੱਚ ਅਸਧਾਰਨ ਸਮਰੱਥਾਵਾਂ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦੇ ਹਨ, ਆਪਣੇ ਆਪ ਨੂੰ ਏਜੰਟ-ਵਰਗੇ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਇੱਕ ਨੀਂਹ ਵਜੋਂ ਸਥਾਪਤ ਕਰਦੇ ਹਨ ਜੋ ਗੁੰਝਲਦਾਰ ਅਤੇ ਬਹੁਪੱਖੀ ਕੰਮਾਂ ਨੂੰ ਸੰਭਾਲਦੇ ਹਨ। ਇਤਿਹਾਸਕ ਤੌਰ ‘ਤੇ, ਅਜਿਹੀਆਂ ਸਮਰੱਥਾਵਾਂ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ ਵੱਡੇ ਮਾਡਲਾਂ ਲਈ ਵਿਸ਼ੇਸ਼ ਸਨ। ਫਾਈ-ਰੀਜ਼ਨਿੰਗ ਮਾਡਲ SLMs ਦੀ ਇੱਕ ਨਵੀਂ ਸ਼੍ਰੇਣੀ ਪੇਸ਼ ਕਰਦੇ ਹਨ ਜੋ ਆਕਾਰ ਅਤੇ ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਵਿਚਕਾਰ ਸੰਤੁਲਨ ਬਣਾਉਣ ਲਈ ਡਿਸਟਿਲੇਸ਼ਨ, ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ, ਅਤੇ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਡੇਟਾ ਦਾ ਲਾਭ ਲੈਂਦੇ ਹਨ। ਉਹਨਾਂ ਦਾ ਸੰਖੇਪ ਆਕਾਰ ਉਹਨਾਂ ਨੂੰ ਘੱਟ-ਲੇਟੈਂਸੀ ਵਾਤਾਵਰਣਾਂ ਲਈ ਢੁਕਵਾਂ ਬਣਾਉਂਦਾ ਹੈ, ਜਦੋਂ ਕਿ ਉਹਨਾਂ ਦੀਆਂ ਮਜ਼ਬੂਤ ​​ਤਰਕ ਯੋਗਤਾਵਾਂ ਬਹੁਤ ਵੱਡੇ ਮਾਡਲਾਂ ਨਾਲ ਮੁਕਾਬਲਾ ਕਰਦੀਆਂ ਹਨ। ਕੁਸ਼ਲਤਾ ਅਤੇ ਸਮਰੱਥਾ ਦਾ ਇਹ ਮਿਸ਼ਰਣ ਸਰੋਤ-ਪ੍ਰਤੀਬੰਧਿਤ ਉਪਕਰਣਾਂ ਨੂੰ ਵੀ ਗੁੰਝਲਦਾਰ ਤਰਕ ਕਾਰਜਾਂ ਨੂੰ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਚਲਾਉਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ।

ਫਾਈ-4-ਰੀਜ਼ਨਿੰਗ ਅਤੇ ਫਾਈ-4-ਰੀਜ਼ਨਿੰਗ-ਪਲੱਸ: ਇੱਕ ਡੂੰਘੀ ਡੁਬਕੀ

ਫਾਈ-4-ਰੀਜ਼ਨਿੰਗ: ਓਪਨ-ਵੇਟ ਰੀਜ਼ਨਿੰਗ ਮਾਡਲ

ਫਾਈ-4-ਰੀਜ਼ਨਿੰਗ 14 ਬਿਲੀਅਨ ਪੈਰਾਮੀਟਰਾਂ ਵਾਲੇ ਇੱਕ ਓਪਨ-ਵੇਟ ਰੀਜ਼ਨਿੰਗ ਮਾਡਲ ਵਜੋਂ ਵੱਖਰਾ ਹੈ। ਇਹ ਗੁੰਝਲਦਾਰ ਤਰਕ ਕਾਰਜਾਂ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ ਵੱਡੇ ਮਾਡਲਾਂ ਨਾਲ ਮੁਕਾਬਲਾ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਸ ਮਾਡਲ ਨੂੰ OpenAI ਦੇ o3-mini ਤੋਂ ਲਏ ਗਏ ਸਾਵਧਾਨੀ ਨਾਲ ਤਿਆਰ ਕੀਤੇ ਤਰਕ ਉਦਾਹਰਣਾਂ ‘ਤੇ Phi-4 ਦੇ ਨਿਗਰਾਨੀ ਅਧੀਨ ਵਧੀਆ-ਟਿਊਨਿੰਗ ਦੁਆਰਾ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ। ਫਾਈ-4-ਰੀਜ਼ਨਿੰਗ ਵਿਸਤ੍ਰਿਤ ਤਰਕ ਚੇਨਾਂ ਪੈਦਾ ਕਰਦਾ ਹੈ, ਅਨੁਮਾਨ ਦੇ ਦੌਰਾਨ ਵਾਧੂ ਕੰਪਿਊਟੇਸ਼ਨ ਸਮੇਂ ਨੂੰ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਉਪਯੋਗ ਕਰਦਾ ਹੈ। ਇਹ ਪ੍ਰਾਪਤੀ ਇਸ ਗੱਲ ਨੂੰ ਰੇਖਾਂਕਿਤ ਕਰਦੀ ਹੈ ਕਿ ਕਿਵੇਂ ਸਟੀਕ ਡੇਟਾ ਕਿਊਰੇਸ਼ਨ ਅਤੇ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਸਿੰਥੈਟਿਕ ਡੇਟਾਸੈਟ ਛੋਟੇ ਮਾਡਲਾਂ ਨੂੰ ਆਪਣੇ ਵੱਡੇ ਹਮਰੁਤਬਾ ਨਾਲ ਮੁਕਾਬਲਾ ਕਰਨ ਲਈ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ।

ਫਾਈ-4-ਰੀਜ਼ਨਿੰਗ-ਪਲੱਸ: ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਨਾਲ ਤਰਕ ਨੂੰ ਵਧਾਉਣਾ

ਫਾਈ-4-ਰੀਜ਼ਨਿੰਗ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ‘ਤੇ ਨਿਰਮਾਣ ਕਰਦੇ ਹੋਏ, ਫਾਈ-4-ਰੀਜ਼ਨਿੰਗ-ਪਲੱਸ ਅਨੁਮਾਨ ਦੇ ਦੌਰਾਨ ਵਾਧੂ ਕੰਪਿਊਟੇਸ਼ਨ ਸਮੇਂ ਦਾ ਲਾਭ ਲੈਣ ਲਈ ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਨਾਲ ਹੋਰ ਸਿਖਲਾਈ ਲੈਂਦਾ ਹੈ। ਇਹ ਫਾਈ-4-ਰੀਜ਼ਨਿੰਗ ਨਾਲੋਂ 1.5 ਗੁਣਾ ਜ਼ਿਆਦਾ ਟੋਕਨਾਂ ‘ਤੇ ਪ੍ਰਕਿਰਿਆ ਕਰਦਾ ਹੈ, ਜਿਸਦੇ ਨਤੀਜੇ ਵਜੋਂ ਵਧੀ ਹੋਈ ਸ਼ੁੱਧਤਾ ਹੁੰਦੀ ਹੈ।

ਪ੍ਰਦਰਸ਼ਨ ਬੈਂਚਮਾਰਕ

ਉਹਨਾਂ ਦੇ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ ਛੋਟੇ ਆਕਾਰ ਦੇ ਬਾਵਜੂਦ, ਫਾਈ-4-ਰੀਜ਼ਨਿੰਗ ਅਤੇ ਫਾਈ-4-ਰੀਜ਼ਨਿੰਗ-ਪਲੱਸ ਦੋਵੇਂ ਹੀ ਓਪਨਏਆਈ ਦੇ o1-mini ਅਤੇ DeepSeek-R1-Distill-Llama-70B ਨੂੰ ਵੱਖ-ਵੱਖ ਬੈਂਚਮਾਰਕਾਂ ਵਿੱਚੋਂ ਕੱਢਦੇ ਹਨ, ਜਿਸ ਵਿੱਚ ਗਣਿਤਿਕ ਤਰਕ ਅਤੇ PhD-ਪੱਧਰ ਦੀਆਂ ਵਿਗਿਆਨਕ ਪੁੱਛਗਿੱਛਾਂ ਸ਼ਾਮਲ ਹਨ। ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ, ਉਹ AIME 2025 ਟੈਸਟ ‘ਤੇ ਪੂਰੇ DeepSeek-R1 ਮਾਡਲ (671 ਬਿਲੀਅਨ ਪੈਰਾਮੀਟਰਾਂ ਵਾਲੇ) ਨੂੰ ਵੀ ਪਛਾੜ ਦਿੰਦੇ ਹਨ, ਜੋ ਕਿ 2025 ਦੇ USA ਮੈਥ ਓਲੰਪੀਆਡ ਲਈ ਕੁਆਲੀਫਾਈ ਕਰਨ ਵਾਲੀ ਮੁਕਾਬਲਾ ਵਜੋਂ ਕੰਮ ਕਰਦਾ ਹੈ। ਦੋਵੇਂ ਮਾਡਲ Azure AI Foundry ਅਤੇ Hugging Face ‘ਤੇ ਆਸਾਨੀ ਨਾਲ ਉਪਲਬਧ ਹਨ।

ਫਾਈ-4-ਮਿਨੀ-ਰੀਜ਼ਨਿੰਗ: ਸੀਮਤ ਵਾਤਾਵਰਣਾਂ ਲਈ ਸੰਖੇਪ ਪਾਵਰਹਾਊਸ

ਫਾਈ-4-ਮਿਨੀ-ਰੀਜ਼ਨਿੰਗ ਖਾਸ ਤੌਰ ‘ਤੇ ਇੱਕ ਸੰਖੇਪ ਤਰਕ ਮਾਡਲ ਦੀ ਮੰਗ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਹ ਟ੍ਰਾਂਸਫਾਰਮਰ-ਅਧਾਰਤ ਭਾਸ਼ਾ ਮਾਡਲ ਗਣਿਤਿਕ ਤਰਕ ਲਈ ਅਨੁਕੂਲਿਤ ਹੈ ਅਤੇ ਉਹਨਾਂ ਵਾਤਾਵਰਣਾਂ ਵਿੱਚ ਉੱਚ-ਗੁਣਵੱਤਾ, ਕਦਮ-ਦਰ-ਕਦਮ ਸਮੱਸਿਆ-ਹੱਲ ਕਰਨ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ ਜਿੱਥੇ ਕੰਪਿਊਟਿੰਗ ਪਾਵਰ ਜਾਂ ਲੇਟੈਂਸੀ ਸੀਮਤ ਹੈ। Deepseek-R1 ਮਾਡਲ ਦੁਆਰਾ ਤਿਆਰ ਕੀਤੇ ਗਏ ਸਿੰਥੈਟਿਕ ਡੇਟਾ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਫਾਈਨਟਿਊਨਡ, ਇਹ ਉੱਨਤ ਤਰਕ ਸਮਰੱਥਾਵਾਂ ਨਾਲ ਕੁਸ਼ਲਤਾ ਨੂੰ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਸੰਤੁਲਿਤ ਕਰਦਾ ਹੈ। ਇਹ ਇਸਨੂੰ ਵਿਦਿਅਕ ਐਪਲੀਕੇਸ਼ਨਾਂ, ਏਮਬੈਡਡ ਟਿਊਟਰਿੰਗ ਸਿਸਟਮਾਂ, ਅਤੇ ਐਜ ਜਾਂ ਮੋਬਾਈਲ ਸਿਸਟਮਾਂ ‘ਤੇ ਹਲਕੇ ਭਾਰ ਵਾਲੇ ਤਾਇਨਾਤੀਆਂ ਲਈ ਆਦਰਸ਼ ਬਣਾਉਂਦਾ ਹੈ। ਮਾਡਲ ਨੂੰ ਮੱਧ ਸਕੂਲ ਤੋਂ ਲੈ ਕੇ PhD-ਪੱਧਰ ਤੱਕ ਦੀ ਮੁਸ਼ਕਲ ਵਿੱਚ ਫੈਲੀਆਂ ਇੱਕ ਮਿਲੀਅਨ ਤੋਂ ਵੱਧ ਵਿਭਿੰਨ ਗਣਿਤਿਕ ਸਮੱਸਿਆਵਾਂ ‘ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ, ਇਸਦੀ ਬਹੁਪੱਖੀਤਾ ਅਤੇ ਵਿਦਿਅਕ ਸੰਦਰਭਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਵਿੱਚ ਪ੍ਰਭਾਵਸ਼ਾਲੀਤਾ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਂਦਾ ਹੈ।

ਫਾਈ ਐਕਸ਼ਨ ਵਿੱਚ: ਦਿਸਹੱਦੇ ਦਾ ਵਿਸਥਾਰ ਕਰਨਾ

ਪਿਛਲੇ ਸਾਲ ਵਿੱਚ ਫਾਈ ਦੇ ਵਿਕਾਸ ਨੇ ਲਗਾਤਾਰ ਆਕਾਰ ਦੇ ਅਨੁਸਾਰ ਗੁਣਵੱਤਾ ਦੀਆਂ ਸੀਮਾਵਾਂ ਨੂੰ ਅੱਗੇ ਵਧਾਇਆ ਹੈ, ਪਰਿਵਾਰ ਵਿਭਿੰਨ ਲੋੜਾਂ ਦੇ ਅਨੁਸਾਰ ਨਵੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨ ਲਈ ਫੈਲ ਰਿਹਾ ਹੈ। ਇਹ ਮਾਡਲ ਵੱਖ-ਵੱਖ ਹਾਰਡਵੇਅਰ ਸੰਰਚਨਾਵਾਂ ਵਾਲੇ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਲਚਕਤਾ ਅਤੇ ਪਹੁੰਚਯੋਗਤਾ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹੋਏ, ਵੱਖ-ਵੱਖ ਵਿੰਡੋਜ਼ 11 ਡਿਵਾਈਸਾਂ ਵਿੱਚ CPUs ਅਤੇ GPUs ਦੋਵਾਂ ‘ਤੇ ਸਥਾਨਕ ਤੌਰ ‘ਤੇ ਚਲਾਏ ਜਾ ਸਕਦੇ ਹਨ।

Copilot+ PCs ਨਾਲ ਏਕੀਕਰਣ: AI-ਸੰਚਾਲਿਤ ਕੰਪਿਊਟਿੰਗ ਦਾ ਇੱਕ ਨਵਾਂ ਯੁੱਗ

ਫਾਈ ਮਾਡਲ Copilot+ PCs ਦਾ ਇੱਕ ਅਨਿੱਖੜਵਾਂ ਅੰਗ ਹਨ, ਜੋ NPU-ਅਨੁਕੂਲਿਤ ਫਾਈ ਸਿਲਿਕਾ ਰੂਪਾਂਤਰ ਦਾ ਲਾਭ ਲੈਂਦੇ ਹਨ। ਓਪਰੇਟਿੰਗ ਸਿਸਟਮ ਦੁਆਰਾ ਪ੍ਰਬੰਧਿਤ ਫਾਈ ਦਾ ਇਹ ਬਹੁਤ ਹੀ ਕੁਸ਼ਲ ਸੰਸਕਰਣ, ਯਾਦਦਾਸ਼ਤ ਵਿੱਚ ਪ੍ਰੀ-ਲੋਡ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਤੇਜ਼ ਜਵਾਬ ਸਮਾਂ ਅਤੇ ਊਰਜਾ-ਕੁਸ਼ਲ ਟੋਕਨ ਥਰੂਪੁੱਟ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦਾ ਹੈ। ਇਹ ਇਸਨੂੰ ਪੀਸੀ ‘ਤੇ ਹੋਰ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੇ ਨਾਲ ਨਾਲ ਬੁਲਾਏ ਜਾਣ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ, ਮਲਟੀਟਾਸਕਿੰਗ ਸਮਰੱਥਾਵਾਂ ਅਤੇ ਸਮੁੱਚੀ ਸਿਸਟਮ ਕਾਰਗੁਜ਼ਾਰੀ ਨੂੰ ਵਧਾਉਂਦਾ ਹੈ।

ਅਸਲ-ਸੰਸਾਰ ਐਪਲੀਕੇਸ਼ਨਾਂ

ਫਾਈ ਮਾਡਲ ਪਹਿਲਾਂ ਹੀ ਕੋਰ ਅਨੁਭਵਾਂ ਵਿੱਚ ਵਰਤੇ ਜਾ ਰਹੇ ਹਨ ਜਿਵੇਂ ਕਿ ਕਲਿੱਕ ਟੂ ਡੂ, ਜੋ ਸਕ੍ਰੀਨ ‘ਤੇ ਸਾਰੀ ਸਮੱਗਰੀ ਲਈ ਬੁੱਧੀਮਾਨ ਟੈਕਸਟ ਟੂਲ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਉਹ ਐਪਲੀਕੇਸ਼ਨਾਂ ਵਿੱਚ ਸਹਿਜ ਏਕੀਕਰਣ ਲਈ ਡਿਵੈਲਪਰ APIs ਵਜੋਂ ਵੀ ਉਪਲਬਧ ਹਨ। ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਵਰਤਮਾਨ ਵਿੱਚ ਆਉਟਲੁੱਕ ਵਰਗੀਆਂ ਵੱਖ-ਵੱਖ ਉਤਪਾਦਕਤਾ ਐਪਲੀਕੇਸ਼ਨਾਂ ਵਿੱਚ ਕੀਤੀ ਜਾ ਰਹੀ ਹੈ, ਜਿੱਥੇ ਉਹ ਔਫਲਾਈਨ Copilot ਸਾਰਾਂਸ਼ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ। ਫਾਈ-4-ਰੀਜ਼ਨਿੰਗ ਅਤੇ ਫਾਈ-4-ਮਿਨੀ-ਰੀਜ਼ਨਿੰਗ ਮਾਡਲ ਫਾਈ ਸਿਲਿਕਾ ਲਈ ਘੱਟ-ਬਿੱਟ ਅਨੁਕੂਲਤਾਵਾਂ ਦਾ ਲਾਭ ਲੈਂਦੇ ਹਨ ਅਤੇ ਜਲਦੀ ਹੀ Copilot+ PC NPUs ‘ਤੇ ਚੱਲਣ ਲਈ ਉਪਲਬਧ ਹੋਣਗੇ।

ਜ਼ਿੰਮੇਵਾਰ AI ਅਤੇ ਸੁਰੱਖਿਆ ਲਈ Microsoft ਦੀ ਵਚਨਬੱਧਤਾ

Microsoft ਵਿਖੇ, ਜ਼ਿੰਮੇਵਾਰ AI ਇੱਕ ਬੁਨਿਆਦੀ ਸਿਧਾਂਤ ਹੈ ਜੋ ਫਾਈ ਮਾਡਲਾਂ ਸਮੇਤ AI ਸਿਸਟਮਾਂ ਦੇ ਵਿਕਾਸ ਅਤੇ ਤਾਇਨਾਤੀ ਨੂੰ ਮਾਰਗਦਰਸ਼ਨ ਕਰਦਾ ਹੈ। ਫਾਈ ਮਾਡਲਾਂ ਨੂੰ Microsoft AI ਸਿਧਾਂਤਾਂ ਦੇ ਅਨੁਸਾਰ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ ਹੈ: ਜਵਾਬਦੇਹੀ, ਪਾਰਦਰਸ਼ਤਾ, ਨਿਰਪੱਖਤਾ, ਭਰੋਸੇਯੋਗਤਾ ਅਤੇ ਸੁਰੱਖਿਆ, ਗੋਪਨੀਯਤਾ ਅਤੇ ਸੁਰੱਖਿਆ, ਅਤੇ ਸਮੂਹਿਕਤਾ। ਮਾਡਲਾਂ ਦਾ ਫਾਈ ਪਰਿਵਾਰ ਉਹਨਾਂ ਦੀ ਜ਼ਿੰਮੇਵਾਰ ਅਤੇ ਨੈਤਿਕ ਵਰਤੋਂ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਸੁਪਰਵਾਈਜ਼ਡ ਫਾਈਨ ਟਿਊਨਿੰਗ (SFT), ਡਾਇਰੈਕਟ ਪ੍ਰੈਫਰੈਂਸ ਔਪਟੀਮਾਈਜ਼ੇਸ਼ਨ (DPO), ਅਤੇ ਮਨੁੱਖੀ ਫੀਡਬੈਕ ਤੋਂ ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ (RLHF) ਤਕਨੀਕਾਂ ਦੇ ਸੁਮੇਲ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਪੋਸਟ-ਟ੍ਰੇਨਿੰਗ ਸੁਰੱਖਿਆ ਲਈ ਇੱਕ ਮਜ਼ਬੂਤ ​​ਢੰਗ ਵਰਤਦਾ ਹੈ।

ਫਾਈ ਮਾਡਲਾਂ ਦੇ ਤਕਨੀਕੀ ਨਿਯਮ: ਇੱਕ ਵਿਸਤ੍ਰਿਤ ਜਾਂਚ

Microsoft ਦੇ ਫਾਈ ਮਾਡਲ ਛੋਟੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਦੇ ਖੇਤਰ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਤਰੱਕੀ ਦੀ ਨੁਮਾਇੰਦਗੀ ਕਰਦੇ ਹਨ, ਖਾਸ ਕਰਕੇ ਉਹਨਾਂ ਦੀ ਤੁਲਨਾਤਮਕ ਤੌਰ ‘ਤੇ ਕੁਝ ਪੈਰਾਮੀਟਰਾਂ ਨਾਲ ਗੁੰਝਲਦਾਰ ਤਰਕ ਕਾਰਜਾਂ ਨੂੰ ਕਰਨ ਦੀ ਯੋਗਤਾ ਵਿੱਚ। ਇਹ ਭਾਗ ਉਹਨਾਂ ਤਕਨੀਕੀ ਵੇਰਵਿਆਂ ਵਿੱਚ ਜਾਂਦਾ ਹੈ ਜੋ ਇਹਨਾਂ ਮਾਡਲਾਂ ਨੂੰ ਅਜਿਹੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦੇ ਹਨ।

ਆਰਕੀਟੈਕਚਰਲ ਨਵੀਨਤਾਵਾਂ

ਫਾਈ ਮਾਡਲ ਟ੍ਰਾਂਸਫਾਰਮਰ ਆਰਕੀਟੈਕਚਰ ‘ਤੇ ਅਧਾਰਤ ਹਨ, ਇੱਕ ਡੂੰਘੀ ਸਿੱਖਣ ਮਾਡਲ ਜਿਸਨੇ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਪ੍ਰੋਸੈਸਿੰਗ ਵਿੱਚ ਕ੍ਰਾਂਤੀ ਲਿਆ ਦਿੱਤੀ ਹੈ। ਟ੍ਰਾਂਸਫਾਰਮਰ ਟੈਕਸਟ ਵਿੱਚ ਲੰਬੇ ਸਮੇਂ ਦੀ ਨਿਰਭਰਤਾ ਨੂੰ ਹਾਸਲ ਕਰਨ ਵਿੱਚ ਉੱਤਮ ਹਨ, ਜਿਸ ਨਾਲ ਮਾਡਲ ਨੂੰ ਭਾਸ਼ਾ ਦੇ ਸੰਦਰਭ ਅਤੇ ਸੂਖਮਤਾਵਾਂ ਨੂੰ ਸਮਝਣ ਦੀ ਇਜਾਜ਼ਤ ਮਿਲਦੀ ਹੈ।

  • ਧਿਆਨ ਵਿਧੀ: ਟ੍ਰਾਂਸਫਾਰਮਰ ਆਰਕੀਟੈਕਚਰ ਦਾ ਮੁੱਖ ਹਿੱਸਾ ਧਿਆਨ ਵਿਧੀ ਹੈ, ਜੋ ਮਾਡਲ ਨੂੰ ਆਉਟਪੁੱਟ ਤਿਆਰ ਕਰਦੇ ਸਮੇਂ ਇਨਪੁੱਟ ਦੇ ਸਭ ਤੋਂ ਢੁਕਵੇਂ ਹਿੱਸਿਆਂ ‘ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ। ਇਹ ਤਰਕ ਕਾਰਜਾਂ ਲਈ ਖਾਸ ਤੌਰ ‘ਤੇ ਮਹੱਤਵਪੂਰਨ ਹੈ, ਜਿੱਥੇ ਮਾਡਲ ਨੂੰ ਸਹੀ ਸਿੱਟੇ ‘ਤੇ ਪਹੁੰਚਣ ਲਈ ਮੁੱਖ ਜਾਣਕਾਰੀ ਅਤੇ ਰਿਸ਼ਤਿਆਂ ਦੀ ਪਛਾਣ ਕਰਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।

  • ਸਕੇਲਡ ਡੌਟ-ਪ੍ਰੋਡਕਟ ਧਿਆਨ: ਫਾਈ ਮਾਡਲ ਸਕੇਲਡ ਡੌਟ-ਪ੍ਰੋਡਕਟ ਧਿਆਨ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ, ਜੋ ਧਿਆਨ ਵਿਧੀ ਦਾ ਇੱਕ ਸੁਧਾਰਿਆ ਸੰਸਕਰਣ ਹੈ ਜਿਸ ਵਿੱਚ ਡੌਟ ਉਤਪਾਦਾਂ ਨੂੰ ਬਹੁਤ ਵੱਡਾ ਹੋਣ ਤੋਂ ਰੋਕਣ ਲਈ ਇੱਕ ਸਕੇਲਿੰਗ ਕਾਰਕ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ, ਜੋ ਸਿਖਲਾਈ ਦੌਰਾਨ ਅਸਥਿਰਤਾ ਦਾ ਕਾਰਨ ਬਣ ਸਕਦਾ ਹੈ।

  • ਮਲਟੀ-ਹੈਡ ਧਿਆਨ: ਇਨਪੁਟ ਦੇ ਵੱਖ-ਵੱਖ ਪਹਿਲੂਆਂ ਨੂੰ ਹਾਸਲ ਕਰਨ ਲਈ, ਫਾਈ ਮਾਡਲ ਮਲਟੀ-ਹੈਡ ਧਿਆਨ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ, ਜਿੱਥੇ ਕਈ ਧਿਆਨ ਵਿਧੀਆਂ ਸਮਾਨਾਂਤਰ ਵਿੱਚ ਕੰਮ ਕਰਦੀਆਂ ਹਨ। ਹਰੇਕ ਸਿਰ ਇਨਪੁਟ ਦੇ ਇੱਕ ਵੱਖਰੇ ਉਪ ਸਮੂਹ ‘ਤੇ ਕੇਂਦਰਿਤ ਹੁੰਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਮਾਡਲ ਨੂੰ ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਪ੍ਰਤੀਨਿਧਤਾਵਾਂ ਸਿੱਖਣ ਦੀ ਇਜਾਜ਼ਤ ਮਿਲਦੀ ਹੈ।

  • ਫੀਡ-ਫਾਰਵਰਡ ਨੈੱਟਵਰਕ: ਧਿਆਨ ਪਰਤਾਂ ਤੋਂ ਬਾਅਦ, ਟ੍ਰਾਂਸਫਾਰਮਰ ਆਰਕੀਟੈਕਚਰ ਵਿੱਚ ਫੀਡ-ਫਾਰਵਰਡ ਨੈੱਟਵਰਕ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ ਜੋ ਜਾਣਕਾਰੀ ਨੂੰ ਹੋਰ ਅੱਗੇ ਪ੍ਰਕਿਰਿਆ ਕਰਦੇ ਹਨ। ਇਹਨਾਂ ਨੈੱਟਵਰਕਾਂ ਵਿੱਚ ਨਿਊਰੋਨਾਂ ਦੀਆਂ ਕਈ ਪਰਤਾਂ ਹੁੰਦੀਆਂ ਹਨ ਜੋ ਧਿਆਨ ਆਉਟਪੁੱਟ ਤੋਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਕੱਢਣਾ ਸਿੱਖਦੀਆਂ ਹਨ।

ਸਿਖਲਾਈ ਵਿਧੀਆਂ: ਇੱਕ ਬਹੁਪੱਖੀ ਪਹੁੰਚ

ਫਾਈ ਮਾਡਲਾਂ ਦੀ ਸਿਖਲਾਈ ਵਿੱਚ ਨਿਗਰਾਨੀ ਅਧੀਨ ਵਧੀਆ-ਟਿਊਨਿੰਗ, ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ, ਅਤੇ ਡੇਟਾ ਡਿਸਟਿਲੇਸ਼ਨ ਸਮੇਤ ਤਕਨੀਕਾਂ ਦਾ ਸੁਮੇਲ ਸ਼ਾਮਲ ਹੈ।

  • ਨਿਗਰਾਨੀ ਅਧੀਨ ਵਧੀਆ-ਟਿਊਨਿੰਗ (SFT): ਨਿਗਰਾਨੀ ਅਧੀਨ ਵਧੀਆ-ਟਿਊਨਿੰਗ ਵਿੱਚ ਮਾਡਲ ਨੂੰ ਇੱਕ ਲੇਬਲ ਵਾਲੇ ਡੇਟਾਸੈਟ ‘ਤੇ ਸਿਖਲਾਈ ਦੇਣਾ ਸ਼ਾਮਲ ਹੈ, ਜਿੱਥੇ ਇਨਪੁਟ ਇੱਕ ਸਵਾਲ ਜਾਂ ਸਮੱਸਿਆ ਹੈ, ਅਤੇ ਆਉਟਪੁੱਟ ਸਹੀ ਜਵਾਬ ਜਾਂ ਹੱਲ ਹੈ। ਇਹ ਮਾਡਲ ਨੂੰ ਖਾਸ ਇਨਪੁਟਸ ਨੂੰ ਸੰਬੰਧਿਤ ਆਉਟਪੁਟਸ ਨਾਲ ਜੋੜਨਾ ਸਿੱਖਣ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ।

  • ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ (RL): ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਇੱਕ ਤਕਨੀਕ ਹੈ ਜਿੱਥੇ ਮਾਡਲ ਇੱਕ ਵਾਤਾਵਰਣ ਨਾਲ ਗੱਲਬਾਤ ਕਰਕੇ ਅਤੇ ਆਪਣੀਆਂ ਕਾਰਵਾਈਆਂ ਲਈ ਇਨਾਮ ਜਾਂ ਜੁਰਮਾਨੇ ਪ੍ਰਾਪਤ ਕਰਕੇ ਫੈਸਲੇ ਲੈਣਾ ਸਿੱਖਦਾ ਹੈ। ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਦੇ ਸੰਦਰਭ ਵਿੱਚ, ਵਾਤਾਵਰਣ ਨਿਯਮਾਂ ਜਾਂ ਪਾਬੰਦੀਆਂ ਦਾ ਇੱਕ ਸਮੂਹ ਹੋ ਸਕਦਾ ਹੈ, ਅਤੇ ਇਨਾਮ ਮਾਡਲ ਦੇ ਜਵਾਬਾਂ ਦੀ ਸ਼ੁੱਧਤਾ ‘ਤੇ ਅਧਾਰਤ ਹੋ ਸਕਦਾ ਹੈ।

  • ਡੇਟਾ ਡਿਸਟਿਲੇਸ਼ਨ: ਡੇਟਾ ਡਿਸਟਿਲੇਸ਼ਨ ਇੱਕ ਤਕਨੀਕ ਹੈ ਜਿੱਥੇ ਇੱਕ ਛੋਟੇ ਮਾਡਲ ਨੂੰ ਇੱਕ ਵੱਡੇ, ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਮਾਡਲ ਦੇ ਵਿਵਹਾਰ ਦੀ ਨਕਲ ਕਰਨ ਲਈ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ। ਇਹ ਛੋਟੇ ਮਾਡਲ ਨੂੰ ਵੱਡੇ ਮਾਡਲ ਦੇ ਮੁਕਾਬਲੇ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ, ਜਦੋਂ ਕਿ ਘੱਟ ਸਰੋਤਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।

ਡੇਟਾ ਕਿਊਰੇਸ਼ਨ: ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਮੀਲ ਪੱਥਰ

ਫਾਈ ਮਾਡਲਾਂ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਸਿਖਲਾਈ ਲਈ ਵਰਤੇ ਜਾਣ ਵਾਲੇ ਡੇਟਾ ਦੀ ਗੁਣਵੱਤਾ ‘ਤੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਨਿਰਭਰ ਕਰਦਾ ਹੈ। Microsoft ਨੇ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਡੇਟਾਸੈਟਾਂ ਨੂੰ ਕਿਊਰੇਟ ਕਰਨ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਯਤਨ ਕੀਤੇ ਹਨ ਜੋ ਖਾਸ ਤੌਰ ‘ਤੇ ਤਰਕ ਕਾਰਜਾਂ ਲਈ ਤਿਆਰ ਕੀਤੇ ਗਏ ਹਨ।

  • ਸਿੰਥੈਟਿਕ ਡੇਟਾ ਜਨਰੇਸ਼ਨ: ਉਪਲਬਧ ਡੇਟਾ ਨੂੰ ਵਧਾਉਣ ਲਈ, Microsoft ਨੇ ਸਿੰਥੈਟਿਕ ਡੇਟਾ ਤਿਆਰ ਕਰਨ ਲਈ ਤਕਨੀਕਾਂ ਵਿਕਸਤ ਕੀਤੀਆਂ ਹਨ ਜੋ ਅਸਲ-ਸੰਸਾਰ ਡੇਟਾ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੀ ਨਕਲ ਕਰਦੀਆਂ ਹਨ। ਇਹ ਮਾਡਲਾਂ ਨੂੰ ਇੱਕ ਵੱਡੇ ਅਤੇ ਵਧੇਰੇ ਵਿਭਿੰਨ ਡੇਟਾਸੈਟ ‘ਤੇ ਸਿਖਲਾਈ ਦੇਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ, ਜੋ ਉਹਨਾਂ ਦੀ ਆਮਕਰਨ ਦੀ ਯੋਗਤਾ ਵਿੱਚ ਸੁਧਾਰ ਕਰਦਾ ਹੈ।

  • ਡੇਟਾ ਫਿਲਟਰਿੰਗ: Microsoft ਸਿਖਲਾਈ ਡੇਟਾਸੈਟ ਤੋਂ ਸ਼ੋਰ ਵਾਲੇ ਜਾਂ ਅਪ੍ਰਸੰਗਿਕ ਡੇਟਾ ਨੂੰ ਹਟਾਉਣ ਲਈ ਸਖ਼ਤ ਡੇਟਾ ਫਿਲਟਰਿੰਗ ਤਕਨੀਕਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦਾ ਹੈ ਕਿ ਮਾਡਲਾਂ ਨੂੰ ਸਾਫ਼ ਅਤੇ ਸਹੀ ਡੇਟਾ ‘ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਹੈ, ਜਿਸ ਨਾਲ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਹੁੰਦਾ ਹੈ।

  • ਡੇਟਾ ਵਾਧਾ: ਮੌਜੂਦਾ ਡੇਟਾ ਵਿੱਚ ਤਬਦੀਲੀਆਂ ਲਾਗੂ ਕਰਕੇ ਸਿਖਲਾਈ ਡੇਟਾਸੈਟ ਦੀ ਵਿਭਿੰਨਤਾ ਨੂੰ ਵਧਾਉਣ ਲਈ ਡੇਟਾ ਵਾਧਾ ਤਕਨੀਕਾਂ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਇਹ ਮਾਡਲਾਂ ਨੂੰ ਇਨਪੁਟ ਵਿੱਚ ਭਿੰਨਤਾਵਾਂ ਲਈ ਵਧੇਰੇ ਮਜ਼ਬੂਤ ​​ਬਣਾਉਣ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ।

ਅਨੁਕੂਲਨ ਤਕਨੀਕਾਂ: ਕੁਸ਼ਲਤਾ ਅਤੇ ਸ਼ੁੱਧਤਾ ਨੂੰ ਸੰਤੁਲਿਤ ਕਰਨਾ

ਫਾਈ ਮਾਡਲ ਕੁਸ਼ਲਤਾ ਅਤੇ ਸ਼ੁੱਧਤਾ ਦੋਵਾਂ ਲਈ ਅਨੁਕੂਲਿਤ ਹਨ, ਜਿਸ ਨਾਲ ਉਹ ਪ੍ਰਦਰਸ਼ਨ ਦੀ ਕੁਰਬਾਨੀ ਕੀਤੇ ਬਿਨਾਂ ਸਰੋਤ-ਪ੍ਰਤੀਬੰਧਿਤ ਉਪਕਰਣਾਂ ‘ਤੇ ਚੱਲ ਸਕਦੇ ਹਨ।

  • ਕੁਆਂਟਾਈਜ਼ੇਸ਼ਨ: ਕੁਆਂਟਾਈਜ਼ੇਸ਼ਨ ਇੱਕ ਤਕਨੀਕ ਹੈ ਜਿੱਥੇ ਮਾਡਲ ਦੇ ਪੈਰਾਮੀਟਰਾਂ ਦੀ ਸ਼ੁੱਧਤਾ ਘਟਾਈ ਜਾਂਦੀ ਹੈ, ਜੋ ਮਾਡਲ ਦੇ ਮੈਮੋਰੀ ਫੁੱਟਪ੍ਰਿੰਟ ਅਤੇ ਕੰਪਿਊਟੇਸ਼ਨਲ ਲੋੜਾਂ ਨੂੰ ਘਟਾਉਂਦੀ ਹੈ।

  • ਛਾਂਟੀ: ਛਾਂਟੀ ਇੱਕ ਤਕਨੀਕ ਹੈ ਜਿੱਥੇ ਮਾਡਲ ਵਿੱਚ ਘੱਟ ਮਹੱਤਵਪੂਰਨਕਨੈਕਸ਼ਨਾਂ ਨੂੰ ਹਟਾ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ, ਜੋ ਮਾਡਲ ਦੇ ਆਕਾਰ ਅਤੇ ਗੁੰਝਲਤਾ ਨੂੰ ਘਟਾਉਂਦਾ ਹੈ।

  • ਗਿਆਨ ਡਿਸਟਿਲੇਸ਼ਨ: ਗਿਆਨ ਡਿਸਟਿਲੇਸ਼ਨ ਵਿੱਚ ਇੱਕ ਵੱਡੇ, ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਮਾਡਲ ਤੋਂ ਇੱਕ ਛੋਟੇ ਮਾਡਲ ਵਿੱਚ ਗਿਆਨ ਦਾ ਤਬਾਦਲਾ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ। ਇਹ ਛੋਟੇ ਮਾਡਲ ਨੂੰ ਵੱਡੇ ਮਾਡਲ ਦੇ ਮੁਕਾਬਲੇ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ, ਜਦੋਂ ਕਿ ਘੱਟ ਸਰੋਤਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।

ਫਾਈ ਸਿਲਿਕਾ NPU: ਇੱਕ ਹਾਰਡਵੇਅਰ-ਸਾਫਟਵੇਅਰ ਸਿੰਨਰਜਿਸਟਿਕ ਪਹੁੰਚ

Microsoft ਦੇ ਫਾਈ ਮਾਡਲ ਫਾਈ ਸਿਲਿਕਾ NPU (ਨਿਊਰਲ ਪ੍ਰੋਸੈਸਿੰਗ ਯੂਨਿਟ) ਨਾਲ ਮਜ਼ਬੂਤੀ ਨਾਲ ਏਕੀਕ੍ਰਿਤ ਹੋਣ ਲਈ ਤਿਆਰ ਕੀਤੇ ਗਏ ਹਨ, ਇੱਕ ਵਿਸ਼ੇਸ਼ ਹਾਰਡਵੇਅਰ ਐਕਸਲੇਟਰ ਜੋ ਡੂੰਘੀ ਸਿੱਖਣ ਵਰਕਲੋਡਾਂ ਲਈ ਅਨੁਕੂਲਿਤ ਹੈ।

  • ਘੱਟ-ਬਿੱਟ ਅਨੁਕੂਲਨ: ਫਾਈ ਸਿਲਿਕਾ NPU ਘੱਟ-ਬਿੱਟ ਅਨੁਕੂਲਨ ਦਾ ਸਮਰਥਨ ਕਰਦਾ ਹੈ, ਜੋ ਮਾਡਲਾਂ ਨੂੰ ਘੱਟ ਸ਼ੁੱਧਤਾ ਨਾਲ ਚਲਾਉਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ, ਉਹਨਾਂ ਦੇ ਮੈਮੋਰੀ ਫੁੱਟਪ੍ਰਿੰਟ ਅਤੇ ਕੰਪਿਊਟੇਸ਼ਨਲ ਲੋੜਾਂ ਨੂੰ ਹੋਰ ਘਟਾਉਂਦਾ ਹੈ।

  • ਯਾਦਦਾਸ਼ਤ ਵਿੱਚ ਪ੍ਰੀ-ਲੋਡਿੰਗ: ਫਾਈ ਮਾਡਲ ਯਾਦਦਾਸ਼ਤ ਵਿੱਚ ਪ੍ਰੀ-ਲੋਡ ਹੋਣ ਲਈ ਤਿਆਰ ਕੀਤੇ ਗਏ ਹਨ, ਜੋ ਉਹਨਾਂ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਅਤੇ ਕੁਸ਼ਲਤਾ ਨਾਲ ਬੁਲਾਉਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ।

  • ਓਪਰੇਟਿੰਗ ਸਿਸਟਮ ਪ੍ਰਬੰਧਨ: ਫਾਈ ਸਿਲਿਕਾ NPU ਨੂੰ ਓਪਰੇਟਿੰਗ ਸਿਸਟਮ ਦੁਆਰਾ ਪ੍ਰਬੰਧਿਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਜੋ ਇਸਨੂੰ ਉਪਭੋਗਤਾ ਅਨੁਭਵ ਵਿੱਚ ਸਹਿਜਤਾ ਨਾਲ ਏਕੀਕ੍ਰਿਤ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ।

ਸੰਖੇਪ ਵਿੱਚ, Microsoft ਦੇ ਫਾਈ ਮਾਡਲ ਛੋਟੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਦੇ ਖੇਤਰ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਪ੍ਰਾਪਤੀ ਦੀ ਨੁਮਾਇੰਦਗੀ ਕਰਦੇ ਹਨ। ਨਵੀਨਤਾਕਾਰੀ ਆਰਕੀਟੈਕਚਰਲ ਡਿਜ਼ਾਈਨਾਂ, ਸਖ਼ਤ ਸਿਖਲਾਈ ਵਿਧੀਆਂ, ਧਿਆਨ ਨਾਲ ਡੇਟਾ ਕਿਊਰੇਸ਼ਨ, ਅਤੇ ਹਾਰਡਵੇਅਰ-ਸਾਫਟਵੇਅਰ ਸਹਿ-ਡਿਜ਼ਾਈਨ ਨੂੰ ਜੋੜ ਕੇ, Microsoft ਨੇ ਮਾਡਲਾਂ ਦਾ ਇੱਕ ਪਰਿਵਾਰ ਬਣਾਇਆ ਹੈ ਜੋ ਸ਼ਕਤੀਸ਼ਾਲੀ ਅਤੇ ਕੁਸ਼ਲ ਦੋਵੇਂ ਹਨ, AI-ਸੰਚਾਲਿਤ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦੇ ਹਨ।