ਮਾਈਕਰੋਸਾਫਟ ਰਿਸਰਚ ਨੇ ਫਾਈ-4 ਪੇਸ਼ ਕੀਤਾ ਹੈ, ਜੋ ਕਿ 14 ਬਿਲੀਅਨ ਪੈਰਾਮੀਟਰਾਂ ਵਾਲਾ ਇੱਕ ਛੋਟਾ ਭਾਸ਼ਾ ਮਾਡਲ ਹੈ, ਜੋ ਗਣਿਤਿਕ ਤਰਕ ਦੇ ਖੇਤਰ ਵਿੱਚ ਤਰੱਕੀ ਨੂੰ ਵਧਾਉਣ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਹ ਮਾਡਲ ਸ਼ੁਰੂ ਵਿੱਚ Azure AI Foundry ‘ਤੇ ਉਪਲਬਧ ਸੀ, ਅਤੇ ਹਾਲ ਹੀ ਵਿੱਚ MIT ਲਾਇਸੈਂਸ ਦੇ ਤਹਿਤ ਹੱਗਿੰਗ ਫੇਸ ‘ਤੇ ਖੋਲ੍ਹਿਆ ਗਿਆ ਹੈ।
ਫਾਈ-4 ਦੀਆਂ ਨਵੀਨਤਾਵਾਂ
ਮਾਈਕਰੋਸਾਫਟ ਦੇ ਅਨੁਸਾਰ, ਫਾਈ-4 ਗਣਿਤਿਕ ਤਰਕ ਵਿੱਚ ਆਪਣੇ ਹਮਰੁਤਬਾ ਅਤੇ ਵੱਡੇ ਮਾਡਲਾਂ ਨਾਲੋਂ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ, ਇਸਦੇ ਸਿਖਲਾਈ ਦੌਰਾਨ ਵਰਤੀਆਂ ਗਈਆਂ ਕਈ ਨਵੀਨਤਾਕਾਰੀ ਤਕਨੀਕਾਂ ਦੇ ਕਾਰਨ, ਜਿਸ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ:
- ਸਿੰਥੈਟਿਕ ਡਾਟਾ ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਅਤੇ ਮਿਡ-ਟਰੇਨਿੰਗ: ਸਿੰਥੈਟਿਕ ਡਾਟਾ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਅਤੇ ਮਿਡ-ਟਰੇਨਿੰਗ, ਮਾਡਲ ਨੂੰ ਇੱਕ ਹੋਰ ਢਾਂਚਾਗਤ ਸਿਖਲਾਈ ਮਾਰਗ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।
- ਆਰਗੈਨਿਕ ਡਾਟਾ ਪ੍ਰਬੰਧਨ: ਆਰਗੈਨਿਕ ਡਾਟਾ ਨੂੰ ਧਿਆਨ ਨਾਲ ਤਿਆਰ ਕਰਨਾ ਅਤੇ ਫਿਲਟਰ ਕਰਨਾ, ਸਿਖਲਾਈ ਡਾਟਾ ਦੀ ਗੁਣਵੱਤਾ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਂਦਾ ਹੈ।
- ਨਵੀਂ ਪੋਸਟ-ਟ੍ਰੇਨਿੰਗ ਸਕੀਮ: ਮਾਡਲ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਨੂੰ ਹੋਰ ਬਿਹਤਰ ਬਣਾਉਣ ਲਈ ਨਵੀਆਂ ਪੋਸਟ-ਟ੍ਰੇਨਿੰਗ ਵਿਧੀਆਂ ਨੂੰ ਅਪਣਾਉਣਾ।
ਇਹਨਾਂ ਨਵੀਨਤਾਵਾਂ ਨੇ ਫਾਈ-4 ਨੂੰ STEM ‘ਤੇ ਕੇਂਦ੍ਰਿਤ ਪ੍ਰਸ਼ਨ-ਉੱਤਰ ਦੀ ਸਮਰੱਥਾ ਵਿੱਚ ਆਪਣੇ ਅਧਿਆਪਕ ਮਾਡਲ GPT-4o ਨੂੰ ਪਛਾੜਨ ਦੀ ਆਗਿਆ ਦਿੱਤੀ ਹੈ, ਇਹ ਸਾਬਤ ਕਰਦਾ ਹੈ ਕਿ ਮਾਈਕਰੋਸਾਫਟ ਦੀ ਡਾਟਾ ਜਨਰੇਸ਼ਨ ਅਤੇ ਪੋਸਟ-ਟ੍ਰੇਨਿੰਗ ਤਕਨਾਲੋਜੀ ਸਿਰਫ ਗਿਆਨ ਕੱਢਣਾ ਨਹੀਂ ਹੈ।
ਸਿੰਥੈਟਿਕ ਡਾਟਾ ਦੇ ਵਿਲੱਖਣ ਫਾਇਦੇ
ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ (LLM) ਦੀ ਸਿਖਲਾਈ ਵਿੱਚ, ਸਿੰਥੈਟਿਕ ਡਾਟਾ ਦੀ ਵਰਤੋਂ ਕੋਈ ਨਵੀਂ ਗੱਲ ਨਹੀਂ ਹੈ, ਅਤੇ ਫਾਈ ਮਾਡਲ ਨੇ ਵੀ ਇਸ ਵਿਧੀ ਨੂੰ ਅਪਣਾਇਆ ਹੈ। ਮਾਈਕਰੋਸਾਫਟ ਦੱਸਦਾ ਹੈ ਕਿ ਸਿੰਥੈਟਿਕ ਡਾਟਾ ਕੋਈ ਸਸਤਾ ਬਦਲ ਨਹੀਂ ਹੈ, ਇਹ ਆਰਗੈਨਿਕ ਡਾਟਾ ਨਾਲੋਂ ਹੇਠ ਲਿਖੇ ਪਹਿਲੂਆਂ ਵਿੱਚ ਬਿਹਤਰ ਹੈ:
- ਵਧੇਰੇ ਪ੍ਰਗਤੀਸ਼ੀਲ ਸਿਖਲਾਈ ਮਾਰਗ: ਸਿੰਥੈਟਿਕ ਡਾਟਾ LLM ਨੂੰ ਸ਼ੁਰੂਆਤੀ ਪ੍ਰਸ਼ਨ ਕਥਨ ਤੋਂ ਅੰਤਮ ਹੱਲ ਤੱਕ, ਕਦਮ-ਦਰ-ਕਦਮ ਸਿੱਖਣ ਲਈ ਮਾਰਗਦਰਸ਼ਨ ਕਰ ਸਕਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਤਰਕ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਸਮਝਣਾ ਆਸਾਨ ਹੋ ਜਾਂਦਾ ਹੈ।
- ਤਰਕ ਦੇ ਵਾਤਾਵਰਣ ਨਾਲ ਬਿਹਤਰ ਅਨੁਕੂਲਤਾ: ਆਰਗੈਨਿਕ ਡਾਟਾ ਵਿੱਚ ਪ੍ਰਸ਼ਨ ਕਥਨ ਅਤੇ ਅੰਤਮ ਹੱਲ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ, ਜਦੋਂ ਕਿ ਸਿੰਥੈਟਿਕ ਡਾਟਾ ਕਦਮ-ਦਰ-ਕਦਮ ਤਰਕ ਪ੍ਰਕਿਰਿਆ ਪ੍ਰਦਾਨ ਕਰ ਸਕਦਾ ਹੈ, ਜੋ ਅਸਲ ਤਰਕ ਦ੍ਰਿਸ਼ਾਂ ਨਾਲ ਵਧੇਰੇ ਮੇਲ ਖਾਂਦਾ ਹੈ।
ਧਿਆਨ ਨਾਲ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਆਰਗੈਨਿਕ ਡਾਟਾ
ਸਿੰਥੈਟਿਕ ਡਾਟਾ ਤੋਂ ਇਲਾਵਾ, ਮਾਈਕਰੋਸਾਫਟ ਨੇ ਧਿਆਨ ਨਾਲ ਤਿਆਰ ਕੀਤਾ ਆਰਗੈਨਿਕ ਡਾਟਾ ਵੀ ਵਰਤਿਆ ਹੈ, ਜਿਸ ਵਿੱਚ ਜਨਤਕ ਵੈੱਬਸਾਈਟਾਂ ਅਤੇ ਬਾਹਰੀ ਡਾਟਾਸੈਟਾਂ ਤੋਂ ਇਕੱਠੇ ਕੀਤੇ ਗਏ ਲੱਖਾਂ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਗਣਿਤ ਦੇ ਸਵਾਲ ਅਤੇ ਹੱਲ ਸ਼ਾਮਲ ਹਨ। ਜਿੱਥੇ ਸਹੀ ਹੱਲ ਪ੍ਰਦਾਨ ਨਹੀਂ ਕੀਤੇ ਗਏ ਸਨ, ਉੱਥੇ ਉਹਨਾਂ ਨੇ ਸਹੀਤਾ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣ ਲਈ ਬਹੁਮਤ ਵੋਟਿੰਗ ਵਿਧੀ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਹੱਲ ਤਿਆਰ ਕੀਤੇ ਹਨ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਉਹਨਾਂ ਨੇ ਅਕਾਦਮਿਕ ਪੇਪਰ, ਸਿੱਖਿਆ ਫੋਰਮ ਅਤੇ ਪ੍ਰੋਗਰਾਮਿੰਗ ਟਿਊਟੋਰੀਅਲ ਵੀ ਇਕੱਠੇ ਕੀਤੇ ਹਨ।
ਮਾਈਕਰੋਸਾਫਟ ਨੇ ਸਿੰਥੈਟਿਕ ਡਾਟਾ ਜਨਰੇਸ਼ਨ ਵਿੱਚ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਕੁਦਰਤੀ ਡਾਟਾ ਦੀ ਮਹੱਤਤਾ ‘ਤੇ ਜ਼ੋਰ ਦਿੱਤਾ ਹੈ, ਇਹ ਦੱਸਦੇ ਹੋਏ ਕਿ ਛੋਟੀਆਂ ਗਲਤੀਆਂ ਵੀ ਡੈਰੀਵੇਟਿਵ ਸਿੰਥੈਟਿਕ ਦਸਤਾਵੇਜ਼ਾਂ ਦੀ ਗੁਣਵੱਤਾ ਵਿੱਚ ਗੰਭੀਰ ਗਿਰਾਵਟ ਦਾ ਕਾਰਨ ਬਣ ਸਕਦੀਆਂ ਹਨ। ਇਸ ਲਈ, ਉਹਨਾਂ ਨੇ ਵੈੱਬ ਡਾਟਾ ਦੇ ਪ੍ਰਬੰਧਨ ਨੂੰ ਸੁਧਾਰਨ ਲਈ ਬਹੁਤ ਮਿਹਨਤ ਕੀਤੀ ਹੈ।
ਫਾਈ-4 ਦਾ ਪੋਸਟ-ਟ੍ਰੇਨਿੰਗ ਪੜਾਅ
ਫਾਈ-4 ਦਾ ਪੋਸਟ-ਟ੍ਰੇਨਿੰਗ ਪੜਾਅ ਇਸਨੂੰ ਇੱਕ ਭਰੋਸੇਯੋਗ AI ਸਹਾਇਕ ਵਿੱਚ ਬਦਲਣ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਸ ਪੜਾਅ ਵਿੱਚ ਹੇਠ ਲਿਖੇ ਕਦਮ ਸ਼ਾਮਲ ਹਨ:
- ਫਾਈਨ-ਟਿਊਨਿੰਗ: ਗਣਿਤ, ਕੋਡਿੰਗ, ਤਰਕ, ਗੱਲਬਾਤ, ਮਾਡਲ ਪਛਾਣ ਅਤੇ ਸੁਰੱਖਿਆ ਵਰਗੇ ਵੱਖ-ਵੱਖ ਖੇਤਰਾਂ ਤੋਂ ਤਿਆਰ ਕੀਤੇ ਗਏ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਡਾਟਾ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਮਾਡਲ ਨੂੰ ਫਾਈਨ-ਟਿਊਨ ਕਰਨਾ।
- ਸਿੱਧਾ ਤਰਜੀਹ ਅਨੁਕੂਲਤਾ (DPO): ਮਾਡਲ ਨੂੰ ਮਨੁੱਖੀ ਤਰਜੀਹਾਂ ਨਾਲ ਬਿਹਤਰ ਢੰਗ ਨਾਲ ਜੋੜਨ ਅਤੇ ਮਾੜੇ ਵਿਵਹਾਰ ਨੂੰ ਦੂਰ ਕਰਨ ਲਈ ਦੋ DPO ਕਦਮਾਂ ਨੂੰ ਲਾਗੂ ਕਰਨਾ।
- ਪਿਵੋਟਲ ਟੋਕਨ ਖੋਜ: ਪਹਿਲੇ ਕਦਮ ਵਿੱਚ, ਮਾਈਕਰੋਸਾਫਟ ਲੋੜੀਂਦੇ/ਨਾ-ਲੋੜੀਂਦੇ ਨਤੀਜਿਆਂ ਦੇ ਜੋੜੇ ਤਿਆਰ ਕਰਨ ਲਈ ਪਿਵੋਟਲ ਟੋਕਨ ਖੋਜ ਨਾਮਕ ਇੱਕ ਨਵੀਂ ਤਕਨੀਕ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ।
- GPT-4o ਇੱਕ ਜੱਜ ਵਜੋਂ: ਦੂਜੇ ਕਦਮ ਵਿੱਚ, ਉਹ ਹਰੇਕ ਨਤੀਜੇ ਦੇ ਜੋੜੇ ਲਈ ਸਕਾਰਾਤਮਕ ਜਾਂ ਨਕਾਰਾਤਮਕ ਟੈਗ ਲਗਾਉਣ ਲਈ GPT-4o ਨੂੰ ਇੱਕ ਜੱਜ ਵਜੋਂ ਵਰਤਦੇ ਹਨ।
ਫਾਈ-4 ਦਾ ਮੁਲਾਂਕਣ
ਫਾਈ-4 ਦਾ ਮੁਲਾਂਕਣ ਓਪਨਏਆਈ ਦੇ SIMPLE-EVALS ਫਰੇਮਵਰਕ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਕੀਤਾ ਗਿਆ ਸੀ, ਅਤੇ ਇਸਨੇ ਕਈ ਬੈਂਚਮਾਰਕਾਂ ਵਿੱਚ Llama-3.1-405B ਨੂੰ ਪਛਾੜ ਦਿੱਤਾ ਹੈ। ਇਸ ਤੋਂ ਇਲਾਵਾ, GPQA (ਗ੍ਰੈਜੂਏਟ-ਪੱਧਰ STEM ਪ੍ਰਸ਼ਨ-ਉੱਤਰ) ਅਤੇ MATH (ਗਣਿਤ ਮੁਕਾਬਲਾ) ਬੈਂਚਮਾਰਕਾਂ ਵਿੱਚ, ਇਸਨੇ ਆਪਣੇ ਅਧਿਆਪਕ ਮਾਡਲ GPT-4o ਨੂੰ ਵੀ ਪਛਾੜ ਦਿੱਤਾ ਹੈ।
ਫਾਈ-4 ਮਾਡਲ ਦੇ ਸਿਖਲਾਈ ਡਾਟਾ ਦਾ ਵਿਸਤ੍ਰਿਤ ਵੇਰਵਾ
ਮਾਈਕਰੋਸਾਫਟ ਨੇ ਫਾਈ-4 ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦਿੰਦੇ ਸਮੇਂ ਇੱਕ ਧਿਆਨ ਨਾਲ ਤਿਆਰ ਕੀਤੀ ਡਾਟਾ ਰਣਨੀਤੀ ਅਪਣਾਈ, ਜੋ ਮੁੱਖ ਤੌਰ ‘ਤੇ ਸਿੰਥੈਟਿਕ ਡਾਟਾ ਅਤੇ ਚੁਣੇ ਹੋਏ ਅਸਲ ਡਾਟਾ ਦੇ ਆਲੇ-ਦੁਆਲੇ ਘੁੰਮਦੀ ਹੈ। ਇਸ ਸੰਯੁਕਤ ਪਹੁੰਚ ਦਾ ਉਦੇਸ਼ ਮਾਡਲ ਦੀ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣਾ ਅਤੇ ਇਸਨੂੰ ਗਣਿਤਿਕ ਤਰਕ ਵਿੱਚ ਸ਼ਾਨਦਾਰ ਬਣਾਉਣਾ ਹੈ।
ਸਿੰਥੈਟਿਕ ਡਾਟਾ ਜਨਰੇਸ਼ਨ
ਸਿੰਥੈਟਿਕ ਡਾਟਾ ਫਾਈ-4 ਦੀ ਸਿਖਲਾਈ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਭੂਮਿਕਾ ਨਿਭਾਉਂਦਾ ਹੈ। ਮਾਈਕਰੋਸਾਫਟ ਟੀਮ ਨੇ ਸਿੰਥੈਟਿਕ ਡਾਟਾ ਨੂੰ ਅਸਲ ਡਾਟਾ ਦੇ ਇੱਕ ਸਧਾਰਨ ਬਦਲ ਵਜੋਂ ਨਹੀਂ ਦੇਖਿਆ, ਸਗੋਂ ਇਸਨੂੰ ਇੱਕ ਅਜਿਹੇ ਸਾਧਨ ਵਜੋਂ ਦੇਖਿਆ ਜੋ ਮਾਡਲ ਨੂੰ ਕਦਮ-ਦਰ-ਕਦਮ ਸਿੱਖਣ ਲਈ ਮਾਰਗਦਰਸ਼ਨ ਕਰ ਸਕਦਾ ਹੈ। ਸਿੰਥੈਟਿਕ ਡਾਟਾ ਜਨਰੇਸ਼ਨ ਪ੍ਰਕਿਰਿਆ ਆਮ ਤੌਰ ‘ਤੇ ਹੇਠ ਲਿਖੇ ਕਦਮਾਂ ਦੀ ਪਾਲਣਾ ਕਰਦੀ ਹੈ:
- ਸਵਾਲ ਬਣਾਉਣਾ: ਸਭ ਤੋਂ ਪਹਿਲਾਂ, ਪਹਿਲਾਂ ਤੋਂ ਪਰਿਭਾਸ਼ਿਤ ਨਿਯਮਾਂ ਅਤੇ ਟੈਂਪਲੇਟਾਂ ਦੇ ਆਧਾਰ ‘ਤੇ, ਵੱਖ-ਵੱਖ ਗਣਿਤ ਦੇ ਸਵਾਲ ਤਿਆਰ ਕੀਤੇ ਜਾਂਦੇ ਹਨ। ਇਹ ਸਵਾਲ ਮਾਡਲ ਦੀ ਵਿਆਪਕ ਸਿਖਲਾਈ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਗਣਿਤ ਦੇ ਵੱਖ-ਵੱਖ ਖੇਤਰਾਂ ਅਤੇ ਮੁਸ਼ਕਲ ਪੱਧਰਾਂ ਨੂੰ ਕਵਰ ਕਰਦੇ ਹਨ।
- ਕਦਮ-ਦਰ-ਕਦਮ ਹੱਲ: ਹਰੇਕ ਤਿਆਰ ਕੀਤੇ ਗਏ ਸਵਾਲ ਲਈ, ਇੱਕ ਕਦਮ-ਦਰ-ਕਦਮ ਹੱਲ ਬਣਾਇਆ ਜਾਂਦਾ ਹੈ, ਜੋ ਪ੍ਰਸ਼ਨ ਕਥਨ ਤੋਂ ਅੰਤਮ ਜਵਾਬ ਤੱਕ ਤਰਕ ਪ੍ਰਕਿਰਿਆ ਦੀ ਵਿਸਥਾਰ ਨਾਲ ਵਿਆਖਿਆ ਕਰਦਾ ਹੈ। ਇਹ ਕਦਮ-ਦਰ-ਕਦਮ ਹੱਲ ਨਾ ਸਿਰਫ਼ ਅੰਤਮ ਜਵਾਬ ਨੂੰ ਸ਼ਾਮਲ ਕਰਦਾ ਹੈ, ਸਗੋਂ ਵਿਚਕਾਰਲੇ ਕਦਮਾਂ ਅਤੇ ਤਰਕ ਨੂੰ ਵੀ ਸ਼ਾਮਲ ਕਰਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਮਾਡਲ ਨੂੰ ਸਮੱਸਿਆ ਨੂੰ ਹੱਲ ਕਰਨ ਦੀ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਸਮਝਣ ਵਿੱਚ ਮਦਦ ਮਿਲਦੀ ਹੈ।
- ਡਾਟਾ ਵਧਾਉਣਾ: ਡਾਟਾ ਦੀ ਵਿਭਿੰਨਤਾ ਨੂੰ ਵਧਾਉਣ ਲਈ, ਸਿੰਥੈਟਿਕ ਡਾਟਾ ਨੂੰ ਵੀ ਵਧਾਇਆ ਜਾਂਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ ਸਵਾਲਾਂ ਦੇ ਸ਼ਬਦਾਂ ਨੂੰ ਬਦਲਣਾ, ਸੰਖਿਆਵਾਂ ਨੂੰ ਵਿਵਸਥਿਤ ਕਰਨਾ ਜਾਂ ਵੱਖ-ਵੱਖ ਹੱਲ ਤਰੀਕਿਆਂ ਦੀ ਵਰਤੋਂ ਕਰਨਾ।
ਚੁਣਿਆ ਹੋਇਆ ਅਸਲ ਡਾਟਾ
ਸਿੰਥੈਟਿਕ ਡਾਟਾ ਤੋਂ ਇਲਾਵਾ, ਫਾਈ-4 ਦੀ ਸਿਖਲਾਈ ਵਿੱਚ ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਚੁਣਿਆ ਹੋਇਆ ਅਸਲ ਡਾਟਾ ਵੀ ਵਰਤਿਆ ਗਿਆ ਹੈ। ਇਹ ਡਾਟਾ ਵੱਖ-ਵੱਖ ਜਨਤਕ ਵੈੱਬਸਾਈਟਾਂ, ਅਕਾਦਮਿਕ ਪੇਪਰਾਂ, ਸਿੱਖਿਆ ਫੋਰਮਾਂ ਅਤੇ ਪ੍ਰੋਗਰਾਮਿੰਗ ਟਿਊਟੋਰੀਅਲ ਤੋਂ ਲਿਆ ਗਿਆ ਹੈ, ਜਿਸ ਵਿੱਚ ਹੇਠ ਲਿਖੀਆਂ ਕਿਸਮਾਂ ਸ਼ਾਮਲ ਹਨ:
- ਗਣਿਤ ਦੇ ਸਵਾਲ ਅਤੇ ਜਵਾਬ: ਜਨਤਕ ਵੈੱਬਸਾਈਟਾਂ ਅਤੇ ਬਾਹਰੀ ਡਾਟਾਸੈਟਾਂ ਤੋਂ ਲੱਖਾਂ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਗਣਿਤ ਦੇ ਸਵਾਲ ਅਤੇ ਉਨ੍ਹਾਂ ਦੇ ਜਵਾਬ ਇਕੱਠੇ ਕੀਤੇ ਗਏ ਹਨ। ਇਹ ਸਵਾਲ ਗਣਿਤ ਦੇ ਵੱਖ-ਵੱਖ ਖੇਤਰਾਂ ਅਤੇ ਮੁਸ਼ਕਲ ਪੱਧਰਾਂ ਨੂੰ ਕਵਰ ਕਰਦੇ ਹਨ।
- ਅਕਾਦਮਿਕ ਪੇਪਰ: ਮਾਡਲ ਦੀ ਸਮਝ ਅਤੇ ਤਰਕ ਦੀ ਯੋਗਤਾ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣ ਲਈ, ਵੱਡੀ ਗਿਣਤੀ ਵਿੱਚ ਅਕਾਦਮਿਕ ਪੇਪਰ ਵੀ ਇਕੱਠੇ ਕੀਤੇ ਗਏ ਹਨ, ਜੋ ਗਣਿਤ ਦੀਆਂ ਡੂੰਘਾਈ ਵਾਲੀਆਂ ਧਾਰਨਾਵਾਂ ਅਤੇ ਸਿਧਾਂਤਾਂ ਨੂੰ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ।
- ਸਿੱਖਿਆ ਫੋਰਮ: ਸਿੱਖਿਆ ਫੋਰਮਾਂ ਤੋਂ ਵਿਦਿਆਰਥੀਆਂ ਦੁਆਰਾ ਪੁੱਛੇ ਗਏ ਸਵਾਲ ਅਤੇ ਮਾਹਿਰਾਂ ਦੁਆਰਾ ਪ੍ਰਦਾਨ ਕੀਤੇ ਗਏ ਜਵਾਬ ਇਕੱਠੇ ਕੀਤੇ ਗਏ ਹਨ, ਜਿਸ ਨਾਲ ਮਾਡਲ ਨੂੰ ਗਣਿਤ ਦੇ ਸਵਾਲਾਂ ਨੂੰ ਵੱਖ-ਵੱਖ ਦ੍ਰਿਸ਼ਟੀਕੋਣਾਂ ਤੋਂ ਸਮਝਣ ਦੇ ਯੋਗ ਬਣਾਇਆ ਜਾ ਸਕੇ।
- ਪ੍ਰੋਗਰਾਮਿੰਗ ਟਿਊਟੋਰੀਅਲ: ਮਾਡਲ ਦੀ ਪ੍ਰੋਗਰਾਮਿੰਗ ਯੋਗਤਾ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣ ਲਈ, ਵੱਡੀ ਗਿਣਤੀ ਵਿੱਚ ਪ੍ਰੋਗਰਾਮਿੰਗ ਟਿਊਟੋਰੀਅਲ ਵੀ ਇਕੱਠੇ ਕੀਤੇ ਗਏ ਹਨ, ਜੋ ਵੱਖ-ਵੱਖ ਪ੍ਰੋਗਰਾਮਿੰਗ ਭਾਸ਼ਾਵਾਂ ਅਤੇ ਐਲਗੋਰਿਦਮ ਨੂੰ ਕਵਰ ਕਰਦੇ ਹਨ।
ਡਾਟਾ ਗੁਣਵੱਤਾ ਨਿਯੰਤਰਣ
ਮਾਈਕਰੋਸਾਫਟ ਨੇ ਸਿਖਲਾਈ ਡਾਟਾ ਦੀ ਸਹੀਤਾ ਅਤੇ ਇਕਸਾਰਤਾ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਡਾਟਾ ਗੁਣਵੱਤਾ ਨਿਯੰਤਰਣ ਵਿੱਚ ਬਹੁਤ ਮਿਹਨਤ ਕੀਤੀ ਹੈ। ਉਹਨਾਂ ਨੇ ਹੇਠ ਲਿਖੇ ਕਦਮ ਚੁੱਕੇ ਹਨ:
- ਮਨੁੱਖੀ ਸਮੀਖਿਆ: ਕੁਝ ਮਹੱਤਵਪੂਰਨ ਡਾਟਾਸੈਟਾਂ ਲਈ, ਡਾਟਾ ਦੀ ਸਹੀਤਾ ਅਤੇ ਗੁਣਵੱਤਾ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਮਨੁੱਖੀ ਸਮੀਖਿਆ ਕੀਤੀ ਜਾਂਦੀ ਹੈ।
- ਬਹੁਮਤ ਵੋਟਿੰਗ: ਜਿਨ੍ਹਾਂ ਸਵਾਲਾਂ ਦੇ ਸਹੀ ਹੱਲ ਪ੍ਰਦਾਨ ਨਹੀਂ ਕੀਤੇ ਗਏ ਸਨ, ਉਹਨਾਂ ਲਈ ਸਹੀਤਾ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣ ਲਈ ਬਹੁਮਤ ਵੋਟਿੰਗ ਵਿਧੀ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਹੱਲ ਤਿਆਰ ਕੀਤੇ ਜਾਂਦੇ ਹਨ।
- ਡਾਟਾ ਸਫਾਈ: ਸਾਰੇ ਡਾਟਾ ਨੂੰ ਡੁਪਲੀਕੇਟ ਡਾਟਾ, ਗਲਤ ਡਾਟਾ ਅਤੇ ਅਪ੍ਰਸੰਗਿਕ ਡਾਟਾ ਨੂੰ ਹਟਾਉਣ ਲਈ ਸਾਫ਼ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।
ਪੋਸਟ-ਟ੍ਰੇਨਿੰਗ ਰਣਨੀਤੀਆਂ ਦਾ ਵਿਸਤ੍ਰਿਤ ਵਿਸ਼ਲੇਸ਼ਣ
ਫਾਈ-4 ਦਾ ਪੋਸਟ-ਟ੍ਰੇਨਿੰਗ ਪੜਾਅ ਇਸਨੂੰ ਇੱਕ ਭਰੋਸੇਯੋਗ AI ਸਹਾਇਕ ਵਿੱਚ ਬਦਲਣ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ, ਇਸ ਪੜਾਅ ਵਿੱਚ ਮੁੱਖ ਤੌਰ ‘ਤੇ ਫਾਈਨ-ਟਿਊਨਿੰਗ ਅਤੇ ਸਿੱਧਾ ਤਰਜੀਹ ਅਨੁਕੂਲਤਾ (DPO) ਸ਼ਾਮਲ ਹੈ।
ਫਾਈਨ-ਟਿਊਨਿੰਗ ਪੜਾਅ
ਫਾਈਨ-ਟਿਊਨਿੰਗ ਪੜਾਅ ਦਾ ਉਦੇਸ਼ ਮਾਡਲ ਨੂੰ ਵੱਖ-ਵੱਖ ਕਾਰਜਾਂ ਅਤੇ ਖੇਤਰਾਂ ਦੇ ਅਨੁਕੂਲ ਬਣਾਉਣਾ ਹੈ। ਇਸ ਪੜਾਅ ਵਿੱਚ, ਮਾਈਕਰੋਸਾਫਟ ਨੇ ਹੇਠ ਲਿਖੇ ਖੇਤਰਾਂ ਤੋਂ ਤਿਆਰ ਕੀਤੇ ਗਏ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਡਾਟਾ ਦੀ ਵਰਤੋਂ ਕੀਤੀ:
- ਗਣਿਤ: ਵੱਖ-ਵੱਖ ਗਣਿਤ ਦੇ ਸਵਾਲ ਅਤੇ ਜਵਾਬ ਸ਼ਾਮਲ ਹਨ, ਜਿਸਦਾ ਉਦੇਸ਼ ਮਾਡਲ ਦੀ ਗਣਿਤਿਕ ਤਰਕ ਯੋਗਤਾ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣਾ ਹੈ।
- ਕੋਡਿੰਗ: ਵੱਖ-ਵੱਖ ਪ੍ਰੋਗਰਾਮਿੰਗ ਸਵਾਲ ਅਤੇ ਜਵਾਬ ਸ਼ਾਮਲ ਹਨ, ਜਿਸਦਾ ਉਦੇਸ਼ ਮਾਡਲ ਦੇ ਕੋਡ ਜਨਰੇਸ਼ਨ ਅਤੇ ਸਮਝ ਦੀ ਯੋਗਤਾ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣਾ ਹੈ।
- ਤਰਕ: ਵੱਖ-ਵੱਖ ਤਰਕ ਸਵਾਲ ਸ਼ਾਮਲ ਹਨ, ਜਿਸਦਾ ਉਦੇਸ਼ ਮਾਡਲ ਦੀ ਤਰਕਸ਼ੀਲ ਸੋਚ ਦੀ ਯੋਗਤਾ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣਾ ਹੈ।
- ਗੱਲਬਾਤ: ਵੱਖ-ਵੱਖ ਗੱਲਬਾਤ ਡਾਟਾ ਸ਼ਾਮਲ ਹੈ, ਜਿਸਦਾ ਉਦੇਸ਼ ਮਾਡਲ ਦੀ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਦੀ ਸਮਝ ਅਤੇ ਜਨਰੇਸ਼ਨ ਦੀ ਯੋਗਤਾ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣਾ ਹੈ।
- ਮਾਡਲ ਪਛਾਣ: ਵੱਖ-ਵੱਖ ਮਾਡਲ ਪਛਾਣ ਵਰਣਨ ਸ਼ਾਮਲ ਹਨ, ਜਿਸਦਾ ਉਦੇਸ਼ ਮਾਡਲ ਦੀ ਆਪਣੀ ਯੋਗਤਾ ਦੀ ਸਮਝ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣਾ ਹੈ।
- ਸੁਰੱਖਿਆ: ਵੱਖ-ਵੱਖ ਸੁਰੱਖਿਆ ਸਵਾਲ ਅਤੇ ਜਵਾਬ ਸ਼ਾਮਲ ਹਨ, ਜਿਸਦਾ ਉਦੇਸ਼ ਮਾਡਲ ਦੀ ਸੁਰੱਖਿਆ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣਾ ਹੈ।
ਸਿੱਧਾ ਤਰਜੀਹ ਅਨੁਕੂਲਤਾ (DPO) ਪੜਾਅ
ਸਿੱਧਾ ਤਰਜੀਹ ਅਨੁਕੂਲਤਾ (DPO) ਪੜਾਅ ਦਾ ਉਦੇਸ਼ ਮਾਡਲ ਦੇ ਵਿਵਹਾਰ ਨੂੰ ਮਨੁੱਖੀ ਤਰਜੀਹਾਂ ਨਾਲ ਬਿਹਤਰ ਢੰਗ ਨਾਲ ਜੋੜਨਾ ਅਤੇ ਮਾੜੇ ਵਿਵਹਾਰ ਨੂੰ ਦੂਰ ਕਰਨਾ ਹੈ। ਇਸ ਪੜਾਅ ਵਿੱਚ ਦੋ ਕਦਮ ਸ਼ਾਮਲ ਹਨ:
- ਪਿਵੋਟਲ ਟੋਕਨ ਖੋਜ: ਪਹਿਲੇ ਕਦਮ ਵਿੱਚ, ਮਾਈਕਰੋਸਾਫਟ ਲੋੜੀਂਦੇ/ਨਾ-ਲੋੜੀਂਦੇ ਨਤੀਜਿਆਂ ਦੇ ਜੋੜੇ ਤਿਆਰ ਕਰਨ ਲਈ ਪਿਵੋਟਲ ਟੋਕਨ ਖੋਜ ਨਾਮਕ ਇੱਕ ਨਵੀਂ ਤਕਨੀਕ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਇਹ ਤਕਨੀਕ ਮਾਡਲ ਦੇ ਆਉਟਪੁੱਟ ਸਪੇਸ ਦੀ ਖੋਜ ਕਰਕੇ ਉਹਨਾਂ ਮੁੱਖ ਨਿਸ਼ਾਨਾਂ ਨੂੰ ਲੱਭਦੀ ਹੈ ਜੋ ਲੋੜੀਂਦੇ ਅਤੇ ਨਾ-ਲੋੜੀਂਦੇ ਵਿਵਹਾਰ ਵਿੱਚ ਫਰਕ ਕਰ ਸਕਦੇ ਹਨ।
- GPT-4o ਇੱਕ ਜੱਜ ਵਜੋਂ: ਦੂਜੇ ਕਦਮ ਵਿੱਚ, ਉਹ ਹਰੇਕ ਨਤੀਜੇ ਦੇ ਜੋੜੇ ਲਈ ਸਕਾਰਾਤਮਕ ਜਾਂ ਨਕਾਰਾਤਮਕ ਟੈਗ ਲਗਾਉਣ ਲਈ GPT-4o ਨੂੰ ਇੱਕ ਜੱਜ ਵਜੋਂ ਵਰਤਦੇ ਹਨ। GPT-4o ਮਨੁੱਖੀ ਤਰਜੀਹਾਂ ਦੇ ਆਧਾਰ ‘ਤੇ ਮਾਡਲ ਆਉਟਪੁੱਟ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਦੇ ਯੋਗ ਹੈ, ਜਿਸ ਨਾਲ ਮਾਡਲ ਨੂੰ ਮਨੁੱਖੀ ਤਰਜੀਹਾਂ ਨੂੰ ਬਿਹਤਰ ਢੰਗ ਨਾਲ ਸਿੱਖਣ ਵਿੱਚ ਮਦਦ ਮਿਲਦੀ ਹੈ।
ਫਾਈ-4 ਦਾ ਕਾਰਗੁਜ਼ਾਰੀ ਮੁਲਾਂਕਣ
ਫਾਈ-4 ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ, ਮਾਈਕਰੋਸਾਫਟ ਨੇ ਓਪਨਏਆਈ ਦੇ SIMPLE-EVALS ਫਰੇਮਵਰਕ ਦੀ ਵਰਤੋਂ ਕੀਤੀ, ਜਿਸ ਵਿੱਚ ਵੱਖ-ਵੱਖ ਬੈਂਚਮਾਰਕ ਸ਼ਾਮਲ ਹਨ, ਜੋ ਵੱਖ-ਵੱਖ ਕਾਰਜਾਂ ਵਿੱਚ ਮਾਡਲ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਦਾ ਮੁਲਾਂਕਣ ਕਰ ਸਕਦੇ ਹਨ।
ਬੈਂਚਮਾਰਕ
ਫਾਈ-4 ਨੇ ਹੇਠ ਲਿਖੇ ਬੈਂਚਮਾਰਕਾਂ ਵਿੱਚ ਸ਼ਾਨਦਾਰ ਪ੍ਰਦਰਸ਼ਨ ਕੀਤਾ:
- GPQA (ਗ੍ਰੈਜੂਏਟ-ਪੱਧਰ STEM ਪ੍ਰਸ਼ਨ-ਉੱਤਰ): ਇਸ ਬੈਂਚਮਾਰਕ ਵਿੱਚ, ਫਾਈ-4 ਨੇ ਆਪਣੇ ਅਧਿਆਪਕ ਮਾਡਲ GPT-4o ਨੂੰ ਪਛਾੜ ਦਿੱਤਾ ਹੈ, ਇਹ ਸਾਬਤ ਕਰਦਾ ਹੈ ਕਿ STEM ਖੇਤਰ ਵਿੱਚ ਇਸਦੀ ਪ੍ਰਸ਼ਨ-ਉੱਤਰ ਦੀ ਯੋਗਤਾ ਬਹੁਤ ਮਜ਼ਬੂਤ ਹੈ।
- MATH (ਗਣਿਤ ਮੁਕਾਬਲਾ): ਇਸ ਬੈਂਚਮਾਰਕ ਵਿੱਚ, ਫਾਈ-4 ਨੇ ਆਪਣੇ ਅਧਿਆਪਕ ਮਾਡਲ GPT-4o ਨੂੰ ਵੀ ਪਛਾੜ ਦਿੱਤਾ ਹੈ, ਇਹ ਸਾਬਤ ਕਰਦਾ ਹੈ ਕਿ ਇਹ ਗੁੰਝਲਦਾਰ ਗਣਿਤ ਦੇ ਸਵਾਲਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਵਿੱਚ ਬਹੁਤ ਵਧੀਆ ਹੈ।
- ਹੋਰ ਮਾਡਲਾਂ ਨਾਲ ਤੁਲਨਾ: ਕਈ ਬੈਂਚਮਾਰਕਾਂ ਵਿੱਚ, ਫਾਈ-4 ਨੇ Llama-3.1-405B ਨੂੰ ਪਛਾੜ ਦਿੱਤਾ ਹੈ, ਇਹ ਸਾਬਤ ਕਰਦਾ ਹੈ ਕਿ ਇਸਦੀ ਸਮੁੱਚੀ ਕਾਰਗੁਜ਼ਾਰੀ ਬਹੁਤ ਮਜ਼ਬੂਤ ਹੈ।
ਕਾਰਗੁਜ਼ਾਰੀ ਵਿਸ਼ਲੇਸ਼ਣ
ਫਾਈ-4 ਦੇ ਕਾਰਗੁਜ਼ਾਰੀ ਮੁਲਾਂਕਣ ਦੁਆਰਾ, ਹੇਠ ਲਿਖੇ ਸਿੱਟੇ ਕੱਢੇ ਜਾ ਸਕਦੇ ਹਨ:
- ਮਜ਼ਬੂਤ ਗਣਿਤਿਕ ਤਰਕ ਯੋਗਤਾ: ਫਾਈ-4 ਨੇ ਗਣਿਤਿਕ ਤਰਕ ਵਿੱਚ ਬਹੁਤ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕੀਤਾ ਹੈ, ਇਹ ਇਸਦੀ ਸਿਖਲਾਈ ਦੌਰਾਨ ਵਰਤੀਆਂ ਗਈਆਂ ਨਵੀਨਤਾਕਾਰੀ ਵਿਧੀਆਂ, ਜਿਸ ਵਿੱਚ ਸਿੰਥੈਟਿਕ ਡਾਟਾ, ਚੁਣਿਆ ਹੋਇਆ ਅਸਲ ਡਾਟਾ ਅਤੇ ਪੋਸਟ-ਟ੍ਰੇਨਿੰਗ ਰਣਨੀਤੀਆਂ ਸ਼ਾਮਲ ਹਨ, ਦੇ ਕਾਰਨ ਹੈ।
- ਅਧਿਆਪਕ ਮਾਡਲ ਨੂੰ ਪਛਾੜਨਾ: ਕਈ ਬੈਂਚਮਾਰਕਾਂ ਵਿੱਚ, ਫਾਈ-4 ਨੇ ਆਪਣੇ ਅਧਿਆਪਕ ਮਾਡਲ GPT-4o ਨੂੰ ਪਛਾੜ ਦਿੱਤਾ ਹੈ, ਇਹ ਸਾਬਤ ਕਰਦਾ ਹੈ ਕਿ ਇਸਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਸਿਰਫ ਗਿਆਨ ਕੱਢਣਾ ਨਹੀਂ ਹੈ।
- ਹੋਰ ਮਾਡਲਾਂ ਨਾਲ ਤੁਲਨਾ: ਫਾਈ-4 ਨੇ ਕਈ ਬੈਂਚਮਾਰਕਾਂ ਵਿੱਚ Llama-3.1-405B ਨੂੰ ਪਛਾੜ ਦਿੱਤਾ ਹੈ, ਇਹ ਸਾਬਤ ਕਰਦਾ ਹੈ ਕਿ ਇਸਦੀ ਸਮੁੱਚੀ ਕਾਰਗੁਜ਼ਾਰੀ ਬਹੁਤ ਮਜ਼ਬੂਤ ਹੈ।
ਫਾਈ-4 ਦੀਆਂ ਐਪਲੀਕੇਸ਼ਨ ਸੰਭਾਵਨਾਵਾਂ
ਫਾਈ-4 ਇੱਕ ਛੋਟਾ ਭਾਸ਼ਾ ਮਾਡਲ ਹੋਣ ਦੇ ਨਾਤੇ, ਜੋ ਗੁੰਝਲਦਾਰ ਗਣਿਤਿਕ ਤਰਕ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ, ਇਸ ਵਿੱਚ ਵਿਆਪਕ ਐਪਲੀਕੇਸ਼ਨ ਸੰਭਾਵਨਾਵਾਂ ਹਨ। ਇਸਨੂੰ ਹੇਠ ਲਿਖੇ ਖੇਤਰਾਂ ਵਿੱਚ ਲਾਗੂ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ:
- ਸਿੱਖਿਆ: ਇਸਨੂੰ ਗਣਿਤ ਦੇ ਟਿਊਟਰ ਵਜੋਂ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ, ਜੋ ਵਿਦਿਆਰਥੀਆਂ ਨੂੰ ਗਣਿਤ ਦੇ ਸਵਾਲ ਹੱਲ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ ਅਤੇ ਵਿਅਕਤੀਗਤ ਸਿੱਖਣ ਦਾ ਤਜਰਬਾ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।
- ਖੋਜ: ਇਸਨੂੰ ਖੋਜ ਸੰਦ ਵਜੋਂ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ, ਜੋ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਗਣਿਤਿਕ ਮਾਡਲਿੰਗ ਅਤੇ ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ।
- ਇੰਜੀਨੀਅਰਿੰਗ: ਇਸਨੂੰ ਇੰਜੀਨੀਅਰਿੰਗ ਸੰਦ ਵਜੋਂ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ, ਜੋ ਇੰਜੀਨੀਅਰਾਂ ਨੂੰ ਡਿਜ਼ਾਈਨ ਅਤੇ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ।
- ਵਿੱਤ: ਇਸਨੂੰ ਵਿੱਤੀ ਸੰਦ ਵਜੋਂ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ, ਜੋ ਵਿੱਤੀ ਵਿਸ਼ਲੇਸ਼ਕਾਂ ਨੂੰ ਜੋਖਮ ਮੁਲਾਂਕਣ ਅਤੇ ਨਿਵੇਸ਼ ਫੈਸਲੇ ਲੈਣ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ।
- ਹੋਰ ਖੇਤਰ: ਇਸਨੂੰ ਹੋਰ ਖੇਤਰਾਂ ਵਿੱਚ ਵੀ ਲਾਗੂ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਵਿੱਚ ਗੁੰਝਲਦਾਰ ਗਣਿਤਿਕ ਤਰਕ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਜਿਵੇਂ ਕਿ ਸਿਹਤ ਸੰਭਾਲ, ਲੌਜਿਸਟਿਕਸ ਅਤੇ ਨਿਰਮਾਣ।
ਸਿੱਟਾ
ਮਾਈਕਰੋਸਾਫਟ ਫਾਈ-4 ਦੀ ਆਮਦ ਗਣਿਤਿਕ ਤਰਕ ਦੇ ਖੇਤਰ ਵਿੱਚ ਛੋਟੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਵਿੱਚ ਇੱਕ ਵੱਡੀ ਤਰੱਕੀ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ। ਇਸਦੀ ਵਿਲੱਖਣ ਡਾਟਾ ਸਿਖਲਾਈ ਰਣਨੀਤੀ ਅਤੇ ਪੋਸਟ-ਟ੍ਰੇਨਿੰਗ ਵਿਧੀਆਂ ਇਸਨੂੰ ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ ਸਮਾਨ ਅਤੇ ਵੱਡੇ ਮਾਡਲਾਂ ਨੂੰ ਪਛਾੜਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦੀਆਂ ਹਨ, ਅਤੇ AI ਦੇ ਭਵਿੱਖੀ ਵਿਕਾਸ ਲਈ ਨਵੇਂ ਵਿਚਾਰ ਪ੍ਰਦਾਨ ਕਰਦੀਆਂ ਹਨ। ਹੱਗਿੰਗ ਫੇਸ ‘ਤੇ ਫਾਈ-4 ਦੇ ਓਪਨ ਸੋਰਸ ਹੋਣ ਨਾਲ, ਇਹ ਮੰਨਿਆ ਜਾਂਦਾ ਹੈ ਕਿ ਇਹ ਹੋਰ ਖੋਜਕਰਤਾਵਾਂ ਅਤੇ ਡਿਵੈਲਪਰਾਂ ਲਈ ਸਹੂਲਤ ਲਿਆਏਗਾ ਅਤੇ ਵੱਖ-ਵੱਖ ਖੇਤਰਾਂ ਵਿੱਚ AI ਤਕਨਾਲੋਜੀ ਦੀ ਵਰਤੋਂ ਨੂੰ ਅੱਗੇ ਵਧਾਏਗਾ।