Amazon ਦਾ Nova Act: ਖੁਦਮੁਖਤਿਆਰ AI ਏਜੰਟਾਂ ਲਈ ਰਾਹ

ਡਿਜੀਟਲ ਲੈਂਡਸਕੇਪ ਆਰਟੀਫਿਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਨਾਲ ਭਰਿਆ ਪਿਆ ਹੈ, ਫਿਰ ਵੀ ਇਸਦਾ ਬਹੁਤਾ ਹਿੱਸਾ ਸੀਮਤ ਹੈ, ਪਹਿਲਾਂ ਤੋਂ ਪਰਿਭਾਸ਼ਿਤ ਪੈਰਾਮੀਟਰਾਂ ਦੇ ਅੰਦਰ ਕੰਮ ਕਰਦਾ ਹੈ ਜਾਂ ਸਟ੍ਰਕਚਰਡ ਡਾਟਾ ਫੀਡਸ ਅਤੇ APIs ‘ਤੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਨਿਰਭਰ ਕਰਦਾ ਹੈ। ਸੱਚਮੁੱਚ ਖੁਦਮੁਖਤਿਆਰ ਏਜੰਟਾਂ ਦਾ ਸੁਪਨਾ - ਡਿਜੀਟਲ ਸਹਾਇਕ ਜੋ ਗੁੰਝਲਦਾਰ ਟੀਚਿਆਂ ਨੂੰ ਪੂਰਾ ਕਰਨ ਲਈ World Wide Web ਦੇ ਗੜਬੜ ਵਾਲੇ, ਅਣਪਛਾਤੇ ਵਾਤਾਵਰਣ ਨੂੰ ਨੈਵੀਗੇਟ ਕਰਨ ਦੇ ਸਮਰੱਥ ਹਨ - ਵੱਡੇ ਪੱਧਰ ‘ਤੇ ਅਪਹੁੰਚ ਰਿਹਾ ਹੈ। Amazon ਹੁਣ ਇਸ ਖੇਤਰ ਵਿੱਚ ਦਲੇਰੀ ਨਾਲ ਕਦਮ ਰੱਖ ਰਿਹਾ ਹੈ, Nova Act ਨੂੰ ਪੇਸ਼ ਕਰ ਰਿਹਾ ਹੈ, ਇੱਕ ਉੱਨਤ AI ਮਾਡਲ ਜੋ ਏਜੰਟਾਂ ਨੂੰ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਨ ਲਈ ਸਾਵਧਾਨੀ ਨਾਲ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ ਜੋ ਵੈੱਬ ਬ੍ਰਾਊਜ਼ਰਾਂ ਨੂੰ ਸਮਝ ਸਕਦੇ ਹਨ ਅਤੇ ਉਹਨਾਂ ਨਾਲ ਗੱਲਬਾਤ ਕਰ ਸਕਦੇ ਹਨ, ਗੁੰਝਲਦਾਰ ਕਾਰਜਾਂ ਨੂੰ ਬਿਲਕੁਲ ਉਸੇ ਤਰ੍ਹਾਂ ਲਾਗੂ ਕਰ ਸਕਦੇ ਹਨ ਜਿਵੇਂ ਇੱਕ ਮਨੁੱਖੀ ਉਪਭੋਗਤਾ ਕਰੇਗਾ। ਇਹ ਪਹਿਲਕਦਮੀ ਮੌਜੂਦਾ ਸੀਮਾਵਾਂ ਤੋਂ ਪਰੇ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਧੱਕੇ ਦਾ ਸੰਕੇਤ ਦਿੰਦੀ ਹੈ, ਜਿਸਦਾ ਉਦੇਸ਼ ਵਧੇਰੇ ਸਮਰੱਥ, ਭਰੋਸੇਮੰਦ ਅਤੇ ਬਹੁਮੁਖੀ AI ਸਹਾਇਕਾਂ ਦੇ ਯੁੱਗ ਦੀ ਸ਼ੁਰੂਆਤ ਕਰਨਾ ਹੈ।

ਮਹਾਨ ਦ੍ਰਿਸ਼ਟੀਕੋਣ: ਸਧਾਰਨ ਕਮਾਂਡਾਂ ਤੋਂ ਪਰੇ ਗੁੰਝਲਦਾਰ ਸਮੱਸਿਆ-ਹੱਲ ਤੱਕ

Amazon ਦੀ ਅਭਿਲਾਸ਼ਾ ਮੌਸਮ ਦੀਆਂ ਰਿਪੋਰਟਾਂ ਪ੍ਰਾਪਤ ਕਰਨ ਜਾਂ ਟਾਈਮਰ ਸੈੱਟ ਕਰਨ ਤੋਂ ਕਿਤੇ ਵੱਧ ਹੈ। ਕੰਪਨੀ ਇੱਕ ਮਜਬੂਰ ਕਰਨ ਵਾਲੀ ਦ੍ਰਿਸ਼ਟੀ ਨੂੰ ਸਪਸ਼ਟ ਕਰਦੀ ਹੈ ਜਿੱਥੇ AI ਏਜੰਟ ਡਿਜੀਟਲ ਅਤੇ, ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ, ਆਪਸ ਵਿੱਚ ਜੁੜੇ ਭੌਤਿਕ ਖੇਤਰਾਂ ਦੇ ਅੰਦਰ ਬਹੁਪੱਖੀ ਉਦੇਸ਼ਾਂ ਦਾ ਨਿਰਵਿਘਨ ਪ੍ਰਬੰਧਨ ਕਰਦੇ ਹਨ। ਇੱਕ AI ਦੀ ਕਲਪਨਾ ਕਰੋ ਜੋ ਵਿਆਹ ਦੀ ਯੋਜਨਾਬੰਦੀ ਦੇ ਅਣਗਿਣਤ ਵੇਰਵਿਆਂ ਨੂੰ ਆਰਕੈਸਟ੍ਰੇਟ ਕਰਨ ਦੇ ਸਮਰੱਥ ਹੈ, ਵਿਕਰੇਤਾਵਾਂ ਦਾ ਤਾਲਮੇਲ ਕਰਨਾ, ਬਜਟ ਦਾ ਪ੍ਰਬੰਧਨ ਕਰਨਾ, ਅਤੇ ਵੱਖ-ਵੱਖ ਔਨਲਾਈਨ ਪੋਰਟਲਾਂ ਰਾਹੀਂ RSVPs ਨੂੰ ਟਰੈਕ ਕਰਨਾ। ਉੱਨਤ ਏਜੰਟਾਂ ਦੀ ਤਸਵੀਰ ਬਣਾਓ ਜੋ ਗੁੰਝਲਦਾਰ IT ਪ੍ਰਸ਼ਾਸਨ ਕਾਰਜਾਂ ਨਾਲ ਨਜਿੱਠਦੇ ਹਨ, ਨੈੱਟਵਰਕ ਮੁੱਦਿਆਂ ਦਾ ਨਿਪਟਾਰਾ ਕਰਦੇ ਹਨ, ਸੌਫਟਵੇਅਰ ਲਾਇਸੈਂਸਾਂ ਦਾ ਪ੍ਰਬੰਧਨ ਕਰਦੇ ਹਨ, ਜਾਂ ਅੰਦਰੂਨੀ ਵੈੱਬ-ਅਧਾਰਿਤ ਸਾਧਨਾਂ ਨਾਲ ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਗੱਲਬਾਤ ਕਰਕੇ ਨਵੇਂ ਕਰਮਚਾਰੀਆਂ ਨੂੰ ਸ਼ਾਮਲ ਕਰਦੇ ਹਨ। ਇਹ ਕਾਰਜ-ਵਿਸ਼ੇਸ਼ ਬੋਟਸ ਤੋਂ ਟੀਚਾ-ਮੁਖੀ ਡਿਜੀਟਲ ਭਾਈਵਾਲਾਂ ਵੱਲ ਇੱਕ ਪੈਰਾਡਾਈਮ ਸ਼ਿਫਟ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ ਜੋ ਨਿੱਜੀ ਸਹੂਲਤ ਨੂੰ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ ਵਧਾਉਣ ਅਤੇ ਕਾਰੋਬਾਰੀ ਉਤਪਾਦਕਤਾ ਨੂੰ ਵਧਾਉਣ ਲਈ ਤਿਆਰ ਕੀਤੇ ਗਏ ਹਨ।

ਮੌਜੂਦਾ ਜਨਰੇਟਿਵ AI ਮਾਡਲ, ਜਦੋਂ ਕਿ ਗੱਲਬਾਤ ਅਤੇ ਸਮੱਗਰੀ ਬਣਾਉਣ ਵਿੱਚ ਨਿਪੁੰਨ ਹਨ, ਅਕਸਰ ਵੈੱਬ ਇੰਟਰਫੇਸਾਂ ਦੀ ਗਤੀਸ਼ੀਲ ਅਤੇ ਅਕਸਰ ਅਸੰਗਤ ਪ੍ਰਕਿਰਤੀ ਦਾ ਸਾਹਮਣਾ ਕਰਨ ਵੇਲੇ ਅਸਫਲ ਹੋ ਜਾਂਦੇ ਹਨ। ਕਾਰਵਾਈਆਂ ਦੇ ਇੱਕ ਕ੍ਰਮ ਨੂੰ ਲਾਗੂ ਕਰਨਾ - ਲੌਗਇਨ ਕਰਨਾ, ਮੀਨੂ ਨੈਵੀਗੇਟ ਕਰਨਾ, ਫਾਰਮ ਭਰਨਾ, ਵਿਜ਼ੂਅਲ ਸੰਕੇਤਾਂ ਦੀ ਵਿਆਖਿਆ ਕਰਨਾ, ਅਤੇ ਅਚਾਨਕ ਪੌਪ-ਅਪਸ ਦਾ ਜਵਾਬ ਦੇਣਾ - ਪ੍ਰਸੰਗਿਕ ਸਮਝ ਅਤੇ ਕਾਰਜਸ਼ੀਲ ਭਰੋਸੇਯੋਗਤਾ ਦੇ ਇੱਕ ਪੱਧਰ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ ਜਿਸਨੂੰ ਲਗਾਤਾਰ ਪ੍ਰਾਪਤ ਕਰਨਾ ਮੁਸ਼ਕਲ ਰਿਹਾ ਹੈ। Amazon ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਇਹਨਾਂ ਰੁਕਾਵਟਾਂ ਨੂੰ ਸਵੀਕਾਰ ਕਰਦਾ ਹੈ, Nova Act ਨੂੰ ਇਸਦੇ ਰਣਨੀਤਕ ਜਵਾਬ ਵਜੋਂ ਸਥਿਤੀ ਦਿੰਦਾ ਹੈ, ਜੋ ਵੈੱਬ-ਅਧਾਰਿਤ ਕਾਰਜ ਐਗਜ਼ੀਕਿਊਸ਼ਨ ਦੀਆਂ ਪੇਚੀਦਗੀਆਂ ਵਿੱਚ ਮੁਹਾਰਤ ਹਾਸਲ ਕਰਨ ਲਈ ਜ਼ਮੀਨੀ ਪੱਧਰ ਤੋਂ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ।

Nova Act ਪੇਸ਼ ਕਰ ਰਿਹਾ ਹੈ: ਬੁੱਧੀਮਾਨ ਵੈੱਬ ਨੈਵੀਗੇਸ਼ਨ ਲਈ ਇੰਜਣ

Nova Act ਸਿਰਫ਼ ਇੱਕ ਹੋਰ ਵੱਡਾ ਭਾਸ਼ਾ ਮਾਡਲ ਨਹੀਂ ਹੈ; ਇਹ ਇੱਕ ਵਿਸ਼ੇਸ਼ ਪ੍ਰਣਾਲੀ ਹੈ ਜੋ ਮਨੁੱਖੀ ਇਰਾਦੇ ਨੂੰ ਇੱਕ ਵੈੱਬ ਬ੍ਰਾਊਜ਼ਰ ਦੇ ਅੰਦਰ ਠੋਸ ਕਾਰਵਾਈਆਂ ਵਿੱਚ ਅਨੁਵਾਦ ਕਰਨ ‘ਤੇ ਕੇਂਦ੍ਰਿਤ ਹੈ। ਇਹ AI ਨੂੰ ਵੈੱਬ ਤੱਤਾਂ ਨੂੰ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਸਮਝਣ, ਸਮਝਣ ਅਤੇ ਹੇਰਾਫੇਰੀ ਕਰਨ ਦੀ ਯੋਗਤਾ ਪ੍ਰਦਾਨ ਕਰਨ ਲਈ ਇੱਕ ਠੋਸ ਯਤਨ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਮੁੱਖ ਚੁਣੌਤੀ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਦੀਆਂ ਹਦਾਇਤਾਂ (‘ਅਗਲੇ ਮੰਗਲਵਾਰ ਲਈ ਇੱਕ ਮੀਟਿੰਗ ਰੂਮ ਬੁੱਕ ਕਰੋ’) ਅਤੇ ਕਿਸੇ ਦਿੱਤੀ ਗਈ ਵੈੱਬਸਾਈਟ ਜਾਂ ਵੈੱਬ ਐਪਲੀਕੇਸ਼ਨ ‘ਤੇ ਉਸ ਬੇਨਤੀ ਨੂੰ ਪੂਰਾ ਕਰਨ ਲਈ ਲੋੜੀਂਦੇ ਕਲਿੱਕਾਂ, ਸਕ੍ਰੌਲਾਂ ਅਤੇ ਟੈਕਸਟ ਐਂਟਰੀਆਂ ਦੇ ਖਾਸ ਕ੍ਰਮ ਵਿਚਕਾਰ ਪਾੜੇ ਨੂੰ ਪੂਰਾ ਕਰਨ ਵਿੱਚ ਹੈ।

Amazon ਦੀ ਪਹੁੰਚ ਇਹ ਮੰਨਦੀ ਹੈ ਕਿ ਵੈੱਬ ਇੱਕ ਸਥਿਰ ਇਕਾਈ ਨਹੀਂ ਹੈ। ਵੈੱਬਸਾਈਟਾਂ ਲੇਆਉਟ ਬਦਲਦੀਆਂ ਹਨ, ਇੰਟਰਫੇਸ ਬਹੁਤ ਵੱਖਰੇ ਹੁੰਦੇ ਹਨ, ਅਤੇ ਗਤੀਸ਼ੀਲ ਸਮੱਗਰੀ ਅਣਪਛਾਤੇ ਢੰਗ ਨਾਲ ਲੋਡ ਹੁੰਦੀ ਹੈ। ਇਸ ਲਈ, ਇੱਕ ਏਜੰਟ ਨੂੰ ਸਿਰਫ਼ ਭਾਸ਼ਾਈ ਯੋਗਤਾ ਤੋਂ ਵੱਧ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ; ਇਸਨੂੰ ਵੈੱਬ ਢਾਂਚਿਆਂ (HTML, DOM), ਵਿਜ਼ੂਅਲ ਤੱਤਾਂ, ਅਤੇ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਪੈਟਰਨਾਂ ਦੀ ਇੱਕ ਮਜ਼ਬੂਤ ​​ਸਮਝ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। Nova Act ਨੂੰ ਇਸ ਸੂਖਮ ਸਮਝ ਦੇ ਮਾਲਕ ਹੋਣ ਲਈ ਵਿਕਸਤ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ, ਇਸ ਨੂੰ ਵਿਭਿੰਨ ਔਨਲਾਈਨ ਵਾਤਾਵਰਣਾਂ ਵਿੱਚ ਵਧੇਰੇ ਸ਼ੁੱਧਤਾ ਅਤੇ ਅਨੁਕੂਲਤਾ ਨਾਲ ਕੰਮ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ। ਵੈੱਬ-ਨੇਟਿਵ ਇੰਟਰੈਕਸ਼ਨ ‘ਤੇ ਇਹ ਫੋਕਸ ਉਹ ਹੈ ਜੋ Nova Act ਦੇ ਉਦੇਸ਼ ਨੂੰ ਵਧੇਰੇ ਆਮ-ਉਦੇਸ਼ ਵਾਲੇ AI ਮਾਡਲਾਂ ਤੋਂ ਵੱਖਰਾ ਕਰਦਾ ਹੈ।

ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਨਾ: Nova Act Software Development Kit

ਇਸ ਉੱਨਤ AI ਸਮਰੱਥਾ ਨੂੰ ਵਿਹਾਰਕ ਐਪਲੀਕੇਸ਼ਨਾਂ ਵਿੱਚ ਅਨੁਵਾਦ ਕਰਨ ਲਈ, Amazon Nova Act Software Development Kit (SDK) ਦਾ ਇੱਕ ਖੋਜ ਪ੍ਰੀਵਿਊ ਜਾਰੀ ਕਰ ਰਿਹਾ ਹੈ। ਇਹ ਟੂਲਕਿੱਟ ਡਿਵੈਲਪਰਾਂ ਲਈ ਤਿਆਰ ਕੀਤੀ ਗਈ ਹੈ ਜੋ ਖੁਦਮੁਖਤਿਆਰ ਏਜੰਟਾਂ ਦੀ ਅਗਲੀ ਪੀੜ੍ਹੀ ਬਣਾਉਣ ਲਈ ਉਤਸੁਕ ਹਨ। ਇਹ ਵੈੱਬ-ਅਧਾਰਿਤ ਵਰਕਫਲੋ ਨੂੰ ਸਵੈਚਾਲਤ ਕਰਨ ਲਈ Nova Act ਦੀ ਸ਼ਕਤੀ ਨੂੰ ਵਰਤਣ ਲਈ ਲੋੜੀਂਦੇ ਬਿਲਡਿੰਗ ਬਲੌਕਸ ਅਤੇ ਨਿਯੰਤਰਣ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।

SDK ਦੇ ਡਿਜ਼ਾਈਨ ਫ਼ਲਸਫ਼ੇ ਦਾ ਇੱਕ ਅਧਾਰ ਗੁੰਝਲਦਾਰ ਪ੍ਰਕਿਰਿਆਵਾਂ ਨੂੰ ਭਰੋਸੇਯੋਗ, ਬੁਨਿਆਦੀ ਇਕਾਈਆਂ ਵਿੱਚ ਵੰਡਣਾ ਹੈ ਜਿਨ੍ਹਾਂ ਨੂੰ ‘ਐਟੋਮਿਕ ਕਮਾਂਡਾਂ’ ਕਿਹਾ ਜਾਂਦਾ ਹੈ। ਇਹਨਾਂ ਨੂੰ ਵੈੱਬ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਦੀਆਂ ਬੁਨਿਆਦੀ ਕ੍ਰਿਆਵਾਂ ਵਜੋਂ ਸੋਚੋ:

  • ਖੋਜਣਾ: ਇੱਕ ਪੰਨੇ ‘ਤੇ ਖਾਸ ਜਾਣਕਾਰੀ ਜਾਂ ਤੱਤ ਲੱਭਣਾ।
  • ਚੈੱਕ ਆਊਟ ਕਰਨਾ: ਈ-ਕਾਮਰਸ ਵਿੱਚ ਖਰੀਦ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਪੂਰਾ ਕਰਨਾ।
  • ਇੰਟਰੈਕਟ ਕਰਨਾ: ਖਾਸ ਇੰਟਰਫੇਸ ਕੰਪੋਨੈਂਟਸ ਜਿਵੇਂ ਕਿ ਡ੍ਰੌਪਡਾਉਨ ਮੀਨੂ, ਚੈਕਬਾਕਸ, ਮਿਤੀ ਚੋਣਕਾਰ, ਜਾਂ ਮਾਡਲ ਪੌਪ-ਅਪਸ ਨਾਲ ਜੁੜਨਾ।
  • ਨੈਵੀਗੇਟ ਕਰਨਾ: ਕਿਸੇ ਵੈੱਬਸਾਈਟ ਦੇ ਪੰਨਿਆਂ ਜਾਂ ਭਾਗਾਂ ਵਿਚਕਾਰ ਜਾਣਾ।
  • ਡਾਟਾ ਇਨਪੁਟ ਕਰਨਾ: ਫਾਰਮ ਜਾਂ ਟੈਕਸਟ ਫੀਲਡਾਂ ਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਭਰਨਾ।

ਡਿਵੈਲਪਰ ਇਹਨਾਂ ਉੱਚ-ਪੱਧਰੀ ਕਮਾਂਡਾਂ ਤੱਕ ਸੀਮਿਤ ਨਹੀਂ ਹਨ। SDK ਏਜੰਟ ਵਿਵਹਾਰ ਨੂੰ ਸੁਧਾਰਨ ਲਈ ਵਿਸਤ੍ਰਿਤ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਜੋੜਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ। ਉਦਾਹਰਨ ਲਈ, ਇੱਕ ਫਲਾਈਟ ਬੁੱਕ ਕਰਨ ਦਾ ਕੰਮ ਸੌਂਪੇ ਗਏ ਏਜੰਟ ਨੂੰ ਖਾਸ ਤੌਰ ‘ਤੇ ਯਾਤਰਾ ਬੀਮਾ ਲਈ ਪੇਸ਼ਕਸ਼ਾਂ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਕਰਨ ਜਾਂ ਚੈੱਕਆਉਟ ਪ੍ਰਕਿਰਿਆ ਦੌਰਾਨ ਸੀਟ ਚੋਣ ਅੱਪਸੇਲ ਨੂੰ ਬਾਈਪਾਸ ਕਰਨ ਲਈ ਨਿਰਦੇਸ਼ ਦਿੱਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਦਾਣੇਦਾਰ ਨਿਯੰਤਰਣ ਦਾ ਇਹ ਪੱਧਰ ਉਹਨਾਂ ਏਜੰਟਾਂ ਨੂੰ ਬਣਾਉਣ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ ਜੋ ਕਾਰਜਾਂ ਨੂੰ ਬਿਲਕੁਲ ਇਰਾਦੇ ਅਨੁਸਾਰ ਕਰਦੇ ਹਨ, ਖਾਸ ਉਪਭੋਗਤਾ ਤਰਜੀਹਾਂ ਜਾਂ ਕਾਰੋਬਾਰੀ ਨਿਯਮਾਂ ਦੀ ਪਾਲਣਾ ਕਰਦੇ ਹਨ।

ਅਸਲ-ਸੰਸਾਰ ਵੈੱਬ ਆਟੋਮੇਸ਼ਨ ਦੁਆਰਾ ਮੰਗੀ ਗਈ ਭਰੋਸੇਯੋਗਤਾ ਅਤੇ ਸ਼ੁੱਧਤਾ ਨੂੰ ਵਧਾਉਣ ਲਈ, SDK ਕਈ ਸ਼ਕਤੀਸ਼ਾਲੀ ਵਿਧੀਆਂ ਨੂੰ ਏਕੀਕ੍ਰਿਤ ਕਰਦਾ ਹੈ:

  • Playwright ਦੁਆਰਾ ਬ੍ਰਾਊਜ਼ਰ ਹੇਰਾਫੇਰੀ: ਮਜ਼ਬੂਤ, ਕਰਾਸ-ਬ੍ਰਾਊਜ਼ਰ ਆਟੋਮੇਸ਼ਨ ਲਈ ਪ੍ਰਸਿੱਧ Playwright ਫਰੇਮਵਰਕ ਦਾ ਲਾਭ ਉਠਾਉਂਦਾ ਹੈ, ਬ੍ਰਾਊਜ਼ਰ ਕਾਰਵਾਈਆਂ ‘ਤੇ ਬਾਰੀਕ-ਦਾਣੇ ਵਾਲਾ ਨਿਯੰਤਰਣ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।
  • API ਕਾਲਾਂ: ਏਜੰਟਾਂ ਨੂੰ ਉਪਲਬਧ ਹੋਣ ‘ਤੇ APIs ਦੁਆਰਾ ਸਿੱਧੇ ਵੈੱਬ ਸੇਵਾਵਾਂ ਨਾਲ ਗੱਲਬਾਤ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ, ਕੁਝ ਕਾਰਜਾਂ ਲਈ UI ਹੇਰਾਫੇਰੀ ਲਈ ਵਧੇਰੇ ਸਥਿਰ ਅਤੇ ਕੁਸ਼ਲ ਵਿਕਲਪ ਪੇਸ਼ ਕਰਦਾ ਹੈ।
  • Python ਇੰਟੀਗ੍ਰੇਸ਼ਨ: ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਕਸਟਮ Python ਕੋਡ ਨੂੰ ਏਮਬੈਡ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ, ਏਜੰਟ ਦੇ ਵਰਕਫਲੋ ਦੇ ਅੰਦਰ ਗੁੰਝਲਦਾਰ ਤਰਕ, ਡਾਟਾ ਪ੍ਰੋਸੈਸਿੰਗ, ਜਾਂ ਹੋਰ ਪ੍ਰਣਾਲੀਆਂ ਨਾਲ ਏਕੀਕਰਣ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦਾ ਹੈ।
  • ਪੈਰਲਲ ਥ੍ਰੈਡਿੰਗ: ਹੌਲੀ-ਲੋਡਿੰਗ ਵੈੱਬ ਪੰਨਿਆਂ ਜਾਂ ਨੈੱਟਵਰਕ ਲੇਟੈਂਸੀ ਕਾਰਨ ਹੋਣ ਵਾਲੀਆਂ ਦੇਰੀ ਨੂੰ ਘੱਟ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ, ਕੁਝ ਓਪਰੇਸ਼ਨਾਂ ਨੂੰ ਸਮਕਾਲੀ ਤੌਰ ‘ਤੇ ਚਲਾਉਣ ਦੀ ਇਜਾਜ਼ਤ ਦੇ ਕੇ, ਸਮੁੱਚੀ ਕਾਰਜ ਸੰਪੂਰਨਤਾ ਦੀ ਗਤੀ ਅਤੇ ਲਚਕਤਾ ਵਿੱਚ ਸੁਧਾਰ ਕਰਦਾ ਹੈ।

ਇਸ ਵਿਆਪਕ ਟੂਲਕਿੱਟ ਦਾ ਉਦੇਸ਼ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਉਹਨਾਂ ਉੱਨਤ ਆਟੋਮੇਸ਼ਨ ਚੁਣੌਤੀਆਂ ਨਾਲ ਨਜਿੱਠਣ ਲਈ ਲੋੜੀਂਦੀ ਲਚਕਤਾ ਅਤੇ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਨਾ ਹੈ ਜੋ ਪਹਿਲਾਂ ਅਵਿਵਹਾਰਕ ਜਾਂ ਭਰੋਸੇਯੋਗ ਨਹੀਂ ਸਨ।

ਮਾਪਣਾ: ਪ੍ਰਦਰਸ਼ਨ ਅਤੇ ਵਿਹਾਰਕ ਭਰੋਸੇਯੋਗਤਾ ‘ਤੇ ਧਿਆਨ

ਜਦੋਂ ਕਿ ਬੈਂਚਮਾਰਕ ਸਕੋਰ AI ਸੰਸਾਰ ਵਿੱਚ ਇੱਕ ਆਮ ਮੁਦਰਾ ਹਨ, Amazon ਇਸ ਗੱਲ ‘ਤੇ ਜ਼ੋਰ ਦਿੰਦਾ ਹੈ ਕਿ Nova Act ਦਾ ਵਿਕਾਸ ਸਿਰਫ਼ ਐਬਸਟਰੈਕਟ ਟੈਸਟਾਂ ‘ਤੇ ਲੀਡਰਬੋਰਡਾਂ ਵਿੱਚ ਸਿਖਰ ‘ਤੇ ਰਹਿਣ ਦੀ ਬਜਾਏ ਵਿਹਾਰਕ ਭਰੋਸੇਯੋਗਤਾ ਨੂੰ ਤਰਜੀਹ ਦਿੰਦਾ ਹੈ। ਟੀਚਾ ਉਹਨਾਂ ਏਜੰਟਾਂ ਨੂੰ ਬਣਾਉਣਾ ਹੈ ਜੋ ਅਸਲ-ਸੰਸਾਰ ਦੇ ਦ੍ਰਿਸ਼ਾਂ ਵਿੱਚ ਲਗਾਤਾਰ ਕੰਮ ਕਰਦੇ ਹਨ, ਭਾਵੇਂ ਇਸਦਾ ਮਤਲਬ ਵੈੱਬ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਲਈ ਮਹੱਤਵਪੂਰਨ ਖਾਸ ਸਮਰੱਥਾਵਾਂ ‘ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਨਾ ਹੋਵੇ।

ਇਸ ਨੇ ਕਿਹਾ, Nova Act ਖਾਸ ਤੌਰ ‘ਤੇ ਵੈੱਬ ਇੰਟਰਫੇਸਾਂ ਨਾਲ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤੇ ਗਏ ਬੈਂਚਮਾਰਕਾਂ ‘ਤੇ ਬੇਮਿਸਾਲ ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ। Amazon ਅੰਦਰੂਨੀ ਮੁਲਾਂਕਣਾਂ ‘ਤੇ 90% ਤੋਂ ਵੱਧ ਸ਼ੁੱਧਤਾ ਤੋਂ ਵੱਧ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਸਕੋਰਾਂ ਨੂੰ ਉਜਾਗਰ ਕਰਦਾ ਹੈ ਜੋ ਉਹਨਾਂ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾਉਂਦੇ ਹਨ ਜੋ ਅਕਸਰ ਪ੍ਰਤੀਯੋਗੀ ਮਾਡਲਾਂ ਨੂੰ ਚੁਣੌਤੀ ਦਿੰਦੇ ਹਨ।

ਸਥਾਪਿਤ ਬੈਂਚਮਾਰਕਾਂ ‘ਤੇ, ਨਤੀਜੇ ਕਮਾਲ ਦੇ ਹਨ:

  • ScreenSpot Web Text: ਇਹ ਬੈਂਚਮਾਰਕ ਵੈੱਬ ਪੰਨਿਆਂ ‘ਤੇ ਟੈਕਸਟ-ਅਧਾਰਿਤ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਨਾਲ ਸਬੰਧਤ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਦੀਆਂ ਹਦਾਇਤਾਂ ਦੀ ਵਿਆਖਿਆ ਕਰਨ ਦੀ AI ਦੀ ਯੋਗਤਾ ਦਾ ਮੁਲਾਂਕਣ ਕਰਦਾ ਹੈ (ਉਦਾਹਰਨ ਲਈ, ‘ਫੌਂਟ ਦਾ ਆਕਾਰ ਵਧਾਓ,’ ‘ਸਬਸਕ੍ਰਿਪਸ਼ਨਾਂ ਦਾ ਜ਼ਿਕਰ ਕਰਨ ਵਾਲਾ ਪੈਰਾਗ੍ਰਾਫ ਲੱਭੋ’)। Nova Act ਨੇ 0.939 ਦਾ ਲਗਭਗ ਸੰਪੂਰਨ ਸਕੋਰ ਪ੍ਰਾਪਤ ਕੀਤਾ, ਜੋ ਕਿ Claude 3.7 Sonnet (0.900) ਅਤੇ OpenAI ਦੇ CUA (Conceptual User Agent benchmark) (0.883) ਵਰਗੇ ਪ੍ਰਮੁੱਖ ਮਾਡਲਾਂ ਨੂੰ ਮਹੱਤਵਪੂਰਨ ਤੌਰ ‘ਤੇ ਪਛਾੜਦਾ ਹੈ।
  • ScreenSpot Web Icon: ਇਹ ਟੈਸਟ ਵਿਜ਼ੂਅਲ, ਗੈਰ-ਟੈਕਸਟ ਤੱਤਾਂ ਜਿਵੇਂ ਕਿ ਸਟਾਰ ਰੇਟਿੰਗਾਂ, ਆਈਕਨਾਂ, ਜਾਂ ਸਲਾਈਡਰਾਂ ਨਾਲ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ‘ਤੇ ਕੇਂਦ੍ਰਤ ਕਰਦਾ ਹੈ। Nova Act ਨੇ ਦੁਬਾਰਾ ਮਜ਼ਬੂਤੀ ਨਾਲ ਪ੍ਰਦਰਸ਼ਨ ਕੀਤਾ, 0.879 ਸਕੋਰ ਕੀਤਾ।

ਦਿਲਚਸਪ ਗੱਲ ਇਹ ਹੈ ਕਿ, GroundUI Web ਟੈਸਟ ‘ਤੇ, ਜੋ ਵਿਭਿੰਨ ਉਪਭੋਗਤਾ ਇੰਟਰਫੇਸ ਤੱਤਾਂ ਨੂੰ ਨੈਵੀਗੇਟ ਕਰਨ ਵਿੱਚ ਮੁਹਾਰਤ ਦਾ ਵਿਆਪਕ ਤੌਰ ‘ਤੇ ਮੁਲਾਂਕਣ ਕਰਦਾ ਹੈ, Nova Act ਨੇ ਕੁਝ ਪ੍ਰਤੀਯੋਗੀਆਂ ਦੇ ਮੁਕਾਬਲੇ ਥੋੜ੍ਹਾ ਘੱਟ ਪ੍ਰਦਰਸ਼ਨ ਦਿਖਾਇਆ। Amazon ਇਸ ਨੂੰ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਸਵੀਕਾਰ ਕਰਦਾ ਹੈ, ਇਸ ਨੂੰ ਅਸਫਲਤਾ ਵਜੋਂ ਨਹੀਂ ਬਲਕਿ ਇੱਕ ਸੁਧਾਰ ਲਈ ਨਿਸ਼ਾਨਾ ਖੇਤਰ ਵਜੋਂ ਤਿਆਰ ਕਰਦਾ ਹੈ ਕਿਉਂਕਿ ਮਾਡਲ ਚੱਲ ਰਹੀ ਸਿਖਲਾਈ ਅਤੇ ਸੁਧਾਈ ਦੁਆਰਾ ਵਿਕਸਤ ਹੁੰਦਾ ਰਹਿੰਦਾ ਹੈ। ਇਹ ਪਾਰਦਰਸ਼ਤਾ ਇੱਕ ਸੱਚਮੁੱਚ ਉਪਯੋਗੀ ਸਾਧਨ ਬਣਾਉਣ ‘ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਦੀ ਹੈ, ਇਹ ਮੰਨਦੇ ਹੋਏ ਕਿ ਵਿਕਾਸ ਇੱਕ ਦੁਹਰਾਉਣ ਵਾਲੀ ਪ੍ਰਕਿਰਿਆ ਹੈ।

ਜ਼ੋਰ ਭਰੋਸੇਯੋਗ ਐਗਜ਼ੀਕਿਊਸ਼ਨ ‘ਤੇ ਪੱਕਾ ਰਹਿੰਦਾ ਹੈ। Amazon ਇਸ ਗੱਲ ‘ਤੇ ਜ਼ੋਰ ਦਿੰਦਾ ਹੈ ਕਿ ਇੱਕ ਵਾਰ Nova Act SDK ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਬਣਾਇਆ ਗਿਆ ਏਜੰਟ ਵਿਕਾਸ ਵਿੱਚ ਸਹੀ ਅਤੇ ਭਰੋਸੇਯੋਗ ਢੰਗ ਨਾਲ ਇੱਕ ਕਾਰਜ ਕਰਦਾ ਹੈ, ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਇਸਦੀ ਤੈਨਾਤੀ ਵਿੱਚ ਉੱਚ ਵਿਸ਼ਵਾਸ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ। ਇਹਨਾਂ ਏਜੰਟਾਂ ਨੂੰ ਹੈੱਡਲੈੱਸ (ਇੱਕ ਦਿਸਣਯੋਗ ਬ੍ਰਾਊਜ਼ਰ ਵਿੰਡੋ ਤੋਂ ਬਿਨਾਂ) ਚਲਾਇਆ ਜਾ ਸਕਦਾ ਹੈ, APIs ਦੁਆਰਾ ਵੱਡੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਵਿੱਚ ਏਕੀਕ੍ਰਿਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ, ਜਾਂ ਖਾਸ ਸਮੇਂ ‘ਤੇ ਖੁਦਮੁਖਤਿਆਰੀ ਨਾਲ ਕਾਰਜ ਕਰਨ ਲਈ ਸ਼ਡਿਊਲ ਵੀ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਪ੍ਰਦਾਨ ਕੀਤੀ ਗਈ ਉਦਾਹਰਨ - ਇੱਕ ਏਜੰਟ ਜੋ ਸ਼ੁਰੂਆਤੀ ਸੈੱਟਅੱਪ ਤੋਂ ਬਾਅਦ ਬਿਨਾਂ ਕਿਸੇ ਉਪਭੋਗਤਾ ਦੇ ਦਖਲ ਦੀ ਲੋੜ ਤੋਂ ਹਰ ਮੰਗਲਵਾਰ ਸ਼ਾਮ ਨੂੰ ਡਿਲੀਵਰੀ ਲਈ ਇੱਕ ਪਸੰਦੀਦਾ ਸਲਾਦ ਦਾ ਆਰਡਰ ਦਿੰਦਾ ਹੈ - ਰੁਟੀਨ ਡਿਜੀਟਲ ਕੰਮਾਂ ਲਈ ਸਹਿਜ, ਭਰੋਸੇਮੰਦ ਆਟੋਮੇਸ਼ਨ ਦੇ ਇਸ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਨੂੰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਦਰਸਾਉਂਦਾ ਹੈ।

ਅਨੁਕੂਲਤਾ ਵਿੱਚ ਇੱਕ ਛਾਲ: UI ਸਮਝ ਨੂੰ ਸਿੱਖਣਾ ਅਤੇ ਟ੍ਰਾਂਸਫਰ ਕਰਨਾ

Nova Act ਦੇ ਸਭ ਤੋਂ ਮਜਬੂਰ ਕਰਨ ਵਾਲੇ ਪਹਿਲੂਆਂ ਵਿੱਚੋਂ ਇੱਕ ਇਸਦੀ ਉਪਭੋਗਤਾ ਇੰਟਰਫੇਸਾਂ ਦੀ ਸਮਝ ਨੂੰ ਆਮ ਬਣਾਉਣ ਅਤੇ ਇਸਨੂੰ ਘੱਟੋ-ਘੱਟ ਜਾਂ ਬਿਨਾਂ ਕਿਸੇ ਕਾਰਜ-ਵਿਸ਼ੇਸ਼ ਮੁੜ-ਸਿਖਲਾਈ ਦੇ ਨਵੇਂ ਵਾਤਾਵਰਣਾਂ ਵਿੱਚ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਲਾਗੂ ਕਰਨ ਦੀ ਕਥਿਤ ਯੋਗਤਾ ਹੈ। ਇਹ ਸਮਰੱਥਾ, ਜਿਸਨੂੰ ਅਕਸਰ ਟ੍ਰਾਂਸਫਰ ਲਰਨਿੰਗ ਕਿਹਾ ਜਾਂਦਾ ਹੈ, ਸੱਚਮੁੱਚ ਬਹੁਮੁਖੀ ਏਜੰਟ ਬਣਾਉਣ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ ਜੋ ਨਾਜ਼ੁਕ ਨਹੀਂ ਹਨ ਜਾਂ ਮਾਮੂਲੀ ਵੈੱਬਸਾਈਟ ਰੀਡਿਜ਼ਾਈਨ ਦੁਆਰਾ ਆਸਾਨੀ ਨਾਲ ਟੁੱਟ ਜਾਂਦੇ ਹਨ ਜਾਂ ਅਣਜਾਣ ਐਪਲੀਕੇਸ਼ਨ ਲੇਆਉਟ ਦਾ ਸਾਹਮਣਾ ਕਰਦੇ ਹਨ।

Amazon ਨੇ ਇੱਕ ਮਜਬੂਰ ਕਰਨ ਵਾਲਾ ਕਿੱਸਾ ਸਾਂਝਾ ਕੀਤਾ ਜਿੱਥੇ Nova Act ਨੇ ਬ੍ਰਾਊਜ਼ਰ-ਅਧਾਰਿਤ ਗੇਮਾਂ ਨੂੰ ਚਲਾਉਣ ਵਿੱਚ ਯੋਗਤਾ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕੀਤਾ, ਇਸਦੇ ਸਿਖਲਾਈ ਡੇਟਾ ਵਿੱਚ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਵੀਡੀਓ ਗੇਮ ਅਨੁਭਵ ਸ਼ਾਮਲ ਨਾ ਹੋਣ ਦੇ ਬਾਵਜੂਦ। ਇਹ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ ਮਾਡਲ ਵੈੱਬ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਦੇ ਅੰਤਰੀਵ ਸਿਧਾਂਤਾਂ ਨੂੰ ਸਿੱਖ ਰਿਹਾ ਹੈ - ਬਟਨਾਂ ਨੂੰ ਪਛਾਣਨਾ, ਵਿਜ਼ੂਅਲ ਫੀਡਬੈਕ ਦੀ ਵਿਆਖਿਆ ਕਰਨਾ, ਇਨਪੁਟ ਖੇਤਰਾਂ ਨੂੰ ਸਮਝਣਾ - ਸਿਰਫ਼ ਖਾਸ ਵੈੱਬਸਾਈਟ ਢਾਂਚਿਆਂ ਨੂੰ ਯਾਦ ਕਰਨ ਦੀ ਬਜਾਏ। ਜੇਕਰ ਇਹ ਸਮਰੱਥਾ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਵਿੱਚ ਸੱਚ ਹੈ, ਤਾਂ ਇਹ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਤਰੱਕੀ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਡਿਵੈਲਪਰ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਨਵੀਆਂ ਸਾਹਮਣੇ ਆਈਆਂ ਵੈੱਬਸਾਈਟਾਂ ਜਾਂ ਵੈੱਬ ਐਪਲੀਕੇਸ਼ਨਾਂ ‘ਤੇ ਕਾਰਜਾਂ ਨਾਲ ਨਜਿੱਠਣ ਦੇ ਸਮਰੱਥ ਏਜੰਟ ਬਣਾ ਸਕਦੇ ਹਨ, ਹਰ ਇੱਕ ਟੀਚਾ ਪਲੇਟਫਾਰਮ ਲਈ ਨਿਰੰਤਰ, ਬੇਸਪੋਕ ਸਿਖਲਾਈ ਦੀ ਲੋੜ ਨੂੰ ਨਾਟਕੀ ਢੰਗ ਨਾਲ ਘਟਾਉਂਦੇ ਹੋਏ।

ਇਹ ਅਨੁਕੂਲਤਾ Nova Act ਨੂੰ ਸਧਾਰਨ ਕਾਰਜ ਆਟੋਮੇਸ਼ਨ ਤੋਂ ਪਰੇ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਲਈ ਇੱਕ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਸ਼ਕਤੀਸ਼ਾਲੀ ਇੰਜਣ ਵਜੋਂ ਸਥਿਤੀ ਦਿੰਦੀ ਹੈ। ਇਹ ਵਧੇਰੇ ਬੁੱਧੀਮਾਨ ਵੈੱਬ ਸਕ੍ਰੈਪਰਾਂ, ਵਧੇਰੇ ਅਨੁਭਵੀ ਡਾਟਾ ਐਂਟਰੀ ਟੂਲਸ, ਜਾਂ ਵਧੇਰੇ ਸਮਰੱਥ ਪਹੁੰਚਯੋਗਤਾ ਸਹਾਇਕਾਂ ਨੂੰ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰ ਸਕਦਾ ਹੈ।

Amazon ਪਹਿਲਾਂ ਹੀ ਆਪਣੇ ਈਕੋਸਿਸਟਮ ਦੇ ਅੰਦਰ ਇਸ ਸਮਰੱਥਾ ਦਾ ਲਾਭ ਉਠਾ ਰਿਹਾ ਹੈ। Alexa+, ਇਸਦੇ ਵੌਇਸ ਅਸਿਸਟੈਂਟ ਦਾ ਪ੍ਰੀਮੀਅਮ ਟੀਅਰ, ਸਵੈ-ਨਿਰਦੇਸ਼ਿਤ ਵੈੱਬ ਨੈਵੀਗੇਸ਼ਨ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਣ ਲਈ Nova Act ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਜਦੋਂ ਕੋਈ ਉਪਭੋਗਤਾ ਅਜਿਹੀ ਬੇਨਤੀ ਕਰਦਾ ਹੈ ਜਿਸ ਨੂੰ ਮੌਜੂਦਾ Alexa ਹੁਨਰਾਂ ਜਾਂ ਉਪਲਬਧ APIs (ਇੱਕ ਆਮ ਸੀਮਾ) ਦੁਆਰਾ ਪੂਰੀ ਤਰ੍ਹਾਂ ਪੂਰਾ ਨਹੀਂ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ, ਤਾਂ Nova Act ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਕਦਮ ਰੱਖ ਸਕਦਾ ਹੈ, ਇੱਕ ਸੰਬੰਧਿਤ ਵੈੱਬਪੇਜ ਖੋਲ੍ਹ ਸਕਦਾ ਹੈ, ਅਤੇ ਸਾਈਟ ਦੇ UI ਨਾਲ ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਗੱਲਬਾਤ ਕਰਕੇ ਕਾਰਜ ਨੂੰ ਪੂਰਾ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਸਕਦਾ ਹੈ। ਇਹ AI ਸਹਾਇਕਾਂ ਦੇ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਵੱਲ ਇੱਕ ਠੋਸ ਕਦਮ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ ਜੋ ਪਹਿਲਾਂ ਤੋਂ ਬਣੇ ਏਕੀਕਰਣਾਂ ‘ਤੇ ਘੱਟ ਨਿਰਭਰ ਹਨ ਅਤੇ ਖੁੱਲ੍ਹੇ ਵੈੱਬ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਵਧੇਰੇ ਖੁਦਮੁਖਤਿਆਰੀ ਅਤੇ ਗਤੀਸ਼ੀਲ ਤੌਰ ‘ਤੇ ਕੰਮ ਕਰ ਸਕਦੇ ਹਨ।

ਅੱਗੇ ਦਾ ਰਾਹ: ਇੱਕ ਲੰਬੀ-ਮਿਆਦ ਦੀ AI ਰਣਨੀਤੀ ਵਿੱਚ ਇੱਕ ਬੁਨਿਆਦੀ ਕਦਮ

Amazon ਸਪੱਸ਼ਟ ਹੈ ਕਿ Nova Act, ਇਸਦੇ ਮੌਜੂਦਾ ਰੂਪ ਵਿੱਚ, ਇੱਕ ਬਹੁਤ ਵਿਆਪਕ, ਲੰਬੀ-ਮਿਆਦ ਦੇ ਮਿਸ਼ਨ ਦੇ ਸਿਰਫ਼ ਸ਼ੁਰੂਆਤੀ ਪੜਾਅ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਅੰਤਮ ਟੀਚਾ ਉੱਚ ਬੁੱਧੀਮਾਨ, ਅਨੁਕੂਲ, ਅਤੇ ਭਰੋਸੇਮੰਦ AI ਏਜੰਟਾਂ ਨੂੰ ਪੈਦਾ ਕਰਨਾ ਹੈ ਜੋ ਵੱਧ ਰਹੇ ਗੁੰਝਲਦਾਰ, ਬਹੁ-ਪੜਾਵੀ ਵਰਕਫਲੋ ਦਾ ਪ੍ਰਬੰਧਨ ਕਰਨ ਦੇ ਸਮਰੱਥ ਹਨ ਜੋ ਕਈ ਵੈੱਬਸਾਈਟਾਂ, ਐਪਲੀਕੇਸ਼ਨਾਂ ਅਤੇ ਸੈਸ਼ਨਾਂ ਵਿੱਚ ਫੈਲ ਸਕਦੇ ਹਨ।

ਕੰਪਨੀ ਦੀ ਰਣਨੀਤੀ ਵਿੱਚ ਸਧਾਰਨ ਪ੍ਰਦਰਸ਼ਨਾਂ ਜਾਂ ਸਿਰਫ਼ ਸੀਮਤ ਡੇਟਾਸੈਟਾਂ ‘ਤੇ ਸਿਖਲਾਈ ਤੋਂ ਪਰੇ ਜਾਣਾ ਸ਼ਾਮਲ ਹੈ। ਫੋਕਸ ਵਿਭਿੰਨ, ਅਸਲ-ਸੰਸਾਰ ਦੇ ਦ੍ਰਿਸ਼ਾਂ ਵਿੱਚ ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਤਕਨੀਕਾਂ ਨੂੰ ਲਾਗੂ ਕਰਨ ‘ਤੇ ਹੈ। ਇਸਦਾ ਮਤਲਬ ਹੈ Nova ਮਾਡਲਾਂ ਨੂੰ ਕਾਰਜਾਂ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਨ, ਸਫਲਤਾਵਾਂ ਅਤੇ ਅਸਫਲਤਾਵਾਂ ਤੋਂ ਸਿੱਖਣ, ਅਤੇ ਲਾਈਵ ਵੈੱਬ ਵਾਤਾਵਰਣ ਵਿੱਚ ਮੌਜੂਦ ਜਟਿਲਤਾਵਾਂ ਅਤੇ ਅਣਪਛਾਤੇਪਣ ਨੂੰ ਨੈਵੀਗੇਟ ਕਰਨ ਵਿੱਚ ਹੌਲੀ-ਹੌਲੀ ਮੁਹਾਰਤ ਹਾਸਲ ਕਰਨ ਦੁਆਰਾ ਸਿਖਲਾਈ ਦੇਣਾ। ਇਹ ਦੁਹਰਾਉਣ ਵਾਲੀ, ਤਜਰਬੇ-ਸੰਚਾਲਿਤ ਪਹੁੰਚ ਮਜ਼ਬੂਤੀ ਅਤੇ ਸੱਚੀ ਬੁੱਧੀ ਬਣਾਉਣ ਲਈ ਜ਼ਰੂਰੀ ਮੰਨੀ ਜਾਂਦੀ ਹੈ।

Nova Act ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਚੈਕਪੁਆਇੰਟ ਵਜੋਂ ਕੰਮ ਕਰਦਾ ਹੈ ਜਿਸਨੂੰ Amazon ਆਪਣੇ Nova ਮਾਡਲਾਂ ਦੇ ਪਰਿਵਾਰ ਲਈ ਇੱਕ ਲੰਬੀ-ਮਿਆਦ ਦੇ ਸਿਖਲਾਈ ਪਾਠਕ੍ਰਮ ਵਜੋਂ ਦਰਸਾਉਂਦਾ ਹੈ। ਇਹ AI ਏਜੰਟਾਂ ਦੇ ਲੈਂਡਸਕੇਪ ਨੂੰ ਬੁਨਿਆਦੀ ਤੌਰ ‘ਤੇ ਮੁੜ ਆਕਾਰ ਦੇਣ ਲਈ ਇੱਕ ਨਿਰੰਤਰ ਵਚਨਬੱਧਤਾ ਅਤੇ ਇੱਕ ਰਣਨੀਤਕ ਅਭਿਲਾਸ਼ਾ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਉਹਨਾਂ ਨੂੰ ਵਿਸ਼ੇਸ਼ ਸਾਧਨਾਂ ਤੋਂ ਸਾਡੇ ਡਿਜੀਟਲ ਜੀਵਨ ਨੂੰ ਨੈਵੀਗੇਟ ਕਰਨ ਵਿੱਚ ਲਾਜ਼ਮੀ ਭਾਈਵਾਲਾਂ ਵੱਲ ਲਿਜਾਣਾ। ਮੌਜੂਦਾ ਮਾਡਲ ਇੱਕ ਨੀਂਹ ਹੈ ਜਿਸ ‘ਤੇ ਸਮੇਂ ਦੇ ਨਾਲ ਵਧੇਰੇ ਉੱਨਤ ਸਮਰੱਥਾਵਾਂ ਬਣਾਈਆਂ ਜਾਣਗੀਆਂ।

ਭਵਿੱਖ ਦਾ ਸਹਿ-ਨਿਰਮਾਣ: ਡਿਵੈਲਪਰ ਕਮਿਊਨਿਟੀ ਦੀ ਲਾਜ਼ਮੀ ਭੂਮਿਕਾ

ਇਹ ਸਵੀਕਾਰ ਕਰਦੇ ਹੋਏ ਕਿ ਇਸ ਤਕਨਾਲੋਜੀ ਦੀਆਂ ਸਭ ਤੋਂ ਪਰਿਵਰਤਨਸ਼ੀਲ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੀ ਅਜੇ ਕਲਪਨਾ ਕੀਤੀ ਜਾਣੀ ਬਾਕੀ ਹੈ, Amazon ਜਾਣਬੁੱਝ ਕੇ Nova Act SDK ਦੇ ਖੋਜ ਪ੍ਰੀਵਿਊ ਦੁਆਰਾ ਡਿਵੈਲਪਰ ਕਮਿਊਨਿਟੀ ਨੂੰ ਜਲਦੀ ਸ਼ਾਮਲ ਕਰ ਰਿਹਾ ਹੈ। ਕੰਪਨੀ ਨੇ ਕਿਹਾ, ‘ਏਜੰਟਾਂ ਲਈ ਸਭ ਤੋਂ ਕੀਮਤੀ ਵਰਤੋਂ ਦੇ ਮਾਮਲੇ ਅਜੇ ਬਣਾਏ ਜਾਣੇ ਹਨ।’ ‘ਸਭ ਤੋਂ ਵਧੀਆ ਡਿਵੈਲਪਰ ਅਤੇ ਡਿਜ਼ਾਈਨਰ ਉਹਨਾਂ ਨੂੰ ਲੱਭਣਗੇ।’

ਇਹ ਰੀਲੀਜ਼ ਰਣਨੀਤੀ ਕਈ ਉਦੇਸ਼ਾਂ ਦੀ ਪੂਰਤੀ ਕਰਦੀ ਹੈ। ਇਹ ਨਵੀਨਤਾਕਾਰੀ ਬਿਲਡਰਾਂ ਨੂੰ ਤਕਨਾਲੋਜੀ ਦੇ ਨਾਲ ਹੱਥੀਂ ਅਨੁਭਵ