ਡੀਐਨਏ ਦੀ ਭਾਸ਼ਾ ਨੂੰ ਸਮਝਣਾ
ਜਨਰੇਟਿਵ AI, ਜਿਵੇਂ ਕਿ ChatGPT ਵਰਗੇ ਟੂਲਸ ਦੁਆਰਾ ਦਰਸਾਈ ਗਈ ਹੈ, ਨੇ ਸਾਡੇ ਤਕਨਾਲੋਜੀ ਨਾਲ ਗੱਲਬਾਤ ਕਰਨ ਦੇ ਤਰੀਕੇ ਵਿੱਚ ਕ੍ਰਾਂਤੀ ਲਿਆ ਦਿੱਤੀ ਹੈ। ਇਹਨਾਂ ਮਾਡਲਾਂ ਦੀ ਸ਼ਕਤੀ ਉਹਨਾਂ ਦੀ ਇੱਕ ਕ੍ਰਮ ਵਿੱਚ ਅਗਲੇ ਟੋਕਨ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਦੀ ਯੋਗਤਾ ਵਿੱਚ ਹੈ, ਭਾਵੇਂ ਇਹ ਇੱਕ ਸ਼ਬਦ ਹੋਵੇ ਜਾਂ ਸ਼ਬਦ ਦਾ ਹਿੱਸਾ। ਇਹ ਕੰਮ, ਜਦੋਂ ਵੱਡੇ ਪੈਮਾਨੇ ‘ਤੇ ਅਤੇ ਸੁਧਾਰਿਆ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਇਹ ਸਪਸ਼ਟ ਅਤੇ ਪ੍ਰਸੰਗਿਕ ਤੌਰ ‘ਤੇ ਢੁਕਵੇਂ ਟੈਕਸਟ ਦੀ ਸਿਰਜਣਾ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ। ਪਰ ਕੀ ਹੋਵੇਗਾ ਜੇ ਇਹ ਸਫਲਤਾਪੂਰਵਕ ਤਕਨਾਲੋਜੀ ਕਿਸੇ ਵੀ ਮਨੁੱਖੀ ਉਪਭਾਸ਼ਾ ਨਾਲੋਂ ਕਿਤੇ ਜ਼ਿਆਦਾ ਬੁਨਿਆਦੀ ਭਾਸ਼ਾ ‘ਤੇ ਲਾਗੂ ਕੀਤੀ ਜਾ ਸਕੇ - ਖੁਦ ਜੀਵਨ ਦੀ ਭਾਸ਼ਾ?
DNA, ਸਾਰੇ ਜੀਵਿਤ ਜੀਵਾਂ ਦਾ ਬਲੂਪ੍ਰਿੰਟ, ਨਿਊਕਲੀਓਟਾਈਡਸ ਦਾ ਬਣਿਆ ਹੁੰਦਾ ਹੈ, ਜਿਸਨੂੰ A, C, G, ਅਤੇ T ਅੱਖਰਾਂ ਦੁਆਰਾ ਦਰਸਾਇਆ ਜਾਂਦਾ ਹੈ। ਇਹ ਨਿਊਕਲੀਓਟਾਈਡਸ ਜੋੜ ਕੇ ਆਈਕੋਨਿਕ ਡਬਲ ਹੈਲਿਕਸ ਢਾਂਚਾ ਬਣਾਉਂਦੇ ਹਨ। ਇਸ ਢਾਂਚੇ ਦੇ ਅੰਦਰ ਜੀਨ ਅਤੇ ਰੈਗੂਲੇਟਰੀ ਕ੍ਰਮ ਹੁੰਦੇ ਹਨ, ਸਾਰੇ ਸਾਫ਼-ਸੁਥਰੇ ਢੰਗ ਨਾਲ ਕ੍ਰੋਮੋਸੋਮ ਵਿੱਚ ਪੈਕ ਕੀਤੇ ਜਾਂਦੇ ਹਨ, ਜੋ ਸਮੂਹਿਕ ਤੌਰ ‘ਤੇ ਜੀਨੋਮ ਬਣਾਉਂਦੇ ਹਨ। ਧਰਤੀ ‘ਤੇ ਹਰ ਪ੍ਰਜਾਤੀ ਕੋਲ ਇੱਕ ਵਿਲੱਖਣ ਜੀਨੋਮਿਕ ਕ੍ਰਮ ਹੁੰਦਾ ਹੈ, ਅਤੇ, ਅਸਲ ਵਿੱਚ, ਇੱਕ ਪ੍ਰਜਾਤੀ ਦੇ ਅੰਦਰ ਹਰੇਕ ਵਿਅਕਤੀ ਦਾ ਆਪਣਾ ਵੱਖਰਾ ਰੂਪ ਹੁੰਦਾ ਹੈ।
ਜਦੋਂ ਕਿ ਇੱਕੋ ਪ੍ਰਜਾਤੀ ਦੇ ਵਿਅਕਤੀਆਂ ਵਿਚਕਾਰ ਅੰਤਰ ਮੁਕਾਬਲਤਨ ਮਾਮੂਲੀ ਹੁੰਦੇ ਹਨ, ਜੋ ਕੁੱਲ ਜੀਨੋਮ ਦੇ ਸਿਰਫ ਇੱਕ ਛੋਟੇ ਜਿਹੇ ਹਿੱਸੇ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ, ਪ੍ਰਜਾਤੀਆਂ ਵਿਚਕਾਰ ਭਿੰਨਤਾਵਾਂ ਬਹੁਤ ਜ਼ਿਆਦਾ ਮਹੱਤਵਪੂਰਨ ਹੁੰਦੀਆਂ ਹਨ। ਉਦਾਹਰਨ ਲਈ, ਮਨੁੱਖੀ ਜੀਨੋਮ ਵਿੱਚ ਲਗਭਗ 3 ਬਿਲੀਅਨ ਬੇਸ ਜੋੜੇ ਹੁੰਦੇ ਹਨ। ਦੋ ਬੇਤਰਤੀਬੇ ਮਨੁੱਖਾਂ ਵਿਚਕਾਰ ਤੁਲਨਾ ਲਗਭਗ 3 ਮਿਲੀਅਨ ਬੇਸ ਜੋੜਿਆਂ ਦਾ ਅੰਤਰ ਦਰਸਾਉਂਦੀ ਹੈ - ਸਿਰਫ 0.1%। ਹਾਲਾਂਕਿ, ਜਦੋਂ ਮਨੁੱਖੀ ਜੀਨੋਮ ਦੀ ਤੁਲਨਾ ਸਾਡੇ ਸਭ ਤੋਂ ਨਜ਼ਦੀਕੀ ਰਿਸ਼ਤੇਦਾਰ, ਚਿੰਪੈਂਜ਼ੀ ਨਾਲ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਤਾਂ ਅੰਤਰ ਲਗਭਗ 30 ਮਿਲੀਅਨ ਬੇਸ ਜੋੜਿਆਂ ਤੱਕ ਪਹੁੰਚ ਜਾਂਦਾ ਹੈ, ਜਾਂ ਲਗਭਗ 1%।
ਇਹ ਪ੍ਰਤੀਤ ਹੁੰਦੇ ਛੋਟੇ ਭਿੰਨਤਾਵਾਂ ਉਸ ਵਿਸ਼ਾਲ ਜੈਨੇਟਿਕ ਵਿਭਿੰਨਤਾ ਲਈ ਜ਼ਿੰਮੇਵਾਰ ਹਨ ਜੋ ਅਸੀਂ ਨਾ ਸਿਰਫ ਮਨੁੱਖਾਂ ਵਿੱਚ, ਬਲਕਿ ਜੀਵਨ ਦੇ ਪੂਰੇ ਸਪੈਕਟ੍ਰਮ ਵਿੱਚ ਦੇਖਦੇ ਹਾਂ। ਹਾਲ ਹੀ ਦੇ ਸਾਲਾਂ ਵਿੱਚ, ਵਿਗਿਆਨੀਆਂ ਨੇ ਹਜ਼ਾਰਾਂ ਪ੍ਰਜਾਤੀਆਂ ਦੇ ਜੀਨੋਮ ਨੂੰ ਕ੍ਰਮਬੱਧ ਕਰਨ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਤਰੱਕੀ ਕੀਤੀ ਹੈ, ਇਸ ਗੁੰਝਲਦਾਰ ਭਾਸ਼ਾ ਦੀ ਸਾਡੀ ਸਮਝ ਨੂੰ ਲਗਾਤਾਰ ਸੁਧਾਰਿਆ ਹੈ। ਹਾਲਾਂਕਿ, ਅਸੀਂ ਅਜੇ ਵੀ ਇਸਦੀ ਜਟਿਲਤਾ ਦੀ ਸਤਹ ਨੂੰ ਖੁਰਚਣਾ ਸ਼ੁਰੂ ਕਰ ਰਹੇ ਹਾਂ।
Evo 2: DNA ਲਈ ਇੱਕ ChatGPT
Arc Institute ਦਾ Evo 2 ਮਾਡਲ ਜੀਵ ਵਿਗਿਆਨ ਦੇ ਖੇਤਰ ਵਿੱਚ ਜਨਰੇਟਿਵ AI ਨੂੰ ਲਾਗੂ ਕਰਨ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਕਦਮ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਇਹ ਮਾਡਲ, ਜੋ ਹਾਲ ਹੀ ਵਿੱਚ ਜਾਰੀ ਕੀਤਾ ਗਿਆ ਹੈ, ਇੰਜੀਨੀਅਰਿੰਗ ਦਾ ਇੱਕ ਕਮਾਲ ਦਾ ਕਾਰਨਾਮਾ ਹੈ। ਇਸਨੂੰ 9.3 ਟ੍ਰਿਲੀਅਨ DNA ਬੇਸ ਜੋੜਿਆਂ ‘ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ, ਜੋ ਕਿ ਜੀਵਨ ਦੇ ਸਾਰੇ ਡੋਮੇਨਾਂ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨ ਵਾਲੇ ਇੱਕ ਧਿਆਨ ਨਾਲ ਤਿਆਰ ਕੀਤੇ ਜੀਨੋਮਿਕ ਐਟਲਸ ਤੋਂ ਲਿਆ ਗਿਆ ਇੱਕ ਡੇਟਾਸੈੱਟ ਹੈ। ਇਸ ਨੂੰ ਪਰਿਪੇਖ ਵਿੱਚ ਰੱਖਣ ਲਈ, GPT-4 ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾਇਆ ਗਿਆ ਹੈ ਕਿ ਇਸਨੂੰ ਲਗਭਗ 6.5 ਟ੍ਰਿਲੀਅਨ ਟੋਕਨਾਂ ‘ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ, ਜਦੋਂ ਕਿ Meta ਦੇ LLaMA 3 ਅਤੇ DeepSeek V3 ਦੋਵਾਂ ਨੂੰ ਲਗਭਗ 15 ਟ੍ਰਿਲੀਅਨ ਟੋਕਨਾਂ ‘ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ। ਸਿਖਲਾਈ ਡੇਟਾ ਵਾਲੀਅਮ ਦੇ ਮਾਮਲੇ ਵਿੱਚ, Evo 2 ਪ੍ਰਮੁੱਖ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਦੇ ਨਾਲ ਮੋਢੇ ਨਾਲ ਮੋਢਾ ਜੋੜ ਕੇ ਖੜ੍ਹਾ ਹੈ।
ਪਰਿਵਰਤਨ ਦੇ ਪ੍ਰਭਾਵ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨਾ
Evo 2 ਦੀਆਂ ਮੁੱਖ ਯੋਗਤਾਵਾਂ ਵਿੱਚੋਂ ਇੱਕ ਜੀਨ ਦੇ ਅੰਦਰ ਪਰਿਵਰਤਨ ਦੇ ਪ੍ਰਭਾਵਾਂ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਦੀ ਯੋਗਤਾ ਹੈ। ਜੀਨਾਂ ਵਿੱਚ ਆਮ ਤੌਰ ‘ਤੇ ਉਹ ਨਿਰਦੇਸ਼ ਹੁੰਦੇ ਹਨ ਜੋ ਸੈੱਲ ਪ੍ਰੋਟੀਨ ਬਣਾਉਣ ਲਈ ਵਰਤਦੇ ਹਨ, ਜੋ ਜੀਵਨ ਦੇ ਬੁਨਿਆਦੀ ਨਿਰਮਾਣ ਬਲਾਕ ਹਨ। ਇਹ ਪ੍ਰੋਟੀਨ ਕਾਰਜਸ਼ੀਲ ਢਾਂਚਿਆਂ ਵਿੱਚ ਕਿਵੇਂ ਫੋਲਡ ਹੁੰਦੇ ਹਨ, ਇਹ ਇੱਕ ਹੋਰ ਗੁੰਝਲਦਾਰ ਭਵਿੱਖਬਾਣੀ ਚੁਣੌਤੀ ਹੈ, ਜਿਸਨੂੰ DeepMind ਦੇ AlphaFold ਦੁਆਰਾ ਮਸ਼ਹੂਰ ਤੌਰ ‘ਤੇ ਹੱਲ ਕੀਤਾ ਗਿਆ ਹੈ। ਪਰ ਉਦੋਂ ਕੀ ਹੁੰਦਾ ਹੈ ਜਦੋਂ ਕਿਸੇ ਜੀਨ ਦਾ ਕ੍ਰਮ ਬਦਲਿਆ ਜਾਂਦਾ ਹੈ?
ਪਰਿਵਰਤਨ ਦੇ ਨਤੀਜਿਆਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਹੋ ਸਕਦੀ ਹੈ। ਕੁਝ ਵਿਨਾਸ਼ਕਾਰੀ ਹੁੰਦੇ ਹਨ, ਜਿਸ ਨਾਲ ਗੈਰ-ਕਾਰਜਸ਼ੀਲ ਪ੍ਰੋਟੀਨ ਜਾਂ ਗੰਭੀਰ ਵਿਕਾਸ ਸੰਬੰਧੀ ਨੁਕਸ ਪੈਦਾ ਹੁੰਦੇ ਹਨ। ਦੂਸਰੇ ਨੁਕਸਾਨਦੇਹ ਹੁੰਦੇ ਹਨ, ਜਿਸ ਨਾਲ ਸੂਖਮ ਪਰ ਨੁਕਸਾਨਦੇਹ ਤਬਦੀਲੀਆਂ ਹੁੰਦੀਆਂ ਹਨ। ਬਹੁਤ ਸਾਰੇ ਪਰਿਵਰਤਨ ਨਿਰਪੱਖ ਹੁੰਦੇ ਹਨ, ਜਿਸਦਾ ਜੀਵ ‘ਤੇ ਕੋਈ ਧਿਆਨ ਦੇਣ ਯੋਗ ਪ੍ਰਭਾਵ ਨਹੀਂ ਹੁੰਦਾ। ਅਤੇ ਕੁਝ ਦੁਰਲੱਭ ਲਾਭਕਾਰੀ ਵੀ ਹੋ ਸਕਦੇ ਹਨ, ਜੋ ਕੁਝ ਵਾਤਾਵਰਣਾਂ ਵਿੱਚ ਇੱਕ ਫਾਇਦਾ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ। ਚੁਣੌਤੀ ਇਹ ਨਿਰਧਾਰਤ ਕਰਨ ਵਿੱਚ ਹੈ ਕਿ ਇੱਕ ਖਾਸ ਪਰਿਵਰਤਨ ਕਿਸ ਸ਼੍ਰੇਣੀ ਵਿੱਚ ਆਉਂਦਾ ਹੈ।
ਇਹ ਉਹ ਥਾਂ ਹੈ ਜਿੱਥੇ Evo 2 ਆਪਣੀਆਂ ਕਮਾਲ ਦੀਆਂ ਯੋਗਤਾਵਾਂ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ। ਕਈ ਤਰ੍ਹਾਂ ਦੇ ਵੇਰੀਐਂਟ ਭਵਿੱਖਬਾਣੀ ਕਾਰਜਾਂ ਵਿੱਚ, ਇਹ ਮੌਜੂਦਾ, ਬਹੁਤ ਜ਼ਿਆਦਾ ਵਿਸ਼ੇਸ਼ ਮਾਡਲਾਂ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੈ ਜਾਂ ਉਸ ਤੋਂ ਵੀ ਵੱਧ ਜਾਂਦਾ ਹੈ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਇਹ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਭਵਿੱਖਬਾਣੀ ਕਰ ਸਕਦਾ ਹੈ ਕਿ ਕਿਹੜੇ ਪਰਿਵਰਤਨ ਰੋਗ ਪੈਦਾ ਕਰਨ ਵਾਲੇ ਹੋਣ ਦੀ ਸੰਭਾਵਨਾ ਹੈ, ਜਾਂ ਜਾਣੇ-ਪਛਾਣੇ ਕੈਂਸਰ ਜੀਨਾਂ ਦੇ ਕਿਹੜੇ ਰੂਪ, ਜਿਵੇਂ ਕਿ BRCA1 (ਛਾਤੀ ਦੇ ਕੈਂਸਰ ਨਾਲ ਜੁੜਿਆ ਹੋਇਆ ਹੈ), ਡਾਕਟਰੀ ਤੌਰ ‘ਤੇ ਮਹੱਤਵਪੂਰਨ ਹਨ।
ਇਸ ਤੋਂ ਵੀ ਵੱਧ ਕਮਾਲ ਦੀ ਗੱਲ ਇਹ ਹੈ ਕਿ Evo 2 ਨੂੰ ਖਾਸ ਤੌਰ ‘ਤੇ ਮਨੁੱਖੀ ਵੇਰੀਐਂਟ ਡੇਟਾ ‘ਤੇ ਸਿਖਲਾਈ ਨਹੀਂ ਦਿੱਤੀ ਗਈ ਸੀ। ਇਸਦੀ ਸਿਖਲਾਈ ਸਿਰਫ ਮਿਆਰੀ ਮਨੁੱਖੀ ਸੰਦਰਭ ਜੀਨੋਮ ‘ਤੇ ਅਧਾਰਤ ਸੀ। ਫਿਰ ਵੀ, ਇਹ ਅਜੇ ਵੀ ਸਹੀ ਢੰਗ ਨਾਲ ਅੰਦਾਜ਼ਾ ਲਗਾ ਸਕਦਾ ਹੈ ਕਿ ਮਨੁੱਖਾਂ ਵਿੱਚ ਕਿਹੜੇ ਪਰਿਵਰਤਨ ਨੁਕਸਾਨਦੇਹ ਹੋਣ ਦੀ ਸੰਭਾਵਨਾ ਹੈ। ਇਹ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ ਮਾਡਲ ਨੇ ਬੁਨਿਆਦੀ ਵਿਕਾਸਵਾਦੀ ਰੁਕਾਵਟਾਂ ਨੂੰ ਸਿੱਖ ਲਿਆ ਹੈ ਜੋ ਜੀਨੋਮਿਕ ਕ੍ਰਮਾਂ ਨੂੰ ਨਿਯੰਤਰਿਤ ਕਰਦੇ ਹਨ। ਇਸਨੇ ਇਸ ਗੱਲ ਦੀ ਸਮਝ ਵਿਕਸਤ ਕੀਤੀ ਹੈ ਕਿ ਵੱਖ-ਵੱਖ ਪ੍ਰਜਾਤੀਆਂ ਅਤੇ ਸੰਦਰਭਾਂ ਵਿੱਚ “ਸਧਾਰਣ” DNA ਕਿਹੋ ਜਿਹਾ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ।
ਕੱਚੇ ਡੇਟਾ ਤੋਂ ਜੀਵ-ਵਿਗਿਆਨਕ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਸਿੱਖਣਾ
Evo 2 ਦੀਆਂ ਯੋਗਤਾਵਾਂ ਸਿਰਫ DNA ਕ੍ਰਮਾਂ ਵਿੱਚ ਪੈਟਰਨਾਂ ਨੂੰ ਪਛਾਣਨ ਤੋਂ ਇਲਾਵਾ ਹੋਰ ਵੀ ਫੈਲੀਆਂ ਹੋਈਆਂ ਹਨ। ਇਸਨੇ ਕੱਚੇ ਸਿਖਲਾਈ ਡੇਟਾ ਤੋਂ ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਜੀਵ-ਵਿਗਿਆਨਕ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਸਿੱਖਣ ਦੀ ਯੋਗਤਾ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕੀਤਾ ਹੈ, ਬਿਨਾਂ ਕਿਸੇ ਸਪੱਸ਼ਟ ਪ੍ਰੋਗਰਾਮਿੰਗ ਜਾਂ ਮਾਰਗਦਰਸ਼ਨ ਦੇ। ਇਹਨਾਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ:
- ਮੋਬਾਈਲ ਜੈਨੇਟਿਕ ਤੱਤ: DNA ਕ੍ਰਮ ਜੋ ਜੀਨੋਮ ਦੇ ਅੰਦਰ ਘੁੰਮ ਸਕਦੇ ਹਨ।
- ਰੈਗੂਲੇਟਰੀ ਮੋਟਿਫ: ਛੋਟੇ ਕ੍ਰਮ ਜੋ ਜੀਨ ਸਮੀਕਰਨ ਨੂੰ ਨਿਯੰਤਰਿਤ ਕਰਦੇ ਹਨ।
- ਪ੍ਰੋਟੀਨ ਸੈਕੰਡਰੀ ਢਾਂਚਾ: ਪ੍ਰੋਟੀਨ ਦੇ ਸਥਾਨਕ ਫੋਲਡਿੰਗ ਪੈਟਰਨ।
ਇਹ ਸੱਚਮੁੱਚ ਇੱਕ ਕਮਾਲ ਦੀ ਪ੍ਰਾਪਤੀ ਹੈ। ਇਹ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ Evo 2 ਸਿਰਫ DNA ਕ੍ਰਮਾਂ ਨੂੰ ਨਹੀਂ ਪੜ੍ਹ ਰਿਹਾ ਹੈ; ਇਹ ਉੱਚ-ਕ੍ਰਮ ਵਾਲੀ ਢਾਂਚਾਗਤ ਜਾਣਕਾਰੀ ਨੂੰ ਸਮਝ ਰਿਹਾ ਹੈ ਜੋ ਸਿਖਲਾਈ ਡੇਟਾ ਵਿੱਚ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਪ੍ਰਦਾਨ ਨਹੀਂ ਕੀਤੀ ਗਈ ਸੀ। ਇਹ ਉਸ ਤਰੀਕੇ ਦੇ ਸਮਾਨ ਹੈ ਜਿਸ ਤਰ੍ਹਾਂ ChatGPT ਵਿਆਕਰਣ ਦੇ ਨਿਯਮਾਂ ਨੂੰ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਸਿਖਾਏ ਬਿਨਾਂ ਵਿਆਕਰਣਿਕ ਤੌਰ ‘ਤੇ ਸਹੀ ਵਾਕ ਤਿਆਰ ਕਰ ਸਕਦਾ ਹੈ। ਇਸੇ ਤਰ੍ਹਾਂ, Evo 2 ਜੀਨੋਮ ਦੇ ਇੱਕ ਹਿੱਸੇ ਨੂੰ ਇੱਕ ਜਾਇਜ਼ ਜੀਵ-ਵਿਗਿਆਨਕ ਢਾਂਚੇ ਨਾਲ ਪੂਰਾ ਕਰ ਸਕਦਾ ਹੈ, ਭਾਵੇਂ ਉਸਨੂੰ ਇਹ ਨਾ ਦੱਸਿਆ ਗਿਆ ਹੋਵੇ ਕਿ ਜੀਨ ਜਾਂ ਪ੍ਰੋਟੀਨ ਕੀ ਹੈ।
ਨਵੇਂ DNA ਕ੍ਰਮ ਤਿਆਰ ਕਰਨਾ
ਜਿਵੇਂ GPT ਮਾਡਲ ਨਵਾਂ ਟੈਕਸਟ ਤਿਆਰ ਕਰ ਸਕਦੇ ਹਨ, Evo 2 ਪੂਰੀ ਤਰ੍ਹਾਂ ਨਵੇਂ DNA ਕ੍ਰਮ ਤਿਆਰ ਕਰ ਸਕਦਾ ਹੈ। ਇਹ ਸਿੰਥੈਟਿਕ ਬਾਇਓਲੋਜੀ ਦੇ ਖੇਤਰ ਵਿੱਚ ਦਿਲਚਸਪ ਸੰਭਾਵਨਾਵਾਂ ਖੋਲ੍ਹਦਾ ਹੈ, ਜਿੱਥੇ ਵਿਗਿਆਨੀਆਂ ਦਾ ਉਦੇਸ਼ ਵੱਖ-ਵੱਖ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਜੀਵ-ਵਿਗਿਆਨਕ ਪ੍ਰਣਾਲੀਆਂ ਨੂੰ ਡਿਜ਼ਾਈਨ ਅਤੇ ਇੰਜੀਨੀਅਰ ਕਰਨਾ ਹੈ।
Evo 2 ਦੀ ਵਰਤੋਂ ਪਹਿਲਾਂ ਹੀ ਇਹਨਾਂ ਨੂੰ ਤਿਆਰ ਕਰਨ ਲਈ ਕੀਤੀ ਜਾ ਚੁੱਕੀ ਹੈ:
- ਮਾਈਟੋਕੌਂਡਰੀਅਲ ਜੀਨੋਮ: ਮਾਈਟੋਕੌਂਡਰੀਆ ਵਿੱਚ ਪਾਇਆ ਜਾਣ ਵਾਲਾ DNA, ਸੈੱਲਾਂ ਦੇ ਪਾਵਰਹਾਊਸ।
- ਬੈਕਟੀਰੀਅਲ ਜੀਨੋਮ: ਬੈਕਟੀਰੀਆ ਦੀ ਪੂਰੀ ਜੈਨੇਟਿਕ ਸਮੱਗਰੀ।
- ਖਮੀਰ ਜੀਨੋਮ ਦੇ ਹਿੱਸੇ: ਖਮੀਰ ਦੇ DNA ਦੇ ਭਾਗ, ਇੱਕ ਆਮ ਤੌਰ ‘ਤੇ ਖੋਜ ਅਤੇ ਉਦਯੋਗ ਵਿੱਚ ਵਰਤਿਆ ਜਾਣ ਵਾਲਾ ਜੀਵ।
ਇਹ ਯੋਗਤਾਵਾਂ ਇਹਨਾਂ ਲਈ ਜੀਵਾਂ ਨੂੰ ਡਿਜ਼ਾਈਨ ਕਰਨ ਵਿੱਚ ਅਨਮੋਲ ਹੋ ਸਕਦੀਆਂ ਹਨ:
- ਬਾਇਓਮੈਨੂਫੈਕਚਰਿੰਗ: ਇੰਜੀਨੀਅਰਡ ਮਾਈਕ੍ਰੋਬਸ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਕੀਮਤੀ ਮਿਸ਼ਰਣ ਪੈਦਾ ਕਰਨਾ।
- ਕਾਰਬਨ ਕੈਪਚਰ: ਉਹਨਾਂ ਜੀਵਾਂ ਨੂੰ ਵਿਕਸਤ ਕਰਨਾ ਜੋ ਵਾਯੂਮੰਡਲ ਵਿੱਚੋਂ ਕਾਰਬਨ ਡਾਈਆਕਸਾਈਡ ਨੂੰ ਕੁਸ਼ਲਤਾ ਨਾਲ ਹਟਾ ਸਕਦੇ ਹਨ।
- ਡਰੱਗ ਸਿੰਥੇਸਿਸ: ਫਾਰਮਾਸਿਊਟੀਕਲ ਪੈਦਾ ਕਰਨ ਲਈ ਨਵੇਂ ਰਸਤੇ ਬਣਾਉਣਾ।
ਹਾਲਾਂਕਿ, Evo 2 ਦੀਆਂ ਮੌਜੂਦਾ ਸੀਮਾਵਾਂ ਨੂੰ ਸਵੀਕਾਰ ਕਰਨਾ ਮਹੱਤਵਪੂਰਨ ਹੈ, ਜਿਵੇਂ ਕਿ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਦੇ ਸ਼ੁਰੂਆਤੀ ਸੰਸਕਰਣਾਂ ਵਾਂਗ। ਹਾਲਾਂਕਿ ਇਹ ਜੀਵ-ਵਿਗਿਆਨਕ ਤੌਰ ‘ਤੇ ਸੰਭਾਵਿਤ DNA ਕ੍ਰਮ ਤਿਆਰ ਕਰ ਸਕਦਾ ਹੈ, ਇਸ ਗੱਲ ਦੀ ਕੋਈ ਗਾਰੰਟੀ ਨਹੀਂ ਹੈ ਕਿ ਇਹ ਕ੍ਰਮ ਪ੍ਰਯੋਗਾਤਮਕ ਪ੍ਰਮਾਣਿਕਤਾ ਤੋਂ ਬਿਨਾਂ ਕਾਰਜਸ਼ੀਲ ਹੋਣਗੇ। ਨਵੇਂ, ਕਾਰਜਸ਼ੀਲ DNA ਤਿਆਰ ਕਰਨਾ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਚੁਣੌਤੀ ਬਣੀ ਹੋਈ ਹੈ। ਪਰ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਵਿੱਚ ਤੇਜ਼ੀ ਨਾਲ ਤਰੱਕੀ ਨੂੰ ਧਿਆਨ ਵਿੱਚ ਰੱਖਦੇ ਹੋਏ, GPT-3 ਤੋਂ ਲੈ ਕੇ DeepSeek ਵਰਗੇ ਵਧੇਰੇ ਉੱਨਤ ਮਾਡਲਾਂ ਤੱਕ, ਇੱਕ ਅਜਿਹੇ ਭਵਿੱਖ ਦੀ ਕਲਪਨਾ ਕਰਨਾ ਆਸਾਨ ਹੈ ਜਿੱਥੇ ਜਨਰੇਟਿਵ ਬਾਇਓਲੋਜੀ ਟੂਲ ਵੱਧ ਤੋਂ ਵੱਧ ਆਧੁਨਿਕ ਅਤੇ ਸ਼ਕਤੀਸ਼ਾਲੀ ਬਣ ਜਾਂਦੇ ਹਨ।
ਓਪਨ-ਸੋਰਸ ਅਤੇ ਤੇਜ਼ ਤਰੱਕੀ
Evo 2 ਦਾ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਪਹਿਲੂ ਇਸਦਾ ਓਪਨ-ਸੋਰਸ ਸੁਭਾਅ ਹੈ। ਮਾਡਲ ਪੈਰਾਮੀਟਰ, ਪ੍ਰੀਟ੍ਰੇਨਿੰਗ ਕੋਡ, ਇਨਫਰੈਂਸ ਕੋਡ, ਅਤੇ ਪੂਰਾ ਡੇਟਾਸੈੱਟ ਜਿਸ ‘ਤੇ ਇਸਨੂੰ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ, ਸਾਰੇ ਜਨਤਕ ਤੌਰ ‘ਤੇ ਉਪਲਬਧ ਹਨ। ਇਹ ਸਹਿਯੋਗ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦਾ ਹੈ ਅਤੇ ਖੇਤਰ ਵਿੱਚ ਤਰੱਕੀ ਨੂੰ ਤੇਜ਼ ਕਰਦਾ ਹੈ।
ਇਸ ਖੇਤਰ ਵਿੱਚ ਵਿਕਾਸ ਦੀ ਗਤੀ ਵੀ ਧਿਆਨ ਦੇਣ ਯੋਗ ਹੈ। Evo 1, Evo 2 ਦਾ ਪੂਰਵਗਾਮੀ, ਕੁਝ ਮਹੀਨੇ ਪਹਿਲਾਂ, ਨਵੰਬਰ 2024 ਵਿੱਚ ਜਾਰੀ ਕੀਤਾ ਗਿਆ ਸੀ। ਇਹ ਪਹਿਲਾਂ ਹੀ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਪ੍ਰਾਪਤੀ ਸੀ, ਜਿਸਨੂੰ 300 ਬਿਲੀਅਨ ਟੋਕਨਾਂ ਵਾਲੇ ਪ੍ਰੋਕੈਰੀਓਟਿਕ ਜੀਨੋਮ ‘ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ ਅਤੇ 131,000 ਬੇਸ ਜੋੜਿਆਂ ਦੀ ਇੱਕ ਸੰਦਰਭ ਵਿੰਡੋ ਸੀ। ਹਾਲਾਂਕਿ, ਇਸਦੀ ਕਾਰਜਕੁਸ਼ਲਤਾ ਮੁਕਾਬਲਤਨ ਸੀਮਤ ਸੀ।
ਹੁਣ, ਕੁਝ ਮਹੀਨਿਆਂ ਬਾਅਦ, Evo 2 ਆ ਗਿਆ ਹੈ, ਜਿਸ ਵਿੱਚ ਸਿਖਲਾਈ ਡੇਟਾ ਦੇ ਆਕਾਰ ਵਿੱਚ 30 ਗੁਣਾ ਵਾਧਾ, ਸੰਦਰਭ ਵਿੰਡੋ ਦਾ ਅੱਠ ਗੁਣਾ ਵਿਸਤਾਰ, ਅਤੇ ਪੂਰੀ ਤਰ੍ਹਾਂ ਨਵੀਆਂ ਯੋਗਤਾਵਾਂ ਹਨ। ਇਹ ਤੇਜ਼ੀ ਨਾਲ ਵਿਕਾਸ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਵਿੱਚ ਅਸੀਂ ਜੋ ਹੈਰਾਨੀਜਨਕ ਤੌਰ ‘ਤੇ ਤੇਜ਼ ਸੁਧਾਰ ਦੇਖੇ ਹਨ, ਉਸ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਜੋ ਕਿ ਅਕਸਰ ਭੁਲੇਖਿਆਂ ਤੋਂ ਸਿਰਫ ਕੁਝ ਸਾਲਾਂ ਵਿੱਚ ਮਨੁੱਖੀ-ਪੱਧਰ ਦੀ ਮੁਹਾਰਤ ‘ਤੇ ਗੁੰਝਲਦਾਰ ਕੰਮਾਂ ਨੂੰ ਨਜਿੱਠਣ ਵਿੱਚ ਤਬਦੀਲ ਹੋ ਗਏ ਹਨ।
ਜਿਵੇਂ GPT ਮਾਡਲਾਂ ਨੇ ਭਾਸ਼ਾ ਉਤਪਾਦਨ ਵਿੱਚ ਕ੍ਰਾਂਤੀ ਲਿਆ ਦਿੱਤੀ ਹੈ, ਉਸੇ ਤਰ੍ਹਾਂ ਇਹ DNA ਭਾਸ਼ਾ ਮਾਡਲ ਜੀਵਨ ਦੇ ਕੋਡ ਬਾਰੇ ਸਾਡੀ ਸਮਝ ਨੂੰ ਬਦਲਣ ਲਈ ਤਿਆਰ ਹਨ। ਸੰਭਾਵੀ ਐਪਲੀਕੇਸ਼ਨ ਵਿਸ਼ਾਲ ਅਤੇ ਦੂਰਗਾਮੀ ਹਨ, ਜੋ ਦਵਾਈ ਤੋਂ ਲੈ ਕੇ ਖੇਤੀਬਾੜੀ ਤੋਂ ਲੈ ਕੇ ਵਾਤਾਵਰਣ ਵਿਗਿਆਨ ਤੱਕ ਦੇ ਖੇਤਰਾਂ ਵਿੱਚ ਕ੍ਰਾਂਤੀ ਲਿਆਉਣ ਦਾ ਵਾਅਦਾ ਕਰਦੇ ਹਨ। ਜੀਵ ਵਿਗਿਆਨ ਦਾ ਭਵਿੱਖ ਕਦੇ ਵੀ ਇੰਨਾ ਰੋਮਾਂਚਕ ਨਹੀਂ ਰਿਹਾ।