ਟੈਨਸੈਂਟ ਮਿਕਸ ਯੂਆਨ: ਓਪਨ-ਸੋਰਸ ਚਿੱਤਰ-ਤੋਂ-ਵੀਡੀਓ

ਵੀਡੀਓ ਸਿਰਜਣਾ ਦੇ ਦਾਇਰੇ ਦਾ ਵਿਸਤਾਰ: ਚਿੱਤਰ-ਤੋਂ-ਵੀਡੀਓ ਅਤੇ ਇਸ ਤੋਂ ਅੱਗੇ

ਮੁੱਖ ਪੇਸ਼ਕਸ਼, ਚਿੱਤਰ-ਤੋਂ-ਵੀਡੀਓ ਮਾਡਲ, ਵੀਡੀਓ ਉਤਪਾਦਨ ਨੂੰ ਸਰਲ ਬਣਾਉਣ ਵਿੱਚ ਇੱਕ ਵੱਡੀ ਛਾਲ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਇਹ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਸਥਿਰ ਚਿੱਤਰਾਂ ਨੂੰ ਗਤੀਸ਼ੀਲ 5-ਸਕਿੰਟ ਦੀਆਂ ਕਲਿੱਪਾਂ ਵਿੱਚ ਬਦਲਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ। ਉਪਭੋਗਤਾ ਇੱਕ ਚਿੱਤਰ ਅਤੇ ਲੋੜੀਂਦੀ ਗਤੀ ਅਤੇ ਕੈਮਰਾ ਐਡਜਸਟਮੈਂਟਾਂ ਦਾ ਇੱਕ ਟੈਕਸਟ ਵਰਣਨ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। Hunyuan ਫਿਰ ਚਿੱਤਰ ਨੂੰ ਸਮਝਦਾਰੀ ਨਾਲ ਐਨੀਮੇਟ ਕਰਦਾ ਹੈ, ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਪਾਲਣਾ ਕਰਦਾ ਹੈ, ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ ਫਿਟਿੰਗ ਬੈਕਗ੍ਰਾਉਂਡ ਸਾਊਂਡ ਇਫੈਕਟਸ ਨੂੰ ਵੀ ਸ਼ਾਮਲ ਕਰਦਾ ਹੈ। ਇਹ ਅਨੁਭਵੀ ਪ੍ਰਕਿਰਿਆ ਵੀਡੀਓ ਸਿਰਜਣਾ ਨੂੰ ਜਮਹੂਰੀਅਤ ਦਿੰਦੀ ਹੈ, ਇਸ ਨੂੰ ਪਹਿਲਾਂ ਨਾਲੋਂ ਕਿਤੇ ਵੱਧ ਪਹੁੰਚਯੋਗ ਬਣਾਉਂਦੀ ਹੈ।

ਪਰ ਨਵੀਨਤਾ ਉੱਥੇ ਨਹੀਂ ਰੁਕਦੀ. Tencent Hunyuan ਕਾਰਜਕੁਸ਼ਲਤਾਵਾਂ ਪੇਸ਼ ਕਰਦਾ ਹੈ ਜੋ ਸੰਭਵ ਦੀਆਂ ਸੀਮਾਵਾਂ ਨੂੰ ਅੱਗੇ ਵਧਾਉਂਦੀਆਂ ਹਨ:

  • ਲਿਪ-ਸਿੰਕਿੰਗ: ਸਥਿਰ ਪੋਰਟਰੇਟ ਵਿੱਚ ਜੀਵਨ ਦਾ ਸਾਹ ਲਓ। ਇੱਕ ਤਸਵੀਰ ਅੱਪਲੋਡ ਕਰਕੇ ਅਤੇ ਟੈਕਸਟ ਜਾਂ ਆਡੀਓ ਪ੍ਰਦਾਨ ਕਰਕੇ, ਉਪਭੋਗਤਾ ਵਿਸ਼ੇ ਨੂੰ ‘ਬੋਲਣ’ ਜਾਂ ‘ਗਾਉਣ’ ਲਈ ਮਜਬੂਰ ਕਰ ਸਕਦੇ ਹਨ। ਇਹ ਵਿਅਕਤੀਗਤ ਸਮੱਗਰੀ ਅਤੇ ਦਿਲਚਸਪ ਕਹਾਣੀ ਸੁਣਾਉਣ ਲਈ ਦਿਲਚਸਪ ਸੰਭਾਵਨਾਵਾਂ ਖੋਲ੍ਹਦਾ ਹੈ।

  • ਮੋਸ਼ਨ ਡਰਾਈਵਿੰਗ: ਕੋਰੀਓਗ੍ਰਾਫਿੰਗ ਮੂਵਮੈਂਟ ਕਦੇ ਵੀ ਸੌਖਾ ਨਹੀਂ ਰਿਹਾ। ਇੱਕ ਕਲਿੱਕ ਨਾਲ, ਉਪਭੋਗਤਾ ਡਾਂਸ ਵੀਡੀਓ ਤਿਆਰ ਕਰ ਸਕਦੇ ਹਨ, ਮਾਡਲ ਦੀ ਬਹੁਪੱਖੀਤਾ ਅਤੇ ਗੁੰਝਲਦਾਰ ਮੋਸ਼ਨ ਕਮਾਂਡਾਂ ਦੀ ਵਿਆਖਿਆ ਕਰਨ ਅਤੇ ਲਾਗੂ ਕਰਨ ਦੀ ਯੋਗਤਾ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦੇ ਹਨ।

ਇਹ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ, ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ 2K ਰੈਜ਼ੋਲਿਊਸ਼ਨ ਵੀਡੀਓ ਅਤੇ ਬੈਕਗ੍ਰਾਉਂਡ ਸਾਊਂਡ ਇਫੈਕਟਸ ਤਿਆਰ ਕਰਨ ਦੀ ਯੋਗਤਾ ਦੇ ਨਾਲ, ਵੀਡੀਓ ਜਨਰੇਸ਼ਨ ਲਈ ਇੱਕ ਵਿਆਪਕ ਅਤੇ ਸ਼ਕਤੀਸ਼ਾਲੀ ਟੂਲ ਵਜੋਂ Hunyuan ਦੀ ਸਥਿਤੀ ਨੂੰ ਮਜ਼ਬੂਤ ਕਰਦੀਆਂ ਹਨ।

ਓਪਨ ਸੋਰਸ: ਸਹਿਯੋਗ ਅਤੇ ਨਵੀਨਤਾ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਨਾ

ਚਿੱਤਰ-ਤੋਂ-ਵੀਡੀਓ ਮਾਡਲ ਨੂੰ ਓਪਨ-ਸੋਰਸ ਕਰਨ ਦਾ ਫੈਸਲਾ, Hunyuan ਟੈਕਸਟ-ਟੂ-ਵੀਡੀਓ ਮਾਡਲ ਦੇ ਪਹਿਲਾਂ ਓਪਨ-ਸੋਰਸਿੰਗ ਦੁਆਰਾ ਦਰਸਾਏ ਗਏ, ਓਪਨ ਇਨੋਵੇਸ਼ਨ ਲਈ Tencent ਦੀ ਪਿਛਲੀ ਵਚਨਬੱਧਤਾ ‘ਤੇ ਅਧਾਰਤ ਹੈ। ਸਹਿਯੋਗ ਦੀ ਇਹ ਭਾਵਨਾ ਡਿਵੈਲਪਰ ਭਾਈਚਾਰੇ ਨੂੰ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤੀ ਗਈ ਹੈ, ਅਤੇ ਨਤੀਜੇ ਆਪਣੇ ਆਪ ਲਈ ਬੋਲਦੇ ਹਨ।

ਓਪਨ-ਸੋਰਸ ਪੈਕੇਜ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ:

  • ਮਾਡਲ ਵੇਟਸ: ਮਾਡਲ ਦੀ ਮੁੱਖ ਬੁੱਧੀ ਪ੍ਰਦਾਨ ਕਰਨਾ।
  • ਅਨੁਮਾਨ ਕੋਡ: ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਮਾਡਲ ਨੂੰ ਚਲਾਉਣ ਅਤੇ ਵਰਤਣ ਦੇ ਯੋਗ ਬਣਾਉਣਾ।
  • LoRA ਸਿਖਲਾਈ ਕੋਡ: Hunyuan ਫਾਊਂਡੇਸ਼ਨ ਦੇ ਅਧਾਰ ਤੇ ਅਨੁਕੂਲਿਤ, ਵਿਸ਼ੇਸ਼ ਮਾਡਲਾਂ ਦੀ ਸਿਰਜਣਾ ਦੀ ਸਹੂਲਤ। LoRA (ਲੋ-ਰੈਂਕ ਅਡੈਪਟੇਸ਼ਨ) ਇੱਕ ਤਕਨੀਕ ਹੈ ਜੋ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਦੀ ਕੁਸ਼ਲ ਫਾਈਨ-ਟਿਊਨਿੰਗ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ, ਜਿਸ ਨਾਲ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਵਿਆਪਕ ਰੀਟ੍ਰੇਨਿੰਗ ਦੀ ਲੋੜ ਤੋਂ ਬਿਨਾਂ ਮਾਡਲ ਨੂੰ ਖਾਸ ਸ਼ੈਲੀਆਂ ਜਾਂ ਡੇਟਾਸੈਟਾਂ ਦੇ ਅਨੁਕੂਲ ਬਣਾਉਣ ਦੇ ਯੋਗ ਬਣਾਇਆ ਜਾਂਦਾ ਹੈ।

ਇਹ ਵਿਆਪਕ ਪੈਕੇਜ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਨਾ ਸਿਰਫ਼ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰਨ ਲਈ, ਸਗੋਂ ਇਸ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣ ਅਤੇ ਇਸ ‘ਤੇ ਨਿਰਮਾਣ ਕਰਨ ਲਈ ਵੀ ਉਤਸ਼ਾਹਿਤ ਕਰਦਾ ਹੈ। GitHub ਅਤੇ Hugging Face ਵਰਗੇ ਪਲੇਟਫਾਰਮਾਂ ‘ਤੇ ਉਪਲਬਧਤਾ ਵਿਆਪਕ ਪਹੁੰਚਯੋਗਤਾ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਂਦੀ ਹੈ ਅਤੇ ਇੱਕ ਸਹਿਯੋਗੀ ਵਾਤਾਵਰਣ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦੀ ਹੈ।

ਵਿਭਿੰਨ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਇੱਕ ਬਹੁਮੁਖੀ ਮਾਡਲ

Hunyuan ਚਿੱਤਰ-ਤੋਂ-ਵੀਡੀਓ ਮਾਡਲ ਇੱਕ ਪ੍ਰਭਾਵਸ਼ਾਲੀ 13 ਬਿਲੀਅਨ ਪੈਰਾਮੀਟਰਾਂ ਦਾ ਮਾਣ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ, ਜੋ ਇਸਦੇ ਆਧੁਨਿਕ ਆਰਕੀਟੈਕਚਰ ਅਤੇ ਵਿਆਪਕ ਸਿਖਲਾਈ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਇਹ ਪੈਮਾਨਾ ਇਸਨੂੰ ਵਿਸ਼ਿਆਂ ਅਤੇ ਦ੍ਰਿਸ਼ਾਂ ਦੀ ਵਿਭਿੰਨ ਸ਼੍ਰੇਣੀ ਨੂੰ ਸੰਭਾਲਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ, ਇਸ ਨੂੰ ਇਸ ਲਈ ਢੁਕਵਾਂ ਬਣਾਉਂਦਾ ਹੈ:

  • ਯਥਾਰਥਵਾਦੀ ਵੀਡੀਓ ਉਤਪਾਦਨ: ਕੁਦਰਤੀ ਹਰਕਤਾਂ ਅਤੇ ਦਿੱਖਾਂ ਦੇ ਨਾਲ ਜੀਵਨ ਵਰਗੇ ਵੀਡੀਓ ਬਣਾਉਣਾ।
  • ਐਨੀਮੇ ਅੱਖਰ ਜਨਰੇਸ਼ਨ: ਤਰਲ ਐਨੀਮੇਸ਼ਨਾਂ ਦੇ ਨਾਲ ਸ਼ੈਲੀ ਵਾਲੇ ਅੱਖਰਾਂ ਨੂੰ ਜੀਵਨ ਵਿੱਚ ਲਿਆਉਣਾ।
  • CGI ਅੱਖਰ ਸਿਰਜਣਾ: ਉੱਚ ਪੱਧਰੀ ਯਥਾਰਥਵਾਦ ਦੇ ਨਾਲ ਕੰਪਿਊਟਰ ਦੁਆਰਾ ਤਿਆਰ ਕੀਤੀ ਗਈ ਤਸਵੀਰ ਤਿਆਰ ਕਰਨਾ।

ਇਹ ਬਹੁਪੱਖੀਤਾ ਇੱਕ ਯੂਨੀਫਾਈਡ ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਪਹੁੰਚ ਤੋਂ ਪੈਦਾ ਹੁੰਦੀ ਹੈ। ਚਿੱਤਰ-ਤੋਂ-ਵੀਡੀਓ ਅਤੇ ਟੈਕਸਟ-ਟੂ-ਵੀਡੀਓ ਦੋਵੇਂ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਇੱਕੋ ਵਿਆਪਕ ਡੇਟਾਸੈਟ ‘ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ। ਇਹ ਸਾਂਝੀ ਬੁਨਿਆਦ ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦੀ ਹੈ ਕਿ ਮਾਡਲ ਵਿਜ਼ੂਅਲ ਅਤੇ ਅਰਥ ਸੰਬੰਧੀ ਜਾਣਕਾਰੀ ਦੀ ਇੱਕ ਦੌਲਤ ਨੂੰ ਹਾਸਲ ਕਰਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਵਧੇਰੇ ਇਕਸਾਰ ਅਤੇ ਪ੍ਰਸੰਗਿਕ ਤੌਰ ‘ਤੇ ਸੰਬੰਧਿਤ ਆਉਟਪੁੱਟ ਹੁੰਦੇ ਹਨ।

ਬਹੁ-ਆਯਾਮੀ ਨਿਯੰਤਰਣ: ਬਿਰਤਾਂਤ ਨੂੰ ਆਕਾਰ ਦੇਣਾ

Hunyuan ਮਾਡਲ ਨਿਯੰਤਰਣ ਦਾ ਇੱਕ ਪੱਧਰ ਪੇਸ਼ ਕਰਦਾ ਹੈ ਜੋ ਸਧਾਰਨ ਐਨੀਮੇਸ਼ਨ ਤੋਂ ਪਰੇ ਹੈ। ਵੱਖ-ਵੱਖ ਇਨਪੁਟ ਵਿਧੀਆਂ ਨੂੰ ਜੋੜ ਕੇ, ਉਪਭੋਗਤਾ ਤਿਆਰ ਕੀਤੇ ਵੀਡੀਓ ਨੂੰ ਬਾਰੀਕ-ਟਿਊਨ ਕਰ ਸਕਦੇ ਹਨ:

  • ਚਿੱਤਰ: ਬੁਨਿਆਦੀ ਵਿਜ਼ੂਅਲ ਇਨਪੁਟ, ਵੀਡੀਓ ਦੇ ਸ਼ੁਰੂਆਤੀ ਬਿੰਦੂ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨਾ।
  • ਟੈਕਸਟ: ਲੋੜੀਂਦੀਆਂ ਕਾਰਵਾਈਆਂ, ਕੈਮਰੇ ਦੀਆਂ ਹਰਕਤਾਂ, ਅਤੇ ਸਮੁੱਚੇ ਦ੍ਰਿਸ਼ ਦੀ ਗਤੀਸ਼ੀਲਤਾ ਦਾ ਵਰਣਨ ਪ੍ਰਦਾਨ ਕਰਨਾ।
  • ਆਡੀਓ: ਲਿਪ-ਸਿੰਕਿੰਗ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ, ਅੱਖਰਾਂ ਵਿੱਚ ਭਾਵਪੂਰਤਤਾ ਦੀ ਇੱਕ ਹੋਰ ਪਰਤ ਜੋੜਦਾ ਹੈ।
  • ਪੋਜ਼: ਅੱਖਰਾਂ ਦੀਆਂ ਹਰਕਤਾਂ ਅਤੇ ਕਿਰਿਆਵਾਂ ‘ਤੇ ਸਟੀਕ ਨਿਯੰਤਰਣ ਨੂੰ ਸਮਰੱਥ ਕਰਨਾ।

ਇਹ ਬਹੁ-ਆਯਾਮੀ ਨਿਯੰਤਰਣ ਸਿਰਜਣਹਾਰਾਂ ਨੂੰ ਉੱਚ ਪੱਧਰੀ ਸ਼ੁੱਧਤਾ ਦੇ ਨਾਲ ਉਹਨਾਂ ਦੇ ਵੀਡੀਓ ਦੇ ਬਿਰਤਾਂਤ ਨੂੰ ਆਕਾਰ ਦੇਣ ਦੀ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਇਹ ਉਹਨਾਂ ਵੀਡੀਓਜ਼ ਦੀ ਸਿਰਜਣਾ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ ਜੋ ਨਾ ਸਿਰਫ਼ ਦ੍ਰਿਸ਼ਟੀਗਤ ਤੌਰ ‘ਤੇ ਆਕਰਸ਼ਕ ਹਨ, ਸਗੋਂ ਖਾਸ ਸੰਦੇਸ਼ਾਂ ਅਤੇ ਭਾਵਨਾਵਾਂ ਨੂੰ ਵੀ ਵਿਅਕਤ ਕਰਦੇ ਹਨ।

ਡਿਵੈਲਪਰ ਭਾਈਚਾਰੇ ਵਿੱਚ ਇੱਕ ਸ਼ਾਨਦਾਰ ਰਿਸੈਪਸ਼ਨ

Hunyuan ਓਪਨ-ਸੋਰਸ ਰੀਲੀਜ਼ ਦਾ ਪ੍ਰਭਾਵ ਤੁਰੰਤ ਅਤੇ ਮਹੱਤਵਪੂਰਨ ਰਿਹਾ ਹੈ। ਮਾਡਲ ਨੇ ਤੇਜ਼ੀ ਨਾਲ ਟ੍ਰੈਕਸ਼ਨ ਹਾਸਲ ਕੀਤਾ, ਪਿਛਲੇ ਸਾਲ ਦਸੰਬਰ ਵਿੱਚ Hugging Face ਟ੍ਰੈਂਡਿੰਗ ਸੂਚੀ ਵਿੱਚ ਸਿਖਰ ‘ਤੇ ਰਿਹਾ। ਇਹ ਸ਼ੁਰੂਆਤੀ ਸਫਲਤਾ ਮਾਡਲ ਦੀ ਗੁਣਵੱਤਾ ਅਤੇ ਪਹੁੰਚਯੋਗ, ਸ਼ਕਤੀਸ਼ਾਲੀ ਵੀਡੀਓ ਜਨਰੇਸ਼ਨ ਟੂਲਸ ਦੀ ਮੰਗ ਦਾ ਪ੍ਰਮਾਣ ਹੈ।

ਮਾਡਲ ਦੀ ਪ੍ਰਸਿੱਧੀ ਵਧਦੀ ਜਾ ਰਹੀ ਹੈ, ਵਰਤਮਾਨ ਵਿੱਚ GitHub ‘ਤੇ 8.9K ਤੋਂ ਵੱਧ ਸਿਤਾਰੇ ਹਨ। ਇਹ ਮੈਟ੍ਰਿਕ ਡਿਵੈਲਪਰ ਭਾਈਚਾਰੇ ਦੀ ਸਰਗਰਮ ਸ਼ਮੂਲੀਅਤ ਅਤੇ Hunyuan ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਦੀ ਪੜਚੋਲ ਅਤੇ ਵਰਤੋਂ ਕਰਨ ਵਿੱਚ ਵਿਆਪਕ ਦਿਲਚਸਪੀ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ।

ਕੋਰ ਮਾਡਲ ਤੋਂ ਇਲਾਵਾ, ਡੈਰੀਵੇਟਿਵ ਕੰਮਾਂ ਦਾ ਇੱਕ ਜੀਵੰਤ ਈਕੋਸਿਸਟਮ ਉਭਰ ਰਿਹਾ ਹੈ। ਡਿਵੈਲਪਰਾਂ ਨੇ Hunyuan ਫਾਊਂਡੇਸ਼ਨ ‘ਤੇ ਨਿਰਮਾਣ ਕਰਨ ਦੇ ਮੌਕੇ ਨੂੰ ਉਤਸ਼ਾਹ ਨਾਲ ਅਪਣਾਇਆ ਹੈ, ਇਹ ਤਿਆਰ ਕਰਦੇ ਹੋਏ:

  • ਪਲੱਗਇਨ: ਮਾਡਲ ਦੀ ਕਾਰਜਕੁਸ਼ਲਤਾ ਨੂੰ ਵਧਾਉਣਾ ਅਤੇ ਇਸਨੂੰ ਹੋਰ ਸਾਧਨਾਂ ਨਾਲ ਜੋੜਨਾ।
  • ਡੈਰੀਵੇਟਿਵ ਮਾਡਲ: ਮਾਡਲ ਨੂੰ ਖਾਸ ਸ਼ੈਲੀਆਂ, ਡੇਟਾਸੈਟਾਂ, ਜਾਂ ਵਰਤੋਂ ਦੇ ਮਾਮਲਿਆਂ ਦੇ ਅਨੁਕੂਲ ਬਣਾਉਣਾ।

ਪਹਿਲਾਂ ਓਪਨ-ਸੋਰਸ ਕੀਤੇ ਗਏ Hunyuan DiT ਟੈਕਸਟ-ਟੂ-ਇਮੇਜ ਮਾਡਲ ਨੇ ਹੋਰ ਵੀ ਵੱਧ ਡੈਰੀਵੇਟਿਵ ਗਤੀਵਿਧੀ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕੀਤਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਘਰੇਲੂ ਅਤੇ ਅੰਤਰਰਾਸ਼ਟਰੀ ਪੱਧਰ ‘ਤੇ 1,600 ਤੋਂ ਵੱਧ ਡੈਰੀਵੇਟਿਵ ਮਾਡਲ ਬਣਾਏ ਗਏ ਹਨ। ਇਹ Tencent ਦੀ ਓਪਨ-ਸੋਰਸ ਰਣਨੀਤੀ ਦੇ ਲੰਬੇ ਸਮੇਂ ਦੇ ਪ੍ਰਭਾਵ ਅਤੇ ਨਵੀਨਤਾ ਦੇ ਇੱਕ ਸੰਪੰਨ ਭਾਈਚਾਰੇ ਨੂੰ ਪੈਦਾ ਕਰਨ ਦੀ ਯੋਗਤਾ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। Hunyuan ਵੀਡੀਓ ਜਨਰੇਸ਼ਨ ਮਾਡਲ ਦੇ ਡੈਰੀਵੇਟਿਵ ਸੰਸਕਰਣਾਂ ਦੀ ਗਿਣਤੀ ਪਹਿਲਾਂ ਹੀ 900 ਨੂੰ ਪਾਰ ਕਰ ਚੁੱਕੀ ਹੈ।

ਜਨਰੇਟਿਵ AI ਲਈ ਇੱਕ ਸੰਪੂਰਨ ਪਹੁੰਚ

Tencent ਦੀ ਓਪਨ ਸੋਰਸ ਪ੍ਰਤੀ ਵਚਨਬੱਧਤਾ ਵੀਡੀਓ ਜਨਰੇਸ਼ਨ ਤੋਂ ਅੱਗੇ ਹੈ। ਮਾਡਲਾਂ ਦੀ Hunyuan ਓਪਨ-ਸੋਰਸ ਲੜੀ ਵਿੱਚ ਹੁਣ ਵਿਧੀਆਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਸ਼ਾਮਲ ਹੈ, ਜਿਸ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ:

  • ਟੈਕਸਟ ਜਨਰੇਸ਼ਨ: ਇਕਸਾਰ ਅਤੇ ਪ੍ਰਸੰਗਿਕ ਤੌਰ ‘ਤੇ ਸੰਬੰਧਿਤ ਟੈਕਸਟ ਬਣਾਉਣਾ।
  • ਚਿੱਤਰ ਜਨਰੇਸ਼ਨ: ਟੈਕਸਟ ਵਰਣਨ ਤੋਂ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੀਆਂ ਤਸਵੀਰਾਂ ਤਿਆਰ ਕਰਨਾ।
  • ਵੀਡੀਓ ਜਨਰੇਸ਼ਨ: ਇਸ ਚਰਚਾ ਦਾ ਫੋਕਸ, ਚਿੱਤਰਾਂ ਅਤੇ ਟੈਕਸਟ ਤੋਂ ਗਤੀਸ਼ੀਲ ਵੀਡੀਓ ਬਣਾਉਣ ਦੇ ਯੋਗ ਬਣਾਉਣਾ।
  • 3D ਜਨਰੇਸ਼ਨ: ਤਿੰਨ-ਅਯਾਮੀ ਸਮੱਗਰੀ ਸਿਰਜਣਾ ਦੇ ਖੇਤਰ ਵਿੱਚ ਫੈਲਣਾ।

ਇਹ ਸੰਪੂਰਨ ਪਹੁੰਚ ਜਨਰੇਟਿਵ AI ਟੂਲਸ ਦੇ ਇੱਕ ਵਿਆਪਕ ਅਤੇ ਆਪਸ ਵਿੱਚ ਜੁੜੇ ਈਕੋਸਿਸਟਮ ਦੇ Tencent ਦੇ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ। Hunyuan ਓਪਨ-ਸੋਰਸ ਲੜੀ ਲਈ GitHub ‘ਤੇ ਸੰਯੁਕਤ ਫਾਲੋਇੰਗ ਅਤੇ ਸਿਤਾਰੇ 23,000 ਤੋਂ ਵੱਧ ਹਨ, ਜੋ ਡਿਵੈਲਪਰ ਭਾਈਚਾਰੇ ਦੇ ਅੰਦਰ ਇਹਨਾਂ ਤਕਨਾਲੋਜੀਆਂ ਦੀ ਵਿਆਪਕ ਮਾਨਤਾ ਅਤੇ ਅਪਣਾਉਣ ਨੂੰ ਉਜਾਗਰ ਕਰਦੇ ਹਨ।

ਵਿਸਤ੍ਰਿਤ ਤਕਨੀਕੀ ਜਾਣਕਾਰੀ: ਆਰਕੀਟੈਕਚਰ ਅਤੇ ਸਿਖਲਾਈ

Hunyuan ਵੀਡੀਓ ਜਨਰੇਸ਼ਨ ਮਾਡਲ ਦੀ ਲਚਕਤਾ ਅਤੇ ਸਕੇਲੇਬਿਲਟੀ ਇਸਦੇ ਧਿਆਨ ਨਾਲ ਡਿਜ਼ਾਈਨ ਕੀਤੇ ਆਰਕੀਟੈਕਚਰ ਅਤੇ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਜੜ੍ਹਾਂ ਹਨ। ਮਾਡਲ ਇੱਕ ਫੈਲਾਅ-ਅਧਾਰਤ ਪਹੁੰਚ ਦਾ ਲਾਭ ਉਠਾਉਂਦਾ ਹੈ, ਇੱਕ ਤਕਨੀਕ ਜੋ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੀਆਂ ਤਸਵੀਰਾਂ ਅਤੇ ਵੀਡੀਓ ਤਿਆਰ ਕਰਨ ਵਿੱਚ ਬਹੁਤ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਸਾਬਤ ਹੋਈ ਹੈ।

ਫੈਲਾਅ ਮਾਡਲ: ਇਹ ਮਾਡਲ ਕਿਸੇ ਚਿੱਤਰ ਜਾਂ ਵੀਡੀਓ ਵਿੱਚ ਹੌਲੀ-ਹੌਲੀ ਸ਼ੋਰ ਜੋੜ ਕੇ ਕੰਮ ਕਰਦੇ ਹਨ ਜਦੋਂ ਤੱਕ ਇਹ ਸ਼ੁੱਧ ਸ਼ੋਰ ਨਹੀਂ ਬਣ ਜਾਂਦਾ। ਮਾਡਲ ਫਿਰ ਇਸ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਉਲਟਾਉਣਾ ਸਿੱਖਦਾ ਹੈ, ਸ਼ੋਰ ਤੋਂ ਸ਼ੁਰੂ ਕਰਕੇ ਅਤੇ ਹੌਲੀ-ਹੌਲੀ ਇਸਨੂੰ ਹਟਾ ਕੇ ਇੱਕ ਇਕਸਾਰ ਚਿੱਤਰ ਜਾਂ ਵੀਡੀਓ ਤਿਆਰ ਕਰਦਾ ਹੈ। ਇਹ ਦੁਹਰਾਓ ਵਾਲੀ ਸ਼ੁੱਧਤਾ ਪ੍ਰਕਿਰਿਆ ਬਹੁਤ ਵਿਸਤ੍ਰਿਤ ਅਤੇ ਯਥਾਰਥਵਾਦੀ ਆਉਟਪੁੱਟਾਂ ਦੀ ਸਿਰਜਣਾ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ।

ਯੂਨੀਫਾਈਡ ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ: ਜਿਵੇਂ ਕਿ ਪਹਿਲਾਂ ਦੱਸਿਆ ਗਿਆ ਹੈ, ਚਿੱਤਰ-ਤੋਂ-ਵੀਡੀਓ ਅਤੇ ਟੈਕਸਟ-ਟੂ-ਵੀਡੀਓ ਸਮਰੱਥਾਵਾਂ ਇੱਕ ਸਾਂਝਾ ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਡੇਟਾਸੈਟ ਸਾਂਝਾ ਕਰਦੀਆਂ ਹਨ। ਇਹ ਪਹੁੰਚ ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦੀ ਹੈ ਕਿ ਮਾਡਲ ਵਿਜ਼ੂਅਲ ਅਤੇ ਅਰਥ ਸੰਬੰਧੀ ਜਾਣਕਾਰੀ ਦੀ ਇੱਕ ਏਕੀਕ੍ਰਿਤ ਪ੍ਰਤੀਨਿਧਤਾ ਸਿੱਖਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਵੱਖ-ਵੱਖ ਵਿਧੀਆਂ ਵਿੱਚ ਸੁਧਾਰੀ ਇਕਸਾਰਤਾ ਅਤੇ ਇਕਸਾਰਤਾ ਹੁੰਦੀ ਹੈ।

ਟੈਂਪੋਰਲ ਮਾਡਲਿੰਗ: ਵੀਡੀਓ ਦੀ ਗਤੀਸ਼ੀਲਤਾ ਨੂੰ ਹਾਸਲ ਕਰਨ ਲਈ, ਮਾਡਲ ਟੈਂਪੋਰਲ ਮਾਡਲਿੰਗ ਤਕਨੀਕਾਂ ਨੂੰ ਸ਼ਾਮਲ ਕਰਦਾ ਹੈ। ਇਹ ਤਕਨੀਕਾਂ ਮਾਡਲ ਨੂੰ ਇੱਕ ਵੀਡੀਓ ਵਿੱਚ ਫਰੇਮਾਂ ਵਿਚਕਾਰ ਸਬੰਧਾਂ ਨੂੰ ਸਮਝਣ ਅਤੇ ਨਿਰਵਿਘਨ ਅਤੇ ਕੁਦਰਤੀ ਤਬਦੀਲੀਆਂ ਪੈਦਾ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦੀਆਂ ਹਨ।

ਕੈਮਰਾ ਨਿਯੰਤਰਣ: ਕੈਮਰੇ ਦੀਆਂ ਹਰਕਤਾਂ ਦੇ ਨਿਰਦੇਸ਼ਾਂ ਦਾ ਜਵਾਬ ਦੇਣ ਦੀ ਮਾਡਲ ਦੀ ਯੋਗਤਾ ਇੱਕ ਮੁੱਖ ਅੰਤਰ ਹੈ। ਇਹ ਮਾਡਲ ਦੇ ਇਨਪੁਟ ਅਤੇ ਸਿਖਲਾਈ ਡੇਟਾ ਵਿੱਚ ਕੈਮਰਾ ਪੈਰਾਮੀਟਰਾਂ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨ ਦੁਆਰਾ ਪ੍ਰਾਪਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਮਾਡਲ ਸੰਬੰਧਿਤ ਵਿਜ਼ੂਅਲ ਤਬਦੀਲੀਆਂ ਦੇ ਨਾਲ ਖਾਸ ਕੈਮਰੇ ਦੀਆਂ ਹਰਕਤਾਂ ਨੂੰ ਜੋੜਨਾ ਸਿੱਖਦਾ ਹੈ, ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਤਿਆਰ ਕੀਤੇ ਵੀਡੀਓ ਦੇ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਅਤੇ ਫਰੇਮਿੰਗ ਨੂੰ ਨਿਯੰਤਰਿਤ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ।

ਨੁਕਸਾਨ ਫੰਕਸ਼ਨ: ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਧਿਆਨ ਨਾਲ ਡਿਜ਼ਾਈਨ ਕੀਤੇ ਨੁਕਸਾਨ ਫੰਕਸ਼ਨਾਂ ਦੁਆਰਾ ਸੇਧਿਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਇਹ ਫੰਕਸ਼ਨ ਤਿਆਰ ਕੀਤੇ ਵੀਡੀਓ ਅਤੇ ਜ਼ਮੀਨੀ ਸੱਚਾਈ ਵਾਲੇ ਵੀਡੀਓ ਵਿਚਕਾਰ ਅੰਤਰ ਨੂੰ ਮਾਪਦੇ ਹਨ, ਮਾਡਲ ਨੂੰ ਫੀਡਬੈਕ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ ਅਤੇ ਇਸਦੀ ਸਿਖਲਾਈ ਦਾ ਮਾਰਗਦਰਸ਼ਨ ਕਰਦੇ ਹਨ। ਨੁਕਸਾਨ ਫੰਕਸ਼ਨਾਂ ਵਿੱਚ ਆਮ ਤੌਰ ‘ਤੇ ਉਹ ਸ਼ਰਤਾਂ ਸ਼ਾਮਲ ਹੁੰਦੀਆਂ ਹਨ ਜੋ ਉਤਸ਼ਾਹਿਤ ਕਰਦੀਆਂ ਹਨ:

  • ਚਿੱਤਰ ਗੁਣਵੱਤਾ: ਇਹ ਯਕੀਨੀ ਬਣਾਉਣਾ ਕਿ ਵਿਅਕਤੀਗਤ ਫਰੇਮ ਤਿੱਖੇ ਅਤੇ ਦ੍ਰਿਸ਼ਟੀਗਤ ਤੌਰ ‘ਤੇ ਆਕਰਸ਼ਕ ਹਨ।
  • ਸਥਾਈ ਇਕਸਾਰਤਾ: ਫਰੇਮਾਂ ਵਿਚਕਾਰ ਨਿਰਵਿਘਨ ਅਤੇ ਕੁਦਰਤੀ ਤਬਦੀਲੀਆਂ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਨਾ।
  • ਅਰਥ ਸੰਬੰਧੀ ਸ਼ੁੱਧਤਾ: ਇਹ ਯਕੀਨੀ ਬਣਾਉਣਾ ਕਿ ਤਿਆਰ ਕੀਤਾ ਵੀਡੀਓ ਇਨਪੁਟ ਟੈਕਸਟ ਅਤੇ ਹੋਰ ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਸਹੀ ਰੂਪ ਵਿੱਚ ਦਰਸਾਉਂਦਾ ਹੈ।

ਹਾਈਪਰਪੈਰਾਮੀਟਰ ਟਿਊਨਿੰਗ: ਮਾਡਲ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਹਾਈਪਰਪੈਰਾਮੀਟਰਾਂ ਦੀ ਇੱਕ ਸ਼੍ਰੇਣੀ ਦੁਆਰਾ ਵੀ ਪ੍ਰਭਾਵਿਤ ਹੁੰਦੀ ਹੈ, ਜਿਵੇਂ ਕਿ ਸਿੱਖਣ ਦੀ ਦਰ, ਬੈਚ ਦਾ ਆਕਾਰ, ਅਤੇ ਸਿਖਲਾਈ ਦੁਹਰਾਓ ਦੀ ਗਿਣਤੀ। ਇਹਨਾਂ ਪੈਰਾਮੀਟਰਾਂ ਨੂੰ ਮਾਡਲ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣ ਅਤੇ ਇਹ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਧਿਆਨ ਨਾਲ ਟਿਊਨ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਕਿ ਇਹ ਇੱਕ ਸਥਿਰ ਅਤੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਹੱਲ ਲਈ ਇਕਸਾਰ ਹੋਵੇ।

LoRA ਫਾਇਦਾ: ਓਪਨ-ਸੋਰਸ ਪੈਕੇਜ ਵਿੱਚ LoRA ਸਿਖਲਾਈ ਕੋਡ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨਾ ਡਿਵੈਲਪਰਾਂ ਲਈ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਲਾਭ ਹੈ। LoRA ਵਿਆਪਕ ਰੀਟ੍ਰੇਨਿੰਗ ਦੀ ਲੋੜ ਤੋਂ ਬਿਨਾਂ ਮਾਡਲ ਦੀ ਕੁਸ਼ਲ ਫਾਈਨ-ਟਿਊਨਿੰਗ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ। ਇਹ ਮਾਡਲ ਨੂੰ ਖਾਸ ਸ਼ੈਲੀਆਂ ਜਾਂ ਡੇਟਾਸੈਟਾਂ ਦੇ ਅਨੁਕੂਲ ਬਣਾਉਣ ਲਈ ਖਾਸ ਤੌਰ ‘ਤੇ ਲਾਭਦਾਇਕ ਹੈ। ਉਦਾਹਰਨ ਲਈ, ਇੱਕ ਡਿਵੈਲਪਰ ਕਿਸੇ ਖਾਸ ਕਲਾਕਾਰ ਦੀ ਸ਼ੈਲੀ ਵਿੱਚ ਵੀਡੀਓ ਤਿਆਰ ਕਰਨ ਲਈ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ LoRA ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦਾ ਹੈ ਜਾਂ ਇਸਨੂੰ ਕਿਸੇ ਖਾਸ ਕਿਸਮ ਦੀ ਸਮੱਗਰੀ, ਜਿਵੇਂ ਕਿ ਮੈਡੀਕਲ ਇਮੇਜਿੰਗ ਜਾਂ ਵਿਗਿਆਨਕ ਸਿਮੂਲੇਸ਼ਨਾਂ ਲਈ ਵਿਸ਼ੇਸ਼ ਬਣਾ ਸਕਦਾ ਹੈ।

ਇਹਨਾਂ ਆਰਕੀਟੈਕਚਰਲ ਅਤੇ ਸਿਖਲਾਈ ਦੇ ਵੇਰਵਿਆਂ ਦਾ ਸੁਮੇਲ Hunyuan ਮਾਡਲ ਦੀ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਕਾਰਗੁਜ਼ਾਰੀ ਅਤੇ ਬਹੁਪੱਖੀਤਾ ਵਿੱਚ ਯੋਗਦਾਨ ਪਾਉਂਦਾ ਹੈ। ਮਾਡਲ ਦੀ ਓਪਨ-ਸੋਰਸ ਪ੍ਰਕਿਰਤੀ ਖੋਜਕਰਤਾਵਾਂ ਅਤੇ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਇਹਨਾਂ ਵੇਰਵਿਆਂ ਵਿੱਚ ਡੂੰਘਾਈ ਨਾਲ ਖੋਜ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ, ਵੀਡੀਓ ਜਨਰੇਸ਼ਨ ਦੇ ਖੇਤਰ ਨੂੰ ਹੋਰ ਅੱਗੇ ਵਧਾਉਂਦੀ ਹੈ।

ਓਪਨ-ਸੋਰਸ Hunyuan ਚਿੱਤਰ-ਤੋਂ-ਵੀਡੀਓ ਮਾਡਲ ਦੀ ਰਿਲੀਜ਼ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਮੀਲ ਪੱਥਰ ਹੈ। ਇਹ ਨਾ ਸਿਰਫ਼ ਸਿਰਜਣਹਾਰਾਂ ਲਈ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਟੂਲ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਇਹ ਇੱਕ ਭਾਈਚਾਰੇ ਨੂੰ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਸਹਿਯੋਗ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦਾ ਹੈ ਅਤੇ ਵੀਡੀਓ ਜਨਰੇਸ਼ਨ ਤਕਨਾਲੋਜੀ ਦੀ ਪ੍ਰਗਤੀ ਨੂੰ ਤੇਜ਼ ਕਰਦਾ ਹੈ।