GPT-4o'வின் புதிய கேன்வாஸ்: உரையாடலில் படங்களை நெய்தல்

OpenAI தனது முதன்மை உரையாடல் AI ஆன GPT-4o’வின் நிலப்பரப்பை, அதன் மையத்திலேயே ஒரு நுட்பமான பட உருவாக்கத் திறனை உட்பொதிப்பதன் மூலம் அடிப்படையில் மாற்றியுள்ளது. இது வெறுமனே ஒரு கூடுதல் அம்சம் அல்லது ஒரு தனி சேவைக்கான இணைப்பு அல்ல; இது காட்சிப் பொருட்களின் உருவாக்கம் உரையாடலின் உள்ளார்ந்த பகுதியாக மாறும் ஒரு முன்னுதாரண மாற்றத்தைக் குறிக்கிறது. முன்பு, ChatGPT உடன் உரையாடும் பயனர்கள் ஒரு படத்தை விரும்பினால், அவர்கள் பெரும்பாலும் வெளிப்படையாக ஆனால் சில சமயங்களில் தனித்தனி படிகள் தேவைப்படும் வகையில், DALL·E மாதிரிக்கு அனுப்பப்பட்டனர். அந்த செயல்முறை, பயனுள்ளதாக இருந்தாலும், முக்கிய மாதிரியின் மொழியியல் புரிதலுக்கும் பட ஜெனரேட்டரின் காட்சித் தொகுப்புக்கும் இடையில் ஒரு பிரிவினையை பராமரித்தது. இப்போது, அந்த சுவர் இடிந்து விழுந்துள்ளது. GPT-4o தானாகவே ஒரு பயனரின் உரை கோரிக்கையைப் புரிந்துகொண்டு அதை பிக்சல்களாக மொழிபெயர்க்கும் உள்ளார்ந்த திறனைக் கொண்டுள்ளது, அனைத்தும் ஒரே அரட்டை அமர்வின் தொடர்ச்சியான ஓட்டத்திற்குள். இந்த ஒருங்கிணைந்த செயல்பாடு ChatGPT’யின் இலவச அடுக்கு பயனர்கள் முதல் Plus, Pro, மற்றும் Team திட்டங்களின் சந்தாதாரர்கள் வரை, அத்துடன் Sora இடைமுகத்திற்குள்ளும் பயனர்களுக்கு வெளியிடத் தொடங்கியது. நிறுவனம் இந்த திறனை அதன் Enterprise வாடிக்கையாளர்கள், கல்விப் பயனர்கள் மற்றும் API வழியாக டெவலப்பர்களுக்கு எதிர்காலத்தில் விரிவுபடுத்த எதிர்பார்க்கிறது, இது இந்த ஒருங்கிணைந்த அணுகுமுறைக்கு ஒரு பரந்த அர்ப்பணிப்பைக் குறிக்கிறது.

உரை மற்றும் பிக்சலின் தடையற்ற இணைவு

உண்மையான புதுமை ஒருங்கிணைப்பில் உள்ளது. ஒரு AI உதவியாளருடன் ஒரு கருத்தைப் பற்றி உரையாடுவதை கற்பனை செய்து பாருங்கள் - ஒருவேளை ஒரு புதிய தயாரிப்பு லோகோவிற்கான யோசனைகளை மூளைச்சலவை செய்வது அல்லது நீங்கள் எழுதும் கதையிலிருந்து ஒரு காட்சியை காட்சிப்படுத்துவது. நீங்கள் விரும்பும் படத்தை விவரித்துவிட்டு, அதை உருவாக்க வேறு கருவி அல்லது கட்டளை அமைப்புக்கு மாறுவதற்குப் பதிலாக, நீங்கள் வெறுமனே உரையாடலைத் தொடர்கிறீர்கள். நீங்கள் GPT-4o’விடம் நேரடியாகக் கேட்கலாம்: ‘அந்தக் கருத்தை விளக்குங்கள்,’ அல்லது ‘அந்தக் காட்சி எப்படி இருக்கும் என்பதைக் காட்டுங்கள்.’ AI, உரையைச் செயலாக்கவும் உருவாக்கவும் பயன்படுத்தும் அதே சூழல் புரிதலைப் பயன்படுத்தி, இப்போது அந்தப் புரிதலை ஒரு படத்தை உருவாக்குவதற்குப் பயன்படுத்துகிறது.

இந்த ஒருங்கிணைந்த மாதிரி கட்டமைப்பு சூழல் மாறுதலின் உராய்வை நீக்குகிறது. AI’க்கு ஒரு தனி பட உருவாக்க தொகுதியில் மீண்டும் விளக்கப்பட வேண்டிய அவசியமில்லை; அது இயல்பாகவே முந்தைய உரையாடல், உங்கள் கூறப்பட்ட விருப்பத்தேர்வுகள் மற்றும் உரையாடலில் முன்னர் விவாதிக்கப்பட்ட நுணுக்கங்களைப் புரிந்துகொள்கிறது. இது ஒரு சக்திவாய்ந்த திரும்பத் திரும்ப செம்மைப்படுத்தும் சுழற்சிக்கு வழிவகுக்கிறது. இந்த சாத்தியக்கூறுகளைக் கவனியுங்கள்:

  • ஆரம்ப உருவாக்கம்: நீங்கள் ‘ஒரு சன்னி கடற்கரையில் ஒரு ஃபிரிஸ்பியைப் பிடிக்கும் கோல்டன் ரெட்ரீவரின் ஒளிப்பட யதார்த்தமான படம்’ கேட்கிறீர்கள். GPT-4o அரட்டையில் படத்தை உருவாக்குகிறது.
  • செம்மைப்படுத்தல்: நீங்கள் படத்தைப் பார்த்துவிட்டு பதிலளிக்கிறீர்கள், ‘அது அருமை, ஆனால் வானத்தை பிற்பகல் போல மாற்றி, தூரத்தில் ஒரு பாய்மரப் படகைச் சேர்க்க முடியுமா?’
  • சூழல் சரிசெய்தல்: இது அதே மாதிரி என்பதால், GPT-4o ‘அது அருமை’ என்பது அது இப்போது உருவாக்கிய படத்தைக் குறிக்கிறது என்பதைப் புரிந்துகொள்கிறது. இது ‘வானத்தை பிற்பகல் போல மாற்று’ மற்றும் ‘ஒரு பாய்மரப் படகைச் சேர்’ என்பதை ஏற்கனவே உள்ள காட்சிக்கு மாற்றங்களாகப் புரிந்துகொள்கிறது, முற்றிலும் புதிய கோரிக்கைகளாக அல்ல. பின்னர் அது முக்கிய கூறுகளை (நாய், ஃபிரிஸ்பீ, கடற்கரை) பாதுகாக்கும் போது மாற்றங்களை இணைத்து, புதுப்பிக்கப்பட்ட பதிப்பை உருவாக்குகிறது.

இந்த உரையாடல் செம்மைப்படுத்தல் செயல்முறை மென்பொருளை இயக்குவது போல் குறைவாகவும், நீங்கள் விவாதித்ததை நினைவில் வைத்திருக்கும் ஒரு வடிவமைப்பு கூட்டாளியுடன் ஒத்துழைப்பது போலவும் உணர்கிறது. சிக்கலான ஸ்லைடர்களுடன் விளையாடவோ, எதிர்மறை தூண்டுதல்களைத் தனியாக உள்ளிடவோ அல்லது முதல் முயற்சி சரியாக இல்லாவிட்டால் புதிதாகத் தொடங்கவோ தேவையில்லை. நீங்கள் வெறுமனே உரையாடலைத் தொடர்கிறீர்கள், விரும்பிய காட்சி விளைவை நோக்கி AI’ஐ இயற்கையாக வழிநடத்துகிறீர்கள். இந்த நெகிழ்வான தொடர்பு காட்சி உருவாக்கத்திற்கான நுழைவுத் தடையை கணிசமாகக் குறைக்கும் மற்றும் அதை சிந்தனை மற்றும் தகவல்தொடர்புக்கான மிகவும் உள்ளுணர்வு நீட்டிப்பாக மாற்றும் திறனைக் கொண்டுள்ளது. மாதிரி ஒரு காட்சி ஒத்துழைப்பாளராக செயல்படுகிறது, முந்தைய அறிவுறுத்தல்களை அடிப்படையாகக் கொண்டு, மறு செய்கைகளில் நிலைத்தன்மையை பராமரிக்கிறது, ஒரு மனித வடிவமைப்பாளர் வரைந்து, கருத்துக்களைப் பெற்று, திருத்துவது போல.

திரைக்குப் பின்னால்: காட்சி சரளத்திற்கான பயிற்சி

OpenAI இந்த மேம்பட்ட திறனை ஒரு நுட்பமான பயிற்சி முறைக்குக் காரணம் காட்டுகிறது. மாதிரி உரை மீது மட்டும் அல்லது படங்கள் மீது மட்டும் பயிற்சி அளிக்கப்படவில்லை; அதற்கு பதிலாக, நிறுவனம் படங்கள் மற்றும் உரையின் கூட்டு விநியோகம் என்று விவரிப்பதில் இருந்து அது கற்றுக்கொண்டது. இதன் பொருள் AI பரந்த தரவுத்தொகுப்புகளுக்கு வெளிப்படுத்தப்பட்டது, அங்கு உரை விளக்கங்கள் தொடர்புடைய காட்சிகளுடன் சிக்கலான முறையில் இணைக்கப்பட்டிருந்தன. இந்த செயல்முறையின் மூலம், அது மொழியின் புள்ளிவிவர வடிவங்களையும் பொருட்களின் காட்சிப் பண்புகளையும் மட்டும் கற்றுக்கொள்ளவில்லை, ஆனால் முக்கியமாக, அது சொற்களுக்கும் படங்களுக்கும் இடையிலான சிக்கலான உறவுகளைக் கற்றுக்கொண்டது.

பயிற்சியின் போது இந்த ஆழமான ஒருங்கிணைப்பு உறுதியான நன்மைகளைத் தருகிறது:

  1. மேம்பட்ட தூண்டுதல் புரிதல்: மாதிரி அதன் முன்னோடிகளை விட கணிசமாக சிக்கலான தூண்டுதல்களைப் பாகுபடுத்தி விளக்க முடியும். முந்தைய பட உருவாக்க மாதிரிகள் பல பொருள்கள் மற்றும் குறிப்பிட்ட இடஞ்சார்ந்த அல்லது கருத்தியல் உறவுகளை உள்ளடக்கிய கோரிக்கைகளை எதிர்கொள்ளும்போது சிரமப்படலாம் அல்லது கூறுகளைப் புறக்கணிக்கலாம் என்றாலும், GPT-4o 20 தனித்துவமான கூறுகள் வரை விவரிக்கும் தூண்டுதல்களை அதிக நம்பகத்தன்மையுடன் கையாள்வதாகக் கூறப்படுகிறது. ‘ஒரு ரொட்டி விற்பனையாளர், ஒரு நீரூற்றுக்கு அருகில் வாதிடும் இரண்டு மாவீரர்கள், வண்ணமயமான பட்டுகளைக் காட்டும் ஒரு வணிகர், ஒரு நாயைத் துரத்தும் குழந்தைகள், மற்றும் பின்னணியில் ஒரு மலையில் தெரியும் ஒரு கோட்டை, ஓரளவு மேகமூட்டமான வானத்தின் கீழ் உள்ள ஒரு பரபரப்பான இடைக்கால சந்தைக் காட்சி’யைக் கோருவதை கற்பனை செய்து பாருங்கள். கூட்டு விநியோகங்களில் பயிற்சி பெற்ற ஒரு மாதிரி, குறிப்பிடப்பட்ட ஒவ்வொரு கூறுகளையும் அவற்றின் மறைமுக தொடர்புகளையும் புரிந்துகொண்டு வழங்க முயற்சிப்பதற்கு சிறப்பாகப் பொருத்தப்பட்டுள்ளது.
  2. மேம்பட்ட கருத்தியல் பிடிப்பு: பொருட்களை அங்கீகரிப்பதைத் தாண்டி, மாதிரி தூண்டுதலில் உட்பொதிக்கப்பட்ட சுருக்கமான கருத்துக்கள் மற்றும் பாணி சார்ந்த அறிவுறுத்தல்களைப் பற்றிய சிறந்த பிடிப்பை வெளிப்படுத்துகிறது. இது மனநிலை, கலைநயம் (எ.கா., ‘வான் கோவின் பாணியில்,’ ‘ஒரு மினிமலிஸ்ட் கோட்டு வரைபடமாக’), மற்றும் குறிப்பிட்ட கலவை கோரிக்கைகளின் நுணுக்கங்களை சிறப்பாக மொழிபெயர்க்க முடியும்.
  3. உரை ஒழுங்கமைவு துல்லியம்: AI பட ஜெனரேட்டர்களுக்கு ஒரு பொதுவான தடுமாற்றம் படங்களுக்குள் உரையைத் துல்லியமாக ஒழுங்கமைப்பதாகும். அது ஒரு கட்டிடத்தில் உள்ள அடையாளமாக இருந்தாலும், ஒரு டி-ஷர்ட்டில் உள்ள உரையாக இருந்தாலும், அல்லது ஒரு வரைபடத்தில் உள்ள லேபிள்களாக இருந்தாலும், மாதிரிகள் பெரும்பாலும் குழப்பமான அல்லது அர்த்தமற்ற எழுத்துக்களை உருவாக்குகின்றன. GPT-4o இந்த பகுதியில் குறிப்பிடத்தக்க முன்னேற்றத்தைக் காட்டுவதாக OpenAI எடுத்துக்காட்டுகிறது, அது உருவாக்கும் காட்சிகளுக்குள் படிக்கக்கூடிய மற்றும் சூழலுக்குப் பொருத்தமான உரையை உருவாக்கும் திறன் கொண்டது. இது உட்பொதிக்கப்பட்ட உரை முக்கியமானதாக இருக்கும் மாதிரிகள், வரைபடங்கள் மற்றும் விளக்கப்படங்களை உருவாக்குவதற்கான சாத்தியங்களைத் திறக்கிறது.

இந்த மேம்பட்ட பயிற்சி முறை, மொழியியல் மற்றும் காட்சி தரவு ஓடைகளை அடிப்படையிலிருந்து இணைத்து, GPT-4o’வை உரை நோக்கத்திற்கும் காட்சி செயலாக்கத்திற்கும் இடையிலான இடைவெளியை, இந்த முறைகள் தனித்தனியாகப் பயிற்றுவிக்கப்பட்டு பின்னர் ஒன்றாக இணைக்கப்பட்ட அமைப்புகளை விட திறம்பட குறைக்க அனுமதிக்கிறது. இதன் விளைவாக, படங்களை வெறுமனே உருவாக்கும் ஒரு AI அல்ல, ஆனால் அவற்றின் பின்னணியில் உள்ள கோரிக்கையை மிகவும் அடிப்படை மட்டத்தில் புரிந்துகொள்ளும் ஒரு AI ஆகும்.

அழகான படங்களுக்கு அப்பால் நடைமுறைத்தன்மை

கலைப்படைப்புகள், விளக்கப்படங்கள் மற்றும் கருத்தியல் காட்சிகளை உருவாக்குதல் போன்ற படைப்பாற்றல் பயன்பாடுகள் உடனடியாகத் தெரிந்தாலும், OpenAI GPT-4o’வின் ஒருங்கிணைந்த பட உருவாக்கத்தின் நடைமுறைப் பயன்பாட்டை வலியுறுத்துகிறது. குறிக்கோள் வெறும் புதுமை அல்லது கலை வெளிப்பாட்டிற்கு அப்பால் நீண்டுள்ளது; இது பல்வேறு பணிப்பாய்வுகளுக்குள் காட்சி உருவாக்கத்தை ஒரு செயல்பாட்டுக் கருவியாக உட்பொதிப்பதை நோக்கமாகக் கொண்டுள்ளது.

சாத்தியமான பயன்பாடுகளின் அகலத்தைக் கவனியுங்கள்:

  • வரைபடங்கள் மற்றும் பாய்வு விளக்கப்படங்கள்: ஒரு சிக்கலான செயல்முறையை விளக்க வேண்டுமா? GPT-4o’விடம் ‘ஒளிச்சேர்க்கைக்கான படிகளை விளக்கும் ஒரு எளிய பாய்வு விளக்கப்படத்தை உருவாக்கவும்’ அல்லது ‘ஒரு கணினி மதர்போர்டின் கூறுகளைக் காட்டும் ஒரு வரைபடத்தை உருவாக்கவும்’ என்று கேளுங்கள். மேம்பட்ட உரை ஒழுங்கமைவு லேபிள்கள் மற்றும் சிறுகுறிப்புகளுக்கு இங்கு குறிப்பாக மதிப்புமிக்கதாக இருக்கும்.
  • கல்வி உதவிகள்: ஆசிரியர்கள் மற்றும் மாணவர்கள் வரலாற்று நிகழ்வுகள், அறிவியல் கருத்துக்கள் அல்லது இலக்கியக் காட்சிகளை உடனடியாகக் காட்சிப்படுத்தலாம். ‘சுதந்திரப் பிரகடனத்தில் கையெழுத்திடுவதன் சித்தரிப்பைக் காட்டு’ அல்லது ‘நீர் சுழற்சியை விளக்கு.’
  • வணிகம் மற்றும் சந்தைப்படுத்தல்: இணையதள தளவமைப்புகள், தயாரிப்பு பேக்கேஜிங் யோசனைகள் அல்லது சமூக ஊடக இடுகைகளுக்கான விரைவான மாதிரிகளை உருவாக்கவும். விளக்கக்காட்சிகள் அல்லது உள் ஆவணங்களுக்கான எளிய விளக்கப்படங்களை உருவாக்கவும். சிக்கலான விளக்கப்பட மென்பொருளுக்குச் செல்வதற்கு முன் தரவு கருத்துக்களைக் காட்சிப்படுத்தவும். ‘ஒரு நவீன இத்தாலிய உணவகத்திற்கான மெனு வடிவமைப்பை உருவாக்கவும், பாஸ்தா உணவுகள் மற்றும் ஒயின் இணைப்புகளைக் கொண்டுள்ளது, சுத்தமான, நேர்த்தியான அழகியலுடன்’ என்று கேட்பதை கற்பனை செய்து பாருங்கள்.
  • வடிவமைப்பு மற்றும் மேம்பாடு: ஆரம்ப வடிவமைப்பு சொத்துக்களை உருவாக்கவும், ஒருவேளை ஐகான்கள் அல்லது எளிய இடைமுக கூறுகளைக் கோரவும். வெளிப்படையான பின்னணியுடன் சொத்துக்களை நேரடியாகக் கோரும் திறன், கைமுறையாக பின்னணியை அகற்றாமல் மற்ற திட்டங்களில் எளிதாக அடுக்கி வைக்க வேண்டிய வடிவமைப்பாளர்களுக்கு ஒரு குறிப்பிடத்தக்க வரப்பிரசாதமாகும்.
  • தனிப்பட்ட பயன்பாடு: தனிப்பயன் வாழ்த்து அட்டைகளை உருவாக்கவும், வீட்டுப் புதுப்பிப்பு யோசனைகளைக் காட்சிப்படுத்தவும் (‘எனது வாழ்க்கை அறையை ஒரு சேஜ் பச்சை நிறத்தில் வர்ணம் பூசிக் காட்டு’), அல்லது தனிப்பட்ட திட்டங்களுக்கு தனித்துவமான படங்களை உருவாக்கவும்.

சக்தி மாதிரியின் மொழி மற்றும் காட்சி அமைப்பு இரண்டையும் பற்றிய ஒருங்கிணைந்த புரிதலில் உள்ளது. அது எதை வரைய வேண்டும் என்பதை மட்டுமல்ல, அது எப்படி வழங்கப்பட வேண்டும் என்பதையும் விளக்க முடியும் - தளவமைப்பு, பாணி மற்றும் தூண்டுதலில் மறைமுகமாக உள்ள செயல்பாட்டுத் தேவைகளைக் கருத்தில் கொண்டு. OpenAI, மாதிரியின் துல்லியம் மற்றும் நிலைத்தன்மையை மேம்படுத்துவதற்காக பயிற்சிக்குப் பிந்தைய நுட்பங்கள் குறிப்பாகப் பயன்படுத்தப்பட்டன என்று குறிப்பிடுகிறது, உருவாக்கப்பட்ட படங்கள் பயனரின் குறிப்பிட்ட நோக்கத்துடன் மிகவும் நெருக்கமாகப் பொருந்துவதை உறுதிசெய்கிறது, அந்த நோக்கம் கலைநயமாக இருந்தாலும் அல்லது முற்றிலும் செயல்பாட்டு ரீதியாக இருந்தாலும் சரி. நடைமுறைத்தன்மையில் இந்த கவனம் பட உருவாக்க அம்சத்தை ஒரு பொம்மையாக மட்டுமல்ல, பலர் ஏற்கனவே தகவல் மீட்டெடுப்பு மற்றும் உரை உருவாக்கத்திற்காகப் பயன்படுத்தும் ஒரு தளத்தில் ஒருங்கிணைக்கப்பட்ட ஒரு பல்துறை கருவியாக நிலைநிறுத்துகிறது.

உள்ளார்ந்த அபாயங்களைக் கையாளுதல்: பாதுகாப்பு மற்றும் பொறுப்பு

சக்திவாய்ந்த உருவாக்கும் திறன்களை அறிமுகப்படுத்துவது தவிர்க்க முடியாமல் சாத்தியமான தவறான பயன்பாடு பற்றிய கவலைகளை எழுப்புகிறது. GPT-4o’வின் பட உருவாக்க அம்சங்களின் மேம்பாடு மற்றும் வரிசைப்படுத்தலில் பாதுகாப்பு ஒரு முதன்மைக் கருத்தாக இருந்துள்ளது என்று OpenAI வலியுறுத்துகிறது. AI-உருவாக்கிய காட்சிகள் தொடர்பான அபாயங்களை அங்கீகரித்து, நிறுவனம் பல பாதுகாப்பு அடுக்குகளைச் செயல்படுத்தியுள்ளது:

  • தோற்றத்தைக் கண்காணித்தல்: மாதிரியால் உருவாக்கப்பட்ட அனைத்து படங்களும் C2PA (Coalition for Content Provenance and Authenticity) தரநிலைக்கு இணங்க மெட்டாடேட்டாவுடன் உட்பொதிக்கப்பட்டுள்ளன. இந்த டிஜிட்டல் வாட்டர்மார்க் படம் AI ஆல் உருவாக்கப்பட்டது என்பதற்கான குறிகாட்டியாகச் செயல்படுகிறது, செயற்கை ஊடகத்தை நிஜ உலக புகைப்படம் எடுத்தல் அல்லது மனிதனால் உருவாக்கப்பட்ட கலையிலிருந்து வேறுபடுத்த உதவுகிறது. சாத்தியமான தவறான தகவல் அல்லது ஏமாற்றும் பயன்பாடுகளை எதிர்த்துப் போராடுவதில் இது ஒரு முக்கியமான படியாகும்.
  • உள்ளடக்க மட்டுப்படுத்தல்: OpenAI தீங்கு விளைவிக்கும் அல்லது பொருத்தமற்ற உள்ளடக்கத்தை உருவாக்கும் முயற்சிகளைக் கண்டறிந்து தடுக்க வடிவமைக்கப்பட்ட உள் கருவிகள் மற்றும் நுட்பமான மட்டுப்படுத்தல் அமைப்புகளைப் பயன்படுத்துகிறது. இதில் பின்வருவனவற்றை உருவாக்குவதற்கு எதிரான கடுமையான கட்டுப்பாடுகளைச் செயல்படுத்துவதும் அடங்கும்:
    • சம்மதமற்ற பாலியல் உள்ளடக்கம் (NC inúmeras): வெளிப்படையான நிர்வாணம் மற்றும் கிராஃபிக் படங்கள் உட்பட.
    • வெறுக்கத்தக்க அல்லது துன்புறுத்தும் உள்ளடக்கம்: தனிநபர்கள் அல்லது குழுக்களைக் கீழ்த்தரமாகக் காட்ட, பாகுபாடு காட்ட அல்லது தாக்க நோக்கம் கொண்ட காட்சிகள்.
    • சட்டவிரோத செயல்கள் அல்லது தீவிர வன்முறையை ஊக்குவிக்கும் படங்கள்.
  • உண்மையான தனிநபர்களின் பாதுகாப்பு: உண்மையான நபர்களை, குறிப்பாக பொது நபர்களை, அனுமதியின்றி சித்தரிக்கும் ஒளிப்பட யதார்த்தமான படங்களை உருவாக்குவதைத் தடுக்க குறிப்பிட்ட பாதுகாப்பு நடவடிக்கைகள் உள்ளன. இது டீப்ஃபேக்குகள் மற்றும் நற்பெயருக்கு தீங்கு விளைவிக்கும் அபாயங்களைக் குறைப்பதை நோக்கமாகக் கொண்டுள்ளது. பொது நபர்களின் படங்களை உருவாக்குவது தடைசெய்யப்படலாம் என்றாலும், ஒரு பிரபலமான கலைஞரின் பாணியில் படங்களைக் கோருவது பொதுவாக அனுமதிக்கப்படுகிறது.
  • உள் சீரமைப்பு மதிப்பீடு: எதிர்வினைத் தடுப்புக்கு அப்பால், OpenAI பட உருவாக்க அமைப்பின் பாதுகாப்பு வழிகாட்டுதல்களுடன் சீரமைப்பை முன்கூட்டியே மதிப்பிடுவதற்கு ஒரு உள் பகுத்தறிவு மாதிரியைப் பயன்படுத்துகிறது. இது மனிதனால் எழுதப்பட்ட பாதுகாப்பு விவரக்குறிப்புகளைக் குறிப்பிடுவதையும், மாதிரியின் வெளியீடுகள் மற்றும் மறுப்பு நடத்தைகள் இந்த நிறுவப்பட்ட விதிகளுக்கு இணங்குகின்றனவா என்பதை மதிப்பீடு செய்வதையும் உள்ளடக்குகிறது. இது மாதிரி பொறுப்புடன் நடந்துகொள்வதை உறுதி செய்வதற்கான மிகவும் நுட்பமான, முன்கூட்டிய அணுகுமுறையைக் குறிக்கிறது.

இந்த நடவடிக்கைகள் AI துறையில் புதுமை மற்றும் நெறிமுறைக் கருத்தாய்வுகளை சமநிலைப்படுத்துவதற்கான ஒரு தொடர்ச்சியான முயற்சியைப் பிரதிபலிக்கின்றன. எந்த அமைப்பும் முட்டாள்தனமற்றது அல்ல என்றாலும், தோற்றத்தைக் குறித்தல், உள்ளடக்க வடிகட்டுதல், குறிப்பிட்ட கட்டுப்பாடுகள் மற்றும் உள் சீரமைப்பு சோதனைகள் ஆகியவற்றின் கலவையானது, சாத்தியமான தீங்குகளைக் குறைக்கும் வகையில் இந்த சக்திவாய்ந்த தொழில்நுட்பத்தை வரிசைப்படுத்துவதற்கான ஒரு அர்ப்பணிப்பை நிரூபிக்கிறது. AI பட உருவாக்கம் மேலும் அணுகக்கூடியதாகவும் அன்றாட கருவிகளில் ஒருங்கிணைக்கப்படுவதாலும் இந்த பாதுகாப்பு நெறிமுறைகளின் செயல்திறன் மற்றும் தொடர்ச்சியான செம்மைப்படுத்தல் முக்கியமானதாக இருக்கும்.

செயல்திறன், வெளியீடு மற்றும் டெவலப்பர் அணுகல்

GPT-4o’வின் பட உருவாக்கத்தின் மேம்பட்ட நம்பகத்தன்மை மற்றும் சூழல் புரிதல் ஒரு சமரசத்துடன் வருகிறது: வேகம். இந்த மிகவும் நுட்பமான படங்களை உருவாக்குவது பொதுவாக உரை பதில்களை உருவாக்குவதை விட அதிக நேரம் எடுக்கும், சில சமயங்களில் கோரிக்கையின் சிக்கலான தன்மை மற்றும் கணினி சுமை ஆகியவற்றைப் பொறுத்து ஒரு நிமிடம் வரை தேவைப்படலாம். இது விரிவான தூண்டுதல்கள் மற்றும் உரையாடல் சூழலைத் துல்லியமாகப் பிரதிபலிக்கும் உயர்தர காட்சிகளைத் தொகுக்கத் தேவையான கணக்கீட்டு வளங்களின் விளைவாகும். பயனர்கள் ஒரு குறிப்பிட்ட அளவு பொறுமையைக் கடைப்பிடிக்க வேண்டியிருக்கலாம், காத்திருப்புக்கான பலன் விரைவான, குறைவான சூழல்-விழிப்புணர்வு மாதிரிகளுடன் ஒப்பிடும்போது அதிக கட்டுப்பாடு, அறிவுறுத்தல்களுக்கு மேம்பட்ட இணக்கம் மற்றும் ஒட்டுமொத்த உயர் படத் தரம் என்பதைப் புரிந்துகொள்ள வேண்டும்.

இந்த அம்சத்தின் வெளியீடு கட்டங்களாக நிர்வகிக்கப்படுகிறது:

  1. ஆரம்ப அணுகல்: ChatGPT’க்குள் (Free, Plus, Pro, மற்றும் Team அடுக்குகளில்) மற்றும் Sora இடைமுகத்தில் உடனடியாகக் கிடைக்கிறது. இது ஒரு பரந்த பயனர் தளத்திற்கு ஒருங்கிணைந்த உருவாக்கத்தை நேரடியாக அனுபவிக்கும் வாய்ப்பை வழங்குகிறது.
  2. வரவிருக்கும் விரிவாக்கம்: Enterprise மற்றும் Education வாடிக்கையாளர்களுக்கான அணுகல் எதிர்காலத்தில் திட்டமிடப்பட்டுள்ளது, இது நிறுவனங்கள் மற்றும் கல்வி நிறுவனங்கள் தங்கள் குறிப்பிட்ட சூழல்களில் திறனைப் பயன்படுத்த அனுமதிக்கிறது.
  3. டெவலப்பர் அணுகல்: முக்கியமாக, OpenAI GPT-4o’வின் பட உருவாக்கத் திறன்களை அதன் API வழியாக வரும் வாரங்களில் கிடைக்கச் செய்யத் திட்டமிட்டுள்ளது. இது டெவலப்பர்கள் இந்த செயல்பாட்டை நேரடியாக தங்கள் சொந்த பயன்பாடுகள் மற்றும் சேவைகளில் ஒருங்கிணைக்க அதிகாரம் அளிக்கும், இது இந்த உரையாடல் பட உருவாக்க முன்னுதாரணத்தின் அடிப்படையில் புதிய கருவிகள் மற்றும் பணிப்பாய்வுகளின் அலைக்கு வழிவகுக்கும்.

முந்தைய பணிப்பாய்வு அல்லது ஒருவேளை DALL·E மாதிரியின் குறிப்பிட்ட பண்புகளை விரும்பும் பயனர்களுக்கு, OpenAI GPT ஸ்டோரில் பிரத்யேக DALL·E GPT‘ஐ பராமரிக்கிறது. இது அந்த இடைமுகம் மற்றும் மாதிரி மாறுபாட்டிற்கான தொடர்ச்சியான அணுகலை உறுதி செய்கிறது, பயனர்களுக்கு அவர்களின் விருப்பத்தேர்வுகள் மற்றும் குறிப்பிட்ட தேவைகளின் அடிப்படையில் ஒரு தேர்வை வழங்குகிறது.

காட்சி AI சுற்றுச்சூழல் அமைப்பில் அதன் இடத்தைக் கண்டறிதல்

AI பட உருவாக்கத்தின் பரந்த நிலப்பரப்பிற்குள் GPT-4o’வின் புதிய திறனைச் சூழலாக்குவது முக்கியம். Midjourney போன்ற மிகவும் சிறப்பு வாய்ந்த கருவிகள் அவற்றின் கலைநயம் மற்றும் பிரமிக்க வைக்கும், பெரும்பாலும் சர்ரியல் காட்சிகளை உருவாக்கும் திறனுக்காகப் புகழ்பெற்றவை, இருப்பினும் வேறுபட்ட இடைமுகம் (முதன்மையாக Discord கட்டளைகள்) மூலம். Stable Diffusion மகத்தான நெகிழ்வுத்தன்மை மற்றும் தனிப்பயனாக்கத்தை வழங்குகிறது, குறிப்பாக தொழில்நுட்ப அளவுருக்கள் மற்றும் மாதிரி மாறுபாடுகளில் ஆராயத் தயாராக உள்ள பயனர்களுக்கு. Adobe அதன் Firefly மாதிரியை Photoshop மற்றும் பிற Creative Cloud பயன்பாடுகளில் ஆழமாக ஒருங்கிணைத்துள்ளது, தொழில்முறை வடிவமைப்பு பணிப்பாய்வுகளில் கவனம் செலுத்துகிறது.

GPT-4o’வின் பட உருவாக்கம், குறைந்தபட்சம் ஆரம்பத்தில், இந்த சிறப்பு வாய்ந்த கருவிகளை ஒவ்வொரு அம்சத்திலும், அதாவது மூல கலை வெளியீட்டுத் தரம் அல்லது நுணுக்கமான சரிசெய்தல் விருப்பங்களின் ஆழம் போன்றவற்றில் விஞ்சுவதை நோக்கமாகக் கொண்டிருக்க வேண்டிய அவசியமில்லை. அதன் மூலோபாய நன்மை வேறு இடத்தில் உள்ளது: வசதி மற்றும் உரையாடல் ஒருங்கிணைப்பு.

முதன்மை மதிப்பு முன்மொழிவு, மில்லியன் கணக்கானவர்கள் ஏற்கனவே உரை அடிப்படையிலான பணிகளுக்காக AI உடன் உரையாடும் சூழலுக்குள் திறமையான பட உருவாக்கத்தைக் கொண்டுவருவதாகும். இது சூழல்களை மாற்றவோ அல்லது புதிய இடைமுகத்தைக் கற்றுக்கொள்ளவோ வேண்டிய தேவையை நீக்குகிறது. பல பயனர்களுக்கு, ஒரு யோசனையை விரைவாகக் காட்சிப்படுத்தவும், ஒரு செயல்பாட்டு வரைபடத்தை உருவாக்கவும் அல்லது அவர்களின் தற்போதைய ChatGPT உரையாடலுக்குள் ஒரு ஒழுக்கமான விளக்கப்படத்தை உருவாக்கவும் உள்ள திறன், ஒரு தனி பயன்பாட்டில் கலைத் தரத்தின் முழுமையான உச்சத்தை அடைவதை விட மிகவும் மதிப்புமிக்கதாக இருக்கும்.

இந்த அணுகுமுறை பட உருவாக்கத்தை மேலும் ஜனநாயகப்படுத்துகிறது. சிக்கலான தூண்டுதல்கள் அல்லது பிரத்யேக பட உருவாக்க தளங்களால் மிரட்டப்படக்கூடிய பயனர்கள் இப்போது ஒரு பழக்கமான அமைப்பில் இயற்கையான மொழியைப் பயன்படுத்தி காட்சித் தொகுப்புடன் பரிசோதனை செய்யலாம். இது பட உருவாக்கத்தை ஒரு தனித்துவமான பணியிலிருந்து தகவல்தொடர்பு மற்றும் மூளைச்சலவையின் நெகிழ்வான நீட்டிப்பாக மாற்றுகிறது. தொழில்முறை கலைஞர்கள் மற்றும் வடிவமைப்பாளர்கள் உயர்-பங்கு வேலைகளுக்கு சிறப்பு வாய்ந்த கருவிகளைத் தொடர்ந்து நம்பியிருக்கலாம் என்றாலும், GPT-4o’வின் ஒருங்கிணைந்த அம்சம் விரைவான காட்சிப்படுத்தல்கள், கருத்தியல் வரைவுகள் மற்றும் மிகவும் பரந்த பார்வையாளர்களுக்கான அன்றாட காட்சித் தேவைகளுக்குச் செல்லக்கூடியதாக மாறும். இது யோசனைகளைப் புரிந்துகொண்டு வெளிப்படுத்தக்கூடிய AI உதவியாளர்களை நோக்கி ஒரு குறிப்பிடத்தக்க படியைக் குறிக்கிறது, ஆனால் அவற்றை நாம் பார்க்க உதவவும் முடியும்.