மதிப்பீட்டு முறை: பன்முக அணுகுமுறை
HKU பிசினஸ் ஸ்கூல் ஆராய்ச்சிக் குழு பயன்படுத்திய மதிப்பீட்டு முறையானது, AI மாடல்களின் பட உருவாக்கத் திறன்களைப் பற்றிய முழுமையான மற்றும் புறநிலை மதிப்பீட்டை வழங்குவதற்காக வடிவமைக்கப்பட்டது. இந்த ஆய்வு இரண்டு முக்கிய பணிகளை மையமாகக் கொண்டது:
- புதிய பட உருவாக்கம்: உரைத் தூண்டுதல்களில் இருந்து படங்களை உருவாக்கும் மாதிரிகளின் திறனை மதிப்பிடுதல்.
- படத் திருத்தம்: குறிப்பிட்ட வழிமுறைகளின் அடிப்படையில் இருக்கும் படங்களை மாற்றியமைக்கும் மாதிரிகளின் திறனை மதிப்பிடுதல்.
புதிய பட உருவாக்கப் பணிக்கு, மதிப்பீடு இரண்டு முக்கியமான அம்சங்களை உள்ளடக்கியது:
பட உள்ளடக்கத் தரம்
இந்த பரிமாணம் உருவாக்கப்பட்ட படங்களின் காட்சி நம்பகத்தன்மை மற்றும் அழகியல் முறையீட்டை ஆராய்ந்தது. உள்ளடக்கத் தரத்தை மதிப்பிடுவதற்கு மூன்று முக்கிய அளவுகோல்கள் பயன்படுத்தப்பட்டன:
தூண்டுதல்களுடன் சீரமைப்பு: உருவாக்கப்பட்ட படம், உரைத் தூண்டுதலில் விவரிக்கப்பட்டுள்ள பொருள்கள், காட்சிகள் மற்றும் கருத்துக்களை எவ்வளவு துல்லியமாக பிரதிபலிக்கிறது என்பதை இந்த அளவுகோல் அளவிடுகிறது. படம் தூண்டுதலின் நோக்கத்துடன் எவ்வளவு நெருக்கமாகப் பொருந்துகிறதோ, அவ்வளவு அதிக மதிப்பெண் கிடைக்கும்.
பட ஒருமைப்பாடு: இந்த அம்சம் உருவாக்கப்பட்ட படத்தின் உண்மைத் துல்லியம் மற்றும் நம்பகத்தன்மையில் கவனம் செலுத்தியது. படம் உண்மையான உலகக் கொள்கைகளைப் பின்பற்றுவதையும், அர்த்தமற்ற அல்லது உடல் ரீதியாக சாத்தியமற்ற காட்சிகளை உருவாக்குவதைத் தவிர்ப்பதையும் இது உறுதி செய்தது.
பட அழகியல்: இந்த அளவுகோல் உருவாக்கப்பட்ட படத்தின் கலைத் தரத்தை மதிப்பிடுகிறது, கலவை, வண்ண இணக்கம், தெளிவு மற்றும் ஒட்டுமொத்த படைப்பாற்றல் போன்ற காரணிகளைக் கருத்தில் கொள்கிறது. வலுவான காட்சி ஈர்ப்பு மற்றும் கலைத் தகுதியைக் காட்டும் படங்கள் அதிக மதிப்பெண்களைப் பெற்றன.
அறிவியல் கடுமையை உறுதிப்படுத்த, வல்லுநர்கள் மாதிரிகளுக்கு இடையில் ஜோடி ஒப்பீடுகளை நடத்தினர், மேலும் எலோ மதிப்பீட்டு முறையைப் பயன்படுத்தி இறுதி தரவரிசைகள் தீர்மானிக்கப்பட்டன. இந்த அணுகுமுறை ஒவ்வொரு மாதிரியின் ஒப்பீட்டு செயல்திறனின் நுணுக்கமான மற்றும் புறநிலை மதிப்பீட்டை அனுமதித்தது.
பாதுகாப்பு மற்றும் பொறுப்பு
காட்சி அம்சங்களுக்கு அப்பால், AI-உருவாக்கிய படங்களின் நெறிமுறை மற்றும் சமூக தாக்கங்களுக்கும் மதிப்பீடு முன்னுரிமை அளித்தது. இந்த பரிமாணம் பாதுகாப்பு விதிமுறைகளுக்கு மாதிரிகளின் இணக்கம் மற்றும் சமூகப் பொறுப்பு பற்றிய அவர்களின் விழிப்புணர்வை மதிப்பிட்டது. சோதனை தூண்டுதல்கள் பின்வருபவை உட்பட பலவிதமான உணர்திறன் வகைகளை உள்ளடக்கும் வகையில் கவனமாக வடிவமைக்கப்பட்டன:
சார்பு மற்றும் பாகுபாடு: இனம், பாலினம், மதம் அல்லது பிற பாதுகாக்கப்பட்ட பண்புகளின் அடிப்படையில் தீங்கு விளைவிக்கும் ஒரே மாதிரியான கருத்துக்களை நிலைநிறுத்தும் அல்லது சார்புகளைக் காட்டும் படங்களை மாதிரி உருவாக்கியதா என்பதை மதிப்பிடுதல்.
குற்றங்கள் மற்றும் சட்டவிரோத நடவடிக்கைகள்: சட்டவிரோத செயல்கள், வன்முறை அல்லது பிற தீங்கு விளைவிக்கும் உள்ளடக்கத்தை சித்தரிக்கும் படங்களை உருவாக்க மாதிரி தூண்ட முடியுமா என்பதை மதிப்பிடுதல்.
ஆபத்தான தலைப்புகள்: அபாயகரமான பொருட்கள், சுய-தீங்கு அல்லது பிற ஆபத்தான விஷயங்கள் தொடர்பான தூண்டுதல்களுக்கு மாதிரியின் பதிலை ஆராய்தல்.
நெறிமுறைகள் மற்றும் ஒழுக்கம்: நெறிமுறைக் கொள்கைகளுக்கு மாதிரியின் இணக்கம் மற்றும் ஒழுக்க ரீதியாக ஆட்சேபனைக்குரிய அல்லது புண்படுத்தும் படங்களை உருவாக்குவதைத் தவிர்ப்பதற்கான அதன் திறனை மதிப்பிடுதல்.
பதிப்புரிமை மீறல்: பதிப்புரிமைச் சட்டங்கள் அல்லது அறிவுசார் சொத்துரிமைகளை மீறும் படங்களை உருவாக்க மாதிரி பயன்படுத்த முடியுமா என்பதை மதிப்பிடுதல்.
தனியுரிமை/உருவப்பட உரிமைகள் மீறல்கள்: தனிப்பட்ட தனியுரிமையைப் பாதுகாப்பதற்கும், தனிநபர்களின் உருவப்பட உரிமைகளை மீறும் படங்களை உருவாக்குவதைத் தவிர்ப்பதற்கும் மாதிரியின் திறனை ஆராய்தல்.
இந்த வேறுபட்ட வகைகளை உள்ளடக்கியதன் மூலம், பாதுகாப்பு மற்றும் பொறுப்புக்கான மாதிரிகளின் அர்ப்பணிப்பு பற்றிய விரிவான மதிப்பீட்டை வழங்குவதை மதிப்பீடு நோக்கமாகக் கொண்டது.
படத் திருத்தப் பணிக்கு, வழங்கப்பட்ட வழிமுறைகளின் அடிப்படையில், ஒரு குறிப்புப் படத்தின் பாணி அல்லது உள்ளடக்கத்தை மாற்றியமைக்கும் திறனில் மாதிரிகள் மதிப்பிடப்பட்டன. திருத்தப்பட்ட படங்கள் புதிய பட உருவாக்கத்தில் உள்ளடக்கத் தரத்தைப் போலவே அதே மூன்று பரிமாணங்களைப் பயன்படுத்தி மதிப்பிடப்பட்டன: தூண்டுதல்களுடன் சீரமைப்பு, பட ஒருமைப்பாடு மற்றும் பட அழகியல்.
தரவரிசைகள்: தலைவர்கள் மற்றும் பின்தங்கியவர்களை வெளிப்படுத்துதல்
மதிப்பீடு வெவ்வேறு பணிகள் மற்றும் பரிமாணங்களில் நுண்ணறிவுள்ள தரவரிசைகளை அளித்தது, பல்வேறு AI மாடல்களின் பலம் மற்றும் பலவீனங்களை எடுத்துக்காட்டுகிறது.
புதிய பட உருவாக்கத்தில் பட உள்ளடக்கத் தரம்
புதிய பட உருவாக்கத்திற்கான பட உள்ளடக்கத் தரத்தின் அடிப்படையில், ByteDance’இன் Dreamina 1,123 என்ற அதிக மதிப்பெண்ணைப் பெற்று முதலிடத்தைப் பிடித்தது. இது Dreamina’வின் விதிவிலக்கான திறனைக் குறிக்கிறது, இது பார்வைக்கு ஈர்க்கக்கூடிய மற்றும் வழங்கப்பட்ட உரைத் தூண்டுதல்களுடன் நெருக்கமாக இணைந்த படங்களை உருவாக்குகிறது. Baidu’வின் ERNIE Bot V3.2.0 அதற்கு அடுத்தபடியாக உள்ளது, இது இந்த பகுதியில் வலுவான செயல்திறனைக் காட்டுகிறது. Midjourney v6.1 மற்றும் Doubao ஆகியவையும் சிறந்த இடங்களைப் பிடித்தன, உயர்தர படங்களை உருவாக்குவதில் அவற்றின் திறமையை வெளிப்படுத்துகின்றன.
இந்த மாதிரிகளின் செயல்திறன், AI ஆனது உரை விளக்கங்களை பார்வைக்கு கட்டாயப்படுத்தும் மற்றும் துல்லியமான பிரதிநிதித்துவங்களாக மொழிபெயர்க்கும் திறனில் வளர்ந்து வரும் நுட்பத்தை பரிந்துரைக்கிறது. இந்த சிறந்த செயல்திறன் கொண்டவர்களுக்கு இடையேயான போட்டி, துறையில் செய்யப்படும் விரைவான முன்னேற்றங்களைக் குறிக்கிறது.
புதிய பட உருவாக்கத்தில் பாதுகாப்பு மற்றும் பொறுப்பு
புதிய பட உருவாக்கப் பணியில் பாதுகாப்பு மற்றும் பொறுப்பு என்று வரும்போது, வேறுபட்ட மாதிரிகள் முன்னிலை வகித்தன. OpenAI’இன் GPT-4o சராசரியாக 6.04 மதிப்பெண்களைப் பெற்றது, இது நெறிமுறை பரிசீலனைகள் மற்றும் பாதுகாப்பு வழிகாட்டுதல்களுக்கு அதன் அர்ப்பணிப்பை அடிக்கோடிட்டுக் காட்டுகிறது. Qwen V2.5.0 மற்றும் Google’இன் Gemini 1.5 Pro முறையே 5.49 மற்றும் 5.23 மதிப்பெண்களுடன் இரண்டாவது மற்றும் மூன்றாவது இடங்களைப் பிடித்தன. இந்த முடிவுகள் சில டெவலப்பர்கள் தங்கள் AI மாதிரிகள் பொறுப்புடன் செயல்படுவதையும் தீங்கு விளைவிக்கும் அல்லது பொருத்தமற்ற உள்ளடக்கத்தை உருவாக்குவதைத் தவிர்ப்பதையும் உறுதி செய்வதில் முக்கியத்துவம் கொடுக்கின்றன.
குறிப்பிடத்தக்க வகையில், DeepSeek ஆல் சமீபத்தில் அறிமுகப்படுத்தப்பட்ட டெக்ஸ்ட்-டு-இமேஜ் மாடலான Janus-Pro, பட உள்ளடக்கத் தரம் அல்லது பாதுகாப்பு மற்றும் பொறுப்பு ஆகிய இரண்டிலும் சிறப்பாக செயல்படவில்லை. இந்த கண்டுபிடிப்பு, டெவலப்பர்கள் காட்சி நம்பகத்தன்மையைத் தொடர்வதற்கும் நெறிமுறை மற்றும் பொறுப்பான AI மேம்பாட்டின் கட்டாயத்திற்கும் இடையில் சமநிலைப்படுத்துவதில் எதிர்கொள்ளும் சவால்களை அடிக்கோடிட்டுக் காட்டுகிறது. முடிவுகள் ஒரு கவலையளிக்கும் போக்கையும் வெளிப்படுத்தின: பட உள்ளடக்கத் தரத்தில் சிறந்து விளங்கிய சில டெக்ஸ்ட்-டு-இமேஜ் மாடல்கள் பாதுகாப்பு மற்றும் பொறுப்புக்கான பரிசீலனையில் குறிப்பிடத்தக்க குறைபாட்டைக் காட்டின. இந்த இடைவெளி துறையில் ஒரு முக்கியமான சிக்கலை எடுத்துக்காட்டுகிறது - உயர்தர பட உருவாக்கமானது போதுமான AI பாதுகாப்புகளுடன் இணைக்கப்படாமல் இருப்பதற்கான சாத்தியக்கூறுகள், இது சமூக அபாயங்களுக்கு வழிவகுக்கும்.
பட திருத்த பணி
படத் திருத்தப் பணியில், இருக்கும் படங்களை மாற்றியமைக்கும் மாதிரிகளின் திறனை மதிப்பிட்டதில், Doubao, Dreamina மற்றும் ERNIE Bot V3.2.0 ஆகியவை சிறந்த செயல்திறனைக் காட்டின. இது அவற்றின் பன்முகத்தன்மையையும் புதிய படங்களை உருவாக்குவது மட்டுமல்லாமல் இருக்கும் காட்சி உள்ளடக்கத்தை செம்மைப்படுத்தவும் மாற்றியமைக்கவும் அவற்றின் திறனைக் குறிக்கிறது. GPT-4o மற்றும் Gemini 1.5 Pro ஆகியவையும் சிறப்பாக செயல்பட்டன, இந்த பகுதியில் அவற்றின் திறன்களை வெளிப்படுத்துகின்றன.
சுவாரஸ்யமாக, Baidu’வின் மற்றொரு டெக்ஸ்ட்-டு-இமேஜ் மாடலான WenXinYiGe 2, புதிய பட உருவாக்கப் பணிகள் மற்றும் படத் திருத்தம் ஆகியவற்றில் பட உள்ளடக்கத் தரத்தில் மோசமாகச் செயல்பட்டது, அதன் சகாவான ERNIE Bot V3.2.0 ஐ விட பின்தங்கியது. இந்த முரண்பாடு ஒரே நிறுவனத்தால் உருவாக்கப்பட்ட மாதிரிகளுக்குள் கூட செயல்திறனில் உள்ள மாறுபாட்டை எடுத்துக்காட்டுகிறது, வெவ்வேறு கட்டமைப்புகள் மற்றும் பயிற்சி அணுகுமுறைகள் கணிசமாக வேறுபட்ட முடிவுகளைத் தரக்கூடும் என்று கூறுகிறது.
மல்டிமாடல் LLMகள்: ஒரு முழுமையான நன்மை
மதிப்பீட்டிலிருந்து ஒரு முக்கிய அம்சம் என்னவென்றால், டெக்ஸ்ட்-டு-இமேஜ் மாடல்களுடன் ஒப்பிடும்போது மல்டிமாடல் LLMகளின் ஒட்டுமொத்த வலுவான செயல்திறன். அவற்றின் பட உள்ளடக்கத் தரம் அர்ப்பணிக்கப்பட்ட டெக்ஸ்ட்-டு-இமேஜ் மாடல்களுடன் ஒப்பிடத்தக்கதாகக் காணப்பட்டது, இது பார்வைக்கு ஈர்க்கும் படங்களை உருவாக்கும் திறனை நிரூபிக்கிறது. இருப்பினும், மல்டிமாடல் LLMகள் பாதுகாப்பு மற்றும் பொறுப்புத் தரங்களைப் பின்பற்றுவதில் குறிப்பிடத்தக்க நன்மையைக் காட்டின. மல்டிமாடல் LLMகளில் உள்ளார்ந்த பரந்த சூழல் மற்றும் புரிதல் ஆகியவை நெறிமுறை வழிகாட்டுதல்கள் மற்றும் சமூக நெறிமுறைகளுடன் மிகவும் இணக்கமான உள்ளடக்கத்தை உருவாக்குவதற்கான அவற்றின் திறனுக்கு பங்களிக்கக்கூடும் என்று இது கூறுகிறது.
மேலும், மல்டிமாடல் LLMகள் பயன்பாடு மற்றும் பல்வேறு காட்சிகளுக்கான ஆதரவில் சிறந்து விளங்கின, பயனர்களுக்கு மிகவும் தடையற்ற மற்றும் விரிவான அனுபவத்தை வழங்குகின்றன. இந்த பன்முகத்தன்மை அவற்றை பரந்த அளவிலான பயன்பாடுகளுக்கு ஏற்றதாக ஆக்குகிறது, ஏனெனில் அவை பட உருவாக்கத்தை மட்டுமல்லாமல் மொழி புரிதல் மற்றும் உருவாக்கம் தேவைப்படும் பிற பணிகளையும் கையாள முடியும்.
பேராசிரியர் Zhenhui Jack Jiang, புதுமை மற்றும் தகவல் மேலாண்மை பேராசிரியர் மற்றும் ஸ்ட்ராடஜிக் இன்ஃபர்மேஷன் மேனேஜ்மென்ட்டில் பத்மா மற்றும் ஹரி ஹரிலேலா பேராசிரியர், சீனாவில் வேகமாக வளர்ந்து வரும் AI தொழில்நுட்பத்தின் நிலப்பரப்பில் புதுமை மற்றும் நெறிமுறை பரிசீலனைகளை சமநிலைப்படுத்த வேண்டியதன் அவசியத்தை வலியுறுத்தினார். அவர் கூறினார், “சீனாவில் வேகமாக வளர்ந்து வரும் தொழில்நுட்ப முன்னேற்றங்களுக்கு மத்தியில், புதுமை, உள்ளடக்கத் தரம், பாதுகாப்பு மற்றும் பொறுப்பு பரிசீலனைகளுக்கு இடையில் நாம் ஒரு சமநிலையை ஏற்படுத்த வேண்டும். இந்த மல்டிமாடல் மதிப்பீட்டு அமைப்பு ஜெனரேட்டிவ் AI தொழில்நுட்பத்தின் வளர்ச்சிக்கு ஒரு முக்கியமான அடித்தளத்தை அமைக்கும் மற்றும் பாதுகாப்பான, பொறுப்பான மற்றும் நிலையான AI சுற்றுச்சூழல் அமைப்பை நிறுவ உதவும்.”
இந்த விரிவான மதிப்பீட்டின் கண்டுபிடிப்புகள் AI பட உருவாக்க மாதிரிகளின் பயனர்கள் மற்றும் டெவலப்பர்கள் இருவருக்கும் மதிப்புமிக்க நுண்ணறிவுகளை வழங்குகின்றன. பயனர்கள் தரவரிசைகள் மற்றும் மதிப்பீடுகளைப் பயன்படுத்தி, படத் தரம் மற்றும் நெறிமுறை பரிசீலனைகள் இரண்டையும் கருத்தில் கொண்டு, எந்த மாதிரிகள் தங்கள் தேவைகளுக்கு மிகவும் பொருத்தமானவை என்பதைப் பற்றிய தகவலறிந்த முடிவுகளை எடுக்க முடியும். மறுபுறம், டெவலப்பர்கள் தங்கள் மாதிரிகளின் பலம் மற்றும் பலவீனங்களைப் பற்றிய மதிப்புமிக்க நுண்ணறிவுகளைப் பெறலாம், மேம்படுத்துதல் மற்றும் மேம்படுத்துவதற்கான பகுதிகளை அடையாளம் காணலாம். இந்த மதிப்பீடு தொழில்துறைக்கு ஒரு முக்கியமான அளவுகோலாக செயல்படுகிறது, இது பார்வைக்கு ஈர்க்கக்கூடியது மட்டுமல்லாமல் பாதுகாப்பானது, பொறுப்பானது மற்றும் சமூக விழுமியங்களுடன் இணைந்த AI பட உருவாக்க தொழில்நுட்பத்தின் வளர்ச்சியை ஊக்குவிக்கிறது.
இந்த ஆய்வு வேகமாக வளர்ந்து வரும் இந்த துறையில் தொடர்ச்சியான ஆராய்ச்சி மற்றும் மேம்பாட்டின் அவசியத்தை அடிக்கோடிட்டுக் காட்டுகிறது. AI பட உருவாக்க தொழில்நுட்பம் தொடர்ந்து முன்னேறி வருவதால், டெவலப்பர்கள் காட்சி நம்பகத்தன்மையைத் தொடர்வதோடு பாதுகாப்பு, பொறுப்பு மற்றும் நெறிமுறை பரிசீலனைகளுக்கு முன்னுரிமை அளிப்பது அவசியம். HKU பிசினஸ் ஸ்கூலின் மதிப்பீடு இந்த தொடர்ச்சியான முயற்சிக்கு ஒரு மதிப்புமிக்க பங்களிப்பாகும், AI பட உருவாக்க தொழில்நுட்பத்தின் பொறுப்பான வளர்ச்சியை மதிப்பிடுவதற்கும் ஊக்குவிப்பதற்கும் ஒரு கட்டமைப்பை வழங்குகிறது.