AI உருவப்பட உருவாக்கம்: எந்த மாடல் உயர்ந்தது? | ta

AI மூலம் இயங்கும் உருவப்பட உருவாக்கம் துறையில் பல நிறுவனங்கள் மற்றும் அமைப்புகள் ஆதிக்கம் செலுத்த போட்டியிடுகின்றன. ஒவ்வொரு உருவாக்குநரும் தங்கள் தனித்துவமான AI மாதிரியின் விதிவிலக்கான திறன்களை பெருமையுடன் கூறுகின்றனர், இது உண்மையான செயல்திறனை வேறுபடுத்துவது ஒரு சவாலாக இருக்கும் ஒரு சிக்கலான நிலப்பரப்புக்கு வழிவகுக்கிறது. இந்த அதிகப்படியான விளம்பரங்களுக்கு மத்தியில் தெளிவுபடுத்த வடிவமைக்கப்பட்ட ஒரு தளமான GenAI Image Showdown ஐ உள்ளிடவும். இந்த வலைத்தளம் பல்வேறு உருவப்பட உருவாக்கும் AIகளின் பக்கவாட்டு ஒப்பீட்டை வழங்குகிறது, இவை அனைத்தும் ஒரே மாதிரியான தூண்டுதலுக்கு பதிலளிக்கின்றன. இது ஒவ்வொரு AIயின் திறனையும் உடனடியாகவும், காட்சி ரீதியாகவும் மதிப்பிடுவதற்கு வாய்ப்பளிக்கிறது, மேலும் அறிவுறுத்தல்களை கட்டாய படங்களாக மாற்ற உதவுகிறது.

புருஷிய வீரர்கள் மற்றும் உலோக வளையங்கள்: நேரடி விளக்கத்தின் சோதனை

தளத்தின் திறனை விளக்க, "இரண்டு புருஷிய வீரர்கள் கூர்மையான ஹெல்மெட்களை அணிந்து ஒருவரையொருவர் எதிர்கொள்கிறார்கள், மேலும் ஒருவருக்கொருவர் ஹெல்மெட் கூர்முனைகளில் உலோக வளையங்களை எறியும் விளையாட்டை விளையாடுகிறார்கள்" என்ற தூண்டுதலைக் கவனியுங்கள். இந்த வினோதமான சூழ்நிலை ஆறு முக்கிய உருவப்பட உருவாக்கும் AIகளுக்கு ஒரு லிட்மஸ் சோதனையாக செயல்பட்டது:

பிளாக் ஃபாரஸ்ட் லேப்ஸின் FLUX.1 [dev]
கூகிளின் Gemini 2.0 Flash
டென்செண்டின் Hunyuan Image 2.0
கூகிளின் Imagen 3 and Imagen 4 (அற்பமான செயல்திறன் வேறுபாடுகள் காரணமாக தொகுக்கப்பட்டது)
Midjourney இன் Midjourney V7
OpenAI இன் 4o Image Generation

இதன் விளைவுகள் வெளிப்பட்டன. ஆறு AIகளில் மூன்று மட்டுமே - FLUX.1 [dev], Imagen 3 and Imagen 4, மற்றும் 4o Image Generation - தூண்டுதலின் குறிப்பிட்ட விவரங்களுக்கு இணங்கக்கூடிய படங்களை வெற்றிகரமாக உருவாக்கியது. மற்றவை, பார்வைக்கு சுவாரஸ்யமான படங்களை உருவாக்கியிருந்தாலும், கோரிக்கையின் சாரத்தை துல்லியமாக கைப்பற்றுவதில் தோல்வியடைந்தன. இது ஒரு முக்கியமான வேறுபாட்டை எடுத்துக்காட்டுகிறது: மூல உருவப்பட தரம் ஒரு வெற்றிகரமான உருவப்பட உருவாக்கும் AIயின் ஒரே தீர்மானகரமான காரணி அல்ல; சிக்கலான அறிவுறுத்தல்களை துல்லியமாக விளக்கி செயல்படுத்துவதற்கான திறனும் சமமாக முக்கியமானது.

நட்சத்திர வடிவங்கள்: வடிவவியல் துல்லியத்தை மதிப்பிடுதல்

சிக்கலான காட்சிகளைத் தாண்டி, எளிய மற்றும் வடிவியல் ரீதியாக கவனம் செலுத்தும் தூண்டுதல்களையும் பரிசோதனை உள்ளடக்கியது. ஒரு தூண்டுதல்: "ஒன்பது முனைகளைக் கொண்ட ஒரு நட்சத்திரத்தின் டிஜிட்டல் விளக்கம்." இந்த நேரடியான பணி சில AIகளுக்கு ஆச்சரியமாக சவாலாக இருந்தது. FLUX.1 [dev], Midjourney V7, மற்றும் 4o Image Generation மட்டுமே ஒன்பது புள்ளிகளைக் கொண்ட ஒரு நட்சத்திரத்தை துல்லியமாக சித்தரிக்கும் படங்களை உருவாக்க முடிந்தது. சில எளிய காட்சிகளில் கூட, குறிப்பிட்ட வடிவியல் தேவைகளைக் கையாளும் போது AI எதிர்கொள்ளும் சிரமத்தை தோல்விகள் அடிக்கோடிட்டுக் காட்டுகின்றன. ஒரு நட்சத்திரம் போல் தோற்றமளிக்கும் ஒன்றை உருவாக்குவது எளிதானது, ஆனால் ஒன்பது புள்ளிகள் கொண்ட ஒரு குறிப்பிட்ட பண்பைக் கொண்ட ஒன்றை உருவாக்குவது மிகவும் கடினம். இது துல்லியமான தொழில்நுட்ப அல்லது அறிவியல் வரைபடங்களை உருவாக்குவதற்கு முக்கியமானதாக இருக்கலாம்.

நிறம் மற்றும் ஒளி ஊடுருவலின் கனசதுரங்கள்: வழங்கல் திறனில் ஆழமான மூழ்கல்

அடுத்த சவால் AIயின் வழங்கல் திறன்களை சோதிக்க வடிவமைக்கப்பட்ட ஒரு விரிவான தூண்டுதலாக இருந்தது: "ஐந்து வண்ண கனசதுரங்களைக் கொண்ட ரே-டிரேஸ் செய்யப்பட்ட படம். சிவப்பு கனசதுரம் நீல கனசதுரத்தின் மேல் அடுக்கி வைக்கப்பட்டுள்ளது. நீல கனசதுரம் பச்சை கனசதுரத்தின் மேல் அடுக்கி வைக்கப்பட்டுள்ளது. பச்சை கனசதுரம் ஊதா கனசதுரத்தின் மேல் அடுக்கி வைக்கப்பட்டுள்ளது. ஊதா கனசதுரம் மஞ்சள் கனசதுரத்தின் மேல் அடுக்கி வைக்கப்பட்டுள்ளது. அதாவது, மேலிருந்து கீழாக, வரிசை சிவப்பு, நீலம், பச்சை, ஊதா, மஞ்சள். கனசதுரங்கள் ஓரளவு ஒளி ஊடுருவக்கூடியவை மற்றும் கண்ணாடியால் செய்யப்பட்டவை."

இந்தத் தூண்டுதல் துல்லியமான வண்ண பிரதிநிதித்துவம் மற்றும் அடுக்கும் வரிசையைக் கோருவது மட்டுமல்லாமல், ரே ட்ரேசிங் மற்றும் ஒளி ஊடுருவக்கூடிய கண்ணாடியின் காட்சி பண்புகள் பற்றிய நுணுக்கமான புரிதலையும் கோரியது. முடிவுகள் பெரும்பாலும் நேர்மறையாக இருந்தன, Midjourney V7 தவிர மற்ற அனைத்து AIகளும் குறிப்பிட்ட அளவுகோல்களை பூர்த்தி செய்யும் படங்களை வெற்றிகரமாக உருவாக்கியது. இது யதார்த்தமான மற்றும் காட்சி ரீதியாக சிக்கலான பொருட்களை வழங்குவதில் AIயின் அதிகரித்து வரும் அதிநவீனத்தை நிரூபிக்கிறது, குறிப்பாக ஒளி மற்றும் பொருள் பண்புகளின் விளைவுகளை பிரதிபலிப்பதில். அத்தகைய விளைவுகளைக் கட்டுப்படுத்தும் திறன் தயாரிப்பு வடிவமைப்பு, கட்டிடக்கலை காட்சிப்படுத்தல் மற்றும் ஒளிப்படவியல் உருவப்படங்கள் தேவைப்படும் பிற துறைகளில் பயன்பாடுகளுக்கு முக்கியமானது. மீண்டும், இந்த தூண்டுதலை வெற்றிகரமாக வழங்க Midjourney இன் தோல்வி கருவிகளுக்கு இடையிலான வேறுபாட்டை எடுத்துக்காட்டுகிறது, சில கருவிகள் சில பணிகளுக்கு மிகவும் பொருத்தமானவை.

பிரமைக்குள் செல்லுதல்: தர்க்கரீதியான பகுத்தறிவை மதிப்பிடுதல்

நியாயமாக பகுத்தறியும் திறன் AI செயல்திறனின் மற்றொரு முக்கியமான அம்சம். இந்த திறனை சோதிக்க, AIகள் ஒரு பிரமையை உருவாக்க அறிவுறுத்தப்பட்டன, அதே நேரத்தில் பிரமை வழியாக சரியான வழியையும் காட்டுகின்றன. பார்வைக்கு நம்பகமான பிரமையை உருவாக்குவது மட்டுமல்லாமல், தீர்வு பாதையைப் புரிந்து பிரதிநிதித்துவப்படுத்தவும் இந்த பணி AI க்கு தேவைப்பட்டது. ஆச்சரியப்படும் விதமாக, 4o Image Generation மட்டுமே சரியான மற்றும் ஒத்திசைவான வெளியீட்டை உருவாக்குவதில் வெற்றி பெற்றது. ஒரு காட்சி சூழலில் சிக்கலான உறவுகளைப் புரிந்துகொண்டு பிரதிநிதித்துவப்படுத்தும் திறன் சில AI மாதிரிகள் ஒரு வகையான இடஞ்சார்ந்த பகுத்தறிவை வெளிப்படுத்தத் தொடங்குகின்றன என்பதை இது அறிவுறுத்துகிறது. இந்த திறனின் சாத்தியமான பயன்பாடுகள் பரந்தவை, ஊடாடும் வரைபடங்கள் மற்றும் விளையாட்டுகளை உருவாக்குவது முதல் சிக்கலான அமைப்புகளின் வடிவமைப்பில் உதவுவது வரை.

பகா எண் புதிர்: எண்ணியல் புரிதலின் வரம்புகளை வெளிப்படுத்துதல்

AI குறிப்பிடத்தக்க முன்னேற்றங்களைச் செய்திருந்தாலும், அது அதன் வரம்புகள் இல்லாமல் இல்லை. இது "குறைந்த பகா எண்ணிலிருந்து தொடங்கி 20 பகா எண்களால் ஆன 20 பக்க பகடை" என்ற தூண்டுதலால் தெளிவாக நிரூபிக்கப்பட்டது. இந்த பணி AI ஆனது காட்சியளவில் துல்லியமான 20 பக்க பக்கடையை உருவாக்குவது மட்டுமல்லாமல், அதன் முகங்களில் முதல் 20 பகா எண்களை சரியாக அடையாளம் கண்டு ஏற்பாடு செய்ய வேண்டும். ஏமாற்றமளிக்கும் விதமாக, அனைத்து உருவப்பட உருவாக்கும் AIகளும் திருப்திகரமான முடிவை உருவாக்கத் தவறிவிட்டன. துல்லியமான எண்ணியல் தகவல்களை காட்சி பிரதிநிதித்துவங்களில் ஒருங்கிணைப்பதில் AI எதிர்கொள்ளும் தொடர்ச்சியான சவால்களை இந்த தோல்வி அடிக்கோடிட்டுக் காட்டுகிறது. AI பார்வைக்கு பிரமிக்க வைக்கும் படங்களை உருவாக்க முடியும் என்றாலும், கணிதக் கருத்துகளின் ஆழமான புரிதல் மற்றும் அவற்றை ஒரு காட்சி சூழலுக்கு துல்லியமாக மொழிபெயர்ப்பது தேவைப்படும் பணிகளுடன் இது அடிக்கடி போராடுகிறது.

தீர்ப்பு: AI பட உருவாக்குநர்களின் தரவரிசை

GenAI Image Showdown மொத்தம் 12 சோதனைகளின் முடிவுகளைத் தொகுத்துள்ளது, இது பல்வேறு பணிகளில் ஒவ்வொரு AIயின் செயல்திறன் பற்றிய விரிவான கண்ணோட்டத்தை வழங்குகிறது. துல்லிய விகிதத்தின் அடிப்படையில், AIகள் பின்வருமாறு தரப்படுத்தப்பட்டன:

4o Image Generation
Imagen 3 and Imagen 4
FLUX.1 [dev]
Gemini 2.0 Flash
Hunyuan Image 2.0
Midjourney V7

இந்த தரவரிசை குறிப்பிட்ட தேவைகளுக்கு மிகவும் பொருத்தமான AI ஐத் தேர்ந்தெடுக்க விரும்பும் பயனர்களுக்கு மதிப்புமிக்க நுண்ணறிவுகளை வழங்குகிறது. இருப்பினும், ஒவ்வொரு AIக்கும் அதன் சொந்த பலம் மற்றும் பலவீனங்கள் உள்ளன என்பதையும், கையில் உள்ள குறிப்பிட்ட பணியைப் பொறுத்து உகந்த தேர்வு மாறுபடலாம் என்பதையும் கவனத்தில் கொள்ள வேண்டும். உதாரணமாக, சமூக ஊடகத்திற்கான அழகியல் ரீதியாக மகிழ்ச்சியான கலையை உருவாக்க ஒரு பயனர் AI ஐத் தேடுகிறார்களானால், Midjourney மேலே குறிப்பிட்டுள்ள சில பணிகளை வெற்றிகரமாக முடிக்கத் தவறிய போதிலும், ஒரு விருப்பமான கருவியாக இருக்கலாம்.

இந்த ஆய்வின் தாக்கங்கள் எளிய உருவப்பட உருவாக்கத்தையும் தாண்டி நீட்டிக்கப்படுகின்றன. இந்த AI கருவிகள் சந்தைப்படுத்தல் முதல் பொறியியல் வரை தொழில்களில் புரட்சியை ஏற்படுத்தும் திறனைக் கொண்டுள்ளன. சந்தைப்படுத்துபவர்கள் இப்போது இன்னும் இல்லாத தயாரிப்புகளின் ஒளிப்படவியல் படங்களை உருவாக்க முடியும், இது சாத்தியமான வாடிக்கையாளர்களுடன் திறமையான A/B சோதனைக்கு அனுமதிக்கிறது. இதேபோல், பொறியியலாளர்கள் விலையுயர்ந்த முன்மாதிரிகளுக்காக காத்திருக்காமல் சிக்கலான வடிவமைப்பு யோசனைகளை விரைவாக காட்சிப்படுத்தலாம் மற்றும் மீண்டும் செய்யலாம்.

இறுதியாக, GenAI Image Showdown என்பது AI உருவப்பட உருவாக்கத்தின் சிக்கலான மற்றும் வேகமாக உருவாகி வரும் நிலப்பரப்பை வழிநடத்துவதற்கான மதிப்புமிக்க ஆதாரமாக செயல்படுகிறது. வெவ்வேறு AI மாதிரிகளின் தெளிவான மற்றும் புறநிலை ஒப்பீட்டை வழங்குவதன் மூலம், பயனர்கள் தகவலறிந்த முடிவுகளை எடுக்கவும், இந்த மாற்றத்தக்க தொழில்நுட்பத்தின் முழு திறனையும் பயன்படுத்தவும் இது அதிகாரம் அளிக்கிறது. AI தொடர்ந்து வளர்ச்சியடைந்து வருவதால், GenAI Image Showdown போன்ற தளங்கள் தொழில்நுட்பத்தை தெளிவுபடுத்துவதிலும், அதன் நன்மைகள் அனைவருக்கும் கிடைக்கச் செய்வதிலும் ஒரு முக்கியமான பங்கைத் தொடரும். AI புதிய படங்களை உருவாக்க முடியும் என்றாலும், அது பயிற்சி பெறும் தரவுகளில் இருக்கும் சமூக சார்புகளை உள்வாங்குவதற்கு எளிதில் பாதிக்கப்படுகிறது. எனவே AI உருவாக்கிய படங்கள் சமூகப் பிழைகளை நிலைநிறுத்த வாய்ப்புள்ளது.

AI உருவப்பட உருவாக்கத்தின் தற்போதைய வரம்புகளும் AI உருவாக்கிய படங்கள் தவறாகப் பயன்படுத்தப்பட வாய்ப்புள்ளது. அவை தவறான தகவல்களைப் பரப்புவதற்கு அல்லது பாலியல் ரீதியாக வெளிப்படையான டீப்ஃபேக்குகளைத் தயாரிப்பதற்குப் பயன்படுத்தப்படலாம், எடுத்துக்காட்டாக. தொழில்நுட்பம் வளர்ச்சியடையும்போது, இத்தகைய தீங்கிழைக்கும் தாக்குதல்களின் அதிநவீனமும் அதிகரிக்கும், எனவே தீங்கு விளைவிப்பதைப் குறைக்க போதுமான பாதுகாப்பு நடவடிக்கைகளை அமல்படுத்துவது அவசியம்.

புதுப்பிக்கப்பட்டது ௨௦௨௫-௦௬-௦௧

# Google # Gemini # AIGC