AI களம்: சாட்ஜிபிடி, க்ரோக், ஜெமினி, கிளாட் மோதல்

செயற்கை நுண்ணறிவின் (AI) அபரிமிதமான வளர்ச்சி கண்கூடாகத் தெரிகிறது. இதன் சமீபத்திய போக்குகளை உடனுக்குடன் தெரிந்துகொள்ள அதிக முயற்சி தேவைப்படுகிறது.

எனக்கு அது தெரியும், ஏனெனில் அதுதான் என் வேலை. புதிய மாடல்களை முதலில் அனுபவிப்பதற்காக, Anthropic-ன் Pro முறையைச் சந்தா செய்துள்ளேன். இதன் மூலம் அதன் சமீபத்திய மாடல் Claude 3.7-ன் “விரிவாக்கப்பட்ட சிந்தனை” முறையைப் பயன்படுத்த முடியும். அதே நேரத்தில், OpenAI-ன் நிறுவன முறையையும் சந்தா செய்துள்ளேன். அவர்களின் புதிய மாடல் o3 மற்றும் o4-mini-high ஐ சோதிக்க இது உதவுகிறது (OpenAI இன் குழப்பமான பெயரிடல் முறையை பின்னர் விளக்குகிறேன்!). மேலும் OpenAI-ன் புதிய பட உருவாக்கும் மாடல் 4o ஐப் பயன்படுத்தி நிறைய படங்களை உருவாக்குகிறேன். 4o இன் சிறந்த செயல்திறன் காரணமாக இதற்கு முன்பு நான் சந்தா செய்திருந்த பட உருவாக்கும் கருவி Midjourney-க்கான சந்தாவை ரத்து செய்தேன்.

கூடுதலாக, Elon Musk-ன் Grok 3-யையும் நான் சந்தா செய்துள்ளேன். இது எனக்குப் பிடித்த AI அம்சத்தைக் கொண்டுள்ளது. சீனாவின் AI ஏஜென்ட் தளமான Manus-ஐப் பயன்படுத்தி ஷாப்பிங் மற்றும் அட்டவணை தயாரிக்கும் பணிகளையும் செய்து வருகிறேன். இந்த சந்தாக்களுக்காகவே என் பட்ஜெட்டில் கணிசமான தொகை செலவாகிறது. இவை அனைத்தும் நான் மற்ற வடிவங்களில் பயன்படுத்தும் AI சேவைகள் தவிர. இந்தக் கட்டுரையை நான் எழுதும் இந்த மாதத்தில், கூகிள் அதன் மிகச்சிறந்த AI தயாரிப்பான Gemini 2.5 ஐ பெரிய அளவில் மேம்படுத்தியுள்ளது. மெட்டா, இதுவரை இல்லாத மிகப்பெரிய ஓப்பன் சோர்ஸ் AI மாடலான Llama 4 ஐ வெளியிட்டுள்ளது.

AI வளர்ச்சியைத் தொடர்ந்து கண்காணிப்பது உங்கள் தினசரி வேலையாக இல்லாவிட்டால், எந்த AI உங்கள் வாழ்க்கையை மேம்படுத்தும், எந்த மாடல்கள் பயனற்றவை என்பதை நீங்கள் எப்படி அறிந்துகொள்வீர்கள்?

இதுதான் இந்தக் கட்டுரையின் நோக்கம். ஒரு “நுகர்வோர் அறிக்கை” பாணியில், எந்த AI எந்தப் பயன்பாட்டிற்குச் சிறந்தது, அவற்றை எவ்வாறு பயன்படுத்துவது என்பதைப் பற்றி விரிவாகப் பார்ப்போம். இவை அனைத்தும் நான் நடைமுறைப் பணிகளில் பெற்ற அனுபவங்களின் அடிப்படையில் இருக்கும்.

ஆரம்பத்தில் சில விஷயங்களை தெளிவுபடுத்த விரும்புகிறேன். Vox Media, OpenAI உடன் கூட்டு ஒப்பந்தம் செய்துள்ள சில வெளியீட்டாளர்களில் ஒன்றாகும். ஆனால் எங்கள் அறிக்கைகள் எப்போதும் தலையங்க சுதந்திரத்துடன் இருக்கும். Future Perfect-க்கான நிதி BEMC அறக்கட்டளையிலிருந்து வருகிறது. இந்த அறக்கட்டளையின் முக்கிய ஆதரவாளர் Anthropic-ன் ஆரம்பகால முதலீட்டாளரும் ஆவார். அவர்களுக்கும் எங்கள் உள்ளடக்கத்தில் எந்த தலையீடும் இல்லை. என் மனைவி கூகிளில் பணிபுரிகிறார், ஆனால் அவர்களின் AI தயாரிப்புகளுடன் அவருக்கு எந்த தொடர்பும் இல்லை. எனவே, நான் பொதுவாக கூகிள் பற்றி அதிகம் எழுதுவதில்லை. ஆனால் இந்தக் கட்டுரையில் கூகிள் பற்றி குறிப்பிடாமல் இருப்பது சரியாக இருக்காது.

நல்ல செய்தி என்னவென்றால், இந்தக் கட்டுரைக்கு நீங்கள் எனது தலையங்க சுதந்திரத்தை நம்ப வேண்டியதில்லை. நான் செய்த வேலைகளை உங்களுக்குக் காட்டப் போகிறேன். சந்தையில் உள்ள அனைத்து முக்கிய AIகளையும் வைத்து பல ஒப்பீடுகளைச் செய்துள்ளேன். அவற்றில் பலவற்றை நானே உருவாக்கியுள்ளேன். அவற்றின் பதில்களை ஒப்பிட்டுப் பார்த்து, நான் பரிந்துரைக்க சரியான AI-ஐ தேர்ந்தெடுத்திருக்கிறேனா என்று நீங்களே முடிவு செய்யுங்கள்.

AI கலையின் நெறிமுறைகள்

AI கலை என்பது இணையத்தில் உள்ள உள்ளடக்கத்தில் கணினிகளுக்கு பயிற்சி அளிப்பதன் மூலம் உருவாக்கப்படுகிறது. இதில் பதிப்புரிமை அல்லது கலைஞர்களின் எண்ணம் பெரிதாக எடுத்துக் கொள்ளப்படுவதில்லை. எனவே, பெரும்பாலான கலைஞர்கள் இதற்கு அதிருப்தி தெரிவிக்கின்றனர். இந்நிலையில், AI கலையைப் பயன்படுத்துவது நியாயமானதா?

ஒரு நியாயமான உலகில், OpenAI சில கலைஞர்களுக்கு நஷ்ட ஈடு வழங்க வேண்டும். மேலும் கலை கடன் வாங்குதலின் வரம்புகளை காங்கிரஸ் தீர்மானிக்க வேண்டும். தற்போதுள்ள பதிப்புரிமை சட்டம் இந்த சிக்கலைத் தீர்க்க ஏற்றது அல்ல என்று நான் நம்புகிறேன். கலைஞர்கள் ஒருவரையொருவர் பாதித்து, ஒருவரைப் பற்றி ஒருவர் கருத்து தெரிவித்து, ஒருவருக்கொருவர் பொருட்களை கடன் வாங்குகிறார்கள். அதைப் போலவே AI கருவிகளைப் பயன்படுத்தக்கூடியவர்களும் தொடர்ந்து செய்வார்கள்.

என் தனிப்பட்ட தத்துவம் என் குழந்தைப் பருவத்தில் நான் ரசிகனாக இருந்த கலாச்சாரத்தால் பாதிக்கப்பட்டது: மற்றவர்களின் படைப்புகளை வைத்து உங்கள் சொந்த மகிழ்ச்சிக்காக உருவாக்குவது சரியானது, ஆனால் உங்களுக்குப் பிடித்திருந்தால் அதற்கு நீங்கள் பணம் செலுத்த வேண்டும். மேலும் அதை விற்கக்கூடாது. அதாவது, உருவாக்கப்பட்ட AI கலையை வணிக நோக்கங்களுக்காகப் பயன்படுத்தக்கூடாது, ஆனால் உங்கள் குடும்பப் புகைப்படங்களுடன் விளையாடுவது சரியானது.

பட உருவாக்கும் கருவிகளில் சிறந்த தேர்வு

சமீபத்தில் OpenAI அறிமுகப்படுத்திய 4o பட உருவாக்கும் முறை, AI பட உருவாக்கும் கருவிகளில் சிறந்தது. அது இலவசமாகவும், கட்டண அடிப்படையிலும் சிறந்த தேர்வாக இருக்கிறது.

4o வெளியாவதற்கு முன்பு, நான் AI பட உருவாக்கும் தளம் Midjourney-யை சந்தா செய்திருந்தேன். AI கலை என்று வரும்போது, உங்கள் நினைவுக்கு வருவது Midjourney-தான். இது மர்மமான, மறக்கமுடியாத, கண்கவர் விளைவுகளை உருவாக்கும். மேலும் உங்கள் இறுதி முடிவுகளை மேம்படுத்துவதற்கும், திருத்துவதற்கும் சில சிறந்த கருவிகளைக் கொண்டுள்ளது. உதாரணமாக, மற்ற எல்லாவற்றையும் அப்படியே வைத்துக்கொண்டு ஒருவரின் முடியை மட்டும் மாற்றுவது போன்ற வசதிகள் இதில் உள்ளன.

4o-வின் மிகப்பெரிய பலம் என்னவென்றால், சிறப்பாக இல்லாத ஒரு புகைப்படத்தை அழகான கலைப் படைப்பாக மாற்றும் திறன் கொண்டது. மேலும் அசல் புகைப்படத்தின் அம்சங்களையும் அப்படியே தக்கவைத்துக்கொள்ளும். இதற்கு முந்தைய எந்த மாடலாலும் இதைச் செய்ய முடியவில்லை.

கீழே உள்ள படத்தில், நானும் என் மனைவியும் எங்கள் குழந்தையின் முதல் பிறந்தநாளைக் கொண்டாடுகிறோம்:

AI, கேக்கை (அசல் புகைப்படத்தில் காகிதத் துண்டு சுருளால் மறைக்கப்பட்டிருந்தது) படத்தின் முக்கிய இடத்திற்கு மாற்றியுள்ளது. அதே நேரத்தில் நானும், என் மனைவியும் குழந்தையை வைத்திருக்கும் தோரணையும், மேஜையிலிருந்த பொருட்களும், பின்னணியில் உள்ள புகைப்படங்கள் ஒட்டப்பட்ட பிரிட்ஜையும் அப்படியே தக்கவைத்துக்கொண்டது. இதன் விளைவாக உருவான படம் அன்பானதாகவும், மகிழ்ச்சியானதாகவும், அழகானதாகவும் இருந்தது.

இந்த ஒரு காரணத்திற்காகத்தான் 4o சமீபத்தில் பிரபலமடைந்தது. இதற்கு முன்பு எந்த பட உருவாக்கும் கருவியும் இதைச் செய்யவில்லை.

கீழே உள்ள படத்தில், அதே புகைப்படத்தை “பிக்சர் பாணி திரைப்படமாக” மாற்ற Midjourney-க்கு கட்டளையிடப்பட்டது:

இது முற்றிலும் மாறுபட்ட குடும்பத்தைப் போலவும், அசல் புகைப்படத்துடன் எந்த தொடர்பும் இல்லாதது போலவும் இருக்கும். Midjourney-ல் இதைவிட சிறந்த விளைவுகளைப் பெறலாம். ஆனால் அதற்கு அந்த தளத்தின் குறிப்பிட்ட மொழி மற்றும் கருவிகளைப் பயன்படுத்துவதில் நீங்கள் நிபுணத்துவம் பெற வேண்டும். அதற்கு சில வாரங்கள் ஆகும்.

இதற்கு மாறாக, ChatGPT எந்த சிறப்பு மொழியும் இல்லாமல், எளிமையான வேண்டுகோளுடன் முதல் முயற்சியிலேயே Midjourney-யை விட மிகச்சிறந்த வெளியீட்டை எனக்கு வழங்கியது.

4o மற்றும் மற்ற பட மாதிரிகளுக்கு இடையிலான வேறுபாடு இந்த மாதிரியான வேண்டுகோள்களில் தெளிவாகத் தெரிகிறது. மேலும் படங்கள் உருவாக்கும் மற்ற பணிகளுக்கும் இது மிகவும் பொருத்தமாக இருக்கிறது. நீங்கள் எந்த முயற்சியும் எடுக்காமல் பயன்படுத்தும்போதே நல்ல முடிவுகள் கிடைக்கின்றன. மேலும் சிறந்த படைப்புகளை உருவாக்குவது கடினம் அல்ல. AI கருவிகளிலிருந்து நாம் விரும்புவது இதுதான் - சாதாரண மக்களும் எளிய மொழியில் அற்புதமான விஷயங்களை உருவாக்க முடியும்.

4o-வின் ஒரு குறைபாடு என்னவென்றால், மற்ற பகுதிகளை அப்படியே வைத்துக்கொண்டு, படத்தின் சிறிய பகுதிகளை மட்டும் திருத்துவது கடினம். ஆனால் அதைச் செய்ய Midjourney தேவையில்லை. ஜெமினி இப்போது இந்த அம்சத்தை இலவசமாக வழங்குகிறது.

4o பட உருவாக்கும் உதவிக்குறிப்புகள்

4o-லிருந்து நல்ல படங்களைப் பெற, நீங்கள் முதலில் பல்வேறு படங்களைத் (எடுத்துக்காட்டாக, ஆட்சேபனைக்குரிய அல்லது ஆபாசமான படங்கள்) தடுக்கும் வடிப்பான்களைத் தவிர்க்க வேண்டும், ஆனால் இந்த வடிப்பான்கள் பாதிப்பில்லாத உள்ளடக்கத்திற்கு எதிராகச் செயல்படும். உள்ளடக்க வடிப்பான்களால் ஏற்படும் சிக்கல்களைத் தவிர்க்க, ஒரு குறிப்பிட்ட கலைஞரின் பாணியில் படைப்புகளை உருவாக்கக் கேட்காதீர்கள். அதற்கு பதிலாக, அந்த கலைஞரை நினைவூட்டும் சில படைப்புகளை உருவாக்கக் கேளுங்கள். பின்னர் “பாணி மாற்றம்” செய்யச் சொல்லுங்கள். இது மட்டுமே சரியான தீர்வு என்று உறுதியாகச் சொல்ல முடியாது. ஆனால் இது எனக்கு நல்ல பலனைத் தந்தது.

இந்த ஆண்டு மார்ச் மாதத்தில், 4o ஐப் பயன்படுத்தி ஜப்பானிய அனிமேஷன் மாஸ்டர் ஹயா மியாசக்கியின் கிப்லி ஸ்டுடியோ பாணியில் அழகான குடும்பப் புகைப்படங்களை உருவாக்கினர். அது இணையத்தில் பிரபலமானது. கிப்லி ஸ்டுடியோவின் பாணி அழகானது மட்டுமல்ல, இன்னும் கொஞ்சம் அதிகமாகக் கொடுத்தால், அதைவிட சிறந்த விளைவுகளைப் பெறலாம். கீழே உள்ள படத்தில், என் மகள் மேசையிலிருந்து தின்பண்டங்களைத் திருடும் புகைப்படத்தை கிப்லி ஸ்டுடியோ பாணியில் உருவாக்க 4o ஐப் பயன்படுத்தினேன். அதற்கு “கிப்ளி பாணியில் மாற்றவும்” என்று மட்டும் கட்டளையிட்டேன்:

அழகாக இருக்கிறது! ஆனால் இந்த புகைப்படத்தை கிப்லி பாணியில் சிறப்பாக மாற்றுவது எது, அது கிப்லி ஸ்டுடியோவின் எந்த திரைப்படத்திற்குப் பொருந்தும், அத்தகைய திரைப்படத்தில் என்ன சிறிய விவரங்கள் இருக்கும் என்று 4o-ஐ சிந்திக்கச் செய்தால், இதன் விளைவு இப்படி இருக்கும்:

இந்த இரண்டு படங்களுக்கும் இடையிலான வேறுபாடுகள் சிறியவை, ஆனால் முக்கியமானவை! ஒளி ஒரு குறிப்பிட்ட மூலத்திலிருந்து வருகிறது. மேசையின் மேல் உள்ள உணவு வகைகள் அதிகமாகவும், உண்மையானதாகவும் இருக்கிறது. தரையில் இருக்கும் புத்தகம் ஏதோ ஒரு புத்தகம் மட்டுமல்ல - அது எரிக் கார்லின் எழுதிய “தி வெரி ஹங்க்ரி கேட்டர்பில்லர்” புத்தகத்தின் தெளிவான படத்தைக் காட்டுகிறது. முதல் புகைப்படத்தில் குழந்தையின் நோக்கம் மற்றும் தீவிரம் இல்லை.

சில ஆண்டுகளுக்கு முன்பு, மொழி மாதிரிகளில் ஒரு விசித்திரமான விஷயம் இருந்தது. நீங்கள் வெறுமனே “ஒரு சிறந்த பதிலைக் கொடுங்கள்” என்று சொன்னால், அவை இன்னும் புத்திசாலித்தனமாக பதிலளிக்கும். மொழி மாதிரிகளுக்கு இது அவ்வளவாகப் பொருந்தாது, ஆனால் AI கலை உருவாக்கத்திற்கு, இது இன்னும் பொருந்தும். AI-ஐ நன்றாக வேலை செய்யச் சொல்லுங்கள், அது நன்றாகச் செய்யும். கலைஞரின் திறமையை அது சரியாகக் காட்டுகிறதா என்று கேள்வி கேளுங்கள். அது ஒரு சிந்தனைமிக்க பதிலைக் கொடுக்கும், பின்னர் இன்னும் சிறந்த படத்தை வரையும்.

பென்சில் ஓவியங்கள், புகைப்படம் எடுத்தல் அல்லது எண்ணெய் ஓவியம் போன்ற யதார்த்தமான கலை பாணிகளுக்கு இந்த வேறுபாடு இன்னும் தெளிவாகத் தெரியும். AIக்கு எப்படி கட்டளையிடுவது என்றுஉங்களுக்குத் தெரியாவிட்டால், இந்த பாணிகள் அவ்வளவு சிறப்பாக இருக்காது. மேலும் அடிக்கடி திகில் பள்ளத்தாக்கில் சிக்கிக் கொள்ளும். கடற்கரையில் நானும் என் மகளும் இருக்கும் புகைப்படத்தை பதிவேற்றி, “Rockwell-ன் ஓவியத்தை நினைவூட்டும் பாணியில் மாற்றவும்” என்று கூறினால், இதன் விளைவு இப்படி இருக்கும்:

AIக்கு இது மிகவும் சிறப்பாக இருக்கிறது, ஆனால் ஒரு கலைப் படைப்பாக இது உண்மையில் அவ்வளவு சிறப்பாக இல்லை. நார்மன் ராக்வெல்லின் மந்திரம் இதில் இல்லை. அதற்குக் காரணம் இருக்கிறது. AI-க்கு எப்படி சரியாக வரைய வேண்டும் என்று சொல்லிக் கொடுக்காமல் Rockwell போன்ற யதார்த்தமான கலை பாணிகளில் எதிர்பார்த்த முடிவுகளைப் பெறுவது கடினம்.

அவ்வாறு செய்வதற்கான ஒரு பரிந்துரை: ஒரு புகைப்படத்தை மட்டும் பதிவேற்றாமல், ஒவ்வொரு குடும்ப உறுப்பினரின் முகத்தின் தெளிவான புகைப்படங்களையும் பதிவேற்றி, அவை குறிப்புக்காகப் பயன்படுத்தப்படுகின்றன என்று AI-க்கு சொல்லுங்கள். பின்னர், AI-ஐ உடனடியாக படத்தை உருவாக்கச் சொல்லாமல், நீங்கள் எதைப் பிடிக்க விரும்புகிறீர்கள் என்பதைப் பற்றி உங்களுடன் கலந்துரையாடச் சொல்லுங்கள். நான் எழுதியது இங்கே:

இது என் மகள் கடலைப் பார்த்த முதல் தருணம். நார்மன் ராக்வெல்லின் பாணியில் இந்த தருணத்தைக் கைப்பற்றும் ஒரு ஓவியத்தை நான் விரும்புகிறேன். சாதாரண தருணங்களின் அழகையும், சாதாரண வாழ்க்கையின் மகிழ்ச்சியையும் எடுத்துக்காட்டும் வகையில் அது இருக்க வேண்டும். உங்களின் குறிப்புக்காக நானும், என் மகளின் கூடுதல் புகைப்படங்களை வழங்கியுள்ளேன். நீங்கள் படத்தை உருவாக்குவதற்கு முன், ராக்வெல் பாணியின் சாராம்சம், அவர் இந்த ஓவியத்தில் என்ன கொண்டு வருவார், அதை நாம் எப்படிப் பிடிக்கலாம் என்பதைப் பற்றி பேசலாம்.

4o இப்படி ஒரு வேண்டுகோளுக்கு ஆர்வத்துடன் பதிலளித்தது:

நார்மன் ராக்வெல் பாணியில் இந்த தருணத்தை சித்தரிக்க நான் மகிழ்ச்சியடைகிறேன். ஏனெனில் இது அந்த பாணிக்கு சரியான உதாரணமாக இருக்கும்: பரந்த மற்றும் காட்டுத்தனமான ஒன்றை (கடல்!) முதன்முறையாக சந்திப்பது, அரவணைப்பு, அக்கறை மற்றும் பெற்றோர் மற்றும் குழந்தைக்கு இடையிலான மனிதநேய தருணத்தின் அடிப்படையைக் கொண்டு வரையப்படும் படம் இது.

ராக்வெல் பாணியின் சில அடிப்படை கூறுகளைப் பற்றி பார்ப்போம், அவற்றைப் பயன்படுத்தி இந்த காட்சியின் அழகை எவ்வாறு வெளிப்படுத்தலாம்.

சிறிது நேரம் கலந்துரையாடிய பிறகு கிடைத்த முடிவு இங்கே:

இது ராக்வெல் பாணியில் இல்லையா? சரியாகச் சொல்ல முடியாது. ஆனால் நாம் முன்பு பார்த்த வரைபடத்தை விட இது மிகவும் சிறப்பாக இருக்கிறது. இதில் அதிக அசைவு, அதிக ஆற்றல், அதிக விவரங்கள் மற்றும் அதிக வெளிப்பாடு உள்ளது. ஒரு ஓவியத்தை வரைவதற்கு முன் அதைப்பற்றி AI-ஐ சிந்திக்கச் சொன்னதால் கிடைத்த பலன் இது!

4o வரைந்த படத்தை திருத்தச் சொல்லலாம், ஆனால் அதை ஒரு முறைதான் செய்ய முடியும். முதல் திருத்தத்திற்குப் பிறகு, அது வரைபடத்தை மோசமாக்கத் தொடங்குகிறது. ஏனெனில் அது பயன்படுத்தும் “சூழல்” இப்போது மோசமான வரைவுகளால் நிறைந்திருக்கிறது. (AI மனிதர்களைப் போல் வேலை செய்யாததற்கு இதுவும் ஒரு காரணம்.)

Midjourney இன்னும் சிறப்பாகச் செயல்படும் இடம் இதுதான். ஒட்டுமொத்த பாணியையும் அப்படியே வைத்துக்கொண்டு படத்தின் குறிப்பிட்ட பகுதிகளைத் திருத்துவதற்கு இதில் சிறந்த கருவிகள் உள்ளன. 4o-வில் இது இல்லை. 4o-வில் நீங்கள் திருத்தும் வரைபடத்தை இரண்டாவது முறையாகத் திருத்த விரும்பினால், ஒரு புதிய சாட் வி