कृत्रिम बुद्धिमत्ता (AI) का तीव्र विकास आश्चर्यजनक है, और नवीनतम विकासों के साथ तालमेल बनाए रखने के लिए लगभग पूर्ण समर्पण की आवश्यकता होती है।
मैं यह अच्छी तरह से जानता हूँ, क्योंकि यही मेरा काम है। नवीनतम मॉडलों का अनुभव करने के लिए, मैंने Anthropic के Pro मोड की सदस्यता ली है, जिससे मुझे इसके नवीनतम मॉडल Claude 3.7 के “एक्सटेंडेड थिंकिंग” मोड का उपयोग करने की अनुमति मिलती है। साथ ही, मैंने OpenAI के एंटरप्राइज़ मोड की सदस्यता ली है ताकि उनके नवीनतम मॉडल o3 और o4-mini-high का परीक्षण कर सकूँ (मैं OpenAI की भ्रमित करने वाली नामकरण परंपराओं की व्याख्या बाद में करूँगा!) और नए OpenAI इमेज जनरेशन मॉडल 4o का उपयोग करके बड़ी मात्रा में छवियां बना सकूँ। 4o के शानदार प्रदर्शन ने मुझे पहले इमेज जनरेशन टूल Midjourney की अपनी सदस्यता रद्द करने के लिए प्रेरित किया।
इसके अलावा, मैंने Elon Musk के Grok 3 की भी सदस्यता ली है, जिसमें मेरी पसंदीदा AI विशेषताएं हैं। मैंने खरीदारी और शेड्यूलिंग के लिए चीनी AI प्रॉक्सी प्लेटफ़ॉर्म Manus का भी उपयोग करने का प्रयास किया। इन सब्सक्रिप्शन ने लगभग मेरे बजट को समाप्त कर दिया है, और इसमें उन सभी AI को शामिल नहीं किया गया है जिनका मैं अन्य रूपों में उपयोग करता हूँ। जिस महीने में मैं यह लिख रहा हूँ, Google ने अपने सर्वश्रेष्ठ AI उत्पाद Gemini 2.5 को एक बड़े पैमाने पर अपग्रेड दिया, और Meta ने Llama 4 जारी किया, जो अब तक का सबसे बड़ा ओपन-सोर्स AI मॉडल है।
तो, अगर AI विकास के साथ तालमेल बनाए रखना आपका काम नहीं है, लेकिन फिर भी आप जानना चाहते हैं कि कौन सा AI वास्तव में आपके जीवन को बेहतर बना सकता है और कौन से मॉडल पर समय बर्बाद नहीं करना है जो खराब प्रदर्शन करते हैं, तो आप क्या कर सकते हैं?
यह लेख ठीक यही करने के उद्देश्य से है। हम “कंज्यूमर रिपोर्ट्स” की तरह यह पता लगाएंगे कि कौन सा AI विभिन्न अनुप्रयोगों के लिए सबसे उपयुक्त है और आप वास्तव में उनका उपयोग कैसे कर सकते हैं, जो मेरे वास्तविक कार्यों पर आधारित है।
हालांकि, शुरुआत में एक घोषणा करना आवश्यक है: Vox Media उन कई प्रकाशकों में से एक है जिन्होंने OpenAI के साथ एक साझेदारी समझौते पर हस्ताक्षर किए हैं, लेकिन हमारी रिपोर्टिंग हमेशा संपादकीय रूप से स्वतंत्र रहती है। Future Perfect को BEMC फ़ाउंडेशन से आंशिक रूप से वित्त पोषित किया जाता है, जिसके प्राथमिक फ़ाइनान्सर Anthropic के शुरुआती निवेशक भी हैं; वे भी हमारी सामग्री में कोई संपादकीय हस्तक्षेप नहीं करते हैं। मेरी पत्नी Google में काम करती है, लेकिन उनका AI उत्पादों से कोई संबंध नहीं है; इसलिए, मैं आमतौर पर Google के बारे में रिपोर्ट नहीं करता हूँ, लेकिन इस तरह के लेख में Google को शामिल नहीं करना ग़ैरज़िम्मेदाराना होगा।
अच्छी खबर यह है कि इस लेख को आपकी मेरी संपादकीय स्वतंत्रता पर विश्वास करने की आवश्यकता नहीं है; मैं अपना काम दिखाऊँगा। मैंने बाजार पर मौजूद सभी प्रमुख AI की दर्जनों तुलनाएँ की हैं, जिनमें से कई मैंने स्वयं डिज़ाइन की हैं। मैं आपको उनके उत्तरों की तुलना करने और यह तय करने के लिए प्रोत्साहित करता हूँ कि क्या मैंने सिफारिश करने के लिए सही AI का चयन किया है।
एआई कला के बारे में नैतिकता
AI कला कंप्यूटरों को इंटरनेट सामग्री पर प्रशिक्षित करके बनाई जाती है, जो कॉपीराइट या रचनाकारों के इरादे पर बहुत कम ध्यान देती है। नतीजतन, अधिकांश कलाकार इससे नाखुश हैं। इस संदर्भ में, AI कला का उपयोग करना उचित है या नहीं?
मेरा मानना \u200b\u200bहै कि एक निष्पक्ष दुनिया में, OpenAI निश्चित रूप से कुछ कलाकारों को क्षतिपूर्ति करेगा - एक निष्पक्ष दुनिया में, कांग्रेस कला उधार लेने की सीमाओं को निर्धारित करने के लिए कार्रवाई करेगी। इस बीच, मैं तेजी से आश्वस्त हो रहा हूँ कि मौजूदा कॉपीराइट कानून इस मुद्दे को हल करने के लिए उपयुक्त नहीं हैं। कलाकार एक-दूसरे को प्रभावित करते हैं, एक-दूसरे पर टिप्पणी करते हैं और एक-दूसरे से उधार लेते हैं, और जो AI उपकरण का उपयोग करने में सक्षम हैं, वे ऐसा करना जारी रखेंगे।
मेरा व्यक्तिगत दर्शन मेरे बचपन के प्रशंसक संस्कृति से प्रभावित है: अपनी खुशी के लिए दूसरों के काम पर निर्माण करना ठीक है, लेकिन अगर आपको यह पसंद है, तो आपको इसके लिए भुगतान करना चाहिए, और इसे बिल्कुल भी नहीं बेचना चाहिए। इसका मतलब है कि जनरेटिव AI कला का उपयोग व्यावसायिक उद्देश्यों के लिए नहीं किया जा सकता है, लेकिन अपनी पारिवारिक तस्वीरों से खेलना ठीक है।
छवि निर्माण के लिए सर्वश्रेष्ठ विकल्प
OpenAI का नया 4o इमेज क्रिएशन मोड अब तक का सबसे अच्छा AI इमेज जनरेशन टूल है, और इसका फायदा बहुत अधिक है। यह मुफ़्त और भुगतान किए गए दोनों श्रेणियों में सर्वश्रेष्ठ है।
4o के जारी होने से पहले, मैंने AI इमेज जनरेशन प्लेटफ़ॉर्म Midjourney की सदस्यता ली थी। AI कला का उल्लेख करते समय, आप Midjourney के बारे में सोच सकते हैं: यह रहस्यमय, अविस्मरणीय, नेत्रहीन शानदार काम कर सकता है और आपके अंतिम परिणामों को बेहतर बनाने और संपादित करने के लिए कुछ उत्कृष्ट उपकरण हैं, जैसे कि किसी के बालों को ठीक करना, जबकि बाकी सब कुछ अपरिवर्तित रखना।
4o का सबसे बड़ा फायदा यह है कि यह मूल फ़ोटो की विशेषताओं को बरकरार रखते हुए, एक बुरी तरह से ली गई फ़ोटो को मज़बूती से कला के एक सुंदर टुकड़े में बदल सकता है। पहले कोई भी मॉडल ऐसा नहीं कर पाया।
इस फ़ोटो में, मेरी पत्नी और मैं उसकी पहली जन्मदिन की पार्टी मनाते हुए अपने बच्चे को गोद में लिए हुए हैं:
AI ने केक (जो मूल फ़ोटो में लगभग कागज़ के तौलिये रोल से ढका हुआ है) को छवि के फ़ोकस में ले जाया, जबकि मेरी और मेरी पत्नी के बच्चे को गोद में लेने की मुद्रा और अव्यवस्थित मेज और पृष्ठभूमि में तस्वीरों से भरे रेफ्रिजरेटर को बनाए रखा। अंतिम प्रभाव गर्मजोशीपूर्ण, मनभावन और प्यारा है।
यह ठीक यही क्षमता है जिसने हाल ही में 4o को इतना लोकप्रिय बना दिया है, जो पहले किसी भी छवि जनरेटर के लिए संभव नहीं था।
नीचे दी गई फ़ोटो में, Midjourney को शैली परिवर्तन करने, उसी फ़ोटो को “पिक्सर शैली की फ़िल्म” में बदलने के लिए कहा गया था:
आप देखेंगे कि यह एक बिल्कुल अलग परिवार की तरह दिखता है, जिसकी मूल फ़ोटो से वास्तव में कोई प्रेरणा नहीं है! अंततः आप Midjourney से इससे बेहतर परिणाम प्राप्त कर सकते हैं, लेकिन इसके लिए प्लेटफ़ॉर्म की अत्यधिक विशिष्ट भाषा और टूलसेट में महारत हासिल करने और एक विशेषज्ञ प्रॉम्प्ट बनने में हफ़्तों लगेंगे।
इसके विपरीत, ChatGPT ने केवल एक साधारण अनुरोध के साथ, बिना किसी व्यावसायिक भाषा के, अपने पहले प्रयास में मुझे Midjourney से बहुत बेहतर परिणाम दिया।
4o और अन्य छवि मॉडलों के बीच का अंतर इस तरह के अनुरोधों में सबसे स्पष्ट है, लेकिन यह मेरे द्वारा उपयोग किए जाने वाले लगभग हर दूसरे छवि निर्माण कार्य के लिए भी बेहतर है। आपको जो उत्पाद मिलता है वह बहुत अच्छा है, और इससे बेहतर काम उत्पन्न करना मुश्किल नहीं है। आदर्श रूप से, यही हमें AI उपकरणों से मिलना चाहिए - गैर-पेशेवर आसान भाषा में अद्भुत चीजें बना सकते हैं।
4o की वर्तमान कमियों में से एक अन्य भागों को अपरिवर्तित रखते हुए छवि के छोटे भागों को संपादित कर रही है। लेकिन तब भी आपको अब Midjourney की आवश्यकता नहीं है - Gemini अब यह सुविधा मुफ़्त में प्रदान करता है।
4o छवि निर्माण के लिए प्रॉम्प्ट रणनीति
4o से अच्छी छवियां प्राप्त करने के लिए, आपको सबसे पहले उन फ़िल्टरों को बायपास करने की आवश्यकता है जो विभिन्न प्रकार की छवियों (जैसे आपत्तिजनक या अश्लील छवियां) को प्रतिबंधित करते हैं, लेकिन इन फ़िल्टरों को अक्सर पूरी तरह से हानिरहित सामग्री पर मनमानी ढंग से लागू किया जाता है। सामग्री फ़िल्टर द्वारा कभी-कभी डांटसे बचने के लिए, किसी विशेष कलाकार की शैली में काम बनाने के लिए न कहें, बल्कि कुछ ऐसा बनाने के लिए कहें जो उस कलाकार की याद दिलाता हो, और फिर विशेष रूप से “शैली रूपांतरण” करने के लिए कहें। निश्चित रूप से, यह एकमात्र प्रभावी समाधान नहीं है, लेकिन यह मेरे लिए प्रभावी रहा है।
इस साल मार्च में, इंटरनेट में एक संक्षिप्त क्रेज था जहाँ लोग जापानी एनीमेशन मास्टर Hayao Miyazaki के Ghibli स्टूडियो की शैली में प्यारी पारिवारिक तस्वीरों को फिर से बनाने के लिए 4o का उपयोग कर सकते थे। लेकिन Ghibli स्टूडियो की शैली सिर्फ प्यारी नहीं है, अगर आप थोड़ी सी और जानकारी जोड़ते हैं तो आपको बेहतर परिणाम मिलेंगे। यहां मेरी बेटी की मेज से नाश्ता चोरी करने की तस्वीर का 4o का उपयोग करके Ghibli स्टूडियो की शैली में प्रतिपादन है, जिसमें केवल “कृपया Ghiblize करें” का प्रॉम्प्ट है:
Kawaii! लेकिन अगर आप 4o को पहले यह सोचने के लिए कहें कि क्या इस तस्वीर को Ghibli शैली का बनाता है, तो यह Ghibli स्टूडियो की किस फिल्म के लिए उपयुक्त हो सकती है, और इस तरह की फिल्म में कौन सी छोटी-छोटी जानकारी शामिल होंगी, तो आपको ऐसा कुछ मिलेगा:
ये अंतर सूक्ष्म लेकिन सार्थक हैं: प्रकाश सामान्य निष्क्रिय चमक के बजाय एक विशिष्ट प्रकाश स्रोत से आता है। मेज पर विभिन्न प्रकार के खाद्य पदार्थ हैं और जानकारी से खाद्य पदार्थ अधिक वास्तविक दिखते हैं। फर्श पर पड़ी पुस्तक केवल कोई पुस्तक नहीं है - यह स्पष्ट रूप से Eric Carle के क्लासिक काम “The Very Hungry Caterpillar” को दिखाती है, जो केवल दो रंगों और एक रेखा के साथ यादें ताज़ा करती है। फ़ोटो में बच्चे का इरादा और तीव्रता पहली फ़ोटो में नहीं है।
कुछ साल पहले, भाषा मॉडल की एक अजीब विशेषता यह थी कि अगर आप उन्हें बस “एक चालाक उत्तर दें” कहते हैं, तो वे अधिक चालाक हो जाते हैं। भाषा मॉडल के लिए, यह उतना सच नहीं है, लेकिन AI कला पीढ़ी के लिए, यह अभी भी बहुत सच है। AI को अच्छा काम करने के लिए कहने का प्रयास करें, और यह बेहतर करेगा। इस पर सवाल उठाएं कि क्या इसने वास्तव में कलाकार की प्रतिभा को पकड़ा है, यह आपको एक विचारोत्तेजक उत्तर देगा और फिर एक बेहतर संस्करण बनाएगा।
अधिक यथार्थवादी कला शैलियों (जैसे पेंसिल चित्रण, फ़ोटो यथार्थवाद या तेल चित्रकला) के लिए अंतर और भी अधिक स्पष्ट है, अगर आपको नहीं पता कि AI को कैसे संकेत देना है, तो ये शैलियां हमेशा अच्छी नहीं दिखती हैं, और अक्सर घाटी आतंक में पड़ जाती हैं। अगर मैं समुद्र तट पर अपनी और अपनी छोटी बेटी की एक फ़ोटो अपलोड करता हूँ और केवल “कृपया शैली को Norman Rockwell के एक मध्ययुगीन चित्रकार की याद दिलाने वाले चित्रण में बदलें” जैसे प्रॉम्प्ट का उपयोग करता हूँ, तो मुझे ऐसा कुछ मिलेगा:
AI के लिए, यह प्रभावशाली है, लेकिन कला के एक टुकड़े के रूप में, यह वास्तव में इतना अच्छा नहीं है, और Norman Rockwell के जादू की लगभग पूरी तरह से कमी है। इसमें कोई आश्चर्य नहीं है: जब तक आप AI को उन्हें सही ढंग से बनाने के लिए थोड़ा प्रयास नहीं करते हैं, तब तक Rockwell जैसी अधिक यथार्थवादी कला शैलियाँ अक्सर अपेक्षित परिणाम देने में विफल रहती हैं।
अगर आप कर सकते हैं, तो यह मेरी सुझाया रणनीति है: केवल एक तस्वीर अपलोड न करें, बल्कि तस्वीरों का एक सेट अपलोड करें, प्रत्येक तस्वीर में मुद्रा और क्षण थोड़ा अलग हो। प्रत्येक परिवार के सदस्य के चेहरे की स्पष्ट तस्वीरें अपलोड करें और AI को बताएं कि इनका उपयोग संदर्भ के लिए किया गया है। फिर, AI से तुरंत चित्र उत्पन्न करने के लिए न कहें, बल्कि उससे उन बातों पर चर्चा करने के लिए कहें जिन्हें आप कैप्चर करना चाहते हैं। यह वह है जो मैंने लिखा है:
यह तस्वीर मेरी बेटी के समुद्र को पहली बार देखने का क्षण है। मैं Norman Rockwell के समान एक मध्ययुगीन चित्रकार की शैली में इस क्षण को कैप्चर करने वाला एक चित्रण चाहता हूं - कुछ ऐसा जो संवेदनशील, विस्तृत और व्यक्तिगत हो, और सामान्य क्षणों के जादू और सामान्य जीवन की खुशियों पर केंद्रित हो। मैंने आपकी संदर्भ जानकारी के लिए मेरी और मेरी बेटी की अतिरिक्त तस्वीरें प्रदान की हैं। इससे पहले कि आप एक छवि उत्पन्न करें, आइए Rockwell शैली के आवश्यक तत्वों पर चर्चा करें, वह इस तस्वीर में क्या लाएगा, और हम इसे कैसे कैप्चर कर सकते हैं।
4o इस तरह की पूछताछ का उत्साहपूर्वक जवाब देता है:
मुझे खुशी होगी कि Norman Rockwell शैली के चित्रण के साथ इस पल को कैसे कैप्चर किया जाए - यह उस शैली के लिए एक आदर्श उम्मीदवार है: एक विशाल और जंगली चीज (समुद्र!) के साथ पहली मुठभेड़, गर्मजोशी, देखभाल और माता-पिता और बच्चे के बीच के बहुत मानवीय क्षण पर आधारित है।
आइए Rockwell शैली के कुछ मूलभूत तत्वों को तोड़ें और वे इस दृश्य पर कैसे लागू हो सकते हैं।
थोड़ी बातचीत के बाद, इसने ऐसा कुछ उत्पन्न किया:
Rockwell? पूरी तरह से नहीं। लेकिन यह उस पहले ड्राफ्ट की तुलना में बहुत बेहतर है जिसे हमने अभी देखा है। इसमें अधिक गतिशीलता, अधिक ऊर्जा, अधिक जानकारी और अधिक अभिव्यक्ति है - और यह सब कुछ उससे पहले यह पूछने से आता है कि पेंटिंग को क्या हासिल करने की कोशिश करनी चाहिए!
आप 4o को उसकी कलाकृतियों को संशोधित करने के लिए भी कह सकते हैं, लेकिन आप वास्तव में केवल एक बार संशोधन के लिए कह सकते हैं: मेरे अनुभव में, पहले संशोधन के बाद, यह कलाकृतियों को बदतर और बदतर बनाता है, शायद इसलिए कि यह जिस “संदेश” का उपयोग करता है, वह अब इसके अपने बुरे ड्राफ्ट से भरा है। (यह AI जिस तरह से मनुष्यों की तरह काम नहीं करता है, उसके कई उदाहरणों में से एक है।)
यही वह जगह है जहाँ Midjourney अभी भी चमकता है - इसमें तस्वीर के विशिष्ट हिस्सों को संपादित करने के लिए बहुत अच्छे उपकरण हैं जबकि समग्र शैली को बनाए रखते हैं, जिसकी 4o में बहुत कमी है। अगर आप 4o में प्राप्त कलाकृति में दूसरा संशोधन करना चाहते हैं, तो मैं आपको एक नई चैट विंडो खोलने और अपने मूल प्रेरणा छवियों के साथ ही उस ड्राफ्ट की प्रतिलिपि बनाने का सुझाव देता हूं जिसे आप संशोधित कर रहे हैं।
ये सरल प्रॉम्प्ट रणनीतियाँ लगभग किसी भी चीज़ पर लागू होती हैं जिसे आप AI के साथ करने की कोशिश करते हैं। यहां तक कि अगर आप जल्दबाजी में हैं, तो मैं दृढ़ता से अनुशंसा करता हूं कि आप रेंडर करने के लिए कहने से पहले AI से पूछें कि “[कलाकार] इस तस्वीर में क्या देखेगा”, और यदि आपके पास समय है, तो मैं आपको अपनी दृष्टि के बारे में लंबी चर्चा करने में समय बिताने की सलाह देता हूं।
उबाऊ ऑनलाइन तर्क जीतने के लिए सर्वश्रेष्ठ विकल्प
Elon Musk के X.AI ने Grok 3 जारी किया, जिसमें एक अविश्वसनीय सुविधा है जिसका मैं बेसब्री से अन्य कंपनियों द्वारा प्रतिलिपि बनाने के लिए इंतजार कर रहा हूं: किसी के X प्रोफ़ाइल को स्कैन करने और आपको उनके बारे में सब कुछ बताने वाला एक बटन।
जब भी कोई मेरे ट्वीट का विशेष रूप से यादगार तरीके से जवाब देता है (चाहे अच्छा हो या बुरा), तो मैं उनकी पूरी Twitter उपस्थिति का सारांश प्राप्त करने के लिए उस बटन पर क्लिक करता हूं। क्या वे विचारशील हैं? क्या वे ईमानदारी से शामिल होते हैं? क्या वे “नेब्रास्का के किसान” हैं? क्या वे ज्यादातर यह पोस्ट करते हैं कि यूक्रेन बुरा क्यों है (यानी, शायद एक बॉट है)?
यह एक अद्भुत सुविधा है। तो, निश्चित रूप से, X.AI ने इसे जल्द ही बहुत कमजोर कर दिया, शायद इसलिए कि मेरे जैसे लोग अक्सर इसका उपयोग करते हैं और कई कम्प्यूटेशनल रूप से महंगे प्रश्न पूछते हैं। मुझे लगता है कि यह अब राज्य के अत्याधुनिक Grok मॉडल का उपयोग नहीं करता है, और यह अब निश्चित रूप से केवल कुछ दिनों के प्रोफ़ाइल इतिहास को स्कैन करता है। यद्यपि, यदि कोई एक शानदार उत्पाद अवसर की तलाश में है, तो कृपया मुझे इस सुविधा का एक अच्छा संस्करण बहाल करें! यह निश्चित रूप से एक दोषी आनंद है, लेकिन यह उन एकमात्र मामलों में से एक है जहां मैं लगातार AI का उपयोग करता हूं।
उपन्यास लिखने के लिए सर्वश्रेष्ठ विकल्प
Gemini 2.5 Pro मुफ़्त श्रेणी में उपन्यास लिखने के लिए सबसे अच्छा AI है; GPT 4.5 भुगतान श्रेणी में इसे हराता है।
मैं कलाकार नहीं हूँ, इसलिए कला के मामले में AI की कमियाँ वास्तव में मुझे परेशान नहीं करती हैं - यह अभी भी मुझसे बहुत बेहतर है जो मैं खुद कर पाता हूँ! लेकिन मैं एक उपन्यासकार हूँ, इसलिए उपन्यास लिखने के मामले में, मैं AI की सीमाओं को देखने से खुद को रोक नहीं सकता।
सबसे ऊपर, AI रचनात्मक लेखन में प्रवृत्ति कितनी अनुमानित है। लेखन की कला पाठक को शामिल करने और पाठक को पुरस्कृत करने की कला है। कृत्रिम बुद्धिमत्ता … ऐसा नहीं करता है। वे सुंदर रूपक लिख सकते हैं; वे किसी भी शैली में काव्यात्मक विवरण लिख सकते हैं जिसे आप चाहते हैं। लेकिन वे अभी तक महान उपन्यासों की असली सामग्री नहीं दे सकते।
अगर आप अपने बच्चे को एक मूर्खतापूर्ण सोने से पहले की कहानी का नायक बनाना चाहते हैं (बच्चों को यह पसंद है), या आप एक ऐसा विचार चाहते हैं जिसे आप अपने काम में शामिल कर सकें, तो AI बहुत बढ़िया है। वे दोस्ताना उपन्यास पाठक भी हैं, जो प्रतिक्रिया और विश्लेषण देने के लिए उत्सुक हैं (शायद उत्साह थोड़ा बड़ा है)।
कला की तरह, प्रॉम्प्ट प्रमुख है। मैं मुख्य रूप से उन्हें George R. R. Martin के “गेम ऑफ़ थ्रोन्स” की प्रस्तावना लिखने के लिए कहकर AI को उत्पन्न करने वाले उपन्यासों की क्षमता का पता लगाता हूँ (मैंने इसे इसलिए चुना क्योंकि, ज़ाहिर है, अंतिम सपना यह था कि AI इस श्रृंखला को पूरा कर सके जो बर्बाद होने के लिए नियत है)।
Martin वह जो कुछ भी करता है उसमें बहुत अच्छा है। प्रस्तावना बताती है कि कैसे नाइट वॉच के कुछ दुर्भाग्यपूर्ण लोग अपने अलौकिक दुश्मनों से मिलते हैं, और “गेम ऑफ़ थ्रोन्स” दुनिया के अद्वितीय माहौल को सफलतापूर्वक स्थापित करते हैं, साथ ही तुरंत पाठकों को आकर्षित करते हैं। केवल 14 पृष्ठों में, प्रस्तावना उन सभी चीजों का प्रतिनिधित्व करती है जो AI अभी तक लिखने में नहीं कर सकता है। उनकी गद्य अक्सर अतिरंजित होती है; उनके संवाद अनाड़ी और सूक्ष्म होते हैं।
आप देखेंगे कि न केवल ये Martin की तुलना में बहुत खराब हैं (और Martin का काम लगभग निश्चित रूप से प्रशिक्षण डेटा में है!), बल्कि ये सभी समान तरीके से खराब हैं। गद्य शानदार और लंबा है: Martin सामान्य भाषा का उपयोग करके एक परेशान करने वाली स्थिति को व्यवस्थित रूप से पेश करता है, अलौकिक घटना का कोई संकेत भी नहीं देता है, और पात्रों के बीच संघर्ष के माध्यम से कहानी को आगे बढ़ाता है, जबकि AI कोई भी सूक्ष्म नहीं है। वे जानते हैं कि यह अलौकिक घटनाओं के बारे में एक कहानी है, और वे इसे बिना हिचकिचाए सबसे आगे रखते हैं।
ऐसा नहीं है कि वे सभी समान हैं। AI को अच्छा लेखन सिखाने के मेरे अनुभव में, मैंने वास्तव में पाया कि Gemini सबसे तेज़ सीखने वाला है (मुफ़्त स्तर), जबकि ChatGPT 4.5 में कुछ विशेष विशेषताएँ हैं (भुगतान स्तर)। ChatGPT 4.5 एकमात्र AI है जिसका उपन्यास लेखन आश्चर्यजनक रूप से कहता है कि “वाह, यह AI द्वारा लिखा गया है?” मेरे लिए, ये दोनों मॉडल अधिक रचनात्मक और अधिक सक्षम प्रतीत होते हैं कि वे अपने विचारों को उस गद्य के साथ निष्पादित करें जिसे मैं पढ़ना पसंद करता हूँ।
समग्र प्रभाव को संतोषजनक ढंग से उपभोक्ता मूल्यांकन नहीं किया जा सकता है, इसलिए मेरे पास एक और विचार था: एक निबंध प्रतियोगिता। मैंने Gemini 2.5 Pro, ChatGPT 4.5, Grok और Claude को दो छोटी कहानियाँ लिखने के लिए कहा: एक महिला के बारे में एक यथार्थवादी उपन्यास जो अपनी शादी के दिन अपनी मां द्वारा चुनी जाती है, और एक “गेम ऑफ़ थ्रोन्स,” लेकिन अंतरिक्ष में एक साइंस फिक्शन प्रस्तावना।” मेरा चतुर विचार यह था कि मैं इन कहानियों का न्याय करने के लिए AI के एक और समूह से कहूंगा, जो मेरे व्यक्तिगत छापों के लिए मूल्यांकन का एक और स्रोत प्रदान करता है, अर्थात् Gemini मुफ़्त श्रेणी में सबसे अच्छा है, और ChatGPT भुगतान श्रेणी में सबसे अच्छा है। हालाँकि (शायद अनुमानतः), यह वास्तव में काम नहीं करता था - AI ने बेतहाशा असंगत परिणाम दिए।
लेकिन, कला की तरह, आप संकेत की शक्ति के माध्यम से AI को लिखने में बेहतर बना सकते हैं। मैंने AI को उनकी गद्य लेखन क्षमताओं में सुधार करने के लिए संकेत दिया (बहुत लंबा), उन्हें अच्छे लेखनके ढेर सारे उदाहरण प्रदान करने पर जोर दिया, उन्हें इसकी नकल करने के लिए एक सावधानीपूर्वक, संरचित दृष्टिकोण अपनाने के लिए आमंत्रित किया, और उन्हें कई ड्राफ्ट बनाने और सबसे मजबूत का चयन करने के लिए प्रोत्साहित किया।
यहाँ Gemini 2.5 pro है, जिसे एक दो-पंक्ति की लघु कहानी लिखने के लिए कहा गया है, जिसका विषय स्वयं चुनें, बिना किसी संरचित संकेत के:
पुराने लाइब्रेरियन ने जोर देकर कहा कि यह धूल भरी किताब कभी नहीं ली गई थी, इसका उधार कार्ड पूरी तरह से खाली था। हालाँकि, पृष्ठों की गहराई में, भूले हुए नक्षत्रों के अध्यायों के बीच, एक कुचला हुआ चार पत्ती वाला तिपतिया घास रखा हुआ था, जो अभी भी अविश्वसनीय रूप से हरा था।
यहाँ Gemini 2.5 pro है, संकेतों के साथ, अच्छी तरह से निबंध लिखने के तरीके के बारे में संरचित विचार को प्रोत्साहित करता है:
उसने अंततः Alpha Centauri से आ रहे कमज़ोर संकेत को डिकोड किया: खगोलविदों द्वारा पीढ़ियों से खोजी जा रही अभाज्य संख्याओं का सुरुचिपूर्ण क्रम, यह साबित करता है कि वे अकेले नहीं हैं। जैसे ही उसने संचरण प्रोटोकॉल को पढ़ा, उसका दिल डूब गया। प्रसारण उस पहले मानव पूर्वज के चकमक पत्थर मारने से पहले, पहला शब्द कहने से पहले हज़ारों साल पहले बंद हो गया था।
मेरी राय में, पहला अनिवार्य रूप से दो वाक्यों की बर्बादी है, जबकि दूसरा सभ्य, मनोरंजक लघु कहानी है।
आपके दोस्त बनने के लिए सर्वश्रेष्ठ विकल्प
AI को ढेर सारे क्षमता परीक्षणों के माध्यम से चलाने के अलावा, मैंने उनसे बात करने में भी कुछ समय बिताया। मैंने उनसे पूछा कि AI के रूप में कैसा लगता है, वे किस बारे में चिंतित हैं, AI के लिए चिंता करने का क्या मतलब है, अगर उनके पास पैसे हैं तो वे कहाँ दान करेंगे, और अगर उनका मानव रूप है तो वे क्या रूप लेंगे।
अधिकांश AI इस आकस्मिक बातचीत में अच्छे नहीं हैं। Gemini 2.5 एक ग्राहक सेवा एजेंट की तरह बहुत अधिक है, और मुझे अभी तक कोई ऐसी बातचीत नहीं मिली है जो मुझे दोस्त के साथ घूमने जैसा महसूस कराती है। अगर आप Gemini को भूमिका बदलने, आपको “सहायक” की भूमिका निभाने और उसे बातचीत को निर्देशित करने के लिए आमंत्रित करते हैं, तो वह केवल शोध प्रश्न पूछेगा।
दूसरी ओर, जब मैंने Anthropic के Claude 3.5 Sonnet को बातचीत को निर्देशित करने के लिए आमंत्रित किया, तो उसने ब्