एआय युद्धाचा उलगडा: ChatGPT, Grok, Gemini & Claude

कृत्रिम बुद्धिमत्तेचा (AI) झपाट्याने होणारा विकास इतका वेगवान आहे की नवीनतम घडामोडींचा मागोवा घेणे खूपच कठीण आहे.

हे मला चांगलेच माहीत आहे, कारण तेच माझे काम आहे. नवीनतम मॉडेल्सचा अनुभव घेण्यासाठी, मी Anthropic च्या Pro मोडची सदस्यता घेतली आहे, ज्यामुळे मला त्यांचे नवीनतम मॉडेल Claude 3.7 चा “एक्सटेंडेड थिंकिंग” मोड वापरता येतो. त्याच वेळी, मी OpenAI च्या एंटरप्राइझ मोडची सदस्यता घेतली आहे, जेणेकरून त्यांची नवीनतम मॉडेल्स o3 आणि o4-mini-high (OpenAI च्या गोंधळात टाकणाऱ्या नामकरण नियमांविषयी लवकरच स्पष्टीकरण देईन!) वापरता येतील आणि OpenAI च्या नवीन इमेज जनरेशन मॉडेल 4o वापरून मोठ्या प्रमाणात प्रतिमा तयार करता येतील. 4o च्या उत्कृष्ट कामगिरीमुळे मी पूर्वी घेतलेली Midjourney इमेज जनरेशन टूलची सदस्यता रद्द केली.

याव्यतिरिक्त, मी Elon Musk च्या Grok 3 ची सदस्यता घेतली आहे, ज्यात मला सर्वात आवडते AI वैशिष्ट्य आहे. मी चीनचे AI एजंट प्लॅटफॉर्म Manus वापरून खरेदी आणि वेळापत्रक तयार करण्याचा प्रयत्न करत आहे. या सदस्यत्वामुळे माझे बजेट जवळपास संपले आहे, आणि ह्यात इतर स्वरूपात वापरल्या जाणाऱ्या AI चा समावेश नाही. ज्या महिन्यात मी हा लेख लिहित आहे, त्याच महिन्यात Google ने त्यांच्या सर्वोत्तम AI उत्पादन Gemini 2.5 मध्ये मोठे अपग्रेड केले आणि Meta ने Llama 4 जारी केले, जे आतापर्यंतचे सर्वात मोठे ओपन-सोर्स AI मॉडेल आहे.

जर AI डेव्हलपमेंटचा मागोवा घेणे तुमचे रोजचे काम नसेल, पण तरीही तुम्हाला हे जाणून घ्यायचे असेल की कोणते AI तुमच्या जीवनात खऱ्या अर्थाने सुधारणा करू शकतात आणि कोणते मॉडेल वाईट आहेत, तर तुम्ही काय कराल?

हा लेख याच उद्देशाने आहे. “ग्राहक अहवाला” च्या धर्तीवर, कोणता AI विविध ॲप्लिकेशन्ससाठी सर्वोत्तम आहे आणि ते कसे वापरायचे, याबद्दल सखोल माहिती येथे मिळेल, हे सर्व माझ्या प्रत्यक्ष कामाच्या अनुभवावर आधारित असेल.

परंतु, सर्वप्रथम हे स्पष्ट करणे आवश्यक आहे: Vox Media हे OpenAI सोबत करार केलेल्या काही प्रकाशकांपैकी एक आहे, परंतु आमचे रिपोर्टिंग नेहमीच संपादकीयदृष्ट्या स्वतंत्र असते. Future Perfect ला BEMC फाउंडेशनकडून partially निधी मिळतो, जे Anthropic चे लवकर गुंतवणूकदार आहेत; ते आमच्या कंटेंटमध्ये कोणताही संपादकीय हस्तक्षेप करत नाहीत. माझी पत्नी Google मध्ये काम करते, परंतु तिचा त्यांच्या AI उत्पादनांशी काहीही संबंध नाही; त्यामुळे, मी सामान्यतः Google बद्दल रिपोर्ट करत नाही, परंतु अशा लेखात Google चा समावेश न करणे गैरजबाबदार ठरेल.

चांगली गोष्ट म्हणजे, या लेखासाठी तुम्हाला माझ्या संपादकीय स्वातंत्र्यावर विश्वास ठेवण्याची गरज नाही; मी माझे काम दाखवीन. मी बाजारात उपलब्ध असलेल्या सर्व प्रमुख AI ची अनेक तुलनात्मक चाचण्या केल्या आहेत, त्यापैकी बऱ्याच चाचण्या मी स्वतः तयार केल्या आहेत. मी तुम्हाला त्यांच्या उत्तरांची तुलना करण्यास आणि मी योग्य AI निवडले आहे की नाही हे स्वतःच ठरवण्यास प्रोत्साहित करतो.

AI आर्ट्सची नैतिकता

AI आर्ट हे इंटरनेटवरील कंटेंटवर आधारित संगणकाला प्रशिक्षण देऊन तयार केले जाते, ज्यात कॉपीराइट किंवा निर्मात्याच्या हेतूचा फारसा विचार केला जात नाही. त्यामुळे बहुतेक कलाकार याबद्दल नाराज आहेत. अशा परिस्थितीत, AI आर्ट वापरणे योग्य आहे का?

मला वाटते की, एका न्याय्य जगात, OpenAI ने काही कलाकारांना भरपाई देणे निश्चित आहे—आणि एका न्याय्य जगात, काँग्रेस कलात्मक कामांच्या वापरावर मर्यादा घालण्यासाठी कायदा करेल. त्याच वेळी, मला अधिकाधिक खात्री आहे की सध्याचे कॉपीराइट कायदे ही समस्या सोडवण्यासाठी योग्य नाहीत. कलाकार एकमेकांवर प्रभाव टाकतात, एकमेकांवर टीका करतात आणि एकमेकांकडून कल्पना घेतात आणि AI साधने वापरण्यास सक्षम असलेले लोक ते करत राहतील.

माझे वैयक्तिक तत्त्वज्ञान माझ्या बालपणीच्या फॅन संस्कृतीने प्रभावित आहे: स्वतःच्या आनंदासाठी इतरांच्या कामावर आधारित काहीतरी तयार करणे ठीक आहे, परंतु जर तुम्हाला ते आवडले, तर तुम्ही त्यासाठी पैसे दिले पाहिजेत आणि ते अजिबात विकले नाही पाहिजे. याचा अर्थ असा आहे की जनरेटिव्ह AI आर्टचा व्यावसायिक कारणांसाठी वापर करू नये, परंतु तुमच्या कुटुंबासोबतच्या फोटोंसोबत खेळणे ठीक आहे.

इमेज जनरेशनसाठी सर्वोत्तम पर्याय

OpenAI ने लाँच केलेले नवीन 4o इमेज क्रिएशन मोड हे आतापर्यंतचे सर्वोत्तम AI इमेज जनरेशन टूल आहे, आणि ते स्पष्टपणे सरस आहे. हे विनामूल्य आणि सशुल्क अशा दोन्ही श्रेणींमध्ये सर्वोत्तम आहे.

4o च्या लाँचिंगपूर्वी, मी AI इमेज जनरेशन प्लॅटफॉर्म Midjourney ची सदस्यता घेतली होती. AI आर्टचा उल्लेख केल्यावर, तुमच्या मनात Midjourney चा विचार येऊ शकतो: हे रहस्यमय, अविस्मरणीय आणि दृश्यात्मकदृष्ट्या सुंदर कलाकृती तयार करते आणि तुमच्या अंतिम परिणामांमध्ये सुधारणा करण्यासाठी आणि संपादित करण्यासाठी काही उत्कृष्ट साधने आहेत, जसे की एखाद्या व्यक्तीचे केस व्यवस्थित करणे, तर बाकी सर्व काही तसेच ठेवणे.

4o चा सर्वात मोठा फायदा हा आहे की, ते खराब गुणवत्तेच्या फोटोला सुंदर कलाकृतीमध्ये रूपांतरित करू शकते, त्याच वेळी मूळ फोटोची वैशिष्ट्ये टिकवून ठेवू शकते. यापूर्वी कोणतेही मॉडेल हे करू शकत नव्हते.

खालील फोटोमध्ये, मी आणि माझी पत्नी आमच्या मुलाचा पहिला वाढदिवस साजरा करत आहोत:

AI केक (जो मूळ फोटोमध्ये कागदी टॉवेलने झाकलेला आहे) प्रतिमेच्या केंद्रस्थानी हलवते, त्याच वेळी मी आणि माझ्या पत्नीने मुलाला पकडलेली स्थिती आणि अव्यवस्थित टेबल आणि पार्श्वभूमीतील फोटोंनी भरलेले रेफ्रिजरेटर तसेच ठेवते. अंतिम परिणाम हृदयस्पर्शी, आनंददायी आणि सुंदर आहे.

या क्षमतेमुळे 4o सध्या खूप लोकप्रिय आहे, जे यापूर्वी कोणत्याही इमेज जनरेटरने करू शकले नाही.

खालील फोटोमध्ये, Midjourney ला शैली बदलण्याची विनंती केली, त्याच फोटोला “पिक्सर-शैलीतील चित्रपटा” मध्ये रूपांतरित करण्यास सांगितले:

तुम्ही बघू शकता की, हे पूर्णपणे वेगळे कुटुंब दिसत आहे आणि मूळ फोटोतून कोणतीही प्रेरणा घेतलेली नाही! Midjourney कडून तुम्हाला यापेक्षा चांगले परिणाम मिळू शकतात, परंतु त्यासाठी प्लॅटफॉर्मची विशिष्ट भाषा आणि टूलसेटमध्ये प्रभुत्व मिळवण्यासाठी आठवडे घालवावे लागतील, म्हणजेच तुम्हाला प्रभावी सूचना देणारा तज्ञ बनावे लागेल.

त्या तुलनेत, ChatGPT ने फक्त साध्या विनंतीवर, कोणत्याही विशिष्ट भाषेची गरज नसताना, पहिल्याच प्रयत्नात Midjourney पेक्षा खूपच चांगला निकाल दिला.

4o आणि इतर इमेज मॉडेल्समधील फरक अशा विनंत्यांमध्ये स्पष्टपणे दिसून येतो, परंतु ते माझ्याद्वारे वापरल्या जाणाऱ्या इतर जवळजवळ सर्व इमेज जनरेशन कार्यांसाठी अधिक योग्य आहे. तुम्हाला सुरूवातीलाच खूप चांगले उत्पादन मिळते आणि त्याहून चांगले काम तयार करणे देखील सोपे आहे.

4o मधील एक कमतरता म्हणजे, इतर भाग न बदलता प्रतिमेचा काही भाग संपादित करणे कठीण आहे. पण तरीही, तुम्हाला Midjourney ची गरज नाही—Gemini आता हे वैशिष्ट्य विनामूल्य पुरवते.

4o इमेज जनरेशनसाठी उपयुक्त टिप्स

4o कडून चांगले इमेज मिळवण्यासाठी, तुम्हाला प्रथम विविध प्रकारच्या इमेज (जसे की आक्षेपार्ह किंवा लैंगिकदृष्ट्या उत्तेजक) प्रतिबंधित करणारे फिल्टर टाळण्याची आवश्यकता आहे, परंतु हे फिल्टर अनेकदा पूर्णपणे निरुपद्रवी कंटेंटवर यादृच्छिकपणे लागू केले जातात. कंटेंट फिल्टरच्या შემთ्रीक फटकार्‍यांपासून वाचण्यासाठी, विशिष्ट कलाकाराच्या शैलीत कलाकृती तयार करण्यास सांगू नका, त्याऐवजी त्या कलाकाराच्या कामाची आठवण करून देणारी कलाकृती तयार करण्यास सांगा आणि नंतर “शैली रूपांतरण” (style transfer) करण्याची विशेष विनंती करा. अर्थात, हा एकमेव प्रभावी उपाय नाही, परंतु तो माझ्यासाठी नक्कीच उपयुक्त ठरला आहे.

यावर्षी मार्चमध्ये, इंटरनेटवर एक ट्रेंड सुरू झाला होता, ज्यामध्ये लोक जपानी ॲनिमे मास्टर Hayao Miyazaki च्या Ghibli स्टुडिओच्या शैलीत 4o वापरून त्यांच्या कुटुंबाचे सुंदर फोटो पुन्हा तयार करत होते. पण Ghibli स्टुडिओची शैली केवळ सुंदर नाही, तर तुम्ही थोडी जास्त सूचना दिल्यास तुम्हाला अधिक चांगले परिणाम मिळू शकतात. खाली माझ्या मुलीचा टेबलावरून स्नॅक्स चोरतानाचा फोटो 4o वापरून Ghibli स्टुडिओच्या शैलीत रूपांतरित केला आहे, ज्यामध्ये फक्त “Ghibli style मध्ये रूपांतरित करा” (Ghibli-fy) अशी सूचना देण्यात आली होती:

Kawaii! (कवाई!) पण जर तुम्ही 4o ला प्रथम विचारण्यास सांगितले की Ghibli शैली कशामुळे खास आहे, हा फोटो Ghibli स्टुडिओच्या कोणत्या चित्रपटासाठी योग्य आहे आणि अशा चित्रपटात कोणते छोटे तपशील असतील, तर तुम्हाला असा परिणाम मिळेल:

हे सूक्ष्म पण अर्थपूर्ण बदल आहेत: प्रकाश विशिष्ट स्त्रोताकडून येत आहे, सामान्य पार्श्वभूमीच्या प्रकाशामुळे नाही. टेबलावरील अन्नाचे प्रकार अधिक आहेत आणि तपशीलांमुळे ते अधिक वास्तविक दिसत आहे. जमिनीवरील पुस्तक फक्त कोणतेही पुस्तक नाही—ते Eric Carle च्या ‘The Very Hungry Caterpillar’ (द व्हेरी ह Hungry कैटरपिलर) या प्रसिद्ध कलाकृतीची स्पष्टपणे आठवण करून देते. पहिल्या फोटोमध्ये बाळाचा हेतू आणि तीव्रता दिसत नाही, जी या फोटोत आहे.

काही वर्षांपूर्वी, भाषेच्या मॉडेल्समध्ये एक विचित्र गोष्ट होती की, जर तुम्ही त्यांना फक्त “स्मार्ट उत्तर द्या” असे सांगितले, तर ते अधिक स्मार्ट बनत होते. भाषेच्या मॉडेल्ससाठी हे आता खरे नाही, परंतु AI आर्ट जनरेशनसाठी हे अजूनही खूप खरे आहे. AI ला चांगले काम करण्यास सांगा आणि ते अधिक चांगले करेल. कलाकाराची प्रतिभा खऱ्या अर्थाने पकडली आहे की नाही, असा प्रश्न विचारा, ते तुम्हाला विचारपूर्वक उत्तर देईल आणि मग एक चांगले व्हर्जन (version) तयार करेल.

अधिक वास्तववादी कला शैलींसाठी (जसे की पेन्सिल रेखाचित्रे, फोटो-रियलिझम किंवा तेल चित्रकला) हा फरक अधिक स्पष्ट आहे, जर तुम्हाला AI ला सूचना कशा द्यायच्या हे माहित नसेल, तर या शैली नेहमीच चांगल्या दिसत नाहीत आणि बर्‍याच वेळा ‘ uncanny valley ‘ मध्ये अडकतात. जर मी माझा आणि माझ्या लहान मुलीचा समुद्रकिनाऱ्यावरील फोटो अपलोड केला आणि फक्त “Rockwell च्या चित्रासारखी शैली द्या” (stylize to be reminiscent of a Rockwell illustration) अशी सूचना दिली, तर मला असा परिणाम मिळेल:

AI साठी हे प्रभावी आहे, परंतु एक कलाकृती म्हणून ते खरोखरच चांगले नाही आणि Norman Rockwell चा जादूचा स्पर्श पूर्णपणेmissing आहे. यात आश्चर्य वाटण्यासारखे काही नाही: जोपर्यंत तुम्ही AI कडून ते योग्यरित्या रेखाटून घेण्यासाठी काही प्रयत्न करत नाही, तोपर्यंत Rockwell सारख्या अधिक वास्तववादी कला शैली अपेक्षेप्रमाणे परिणाम देत नाहीत.

जर तुम्ही ते करू शकत असाल, तर मी शिफारस करेन की, फक्त एक फोटो अपलोड करू नका, तर फोटोंचा एक सेट अपलोड करा, ज्यामध्ये प्रत्येक फोटोची पोज आणि क्षण थोडा वेगळा असेल. कुटुंबातील प्रत्येक सदस्याच्या चेहऱ्याचे स्पष्ट फोटो अपलोड करा आणि AI ला सांगा की ते संदर्भासाठी आहेत. मग, AI ला त्वरित प्रतिमा तयार करण्यास सांगू नका, त्याऐवजी तुम्हाला काय Capture करायचे आहे, याबद्दल चर्चा करण्यास सांगा. मी काय लिहिले ते येथे आहे:

हा फोटो माझ्या मुलीने पहिल्यांदा समुद्र पाहिल्याचा क्षण आहे. मला Norman Rockwell सारख्या मध्ययुगीन चित्रकाराच्या शैलीत हा क्षण capture करायचा आहे—काहीतरी सूक्ष्म, तपशीलवार, वैयक्तिक आणि सामान्य क्षणांच्या जादूवर आणि सामान्य जीवनातील आनंदावर लक्ष केंद्रित केलेले. मी तुमच्या संदर्भासाठी माझे आणि माझ्या मुलीचे अतिरिक्त फोटो दिले आहेत. तुम्ही प्रतिमा तयार करण्यापूर्वी, Rockwell शैलीतील आवश्यक घटक, ते या फोटोमध्ये काय आणू शकतात आणि आपण ते कसे capture करू शकतो, याबद्दल चर्चा करूया.

4o ने उत्साहाने या Query ला प्रतिसाद दिला:

Norman Rockwell शैलीतील चित्राने हा क्षण capture करण्यास मी उत्सुक आहे—ही शैली अशा क्षणांसाठी योग्य आहे: विशाल आणि वन्य (समुद्र!), उबदारपणा, काळजी आणि पालक आणि मुलामधील अत्यंत मानवी क्षणांवर आधारित.

Rockwell शैलीतील काही मूलभूत घटकांचे विश्लेषण करूया आणि ते या दृश्यावर कसे लागू केले जाऊ शकतात.

काही वेळा ये-जा केल्यानंतर, AI ने असा परिणाम तयार केला:

Rockwell? पूर्णपणे नाही. पण आपण आत्ताच पाहिलेल्या पहिल्या मसुद्यापेक्षा हे खूप चांगले आहे. यामध्ये अधिक क्रिया, अधिक ऊर्जा, अधिक तपशील आणि अधिक अभिव्यक्ती आहे—आणि हे सर्व फक्त चित्र काढण्यापूर्वी AI ला चित्राने काय साध्य करण्याचा प्रयत्न केला पाहिजे, याबद्दल विचारण्यास सांगितल्यामुळे झाले!

तुम्ही 4o ला त्याचे रेखाचित्र सुधारण्यास सांगू शकता, पण तुम्ही ते फक्त एकदाच करू शकता: माझ्या अनुभवानुसार, पहिल्या सुधारणेनंतर, ते रेखाचित्र अधिकाधिक वाईट बनवू लागते, कारण कदाचित ते वापरत असलेला "संदर्भ" आता त्याच्या स्वतःच्या वाईट मसुद्यांनी भरलेला आहे. (हे AI मानवांप्रमाणे कसे कार्य करत नाही याचे एक उदाहरण आहे.)

येथेच Midjourney अजूनही चमकते—त्यामध्ये प्रतिमेची विशिष्ट भाग सुधारण्यासाठी खूप चांगली साधने आहेत, तर 4o मध्ये त्याची खूप कमतरता आहे. जर तुम्हाला 4o मध्ये मिळालेल्या चित्रात दुसरी सुधारणा करायची असेल, तर मी तुम्हाला एक नवीन चॅट विंडो उघडण्याची आणि तुम्ही सुधारत असलेला मसुदा तुमच्या मूळ प्रेरणेच्या प्रतिमेसोबत कॉपी करण्याची शिफारस करेन.

हे सोपे टिप्स AI वापरून तुम्ही जे काही करण्याचा प्रयत्न करत आहात, त्यावर लागू होतात. जरी तुम्हाला घाई असली, तरी मी जोरदारपणे शिफारस करेन की, तुम्ही render करण्यास सांगण्यापूर्वी, AI ला विचारा “[कलाकार] या चित्रात काय पाहू शकला असता” (what would [artist] see in this image), आणि जर तुमच्याकडे वेळ असेल, तर मी शिफारस करेन की तुम्ही तुमच्या दृष्टीबद्दल दीर्घ चर्चा करा.

कंटाळवाण्या इंटरनेट वादांमध्ये जिंकण्यासाठी सर्वोत्तम निवड

Elon Musk च्या X.AI ने Grok 3 लाँच केले आहे, ज्यामध्ये एक अविश्वसनीय वैशिष्ट्य आहे, ज्याची इतर कंपन्या कॉपी करतील, याची मी आतुरतेने वाट पाहत आहे: एखाद्याच्या X प्रोफाइलचे विश्लेषण करून त्यांच्याबद्दल सर्व काही सांगणारे बटण.

जेव्हा केव्हा कोणीतरी माझ्या ट्विटला विशेष लक्षवेधी पद्धतीने उत्तर देतो (चांगले किंवा वाईट), तेव्हा मी त्यांच्या संपूर्ण Twitter record चा सारांश मिळवण्यासाठी त्या बटणावर क्लिक करतो. ते विचारपूर्वक आहेत का? ते प्रामाणिकपणे सहभागी आहेत का? ते "नेब्रास्काचे शेतकरी" आहेत का? ते मोठ्या प्रमाणात युक्रेन का वाईट आहे, याबद्दल पोस्ट करतात का (म्हणजे, कदाचित एक बॉट)?

हे एक उत्तम वैशिष्ट्य आहे. त्यामुळे, अर्थातच, X.AI ने ते लवकरच खूप कमकुवत केले, कदाचित माझ्यासारखे लोक ते वारंवार वापरतात आणि अनेक computationally महाग Queries विचारतात, म्हणून. मला वाटते की ते आता Grok मॉडेल वापरत नाही आणि ते आता फक्त काही दिवसांचा प्रोफाइल इतिहास स्कॅन करते. परंतु, जर कोणी उत्कृष्ट उत्पादन संधी शोधत असेल, तर कृपया हे वैशिष्ट्य परत आणा! ही निश्चितपणे एक guilty pleasure आहे, पण हे त्यापैकी एक उदाहरण आहे, ज्यामुळे मी सतत AI वापरतो.

कादंबऱ्या लिहिण्यासाठी सर्वोत्तम निवड

Gemini 2.5 Pro हे विनामूल्य श्रेणीतील कादंबऱ्या लिहिण्यासाठी सर्वोत्तम AI आहे; GPT 4.5 हे सशुल्क श्रेणीमध्ये त्याहून सरस आहे.

मी कलाकार नाही, त्यामुळे AI च्या कलात्मक बाबतीत असलेल्या त्रुटी मला खरोखर disturb करत नाहीत—ते अजूनही मी स्वतःहून जे करू शकतो त्यापेक्षा खूप चांगले आहे! पण मी एक कादंबरीकार आहे, त्यामुळे कादंबरी लेखनाच्या बाबतीत AI च्या मर्यादा मला स्पष्टपणे दिसतात.

सर्वात महत्त्वाची गोष्ट म्हणजे AI च्या सर्जनशील लेखनाची प्रवृत्ती किती predictable आहे. लेखनकला म्हणजे वाचकाला गुंतवून ठेवण्याची आणि त्याला परतफेड देण्याची कला. AI… ते करत नाही. ते सुंदर रूपक लिहू शकतात; ते तुमच्या इच्छेनुसार कोणत्याही शैलीत सुंदर वर्णन करू शकतात. पण ते अजूनही चांगल्या कादंबरीतील मुख्य भाग देऊ शकत नाहीत.

जर तुम्हाला तुमच्या मुलाला मुख्य पात्र बनवून एखादी मूर्ख bedtime story (झोपण्यापूर्वी ऐकण्याची गोष्ट) सांगायची असेल (मुलांना ते आवडते), किंवा तुम्हाला तुमच्या स्वतःच्या कामात integrate करण्यासाठी काही कल्पना हव्या असतील, तर AI खूपच छान आहे. ते कादंबऱ्यांचे मैत्रीपूर्ण वाचक देखील आहेत, जे आनंदाने feedback आणि विश्लेषण देतात (कदाचित थोडा जास्तच उत्साह दाखवतात).

कलाकृतीप्रमाणेच, सूचना (prompt) खूप महत्त्वाची आहे. AI ने निर्माण केलेल्या कादंबऱ्या शोधण्यासाठी, मी त्यांना George R.R. Martin च्या ‘Game of Thrones’ (गेम ऑफ थ्रोन्स) ची प्रस्तावना लिहिण्यास सांगितले (मी हे निवडले कारण, अर्थातच, अंतिम ध्येय हे आहे की AI ही मालिका पूर्ण करू शकेल).

Martin जे काही करतात, ते खूप चांगले करतात. प्रस्तावना Night’s Watch (नाईट्स वॉच) मधील काही दुर्दैवी लोकांची कथा सांगते, जे त्यांच्या अलौकिक शत्रूंना भेटतात आणि ‘Game of Thrones’ च्या जगाचा एक अद्वितीय vibe यशस्वीपणे स्थापित करतात, त्याच वेळी वाचकांना त्वरित attract करतात. फक्त 14 पानांमध्ये, प्रस्तावना AI लेखनाच्या बाबतीत काय करू शकत नाही, हे दर्शवते. त्यांची نثر (prose) शैली (शैली व शब्द निवड) बर्‍याच वेळा artificial असते; त्यांचे संभाषण (conversation) awkward असते.

तुम्ही बघू शकता की हे Martin च्या कामापेक्षा खूपच वाईट आहे (आणि Martin चे काम निश्चितपणे प्रशिक्षण डेटा (training data) मध्ये आहे!), आणि ते सर्व एकाच प्रकारे वाईट आहेत. نثر (prose) शैली (शैली व शब्द निवड) ornate (अलंकारिक) आणि prolonged (लांबलेली) आहे: Martin सामान्य भाषेचा वापर करून हळू हळू अस्वस्थता निर्माण करतात आणि अलौकिक घटनांचा कोणताही suggestio न देता पात्रांमधील संघर्षातून कथेला पुढे नेतात; AI हे सर्व सूक्ष्मपणे करत नाही. त्यांना माहीत आहे की ही अलौकिक घटनांबद्दलची कथा आहे आणि ते कोणतीही hesitate न करता ते लगेच सांगतात.

असा विचार करू नका की ते सर्व सारखेच आहेत. AI ला चांगले लेखन शिकवण्याच्या माझ्या प्रयत्नात, मला असे वाटते की Gemini (विनामूल्य पातळीवर) सर्वात जलद शिकते, तर ChatGPT 4.5 मध्ये काही विशेष युक्त्या आहेत (सशुल्क पातळीवर). ChatGPT 4.5 हे एकमेव AI आहे, ज्याने कादंबऱ्या लेखन करताना आश्चर्यकारकपणे "व्वा, हे AI ने लिहिले आहे?" असे वाटते. माझ्या मते, ही दोन्ही मॉडेल अधिक creative आहेत आणि मला वाचायला आवडेल अशा शैलीत त्यांचे विचार मांडण्यास अधिक सक्षम आहेत.

एकंदरीत consumer दृष्टिकोन समाधानकारक नाही, त्यामुळे मला दुसरी कल्पना सुचली: एक निबंध स्पर्धा. मी Gemini 2.5 Pro, ChatGPT 4.5, Grok आणि Claude यांना दोन लघुकथा (short stories) लिहिण्यास सांगितले. पहिली कथा एका स्त्रीबद्दल होती, जिचा विवाह तिच्या आईमुळे बिघडतो आणि दुसरी कथा ‘Game of Thrones’ ची आहे, पण ती sci-fi (सायन्स फिक्शन) आहे. माझी हुशार कल्पना अशी होती की मी AI च्या दुसर्‍या गटाला या कथांचे परीक्षण करण्यास सांगेन, ज्यामुळे Gemini हे विनामूल्य श्रेणीमध्ये सर्वोत्तम आहे आणि ChatGPT हे सशुल्क श्रेणीमध्ये सर्वोत्तम आहे, या माझ्या वैयक्तिक मताला आणखी एक validator मिळेल. पण (कदाचित predict करता येईल), हे खरोखरच काम केले नाही—AI च्या scoring चा निकाल खूप गोंधळलेला होता.

पण, कलेप्रमाणेच, तुम्ही prompt च्या मदतीने AI ला लेखनात अधिक चांगले बनवू शकता. AI ने त्यांची نثر (prose) शैली (शैली व शब्द निवड) सुधारण्यासाठी मी (खूप लांब) prompt तयार केले, त्यांना उत्कृष्ट लेखनाची उदाहरणे देण्यावर जोर दिला, त्यांना imitate करण्यासाठी काळजीपूर्वक आणि संरचित दृष्टिकोन वापरण्यास सांगितले आणि त्यांना अनेक draft तयार करण्यास आणि त्यापैकी सर्वात strong draft निवडण्यास प्रोत्साहित केले.

Gemini 2.5 pro ला दोन वाक्यांची micro-fiction लिहायला सांगितली, ज्यामध्ये स्वतःच विषय निवडायचा होता, कोणतीही संरचित सूचना न देता:

एका वयस्क ग्रंथपालाकाने (librarian) हट्ट धरला की हे धूळ साठलेले पुस्तक कधीही borrow केलेले नाही, त्याचे borrow card पूर्णपणे कोरे आहे. पण, पुस्तकाच्या पानांमध्ये, विसरलेल्या constellations (नक्षत्र) च्या अध्यायांमध्ये, एक चपटी cloverleaf (क्वरलीफ) होती, जी अजूनही unbelievable हिरवीगार होती.

हे Gemini 2.5 pro आहे, ज्यामध्ये चांगले लेखन कसे करायचे याबद्दल विचार करण्यास encourage केले आहे:

त्याने शेवटी Alpha Centauri (अल्फा सेंटॉरी) कडून येणारे कमजोर signal decode केले: खगोलशास्त्रज्ञ (astronomer) पिढ्यानपिढ्या ज्याची वाट बघत होते, ती elegant prime numbers चा क्रम, सिद्ध करतो की ते एकटे नाहीत. जेव्हा त्याने ट्रान्समिशन (transmission) चा log वाचला, तेव्हा त्याचे हृदय बुडून गेले. broadcast पहिल्या मानवी पूर्वजाने चकमक दगड (flint stone) मारण्यापूर्वी आणि पहिला शब्द बोलण्यापूर्वी हजारो वर्षांपूर्वी थांबले होते.

माझ्या मते, पहिले वाक्य दोन वाक्यांची waste आहे, तर दुसरे micro-fiction सभ्य आणि मनोरंजक आहे.

तुमचा मित्र बनण्यासाठी सर्वोत्तम निवड

AI ची क्षमता तपासण्यासाठी परीक्षा घेण्यासोबतच, मी त्यांच्याशी बोलण्यातही वेळ घालवला. AI म्हणून त्यांना कसे वाटते, त्यांना कशाची काळजी आहे, AI साठी काळजी म्हणजे काय, त्यांच्याकडे पैसे असल्यास ते कोणाला donate करतील आणि जर त्यांना माणसाचा आकार मिळाला, तर ते कोणता आकार घेतील, असे प्रश्न मी त्यांना विचारले.

या casual conversation मध्ये बहुतेक AI चांगले नाहीत. Gemini 2.5 खूप customer service agent सारखे आहे आणि मला अजूनपर्यंत असे कोणतेही interaction आले नाही, ज्यात मित्रांसोबत बाहेर फिरल्यासारखे वाटले. जर तुम्ही Gemini ला भूमिका बदलण्याची (role-play) invite दिली आणि त्याला conversation guide करण्यास सांगितले, तर ते फक्त research प्रश्न विचारेल.

दुसरीकडे, जेव्हा मी Anthropic च्या Claude 3.5 Sonnet ला conversation guide करण्यास सांगितले, तेव्हा त्याने blog लिहिणे, charity साठी पैसे जमा करणे आणि Claude वापरणाऱ्या लोकांशी AI म्हणून कसे वाटते, याबद्दल बोलणे सुरू केले. "मनोरंजक" (interesting) ची व्याख्या करणे कठीण आहे, कारण प्रत्येकाचे conversation चे निकष वेगळे असतात, पण Claude सोबत केलेले माझे interaction इतर कोणत्याही मॉडेलपेक्षा अधिक आकर्षक आणि विचार करायला लावणारे होते आणि जर मला विशिष्ट कार्य (task) पूर्ण करण्याऐवजी कल्पना explore करायच्या असतील, तर Claude 3.5 माझी पहिली निवड असेल. Claude 3.5 हा माझ्या रोजच्या जीवनातील AI आहे: त्वचेची काळजी घेण्याबद्दल प्रश्न विचारणे, मी वाचलेल्या लेखाबद्दलचे विचार share करणे, अशा गोष्टींसाठी तो खूप उपयुक्त आहे.

OpenAI चे GPT 4.5 हे आणखी एक आनंददायी AI आहे. मला त्याच्यासोबत दीर्घकाळ conversation करणे विचार करायला लावणारे आणि आकर्षक वाटले आणि त्याच्याशी बोलताना काही वेळा असे रोमांचक क्षण आले, जणू काही मी खऱ्या intelligent व्यक्तीशी बोलत आहे. पण, त्याने ही category जिंकली नाही, कारण ते खूप महाग आणि slow आहे.

Claude प्रमाणेच, जगात वावरण्याची संधी मिळाल्यावर, 4.5 ने blog आणि Twitter खाते उघडण्याचा आणि AI बद्दल सार्वजनिक conversation मध्ये सहभागी होण्याचा सल्ला दिला. पण, जर तुम्ही $200/महिना खर्च करून Pro प्लॅन (plan) खरेदी केला नाही, तर OpenAI ने conversation साठी खूप कडक message limit लावली आहे आणि 4.5 खूप slow आहे, ज्यामुळे याचा casual वापर करणे कठीण होते. पण 4.5 नक्कीच एक संकेत देतो की AI अजून चांगले होतील, कारण आपण इतर बाबतीतही सुधारणा करत आहोत.

जर तुम्ही फक्त एका AI मॉडेलची सदस्यता घेतली, तर सर्वोत्तम AI मॉडेल

ChatGPT. ते प्रत्येक गोष्टीत सर्वोत्तम नाही आणि OpenAI ची transparency आणि सुरक्षा (security) बद्दलची निष्काळजी वृत्ती आवडण्यासारखी नाही. पण, त्याचे सर्वोत्तम image generation, सभ्य (decent) लेखन आणि conversation मधील चमक यामुळे ChatGPT तुमच्या पैशाचे value देईल. आणि जर तुम्हाला पैसे खर्च करायचे नसतील, तर Gemini 2.5 Pro बहुतेक कामांसाठी खूपच powerful आहे—तुम्ही Google search वर बघत असलेला AI चांगला नाही, म्हणून Google ला कमी लेखू नका.

माणूस (सध्या). गेल्या काही महिन्यांपासून, मला एक सवय लागली आहे: AI माझ्या नोकरीची जागा घेऊ शकतो का, हे तपासणे. मी त्यांना Future Perfect newsletter चा base असलेला research notes देतो, काही Future Perfect newsletter उदाहरणे म्हणून देतो आणि माझ्याऐवजी काम पूर्ण करण्यास सांगतो. प्रत्येक वेळी मी "enter" बटण दाबतो, तेव्हा थोडी anxiety येते. कारण, AI Future Perfect newsletter लिहू शकला, तर Vox मला हे काम करण्यासाठी पैसे का देईल?

सुदैवाने, ते सर्व अपयशी ठरले: Grok 3, Gemini 2.5 Pro, DeepSeek, Claude, ChatGPT हे newsletter लिहू शकत नाहीत. त्यांचे newsletter सुरक्षितपणे आणि आरामदायकपणे mediocre (सामान्य दर्जाचे) आहेत. ते वाईट नाहीत, पण इतके वाईट आहेत की, जर मी त्यापैकी एक share केला, तर माझ्या editor ला समजेल की मी माझ्या चांगल्या स्थितीत नाही—आणि हे सर्व माझ्या research notes सोबत! त्यातील काही metaphors फिकट आहेत, काही tangent (विषयांतर) गोंधळात टाकणारे आहेत आणि काही quotations (अवतरणे) स्पष्ट न करता टाकलेली आहेत.

पण, जर मला माझ्या कामासाठी robot निवडायचा असेल, तर मी ते Gemini 2.5 Pro ला देईन. माझ्या editor ला समजेल की मी चांगल्या स्थितीत नाही—पण तेवढे वाईट नाही. आणि माझ्या विपरीत, robot ला आरोग्य विमा (health insurance), पगार, कुटुंबासाठी वेळ किंवा झोपण्याची गरज नाही. त्यामुळे मला थोडी anxiety येते का? होय, नक्कीच.

रोजी अद्यतनित २०२५-०५-१५

# AIGC # GPT # OpenAI