اے آئی میدان جنگ کا انکشاف: چیٹ جی پی ٹی، گروک، جیمنی اور کلاڈ کا مقابلہ

مصنوعی ذہانت (AI) کی تیز رفتار ترقی ایک ایسی چیز ہے جو حیرت انگیز حد تک تیزی سے ہو رہی ہے کہ اس کے ساتھ رہنا تقریباً ایک مکمل وقتی کام ہے۔

میں یہ بات جانتا ہوں کیونکہ یہ میرا کام ہے۔ تازہ ترین ماڈلز کو تیزی سے آزمانے کے لیے، میں Anthrop کے Pro موڈ کا رکن ہوں، جو مجھے اس کے جدید ترین ماڈل، Claude 3.7 کے “بڑھی ہوئی سوچ” موڈ تک رسائی فراہم کرتا ہے۔ میں OpenAI کے انٹرپرائز موڈ کا بھی رکن ہوں، تاکہ ان کے تازہ ترین ماڈل o3 اور o4-mini-high کی جانچ کر سکوں (OpenAI کے ناقابل فہم ناموں کی اصطلاحات پر بعد میں بات کریں گے!) اور اپنے نئے تصویری تخلیق ماڈل، 4o کے ساتھ لاتعداد تصاویر بنا سکوں۔ 4o نے مجھے اتنا متاثر کیا کہ میں نے اپنا Midjourney کی رکنیت ختم کردی۔

میں Elon Musk کے Grok 3 کا بھی رکن ہوں، جس میں وہ AI فیچر ہے جو مجھے بہت پسند ہے۔ اور میں چین کے AI پراکسی پلیٹ فارم Manus کو خریداری اور شیڈولنگ کے لیے استعمال کرنے کی کوشش کر رہا ہوں۔ ان تمام رکنیتوں نے تقریباً میرا بجٹ ختم کر دیا ہے، اور اس میں وہ تمام AI شامل نہیں ہیں جو میں مختلف شکلوں میں استعمال کرتا ہوں۔ اس مہینے میں جس میں میں یہ لکھ رہا ہوں، Google نے اپنے بہترین AI پروڈکٹ، Gemini 2.5 میں ایک بہت بڑا اپ گریڈ کیا ہے، اور Meta نے Llama 4 جاری کیا ہے، جو اب تک کا سب سے بڑا اوپن سورس AI ماڈل ہے۔

تو اگر AI کے ساتھ رہنا آپ کا کل وقتی کام نہیں ہے، لیکن آپ پھر بھی یہ جاننا چاہتے ہیں کہ کون سا AI آپ کی زندگی کو بہتر بنانے کے لیے کب استعمال کرنا ہے اور کون سا ماڈل استعمال کرنے میں وقت ضائع نہیں ہوگا، تو آپ کیا کریں؟

یہ اس مضمون کا مقصد ہے۔ ہم “صارفین کی رپورٹ” کی طرح یہ جاننے کے لیے گہرائی میں جائیں گے کہ کون سا AI مختلف استعمال کے معاملات کے لیے بہترین ہے، اور انہیں عملی طور پر کیسے استعمال کیا جائے، یہ سب میرے اپنے حقیقی دنیا کے کاموں کے تجربے پر مبنی ہے۔

تاہم، پہلے ایک اعلان: Vox Media ان متعدد پبلشرز میں سے ایک ہے جنہوں نے OpenAI کے ساتھ معاہدہ کیا ہے، لیکن ہماری رپورٹنگ ہمیشہ ادارتی طور پر آزادانہ رہے گی۔ Future Perfect کو جزوی طور پر BEMC فاؤنڈیشن کی جانب سے مالی اعانت فراہم کی جاتی ہے، جس کی بنیادی فنڈنگ ​​Anthropic میں ابتدائی سرمایہ کار کی جانب سے بھی آتی ہے۔ وہ بھی ہمارے مواد میں کوئی ادارتی مداخلت نہیں کرتے ہیں۔ میری اہلیہ Google کے لیے کام کرتی ہیں لیکن ان کی AI مصنوعات سے کوئی تعلق نہیں ہے۔ اس لیے میں عام طور پر Google کے بارے میں رپورٹ نہیں کرتا، لیکن اس طرح کے مضمون میں اسے شامل نہ کرنا غیر ذمہ دارانہ ہوگا۔

خوشخبری یہ ہے کہ اس مضمون کے لیے آپ کو میری ادارتی آزادی پر بھروسہ کرنے کی ضرورت نہیں ہے۔ میں آپ کو اپنا کام دکھاؤں گا۔ میں نے مارکیٹ میں موجود تمام بڑے AI کے درجنوں موازنے کیے ہیں، جن میں سے بہت سے میں نے خود ڈیزائن کیے ہیں۔ میں آپ کو ان کے جوابات کا موازنہ کرنے اور یہ فیصلہ کرنے کی ترغیب دیتا ہوں کہ آیا میں نے سفارش کرنے کے لیے صحیح AI کا انتخاب کیا ہے۔

AI آرٹ کے بارے میں اخلاقیات

AI آرٹ کمپیوٹروں کو انٹرنیٹ پر موجود مواد پر ٹرین کرکے تیار کیا جاتا ہے، جس میں اکثر کاپی رائٹ یا تخلیق کاروں کے ارادے کو کم سے کم سمجھا جاتا ہے۔ اس لیے زیادہ تر فنکار اس سے ناخوش ہیں۔ کیا AI آرٹ کا استعمال کرنا ٹھیک ہے؟

میرے خیال میں ایک منصفانہ دنیا میں، OpenAI یقینی طور پر کچھ فنکاروں کو معاوضہ ادا کرے گا — اور ایک منصفانہ دنیا میں، کانگریس آرٹ کے قرض لینے کی حدود طے کرنے کے لیے قدم اٹھائے گی۔ لیکن اس دوران، میں اس بات پر تیزی سے قائل ہو رہا ہوں کہ موجودہ کاپی رائٹ قانون اس مسئلے کو حل کرنے کے لیے مناسب نہیں ہے۔ فنکار ایک دوسرے سے متاثر ہوتے ہیں، ایک دوسرے پر رائے دیتے ہیں، ایک دوسرے سے قرض لیتے ہیں، اور جو لوگ AI ٹولز استعمال کر سکتے ہیں وہ ایسا کرتے رہیں گے۔

میری اپنی ذاتی فلاسفی میرے بچپن کے پرستار ثقافت سے متاثر ہے، یہ کہ کسی اور کے کام پر اپنی تفریح ​​کے لیے تعمیر کرنا ٹھیک ہے، لیکن اگر آپ کو یہ पसंद ہے، تو آپ کو اس کے لیے ادائیگی करनी चाहिए، اور آپ निश्चित طور پر इसे बेच नहीं सकते ہیں۔ اس کا مطلب ہے کہ آپ کو جنریٹیو AI آرٹ کو تجارتی مقاصد کے لیے استعمال نہیں کرنا چاہیے، لیکن اپنی فیملی فوٹوز کے ساتھ کھلواڑ کرنا ٹھیک ہے۔

تصویری تخلیق کے لیے بہترین انتخاب

OpenAI کا نیا 4o تصویری تخلیق موڈ اب تک کا AI تصویری تخلیق کے لیے بہترین ٹول ہے، اور یہ واضح طور پر بہتر ہے۔ یہ مفت اور بامعاوضہ دونوں زمروں میں پہلے نمبر پر ہے۔

4o کے آنے سے پہلے، میں AI امیجنگ پلیٹ فارم Midjourney کا رکن تھا۔ اگر آپ AI آرٹ کے بارے میں سوچتے ہیں، تو امکان ہے کہ آپ Midjourney کے بارے میں سوچتے ہوں: یہ پراسرار، یادگار، بصری طور پر شاندار کام تخلیق کر سکتا ہے، اور اس میں آپ کے نتائج کو بہتر بنانے اور ایڈیٹ کرنے کے لیے کچھ لاجواب ٹولز ہیں، جیسے کسی کی بالوں کو ٹھیک کرنا جبکہ باقی سب کچھ جوں کا توں رکھنا۔

4o کا سب سے بڑا فائدہ یہ ہے کہ یہ معتبر طور پر ایک ایسی تصویر کو جو اتنی اچھی نہیں ہے، ایک خوبصورت فن پارے میں بدل سکتا ہے، جبکہ اس تصویر کی شناخت को बरकरार رکھتا ہے۔ پہلے کوئی بھی ماڈل ایسا नहीं कर سکتا تھا۔

یہاں ایک تصویر ہے جس میں میں اور میری اہلیہ اپنے بچے को اس کی پہلی سالگرہ کی مبارکباد دے رہے ہیں:

AI نے کیک کو (جو اصل تصویر میں تقریباً टिషू पेपर् से ढका ہوا تھا) تصویر کے فوکل پوائنٹ پر منتقل کر دیا، جبکہ मेरी اہلیہ के साथ मेरा بچے को पकडे हुए है, और अस्त-व्यस्त میز بھی અને فریج بھی जहाँ फ़ोटो चिपके हुए हैं को भी برقرار رکھا। نتیجہ ایک گرمجوشی، دلکش और प्यारी छवि बन गया।

یہ وہ قابلیت ہے جس نے 4o کو हाल ही में वायरल कर दिया है, और ऐसा पहले कोई भी امیج जनरेटर نہیں کر ਸਕا تھا۔

یہاں وہی تصویر ہے، جس میں Midjourney से शैली बदलने के लिए कहा गया है, تاکہ تصویر کو “पिक्सर стиле की मूवी” में बदल दे:

آپ دیکھیں گے कि یہ एक अलग خاندان की तरह لگتا है और इसकी तुलना मूल तस्वीर से वास्तविक रूप से نہیں की जा सकती है! अंततः, आप Midjourney से इससे बेहतर परिणाम प्राप्त कर سکتے हैं, लेकिन इसके लिए आपको उस प्लेटफॉर्म की विशिष्ट زبان और टूलसेट को कुछ हफ्ते सीखने में खर्च करने होंगे, जिससे आप एक कुशल प्रॉमप्ट विशेषज्ञ बन सकें।

اس کے برعکس, chatGPT نے बस एक साधारण अनुरोध के साथ, बिना किसी विशेषज्ञ भाषा के, पहले ही प्रयास में Midjourney से कहीं बेहतर परिणाम दिए।

4o और अन्य प्रतिमा मॉडलों के बीच का अंतर इस प्रकार के अनुरोध में सबसे अधिक स्पष्ट होता है, लेकिन यह उन लगभग सभी अन्य छवि निर्माण कार्यों के लिए भी बेहतर है जिनका मैं करता हूं। वह उत्पाद जो आपको बॉक्स से बाहर मिलता है वह बहुत अच्छा है, और बेहतर काम बनाना मुश्किल नहीं है। आदर्श रूप से, हमें AI टूल से यही मिलना चाहिए — यहां तक ​​कि गैर-पेशेवर भी सरल भाषा से अद्भुत कुछ बना सकते हैं।

4o की वर्तमान कमी यह है कि अन्य भागों को अपरिवर्तित रखते हुए किसी इमेज के छोट भाग को संपादित करना। लेकिन फिर भी, अब आपको Midjourney की आवश्यकता नहीं है — Gemini अब इसे मुफ्त में प्रदान کرتا ہے۔

4o छवि निर्माण की युक्तियाँ

4o से अच्छी इमेज प्राप्त करने के लिए, आपको पहले उन फिल्टर को बायपास करना होगा जो विभिन्न इमेज (जैसे आक्रामक या अश्लील इमेज) را阻止 करते हैं, لیکن ये फ़िल्टर सामान्यतः पूरी तरह से हानिरहित सामग्री पर यादृच्छिक طریقے سے लागू होते हैं। कभी-कभी मिलने वाली सामग्री फ़िल्टर की फटकार से बचने के लिए, किसी विशिष्ट कलाकार की शैली में काम बनाने के लिए न कहें, बल्कि उन कार्यों को बनाने के लिए कहें जो उस कलाकार की یاد دلاتے हैं, और फिर विशेष रूप से “शैली परिवर्तन” के लिए कहें। निश्चित रूप से, यह एकमात्र वैध समाधान नहीं है, लेकिन यह मेरे लिए काम करता है।

इस वर्ष मार्च में, इंटरनेट पर संक्षेप में एक सनक फैल गई, जहां लोग जापानी एनिमेटेड निर्देशक हयाओ मियाजाकी के स्टूडियो घिबली की शैली में प्यारी पारिवारिक तस्वीरों को फिर से बनाने के लिए 4o का उपयोग कर सकते थे। लेकिन घिबली शैली सिर्फ प्यारी नहीं है, और अगर आप थोड़ी और जानकारी देते हैं, तो आपको बेहतर परिणाम मिल सकते हैं। यहां 4o के साथ घिबली स्टूडियो की शैली में मेरी बेटी की तस्वीर दी गई है، جس میں وہ میز से नाश्ता चुरा रही है, संकेत सिर्फ “घिबली के रूप میں प्रस्तुत करें”:

कवाई! लेकिन अगर आपने 4o से पहले सोचने के लिए कहा कि तस्वीर को घिबली शैली बनाने के लिए क्या है, यह स्टूडियो घिबली की किस फिल्म के लिए उपयुक्त हो सकता है, और ऐसी फिल्म में कौन से सूक्ष्म विवरण शामिल होंगे, तो आपको इस तरह का कुछ मिलने की संभावना है:

यह الفرق सूक्ष्म लेकिन सार्थक हैं: प्रकाश स्रोत विशेष स्रोत से आता है, न कि सामान्य निष्क्रिय चमक से। میز पर विभिन्न प्रकार के भोजन ہیں, और विवरण भोजन को अधिक वास्तविक बनाते हैं। फर्श पर पड़ी किताबें केवल कोई किताबें नहीं हैं — यह स्पष्ट रूप से एरिक कार्ल के क्लासिक काम “द वेरी हंग्री कैटरपिलर” को प्रदर्शित करता है, جو صرف दो रंगों और एक रेखा के उपयोग के साथ यादों को ताजा करता है। तस्वीर में शिशु का इरादा और तीव्रता पहले तस्वीर में नहीं है।

कुछ साल पहले, भाषा मॉडलों की एक अजीब बात यह थी कि अगर आप बस उन्हें “एक बुद्धिमान उत्तर दें” कहते हैं, तो वे अधिक बुद्धिमान हो जाते थे। यह अब भाषा मॉडलों के लिए उतना सच نہیں ہے, लेकिन यह AI कला उत्पादन के लिए अभी भी बहुत सच है। AI को अच्छा काम करने के लिए कहने का प्रयास करें, यह बेहतर प्रदर्शन करेगा। इससे सवाल करें कि क्या इसने वास्तव में कलाकार की प्रतिभा ،कब्জা कर ली है, यह आपको सोच-समझकर جواب देगा और फिर एक बेहतर ورژن बनाएगा।

अधिक यथार्थवादी कला शैलियों (जैसे पेंसिल चित्र, फोटो रियलिज्म या तेल चित्रकला) के लिए ،यह अंतर और भी अधिक स्पष्ट है, جو हमेशा अच्छी नहीं दिखती हैं अगर आप इस बारे में सुनिश्चित नहीं ہیں कि AI को कैसे उपयोग किया जाए, और अक्सर डरावनी घाटी में गिर जाती हैं। अगर मैं अपनी और अपनी छोटी बेटी की समुद्र तट पर एक तस्वीर अपलोड کرتا ہوں, और बस “शैली को नॉर्मन रॉकवेल जैसे मध्यकालीन चित्रकार के चित्रों से मिलती-जुलती शैली में बदल दें” जैसा संकेत देता ہوں तो मुझे यह मिलता है:

AI के लिए यह बहुत प्रभावशाली है, लेकिन एक कलाकृति के रूप में ،یہ वास्तव में अच्छा نہیں है, और इसमें नॉर्मन रॉकवेल का जादू पूरी तरह से गायब है। आश्चर्य नहीं है: जब तक आप एइ के लिए कुछ ऊर्जा नहीं लगाते हैं ताकि वे उन्हें सही ढंग से खींच सकें, रॉकवेल जैसे अधिक यथार्थवादी कला शैलियाँ अक्सर इरादे के अनुसार نہیں बनेंगी।

अगर आप ऐसा कर सकते हैं, तो यहां एक रणनीति है जिसकी मैं सिफारिश करता हूं: केवल एक तस्वीर अपलोड न करें, बल्कि प्रत्येक परिवार सदस्य के चेहरे की स्पष्ट तस्वीरों के साथ थोड़ी अलग मुद्रा و क्षण के साथ तस्वीरों का एक समूह अपलोड करें, और AI को बताएं कि इन्हें संदर्भ सामग्री के रूप में दिया गया है। फिर, AI से तुरंत इमेज बनाने के लिए न कहें, बल्कि उसे इस बारे में बातचीत करने के लिए कहें कि आप क्या कब्जा करना चाहते हैं। यहाँ मैंने क्या लिखा है:

यह तस्वीर उस पल की है जब मेरी बेटी ने पहली बार समुद्र देखा था। मैं एक ऐसी तस्वीर चाहता हूं जो नॉर्मन रॉकवेल की शैली में एक मध्यकालीन चित्रकार के समान हो — कुछ ایسا جو تیز، विवरण-निर्देशित، व्यक्तिगत اور عام لمحات کے جदु اور عام زندگی के आनंद पर जोर देता है। मैंने आपको संदर्भ सामग्री के रूप में अपनी और अपनी बेटी की अतिरिक्त तस्वीरें दी हैं। इमेज बनाने से पहले ،हम रॉकवेल शैली के आवश्यक तत्वों ، اس तस्वीर में क्या लेकर आएंगे, और हम इसे कैसे कैप्चर कर सकते हैं के बारे में चर्चा करें।

4o اس طرح کی پوچھ گچھ کا جوش و خروش سے जवाब دیتا ہے:

मैं एक नॉर्मन रॉकवेल-शैली کے चित्र के साथ इस पल को کیسے कैप्चर किया जा सकता है, اس پر चर्चा کرنے में मुझे खुशी होगी — یہ اس शैली کے لیے एक بہترین امیدوار है: एक विशाल और जंगली چیز (समुद्र!) کے ساتھ پہلی ملاقات، گرمجوشی، دیکھ بھال اور माता-पिता اور बच्चों کے درمیان انتہائی انسانی لمحے پر आधारित ہے۔

चलो रॉकवेल शैली के कुछ الأساس عناصر पर बात करें اور देखें कि इन्हें कैसे इस场景 पर लागू किया जा सकता है।

कुछ सवाल و جواب के बाद، यह कुछ ऐसा बनाता है:

रॉकवेल؟ पूरी तरह से نہیں। लेकिन यह उस पहले ड्राफ्ट से बहुत बेहतर है जो हमने अभी देखा था। इसमें अधिक گતિ، अधिक ऊर्जा، अधिक تفصیلات اور अधिकअभिव्यक्ति - और यह सब सिर्फ यह पूछने से आता है कि اے آئی تصویر بنانے سے پہلے یہ سمجھता है कि इसे क्या حاصل करने की कोशिश करनी चाहिए!

आप 4o سے अपनी तस्वीरों में भी सुधार करने के लिए कह سکتے हैं, लेकिन आप वास्तव में सिर्फ एक बार ऐसा کرنے کے लिए कह سکتے हैं: मेरे अनुभव के अनुसार, पहले बदलाव के बाद、 यह तस्वीरों को बदतर और बदतर बनना शुरू कर देता है, সম্ভবত इसलिए क्योंकि जिस “संदर्भ” का यह उपयोग कर रहा है वह अब अपने खुद के अनाड़ी ड्राफ्ट سے بھرا ہوا ہے। (यह उन कई उदाहरणों में से एक है जहां ए-ई इंसानों की तरह काम नहीं करता है।)

इसी जगह मिडजर्नी चमकता रहता ہے — इसमें चित्र کے مخصوص حصوں کو ایڈٹ کرنے میں بہت اچھے اوزار ہیں, جبکہ مجموعی طور پر 스타일 برقرار رکی جاتی ہے, जो 4o में काफी हद तक نہیں ہے۔ اگر آپ 4o میں حاصل کردہ تصویرों میں دوسرا تبدیلی کرنا چاہتے ہیں, तो मेरा सुझाव है कि आप एक नया चैट विండో खोलें, और उसी ड्राफ्ट को कॉपी करें جسے आप मूल تحریک देने والی تصویرों के साथ ایڈٹ کر رہے ہیں۔

ये साधारण संकेत उपाय تقریباً हर उस چیز پر لاگو ہوتے ہیں जिसे आप एआई के साथ करने की कोशिश कर