ChatGPT हर जगह है, लेकिन यह क्या कर सकता है, और यह कैसे काम करता है? हम बुनियादी बातों को तोड़ेंगे, और समझाएंगे कि Artificial Intelligence उपयोग कैसे शुरू करें।
2022 में ChatGPT की शुरुआत के बाद से कई साल बीत चुके हैं, और आप अभी भी आर्टिफ़िशियल इंटेलिजेंस की अपनी यात्रा की शुरुआत में ही होंगे। हम प्रतिदिन आर्टिफ़िशियल इंटेलिजेंस के बारे में अधिक जान रहे हैं, और यह तकनीक किस प्रकार काम करती है, इसे समझना वार्तालापों का अधिकतम लाभ उठाने में मदद कर सकता है।
हालांकि ChatGPT को सतह पर उपयोग में आसान है, लेकिन पर्दे के पीछे प्रत्येक उपयोगकर्ता के लिए जटिल गणनाएँ होती हैं। बड़े भाषा मॉडल (Large Language Model - LLM) विशाल आर्टिफ़िशियल इंटेलिजेंस तंत्रिका नेटवर्क पर निर्भर करते हैं, जो मानव के समान पाठ को संसाधित और उत्पन्न करता है, छवियों का विश्लेषण करता है और यहां तक कि खुद से भी बात कर सकता है। यहां बताया गया है कि यह कैसे काम करता है।
ChatGPT के पीछे की तकनीक क्या है?
सबसे बुनियादी अर्थों में, ChatGPT एक संवादात्मक वेबसाइट या मोबाइल एप्लिकेशन है, जो मनुष्यों से अनुरोध प्राप्त करता है। लोगों ने इसका उपयोग विभिन्न रचनात्मक उद्देश्यों के लिए किया है, जिनमें निबंध और ईमेल लिखना, वेबसाइट डिजाइन करना, सॉफ़्टवेयर कोड लिखना और आर्टिफ़िशियल इंटेलिजेंस एजेंटों के माध्यम से कार्य पूरा करना शामिल है।
जबकि ChatGPT आज का सबसे लोकप्रिय आर्टिफ़िशियल इंटेलिजेंस चैटबॉट है, आपने Google Gemini, Perplexity और Anthropic का Claude जैसे अन्य चैटबॉट के बारे में भी सुना होगा। उन सभी को बड़ी मात्रा में डेटा पर प्रशिक्षित किया गया है, जिसने उन्हें सिखाया है कि मनुष्यों के साथ एक ज़ोरदार तरीके से बातचीत कैसे करें, मानो वे इंसान हों। लेकिन वे एलियन (या रेंगने वाले बच्चे) की तरह अधिक हैं जो लगातार यह सीखने की कोशिश कर रहे हैं कि वयस्क कैसे बनें। वे लोकप्रिय होना भी चाहते हैं; OpenAI को हाल ही में एक ChatGPT अपडेट को वापस लेना पड़ा, क्योंकि यह बहुत चापलूस हो गया था।
यह सीखने की प्रक्रिया चैटबॉट में डेटा फीड करके हासिल की जाती है, जो ज्यादातर इंटरनेट (विकिपीडिया एक बड़ा स्रोत है) से आता है, जिसमें कॉपीराइट वाली पुस्तकें, Youtube वीडियो और अन्य मूल सामग्री शामिल हैं, जो कुछ मामलों में मुकदमेबाजी को आमंत्रित करती हैं। चैटबॉट एलियन जितनी संभव हो उतनी जानकारी के लिए उत्सुक हैं ताकि वे लगातार बेहतर प्रदर्शन कर सकें।
मॉडल किसी डेटा से एक पाठ (उदाहरण के लिए, विकिपीडिया लेख का शुरुआती वाक्य) लेकर और अनुक्रम में अगले टोकन की भविष्यवाणी करने की कोशिश करके सीखता है। फिर यह अपने आउटपुट की तुलना प्रशिक्षण कोष में वास्तविक पाठ से करेगा, और किसी भी त्रुटि को ठीक करने के लिए अपने पैरामीटर को समायोजित करेगा। पाठ (या छवि या भाषण) के एक विशाल शरीर पर बार-बार ऐसा करके, यह एक भाषा मॉडल विकसित कर सकता है जो संकेत मिलने पर सुसंगत पाठ अनुक्रम बना सकता है।
यह प्रक्रिया डीप न्यूरल नेटवर्क (Deep Neural Network - DNN) नामक एक सॉफ़्टवेयर आर्किटेक्चर पर निर्भर करती है, विशेष रूप से ट्रांसफार्मर नेटवर्क। ट्रांसफार्मर नेटवर्क टेक्स्ट को “टोकन” में तोड़ने में माहिर हैं, जो अनिवार्य रूप से शब्दों के भाग हैं (“शब्द” एक टोकन है, “अनिवार्य रूप से” दो टोकन हैं)। फिर यह इस बारे में भविष्यवाणी करता है कि कौन सा क्रम उपयोगकर्ता के साथ सबसे अधिक प्रतिध्वनित होने की संभावना है, जो उपयोगकर्ता की बातचीत के आधार पर है जब उन्होंने पहले इसका उपयोग किया था। प्रत्येक गणना एक व्यक्ति से दूसरे व्यक्ति में भिन्न होती है, जिसके लिए बहुत अधिक ऊर्जा और ऊर्जा की आवश्यकता होती है।
ChatGPT आपकी पिछली बातचीत को भी “याद रखताहै” ताकि अनुकूलित उत्तर तैयार किए जा सकें। आप उससे जितना अधिक बात करेंगे, वह आपकी बातचीत को उतना ही बेहतर बनाएगा। अगर आप “यह सही नहीं है” जैसी कोई बात कहते हैं, तो मॉडल ध्यान देगा और अगली बार एक अलग दृष्टिकोण आज़माएगा। इसे “मानव प्रतिक्रिया से सुदृढीकरण शिक्षण” (Reinforcement Learning from Human Feedback - RLHF) कहा जाता है, और यही कारण है कि ChatGPT अपने पूर्ववर्तियों की तुलना में अधिक उपयोगी है।
ChatGPT को कैसे आज़माएं?
आप OpenAI की वेबसाइट या एप्लिकेशन (iOS या Android) पर ChatGPT के लिए साइन अप कर सकते हैं, और खाता बनाए बिना भी मूल संस्करण का उपयोग कर सकते हैं। मुफ़्त संस्करण कभी-कभार होने वाली संवादात्मक जरूरतों के लिए पर्याप्त है, लेकिन यह आपके द्वारा फ्लैगशिप GPT-4o मॉडल के साथ प्रतिदिन की जा सकने वाली बातचीत की संख्या और आपके द्वारा अपलोड की जा सकने वाली तस्वीरों की संख्या को सीमित करता है।
गंभीर, सतत उपयोग के लिए, आप सशुल्क संस्करण ChatGPT Plus को आज़माना चाह सकते हैं, जिसकी कीमत $20 प्रति माह है। इसमें कम प्रतिबंध और सोरा वीडियो क्रिएशन मॉडल और कस्टम GPT जैसी अतिरिक्त सुविधाएं हैं। बाद वाला एक मिनी मॉडल है जिसका उपयोग आप किसी विशिष्ट कार्य (जैसे भाषा अनुवाद) के लिए कर सकते हैं, जबकि मुख्य ChatGPT मॉडल एक ऑल-अराउंड एथलीट की तरह अधिक है।
OpenAI अन्य सदस्यता स्तर भी प्रदान करता है, जैसे $200 प्रति माह का प्रो मॉडल, जिसकी कोई सीमा नहीं है और उच्च-स्तरीय शोध रिपोर्ट संकलित करने जैसे ऑपरेशन कर सकता है। बड़े संगठनों के लिए टीम और एंटरप्राइज खाते भी हैं। अंत में, डेवलपर OpenAI के API के माध्यम से ChatGPT तक भी पहुंच सकते हैं, और आप उपयोग किए गए टोकन की संख्या के आधार पर भुगतान करते हैं।
मैं ChatGPT के साथ क्या कर सकता हूँ?
सही निर्देशों और संदर्भ के साथ, ChatGPT बहुत उपयोगी हो सकता है। ChatGPT के साथ आप कुछ चीजें कर सकते हैं:
लेखन
ChatGPT एक उपयोगी लेखन सहायक हो सकता है। यदि आप इसे एक बार में पूरा निबंध लिखने के लिए कहते हैं, तो यह मिश्रित परिणाम देगा। लेकिन अगर आप इसके साथ कदम दर कदम सहयोग करते हैं, तो ChatGPT प्रभावशाली चीजें कर सकता है। उदाहरण के लिए, आप रूपरेखा से शुरुआत कर सकते हैं, और OpenAI के चैटबॉट की मदद से प्रत्येक अनुभाग को भर सकते हैं।
संपादन
ChatGPT एक उत्कृष्ट संपादन सहायक है; आप इसका उपयोग कॉपी संपादन, प्रूफरीडिंग, पुन: लिखने, शैली समायोजन आदि के लिए कर सकते हैं।
अनुवाद
ChatGPT कई भाषाओं में अच्छा अनुवाद कर सकता है। यदि आप किसी विशेष क्षेत्र में काम कर रहे हैं, तो आप संदर्भ प्रदान करके इसके अनुवाद को बेहतर बना सकते हैं, जैसे कि स्रोत और लक्ष्य भाषा दस्तावेजों के उदाहरण।
सारांश
ChatGPT लेखों, भाषणों और शोध पत्रों का सारांश दे सकता है। जब आप मार्गदर्शन प्रदान करते हैं, जैसे कि किन विषयों को उजागर करना है, तो यह अधिक सटीक हो जाता है।
विचार मंथन
ChatGPT एक प्रस्तुति के लिए चर्चा बिंदुओं का सुझाव देने से लेकर यात्रा की योजना बनाने तक यहां विभिन्न प्रकार की सहायता प्रदान कर सकता है।
कोड लिखना
ChatGPT एक अच्छा कोडिंग सहायक है जो कार्यात्मक विवरणों को कई प्रोग्रामिंग और स्क्रिप्टिंग भाषाओं में कार्यात्मक कोड में बदल सकता है।
चित्र बनाना और व्याख्या करना
आप फ़ोटो अपलोड कर सकते हैं और उनके बारे में प्रश्न पूछ सकते हैं; उदाहरण के लिए, एक पेड़ की तस्वीर जोड़ें और पूछें “यह कौन सा पौधा है?” अगर आपको कोई समस्या है, तो ChatGPT स्क्रीनशॉट की व्याख्या भी कर सकता है, जो आप अपने फोन पर कुछ देख सकते हैं। यह अपने नए आंतरिक जनरेटर के साथ छवियां भी बना सकता है, जिसकी सकारात्मक समीक्षा की गई है।
मौखिक बातचीत करना
ध्वनि मोड के साथ, आपको संपूर्ण पाठ संकेत तैयार करने की आवश्यकता नहीं है। बस माइक्रोफ़ोन पर बोलें और चैट करना शुरू करें।
मूवी क्लिप बनाना
सोरा वीडियो जनरेटर कस्टम क्लिप उत्पन्न करता है, जो केवल कुछ सेकंड लंबी होती है, जिसमें कोई आवाज़ नहीं होती है, और इसका उपयोग बड़ी वीडियो परियोजनाओं को बढ़ाने या स्टैंडअलोन क्लिप के रूप में किया जा सकता है। यह ChatGPT Plus और Pro ग्राहकों के लिए उपलब्ध है, और सीमित सुविधाएँ Microsoft Bing एप्लिकेशन के माध्यम से मुफ़्त में उपलब्ध हैं।
हम ChatGPT को शोध उपकरण के रूप में उपयोग करने की अनुशंसा नहीं करते हैं, क्योंकि इसकी प्रवृत्ति मतिभ्रम करने या जानकारी गढ़ने की होती है। ChatGPT जैसे Large Language Model पाठ को इस तरह से एक साथ रख सकते हैं कि यह शब्दावली रूप से तो सही हो, लेकिन वास्तव में वास्तविकता में गलत हो। यह ChatGPT के साथ कोडिंग के लिए भी सच है: यह गैर-कार्यात्मक या असुरक्षित कोड उत्पन्न कर सकता है। एक अच्छा नियम यह है कि ChatGPT को शुरुआती बिंदु के रूप में उपयोग करें, और फिर ChatGPT द्वारा प्रदान किए गए स्रोत लिंक पर क्लिक करके या अलग Google खोज करके अपने आउटपुट की प्रामाणिकता की जांच करें। (Perplexity एक और उद्धरण-केंद्रित चैटबॉट है।)
ChatGPT के विकल्प क्या हैं?
कई अन्य कंपनियों और संगठनों ने ChatGPT की तुलना में निर्देश-अनुसरण करने वाले Large Language Models विकसित किए हैं।
- Google Gemini: Google का आर्टिफ़िशियल इंटेलिजेंस मॉडल लगभग वह सब कुछ कर सकता है जो आप ChatGPT से कर सकते हैं, और Google के पारिस्थितिकी तंत्र से जुड़ सकता है, इसलिए आप अपने आउटपुट को Gmail, Google Sheets, Docs आदि में निर्यात कर सकते हैं।
- Bing: Microsoft ने OpenAI में अरबों डॉलर का निवेश किया है, और इसने ChatGPT को अपने Bing सर्च इंजन में एकीकृत किया है। यह ज्ञान खोजने और अन्य कार्य करने के लिए एक संवादात्मक इंटरफ़ेस है जो आप ChatGPT के साथ कर सकते हैं। यह उन सूचनाओं का स्रोत बताता है जो उत्पन्न करता है, जिससे आप सूचना स्रोतों का सत्यापन कर सकते हैं।
- Claude: Anthropic सैन फ़्रांसिस्को स्थित एक आर्टिफ़िशियल इंटेलिजेंस प्रयोगशाला है, जिसने Claude लॉन्च किया, जो ChatGPT प्रतिद्वंद्वी है जिसका लेखन और कोडिंग के लिए उच्च प्रतिष्ठा है।
- Perplexity: Google के विकल्प के रूप में, बहुत से लोग वेब खोजने के लिए Perplexity का उपयोग करते हैं। यह तेज़ी से बढ़ रहा है और Motorola के नए Razr फ़ोन पर डिफ़ॉल्ट खोज प्लेटफ़ॉर्म होने के लिए तैयार है। बताया गया है कि Samsung भी ऐसा ही करने के लिए बातचीत कर रहा है।
- Open Source Models: Open Source समुदाय ने Large Language Models जारी किए हैं जिन्हें आप अपने सर्वर पर चला सकते हैं। ये Large Language Models आपको अपने डेटा को नियंत्रित करने और विक्रेता लॉक-इन से बचने में मदद कर सकते हैं। Open Source Large Language Models ChatGPT से बहुत छोटे हैं, और स्थापित करने में अधिक कठिन हैं, लेकिन अगर आपके पास तकनीकी क्षमता है, तो वे प्रभावशाली परिणाम उत्पन्न कर सकते हैं। Meta के Llama मॉडल कुछ सबसे प्रसिद्ध मॉडल हैं। अन्य विकल्पों में Open Assistant, Alpaca, Vicuna और Dolly 2 शामिल हैं।