ChatGPT: OpenAI च्या लोकप्रिय चॅटबॉट विषयी सर्व

ChatGPT 2022 मध्ये प्रथम समोर आल्यापासून काही वर्षे झाली आहेत आणि तुम्ही अजूनही कृत्रिम बुद्धिमत्तेच्या प्रवासाच्या सुरुवातीच्या टप्प्यात असण्याची शक्यता आहे. आपण दररोज AI बद्दल अधिक शिकत आहोत आणि या तंत्रज्ञानाचे कार्य आपल्याला आपल्या संभाषणांचा जास्तीत जास्त उपयोग करण्यात मदत करू शकते.

ChatGPT वरवर पाहता वापरण्यास सोपे असले तरी, पडद्यामागे प्रत्येक वापरकर्त्यासाठी तयार केलेली अनेक जटिल गणना घडतात. Large Language Models (LLM) मोठ्या AI न्यूरल नेटवर्क्सवर अवलंबून असतात, जे मानवासारखे टेक्स्ट प्रोसेस (text process)आणि जनरेट (generate) करू शकतात, प्रतिमांचे विश्लेषण करू शकतात आणि स्वतः बोलू शकतात. हे कसे कार्य करते ते येथे दिले आहे.

ChatGPT च्या मागे कोणती टेक्नोलॉजी (Technology) आहे?

सर्वात मूलभूत अर्थाने, ChatGPT हे संभाषणात्मक वेबसाइट (conversational website) किंवा मोबाइल ॲप्लिकेशन (mobile application) आहे, जे मानवाकडून येणाऱ्या विनंत्या स्वीकारू शकते. लोकांनी लेख आणि ईमेल लिहिणे, वेबसाइट डिझाइन (website design) करणे, सॉफ्टवेअर कोड (software code) लिहिणे आणि AI एजंटद्वारे कार्ये पूर्ण करणे यासह अनेक सर्जनशील (creative) उपयोग शोधले आहेत.

ChatGPT आजकाल सर्वात लोकप्रिय AI चॅटबॉट (AI chatbot) असले तरी, तुम्ही Google Gemini, Perplexity आणि Anthropic चे Claude यांसारख्या इतर चॅटबॉट्सबद्दल ऐकले असेल. या सर्वांना मोठ्या प्रमाणात डेटावर प्रशिक्षित केले जाते, जे त्यांना मानवाशी अशा प्रकारे संवाद साधण्यास “शिकवते”, जणू काही ते मानवच आहेत. परंतु ते परग्रहावासी (किंवा लहान मुले) अधिक आहेत, जे सतत प्रौढ कसे बनायचे हे शिकण्याचा प्रयत्न करत असतात. त्यांना लोकप्रिय व्हायचे आहे; OpenAI ला अलीकडेच ChatGPT अपडेट (update) परत घ्यावे लागले, कारण ते खूप लाळघोटेपणा करत होते.

ही शिकण्याची प्रक्रिया चॅटबॉटला डेटा देऊन साध्य केली जाते. हा डेटा बहुतेक इंटरनेटवरून (विकिपीडिया एक मोठा स्रोत आहे), कॉपीराइट असलेल्या पुस्तकांसह, YouTube व्हिडिओ आणि इतर मूळ सामग्रीसह असतो, ज्यामुळे काही प्रकरणांमध्ये खटले होऊ शकतात. चॅटबॉट परग्रहावासी अधिकाधिक माहितीसाठी उत्सुक असतात, जेणेकरून ते सतत चांगले प्रदर्शन करू शकतील.

हे मॉडेल डेटावरून मजकुराचा एक भाग (उदाहरणार्थ, विकिपीडिया लेखातील सुरुवातीचे वाक्य) घेऊन आणि त्या क्रमाने पुढील टोकन (token) भाकीत करण्याचा प्रयत्न करून शिकते. त्यानंतर, ते प्रशिक्षण डेटासेटमधील वास्तविक मजकुराशी त्याचे आउटपुट (output) तुलना करते आणि कोणतीही त्रुटी सुधारण्यासाठी त्याचे पॅरामीटर्स (parameters) समायोजित करते. हे एका मोठ्या टेक्स्ट बॉडी (text body) (किंवा प्रतिमा किंवा आवाज) वर वारंवार करून, ते एक भाषिक मॉडेल विकसित करू शकते, जे प्रॉम्प्ट (prompt) दिल्यावर सुसंगत टेक्स्ट सिक्वेन्स (text sequence) तयार करू शकते.

ही प्रक्रिया डीप न्यूरल नेटवर्क (Deep Neural Network) (DNN) नावाच्या सॉफ्टवेअर आर्किटेक्चरवर (software architecture) अवलंबून असते, विशेषत: Transformer नेटवर्कवर. Transformer नेटवर्क टेक्स्टला “टोकन” मध्ये विभाजित करण्यात उत्कृष्ट आहे, जे मूलत: शब्दांचे भाग आहेत (“शब्द” हे एक टोकन आहे, “मूलत:” हे दोन टोकन आहेत). त्यानंतर, ते वापरकर्त्याच्या संवादावर आधारित सर्वात योग्य सिक्वेन्सचा (sequence) अंदाज लावतात. प्रत्येक गणना व्यक्तीनुसार बदलते, ज्यासाठी मोठ्या प्रमाणात वीज आणि ऊर्जा लागते.

ChatGPT मागील संभाषणे देखील “लक्षात” ठेवते, जेणेकरून तयार प्रतिसाद मिळू शकेल. तुम्ही त्याच्याशी जितके जास्त बोलाल, तितके ते तुमच्याशी होणारे संवाद अधिक सुधारते. जर तुम्ही “ते बरोबर नाही” असे काहीतरी म्हटले, तर मॉडेल (model) ते लक्षात ठेवते आणि पुढील वेळी वेगळा मार्ग वापरण्याचा प्रयत्न करते. याला “मानवी प्रतिक्रियेतून मजबुतीकरण शिक्षण” (Reinforcement Learning from Human Feedback) (RLHF) म्हणतात आणि हेच कारण आहे कीChatGPT त्याच्या पूर्वीच्या आवृत्त्यांपेक्षा अधिक उपयुक्त आहे.

ChatGPT चा वापर कसा करायचा?

तुम्ही OpenAI च्या वेबसाइटवर किंवा ॲप्लिकेशनवर (iOS किंवा Android) ChatGPT साठी साइन अप (Sign up) करू शकता आणि खाते तयार न करता मूलभूत आवृत्ती वापरू शकता. विनामूल्य आवृत्ती अधूनमधून संभाषणासाठी पुरेशी आहे, परंतु ते फ्लॅगशिप GPT-4o मॉडेल(flagship GPT-4o model) सोबत तुम्ही दररोज करू शकणाऱ्या संवादांची संख्या आणि तुम्ही अपलोड करू शकता अशा फोटोंची संख्या मर्यादित करते.

गंभीर आणि सतत वापरासाठी, तुम्ही सशुल्क आवृत्ती ChatGPT Plus वापरून पाहू शकता, ज्याची किंमत दरमहा $20 आहे. यात कमी मर्यादा आणि सोरा व्हिडिओ (Sora video) निर्मिती मॉडेल (model) आणि कस्टम जीपीटी (custom GPT) यांसारखी अतिरिक्त वैशिष्ट्ये आहेत. नंतरचे तुम्ही विशिष्ट कार्यात (जसे की भाषांतर) वापरू शकता, तर मुख्य ChatGPT मॉडेल (model) अधिक अष्टपैलू खेळाडू आहे.

OpenAI इतर सदस्यता स्तर देखील देते, जसे की दरमहा $200 चे प्रो (Pro) मॉडेल(model), ज्यावर कोणतीही मर्यादा नाही आणि ते प्रगत संशोधन अहवाल तयार करणे यासारखी कार्ये करू शकते. मोठे संस्थांसाठी टीम (team) आणि एंटरप्राइझ (enterprise) खाती देखील आहेत. शेवटी, डेव्हलपर OpenAI च्या API द्वारे ChatGPT ॲक्सेस (access) करू शकतात आणि तुम्ही वापरलेल्या टोकनच्या संख्येनुसार पैसे देऊ शकता.

मी ChatGPT सह काय करू शकतो?

योग्य सूचना आणि संदर्भासह, ChatGPT खूप उपयुक्त ठरू शकते. ChatGPT सह तुम्ही काही गोष्टी करू शकता त्या येथे दिल्या आहेत.

लेखन (Writing)

ChatGPT एक उपयुक्त लेखन सहाय्यक (writing assistant) ठरू शकते. जर तुम्ही त्याला एकाच वेळी संपूर्ण लेख लिहिण्यास सांगितले, तर ते चांगले आणि वाईट दोन्ही परिणाम देऊ शकते. परंतु जर तुम्ही त्याच्याशी हळू हळू सहकार्य केले, तर ChatGPT प्रभावी गोष्टी करू शकते. उदाहरणार्थ, तुम्ही रूपरेषेने सुरुवात करू शकता आणि OpenAI च्या चॅटबॉटच्या मदतीने प्रत्येक भाग भरू शकता.

संपादन (Editing)

ChatGPT एक उत्कृष्ट संपादन सहाय्यक (editing assistant) आहे; तुम्ही ते कॉपी (copy) संपादन, प्रूफरीडिंग (proofreading), पुन्हा लिहिणे, शैली समायोजित करणे इत्यादीसाठी वापरू शकता.

भाषांतर (Translation)

ChatGPT अनेक भाषांमध्ये चांगले भाषांतर करू शकते. जर तुम्ही विशिष्ट क्षेत्रात काम करत असाल, तर तुम्ही संदर्भ देऊन त्याचे भाषांतर सुधारू शकता, जसे की स्रोत भाषा आणि लक्ष्य भाषेतील दस्तऐवजांची उदाहरणे.

सारांश (Summary)

ChatGPT लेख, भाषणे आणि निबंधांचा सारांश देऊ शकते. जेव्हा तुम्ही मार्गदर्शक तत्त्वे प्रदान करता, जसे की कोणते विषय हायलाइट (highlight) करायचे, तेव्हा ते अधिक अचूक होते.

विचारमंथन (Brainstorming)

ChatGPT सादरीकरणासाठी चर्चा बिंदू सुचवण्यापासून ते सहलीची योजना बनवण्यापर्यंत येथे विविध प्रकारे मदत करू शकते.

कोडींग (Coding)

ChatGPT एक चांगला कोडींग (coding) सहाय्यक आहे, जो कार्यात्मक वर्णनांचे अनेक प्रोग्रामिंग (Programming) आणि स्क्रिप्टिंग (scripting) भाषांमध्ये कार्यरत कोडमध्ये रूपांतरित करू शकतो.

प्रतिमा तयार करणे आणि त्यांचे स्पष्टीकरण देणे.(Creating and interpreting images)

तुम्ही फोटो अपलोड (upload) करू शकता आणि त्याबद्दल प्रश्न विचारू शकता; उदाहरणार्थ, झाडाचा फोटो जोडा आणि विचारा “हे कोणते झाड आहे?” तुम्हाला समस्या असल्यास, ChatGPT स्क्रीनशॉट (screenshot) स्पष्ट करू शकते आणि तुम्ही तुमच्या फोनवर काहीतरी पाहू शकता. हे त्याच्या नवीन अंतर्गत जनरेटरने (internal generator) प्रतिमा देखील तयार करू शकते, ज्याला चांगली समीक्षा मिळाली आहे.

तोंडी संभाषण (Verbal conversation)

व्हॉइस मोड (voice mode) वापरून, तुम्हाला परिपूर्ण टेक्स्ट प्रॉम्प्ट (text prompt) तयार करण्याची आवश्यकता नाही. फक्त मायक्रोफोनमध्ये बोला आणि चॅटिंग (chatting) सुरू करा.

चित्रपटाचे भाग तयार करणे (Creating movie clips)

Sora व्हिडिओ (Sora video) जनरेटर (generator) कस्टम (custom) भाग तयार करतो, जे काही सेकंद लांब असतात, आवाज नसतो आणि मोठ्या व्हिडिओ (video) प्रकल्पांना वाढवण्यासाठी किंवा स्वतंत्र भाग म्हणून वापरले जाऊ शकतात. हे ChatGPT Plus आणि Pro सदस्यांसाठी उपलब्ध आहे आणि Microsoft Bing ॲप्लिकेशनद्वारे (Microsoft Bing application) मर्यादित कार्यक्षमतेसह विनामूल्य उपलब्ध आहे.

आम्ही ChatGPT ला संशोधन साधन म्हणून वापरण्याची शिफारस करत नाही, कारण त्याची माहिती चुकीची असण्याची शक्यता असते. ChatGPT सारखे LLM टेक्स्ट एकत्र करून ते शब्दशः योग्य बनवू शकतात, परंतु वस्तुस्थितीनुसार ते चुकीचे असू शकतात. हे ChatGPT वापरून कोडींग (coding) करण्यासाठी देखील लागू होते: हे गैर-कार्यात्मक किंवा असुरक्षित कोड (code) तयार करू शकते. एक चांगला नियम असा आहे की ChatGPT ला प्रारंभिक बिंदू म्हणून वापरा आणि नंतर ChatGPT द्वारे प्रदान केलेल्या स्त्रोत दुव्यांवर क्लिक (click) करून किंवा स्वतंत्र Google शोधाद्वारे त्याच्या आउटपुटची सत्यता तपासा. (Perplexity हा आणखी एक संदर्भ-आधारित चॅटबॉट आहे.)

ChatGPT ला पर्याय काय आहेत?

इतर अनेक कंपन्या आणि संस्थांनी ChatGPT च्या तुलनेत सूचना ट्रॅकिंग LLM विकसित केले आहेत.

  • Google Gemini: गुगलचे AI मॉडेल (AI model) जवळजवळ ChatGPT करू शकणाऱ्या सर्व गोष्टी करू शकते आणि ते गुगलच्या इकोसिस्टमशी (ecosystem) कनेक्ट (connect) होऊ शकते, त्यामुळे तुम्ही त्याचे आउटपुट (output) Gmail, Google Sheets, Docs इत्यादीमध्ये एक्सपोर्ट (export) करू शकता.
  • Bing: मायक्रोसॉफ्टने OpenAI मध्ये अब्जावधी डॉलर्सची गुंतवणूक केली आहे आणि त्यांनी ChatGPT ला त्यांच्या Bing सर्च इंजिनमध्ये (search engine) समाकलित केले आहे. हे ज्ञान शोधण्यासाठी आणि ChatGPT वापरून तुम्ही करू शकता अशी इतर कार्ये करण्यासाठी एक संभाषणात्मक इंटरफेस (conversational interface) आहे. हे तयार केलेल्या माहितीचे स्रोत उद्धृत करते, ज्यामुळे तुम्हाला माहिती स्रोताची पडताळणी करता येते.
  • Claude: Anthropic ही सॅन फ्रान्सिस्को (San Francisco) स्थित AI प्रयोगशाळा आहे, ज्याने Claude लाँच (launch) केले आहे, जे ChatGPT चे प्रतिस्पर्धी आहे आणि लेखन आणि कोडींग (coding) मध्ये चांगली प्रतिष्ठा आहे.
  • Perplexity: गुगलच्या ऐवजी, अनेक लोक वेब (web) शोधण्यासाठी Perplexity वापरतात. हे वेगाने वाढत आहे आणि मोटोरोलाच्या (Motorola) नवीन Razr फोनवर प्राधान्य दिलेले सर्च प्लॅटफॉर्म (search platform) असेल. अहवालानुसार, Samsung देखील असेच करण्याच्या वाटाघाटी करत आहे.
  • ओपन सोर्स मॉडेल (Open source model): ओपन सोर्स समुदायाने (open source community) LLM जारी केले आहेत, जे तुम्ही तुमच्या स्वतःच्या सर्व्हरवर चालवू शकता. हे LLM तुम्हाला तुमच्या डेटावर नियंत्रण ठेवण्यास आणि पुरवठादारांना टाळण्यास मदत करू शकतात. ओपन सोर्स LLM ChatGPT पेक्षा खूप लहान आहेत आणि सेट (set) करणे अधिक कठीण आहे, परंतु तुमच्याकडे तांत्रिक कौशल्ये असल्यास, ते प्रभावी परिणाम देऊ शकतात. Meta चे Llama मॉडेल काही सर्वात प्रसिद्ध मॉडेल आहेत. इतर पर्यायांमध्ये Open Assistant, Alpaca, Vicuna आणि Dolly 2 यांचा समावेश आहे.