सुरुवातीचा संघर्ष: क्लॉडचा खडतर प्रवास
कृत्रिम बुद्धिमत्ता (Artificial intelligence) खूप प्रगत झाली आहे, पण ती एखादा क्लासिक व्हिडिओ गेम खेळण्यात यशस्वी होऊ शकते का? Anthropic, एक आघाडीची AI स्टार्टअप कंपनी, आपल्या तंत्रज्ञानाची चाचणी एका अनोख्या आणि मनोरंजक प्रयोगाद्वारे करत आहे. कंपनीने Twitch या लोकप्रिय गेमिंग प्लॅटफॉर्मवर एक लाईव्हस्ट्रीम सुरू केली आहे, ज्यामध्ये त्यांचा AI मॉडेल, क्लॉड, Pokémon Red हा प्रसिद्ध गेम खेळण्याचा प्रयत्न करत आहे.
ध्येयाकडे वाटचाल: क्लॉड विरुद्ध पोकेमॉन रेड
या प्रयोगाचा उद्देश सोपा आहे: एक AI पोकेमॉनच्या गुंतागुंतीच्या जगात मार्गक्रमण करू शकतो का, लढाईसाठी रणनीती आखू शकतो का आणि शेवटी पोकेमॉन मास्टर बनू शकतो का? Anthropic ने ‘क्लॉड प्लेज पोकेमॉन’ प्रकल्प आपल्या AI एजंटची क्षमता तपासण्यासाठी आणि गेमिंग समुदायाशी संवाद साधण्यासाठी सुरू केला. मात्र, हा प्रवास सोपा नव्हता.
सुरुवातीच्या अडचणी: क्लॉडसाठी खडतर सुरुवात
सुरुवातीला, क्लॉडच्या आधीच्या आवृत्त्यांना अनेक अडचणींचा सामना करावा लागला. लढाईत सहभागी होण्यासारखी मूलभूत कामे करणेही त्याला कठीण जात होते. Anthropic च्या अहवालानुसार, जून 2024 मध्ये क्लॉड 3.5 जवळपास प्रत्येक लढाईतून पळून जाण्याचा प्रयत्न करत होता. या वर्तनामुळे आधीच्या मॉडेल्सच्या मर्यादा दिसून आल्या, ज्यामध्ये गेमची उद्दिष्ट्ये समजून घेणे आणि योग्य कृती करणे समाविष्ट होते.
आशेचा किरण: क्लॉड 3.7 सॉनेटची एन्ट्री
महिन्यांनंतर, फेब्रुवारी 2025 मध्ये, Anthropic ने क्लॉड 3.7 सॉनेट सादर केले. या नवीन आवृत्तीने एक महत्त्वाचा टप्पा गाठला. गेम सुरू केल्यानंतर काही तासांतच, क्लॉड 3.7 सॉनेटने ब्रॉकला हरवले, जो पहिला जिम लीडर होता. काही दिवसांनंतर, त्याने मिस्टीला हरवले, जी दुसरी जिम लीडर होती. हे विजय AI च्या क्षमतांमधील प्रगती दर्शवतात, जे आधीच्या मॉडेल्ससाठी केवळ स्वप्न होते.
पोकेमॉन खेळणाऱ्या AI ची अंतर्गत कार्यप्रणाली
क्लॉड 3.7 सॉनेटमध्ये काय खास होते? Anthropic ने सांगितले की या आवृत्तीमध्ये अनेक महत्त्वाच्या क्षेत्रांमध्ये सुधारित क्षमता होत्या:
- पुढील योजना: क्लॉड 3.7 सॉनेटमध्ये भविष्यातील चालींचा अंदाज घेण्याची आणि त्यानुसार रणनीती आखण्याची क्षमता होती.
- उद्दिष्ट्ये लक्षात ठेवणे: AI आपली उद्दिष्ट्ये लक्षात ठेवू शकत होता आणि त्यांच्या दिशेने सातत्याने काम करू शकत होता.
- चुकांमधून शिकणे: क्लॉड 3.7 सॉनेटमध्ये त्याच्या चुकांचे विश्लेषण करण्याची आणि त्याच्या गेमप्लेमध्ये सुधारणा करण्याची क्षमता होती, जी कोणत्याही गेममध्ये प्राविण्य मिळवण्यासाठी आवश्यक आहे.
- ज्ञानसंचय तयार करणे: AI ने पोकेमॉन जगाबद्दल माहितीचा संग्रह तयार केला, ज्यामध्ये पोकेमॉनचे प्रकार, चाली आणि रणनीती यांचा समावेश होता.
- दृश्य आकलन: क्लॉड 3.7 सॉनेट गेम स्क्रीन ‘पाहू’ शकत होता, ज्यामुळे त्याला माहितीपूर्ण निर्णय घेण्यासाठी दृश्य माहितीचा अर्थ लावता येत होता.
- सिम्युलेटेड बटण दाबणे: AI बटण दाबण्याचे अनुकरण करून आदेश देऊ शकत होता, ज्यामुळे त्याला गेमच्या वातावरणाशी संवाद साधता येत होता.
प्रगती थांबली: माउंट मूनमधून लांबचा प्रवास
सुरुवातीच्या यशानंतरही, क्लॉड 3.7 सॉनेटची प्रगती एका ठिकाणी थांबली. माउंट मून, गेममधील एक कठीण आणि गुंतागुंतीचा भाग, त्याच्यासाठी विशेष आव्हानात्मक ठरला. लाईव्हस्ट्रीम पाहणाऱ्यांनी 78 तासांचा एक कठीण काळ पाहिला, जेव्हा क्लॉड या भागातून मार्ग काढण्यासाठी धडपडत होता. तुलना केल्यास, सामान्य खेळाडू, अगदी लहान मुलेसुद्धा, हा भाग काही तासांत पूर्ण करतात.
चक्राकार तर्क: क्लॉडच्या नेव्हिगेशनल अडचणी
लाइव्हस्ट्रीममध्ये क्लॉडच्या स्थानिक तर्क आणि नेव्हिगेशनमधील अडचणी दिसून आल्या. AI अनेकदा स्वतःला चक्राकार मार्गांमध्ये फिरताना, त्याच मार्गांवरून परत जाताना आणि भिंतींवर आदळताना आढळला. या वर्तनामुळे AI ला अजूनही दृश्य माहितीचा अर्थ लावण्यात आणि आभासी वातावरणात प्रभावीपणे हालचाल करण्यात येणाऱ्या अडचणी दिसून आल्या.
क्लॉडच्या मनात डोकावून पाहणे: AI च्या निर्णय प्रक्रियेची झलक
लाइव्हस्ट्रीमचा एक आकर्षक भाग म्हणजे सोबत असलेला टेक्स्ट बॉक्स, जो क्लॉडची ‘विचार’ प्रक्रिया दर्शवतो. हे वैशिष्ट्य दर्शकांना AI च्या निर्णय प्रक्रियेची माहिती देते, ते कसे परिस्थितीचे विश्लेषण करते, पर्यायांचे मूल्यांकन करते आणि पुढील चाली निवडते हे दर्शवते.
मजकूर विरुद्ध व्हिज्युअल: क्लॉडची बलस्थाने आणि कमतरता
Anthropic अभियंत्यांच्या मते, क्लॉड गेमच्या मजकूर-आधारित पैलूंमध्ये, जसे की पोकेमॉन लढाईमध्ये उत्कृष्ट आहे. AI पोकेमॉनचे प्रकार, चाली आणि आकडेवारी याबद्दलची माहिती प्रभावीपणे हाताळू शकतो, ज्यामुळे त्याला लढाईत रणनीतिकखेळ