क्या xAI ने ग्रोक 3 के बेंचमार्क पर झूठ बोला
xAI के ग्रोक 3 के बेंचमार्क प्रस्तुतीकरण पर विवाद छिड़ गया है, जिससे कृत्रिम बुद्धिमत्ता मॉडल के मूल्यांकन में पारदर्शिता और मानकीकरण की आवश्यकता पर सवाल उठ रहे हैं।
xAI के ग्रोक 3 के बेंचमार्क प्रस्तुतीकरण पर विवाद छिड़ गया है, जिससे कृत्रिम बुद्धिमत्ता मॉडल के मूल्यांकन में पारदर्शिता और मानकीकरण की आवश्यकता पर सवाल उठ रहे हैं।
चीन में आर्टिफिशियल इंटेलिजेंस चैटबॉट का परिदृश्य एक महत्वपूर्ण परिवर्तन से गुजर रहा है, जिसमें बाइटडांस का Doubao एक प्रमुख शक्ति के रूप में उभर रहा है, जो अलीबाबा और बैदु जैसे स्थापित खिलाड़ियों को ग्रहण कर रहा है। यह बदलाव चीनी तकनीकी बाजार की गतिशील प्रकृति को रेखांकित करता है, जहां तेजी से नवाचार और उपयोगकर्ता-केंद्रित दृष्टिकोण सफलता की कुंजी हैं। यह लेख Doubao के उदय, इसके प्रतिस्पर्धियों के सामने आने वाली चुनौतियों और चीन में AI के भविष्य के लिए व्यापक निहितार्थों पर प्रकाश डालता है।
स्टैनफोर्ड और यूसी बर्कले के शोधकर्ताओं द्वारा किए गए एक हालिया अध्ययन में, चैटजीपीटी के प्रदर्शन में तीन महीने की अवधि में महत्वपूर्ण उतार-चढ़ाव का खुलासा हुआ है। अध्ययन में पाया गया कि GPT-4 की सटीकता, निर्देशों का पालन करने की क्षमता और संवेदनशील सवालों के जवाब देने की इच्छा में गिरावट आई है, जबकि GPT-3.5 में कुछ कार्यों में सुधार देखा गया है। यह शोध ChatGPT के व्यवहार की गतिशीलता को समझने में मदद करता है।