एआय सार्वभौमत्वाचा ध्यास: तैवानचा DeepSeek ला प्रतिसाद

चीनच्या आर्टिफिशियल इंटेलिजन्स (Artificial Intelligence) क्षेत्रातील प्रगतीमुळे, विशेषत: DeepSeek-R1 च्या लाँचिंगमुळे जगाचे लक्ष वेधले आहे. या पार्श्वभूमीवर, तैवान एक वेगळा मार्ग चोखाळत आहे. तैवान भाषिक मॉडेलच्या विकासाला प्राधान्य देत आहे, जेथील संस्कृती आणि लोकशाही मूल्यांचे प्रतिबिंब आहे. या प्रयत्नांचा उद्देश सत्तावादी राजवटींच्या प्रभावाखाली असलेल्या एआय सिस्टीम्सला (AI systems) संतुलित करणे आहे.

DeepSeek चं आव्हान

जानेवारी महिन्यात DeepSeek-R1 सादर करण्यात आले, ज्यामुळे तंत्रज्ञान क्षेत्रात बरीच चर्चा झाली. यापूर्वी Baidu चे Ernie आणि ByteDance चे Doubao यांसारख्या चिनी भाषेतील मॉडेल्सनी चिनी भाषेतील ॲप्लिकेशन्स, गणित आणि कोडिंगमध्ये चांगली क्षमता दर्शविली होती, परंतु इंग्रजी भाषेचे ज्ञान कमी असल्याने आणि मर्यादित प्रवेशामुळे त्यांची वाढ खुंटली होती. DeepSeek-R1 ने आंतरराष्ट्रीय स्तरावर ओळख मिळवून एक महत्त्वाचा टप्पा गाठला आहे.

DeepSeek-R1 चा सर्वात महत्त्वाचा पैलू म्हणजे त्याचा कमी विकास खर्च. OpenAI च्या GPT-4o ला प्रशिक्षण देण्यासाठी US$ 100 दशलक्ष खर्च आला, तर DeepSeek च्या संशोधकांनी त्यांचा चॅटबॉट (chatbot) केवळ US$ 5.6 दशलक्षमध्ये विकसित केल्याचा दावा केला आहे. कार्यक्षमतेची बाबतीत DeepSeek च्या अभियंत्यांनी GPT-4o किंवा Anthropic च्या Claude सारख्या मॉडेल्समध्ये वापरल्या जाणार्‍या टॉप-टियर चिप्सऐवजी Nvidia H800 सारख्या मध्यम श्रेणीतील CPUs चा वापर करून R1 मॉडेलला प्रशिक्षण दिले. अमेरिकेने चीनला उच्च-कार्यक्षमतेच्या चिप्सच्या निर्यातीवर निर्बंध घातले असले तरी, DeepSeek-R1 ने केवळ 2,048 प्रोसेसर 256 सर्व्हरमध्ये पसरवून इतर आघाडीच्या बॉट्सपेक्षा चांगली कामगिरी केली.

हे उल्लेखनीय यश प्रामुख्याने अत्याधुनिक प्रोग्रामिंग तंत्रांमुळे शक्य झाले, ज्यात PTX चा समावेश आहे. PTX हे असेम्ब्ली-भाषेसारखे (assembly-like language) आहे, जे डेव्हलपर्सना (developers) कार्यक्षमतेत सुधारणा करण्यास आणि हार्डवेअरचा (hardware) पुरेपूर वापर करण्यास मदत करते.

लाँच झाल्यानंतर लगेचच, DeepSeek-R1 ॲप (app) अमेरिकेच्या ॲपल ॲप स्टोअरमध्ये (Apple App Store) विनामूल्य डाउनलोडमध्ये अव्वल ठरले, त्याने ChatGPT, TikTok आणि Meta च्या सोशल मीडिया प्लॅटफॉर्म्सलाही मागे टाकले. DeepSeek-R1 च्या पदार्पणानंतर Nasdaq मध्ये घसरण झाली आणि Nvidia च्या शेअर्समध्ये मोठी घट झाली.

DeepSeek च्या दाव्यांवर प्रश्नचिन्ह

सुरुवातीच्या उत्साहानंतर, अनेक निरीक्षकांनी DeepSeek च्या LLM (Large Language Model) संदर्भातील दाव्यांवर शंका उपस्थित केली आहे. विश्लेषकांनी (Analysts) असे म्हटले आहे की, नमूद केलेली आकडेवारी केवळ संगणकीय खर्चाचा भाग आहे, तर पायाभूत सुविधा, हार्डवेअर आणि मनुष्यबळ खर्चाचा समावेश नाही किंवा कमी लेखला गेला आहे.

तैपेईस्थित (Taipei-based) जनरेटिव्ह्ह एआय (Generative AI) आणि क्लाउड गेमिंग (cloud gaming) सेवा प्रदाता Ubitus चे संस्थापक आणि सीईओ वेस्ली कुओ (Wesley Kuo) यांनीही याबद्दल चिंता व्यक्त केली आहे. त्यांनी सांगितले की, वास्तविक खर्च अहवालात नमूद केलेल्या खर्चापेक्षा खूप जास्त असण्याची शक्यता आहे. Nvidia च्या पाठिंब्याने Ubitus ने Project TAME ला सपोर्ट (support) केला, जे पारंपरिक चिनी भाषेतील LLM आहे. त्यांनी H100 CPUs आणि गेमिंग डेटा (gaming data) प्रदान केला. Ubitus ने Foxlink आणि Shinfox Energy यांच्या सहकार्याने Ubilink.AI ची स्थापना केली आहे, जे Asus च्या सहकार्याने तैवानमधील सर्वात मोठे ग्रीन एनर्जी-पॉवर एआय सुपरकंप्युटिंग (green energy-powered AI supercomputing) सेवा केंद्र तयार करत आहेत.

कुओ यांनी गेमिंग, पर्यटन आणि रिटेल (retail) यांसारख्या क्षेत्रांमध्ये सरकारांसाठी (जपान सरकारसह) LLM ॲप्लिकेशन्स आणि मॉडेल्स विकसित करण्याच्या कंपनीच्या भूमिकेवर जोर दिला. तसेच, एआयमध्ये कामगारांची कमतरता आणि वृद्ध लोकसंख्येच्या समस्यांचे निराकरण करण्याची क्षमता असल्याचेही सांगितले.

डेटा सत्यतेच्या चिंता

कुओ OpenAI आणि Microsoft च्या मताशी सहमत आहेत की DeepSeek ने मॉडेल डिस्टिलेशनद्वारे (model distillation) डेटा मिळवला असण्याची शक्यता आहे. या प्रक्रियेत, मोठ्या मॉडेल्सच्या आऊटपुटची (output) नक्कल करण्यासाठी लहान भाषिक मॉडेल्सना प्रशिक्षण देणे समाविष्ट आहे. OpenAI आणि Microsoft चा आरोप आहे की DeepSeek ने आपल्या विकासाला गती देण्यासाठी OpenAI च्या ॲप्लिकेशन प्रोग्रामिंग इंटरफेसचा (application programming interface) उपयोग केला आहे.

कुओ यांचा दावा आहे की DeepSeek ने OpenAI कडून डेटा मिळवला आहे आणि कंपनीच्या कार्यक्षमतेबद्दल गैरसमज आहेत. ते निदर्शनास आणतात की DeepSeek-R1 मध्ये 670 अब्ज पॅरामीटर्स (parameters) आहेत, जे Meta AI च्या Llama 3.1 405B पेक्षा खूप मोठे आहे. पॅरामीटर्स हे अंतर्गत संख्यात्मक मूल्य आहेत, जे मॉडेल प्रशिक्षणादरम्यान भविष्य वर्तवण्यासाठी शिकतात. कुओ असेही सांगतात की DeepSeek चे मॉडेल्स Llama 3.1 मधून डिस्टिल्ड (distilled) केले गेले असण्याची शक्यता आहे.

या आरोपांव्यतिरिक्त, DeepSeek-R1 च्या क्षमतेबद्दलही चिंता व्यक्त केली गेली आहे. तज्ञांचे म्हणणे आहे की, R1 विशिष्ट कार्यांमध्ये उत्कृष्ट आहे, परंतु सामान्य उद्देशाच्या कार्यक्षमतेत GPT-4o च्या तुलनेत मागे आहे.

DeepSeek च्या मॉडेल्सवरील एक मोठी मर्यादा म्हणजे माहितीच्या मुक्त प्रवेशावरील निर्बंध. वापरकर्त्यांना असे आढळले की संवेदनशील राजकीय विषयांवर (sensitive political topics) प्रश्न विचारल्यास संदिग्ध उत्तरे दिली जातात. शिनजियांगच्या (Xinjiang) उईगुर अल्पसंख्याकांसारख्या (Uyghur minority) आणि तैवानच्या (Taiwan) स्थितीसारख्या विषयांवर DeepSeek ची उत्तरे चिनी कम्युनिस्ट पक्षाच्या (Chinese Communist Party) अधिकृत भूमिकांचे समर्थन करतात. संशोधनात असे दिसून आले आहे की DeepSeek च्या आउटपुटचा एक महत्त्वपूर्ण भाग लोकशाही, मानवाधिकार आणि चीनच्या विवादास्पद सार्वभौमत्वाशी संबंधित (contested sovereignty claims) माहिती दडपण्यासाठी सेन्सॉर (censor) केला जातो.

तैवानचा पर्याय: TAIDE आणि इतर

या प्रतिक्रियेत, तैवानमध्ये विकसित केलेले LLMs, जसे की TAME, सिनोस्फियरमध्ये (Sinosphere) DeepSeek च्या ऐवजी एक चांगला पर्याय म्हणून उदयास आले आहेत. राष्ट्रीय Applied Research संस्थेने (National Institute of Applied Research) जून 2023 मध्ये Trustworthy AI Dialogue Engine (TAIDE) लाँच केले, ज्याचा उद्देश तैवानच्या सामाजिक, सांस्कृतिक आणि भाषिक मानकांशी जुळणारे मॉडेल विकसित करणे आहे.

TAIDE वरील काम थांबलेले दिसत असले तरी, Project TAME साठी ते एक महत्त्वाचे बेंचमार्क (benchmark) ठरले. TAME, नॅशनल तैवान युनिव्हर्सिटीतील (National Taiwan University) मशीन इंटेलिजन्स ॲन्ड अंडरस्टॅंडिंग (Machine Intelligence and Understanding Laboratory) प्रयोगशाळेने विकसित केले आहे. विविध संस्थांकडून मिळालेल्या निधीतून या मॉडेलला 500 अब्ज टोकन्सवर (tokens) प्रशिक्षण देण्यात आले. या मॉडेलने GPT-4o सह 39 मूल्यांकनांमध्ये (evaluations) चांगली कामगिरी केली आणि विद्यापीठातील प्रवेश परीक्षा, बार परीक्षा (bar exam) आणि पारंपरिक चिनी औषध परीक्षांमध्ये (traditional Chinese medicine examinations) उच्च गुण मिळवले.

TAME च्या उद्दिष्टांपैकी एक म्हणजे स्थानिक संस्कृतीला प्रोत्साहन देणे. स्थानिक भाषिक क्षमता अनलॉक (unlock) करणे हे एक महत्त्वाचे पाऊल आहे. कुओ यांनी Whisper वर आधारित तैवानी व्हॉइस (voice) LLM च्या विकासाचा उल्लेख केला, ज्याने तोंडी तैवानी भाषा समजून घेण्यात सकारात्मक परिणाम प्राप्त केले आहेत. हक्का भाषेला (Hakka language) ओळखण्यासाठी सध्या प्रयत्न सुरू आहेत.

या प्रयत्नांना अशा संस्थांकडून चांगला प्रतिसाद मिळाला आहे, जेथे या भाषा मोठ्या प्रमाणावर बोलल्या जातात. या मॉडेलला स्थानिक भाषेची (indigenous language) ओळख देण्यासाठीही प्रयत्न केले जात आहेत, परंतु मर्यादित डेटा ही एक मोठी समस्या आहे. एआयला (AI) नवीन भाषा शिकवण्यासाठी मोठ्या प्रमाणात व्हॉइस रेकॉर्डिंग्ज (voice recordings) आणि टेक्स्टची (text) आवश्यकता असते.

सरकारी अभिलेखागारातील (government archives) ऐतिहासिक डेटा ॲक्सेस (access) करणे ही आणखी एक संधी आहे. तथापि, काही डेटा कॉपीराइटने (copyright) संरक्षित आहे. आर्टिफिशियल जनरल इंटेलिजन्सचा (artificial general intelligence) उदय धोक्यात आलेल्या आणि आता अस्तित्वात नसलेल्या भाषांना पुनरुज्जीवित (revival) करण्याची क्षमता देतो.

एआय सार्वभौमत्वाचा ध्यास

भाषा आणि संस्कृतीचा संबंध एआय सार्वभौमत्वाच्या (AI sovereignty) महत्त्वावर प्रकाश टाकतो. तैवानी ओळख मजबूत करणे, तैवानची कथा सांगणे आणि माहितीचे संरक्षण करणे हे त्याचे उद्दिष्ट आहे.

मार्केट इंटेलिजन्स ॲन्ड कन्सल्टिंग इन्स्टिट्यूटमधील (Market Intelligence & Consulting Institute) उद्योग सल्लागार (industry consultant) आणि संचालक ज्युलियन चू (Julian Chu) यांनी LLM मॉडेल्स आणि प्रशिक्षण डेटातील (training data) संभाव्य Bias (पक्षपात) बद्दल जोर दिला. ते नमूद करतात की पारंपरिक चिनी भाषेचा (traditional characters) वापर करत असतानाही, LLM आऊटपुट चीनच्या (People’s Republic of China) शैलीचे प्रतिबिंब दाखवतात आणि तैवानची संस्कृती दर्शविण्यात अयशस्वी ठरतात. तैवानी कंपन्यांनी तैवानी भाषा किंवा डेटा वापरून LLMs ला प्रशिक्षण देणे आणि एआय सार्वभौमत्व निर्माण करणे हे मुख्य उद्दिष्ट आहे.

चू यांनी Formosa Foundation Model (FFM-Llama2) चा उल्लेख केला, जे तैवानचे आणखी एक आशादायक LLM आहे. तैवान वेब सर्व्हिसने (Taiwan Web Service) सप्टेंबर 2023 मध्ये ते लाँच केले, ज्याचा उद्देश एआयचे लोकशाहीकरण (democratize) करणे आहे. Foxconn ने मार्चमध्ये FoxBrain नावाचे LLM लाँच केले. तथापि, काही समीक्षक मोठ्या कॉर्पोरेशन्सच्या (corporations) LLMs मधील गुंतवणुकीबद्दल साशंक आहेत.

TAME विकसित करणार्‍या MiuLab टीमचे सदस्य लिन येन-टिंग (Lin Yen-ting) यांनी तैवानसंदर्भात माहितीमधील अंतर भरून काढण्याची गरज अधोरेखित केली आहे. ते नमूद करतात की DeepSeek-R1 आणि इतर चिनी LLMs तैवानबद्दल चुकीचा दृष्टिकोन सादर करतात. अमेरिकेत विकसित केलेले मॉडेल्सदेखील कधीकधी तैवानचे चुकीचे प्रतिनिधित्व करू शकतात. ओपन-सोर्स (open-source) मॉडेल्स तैवानला प्राधान्य देत नाहीत आणि प्रशिक्षण डेटावर चीनचे वर्चस्व आहे.

म्हणून, तैवानी भाषेतील (Taiwanese content) सामग्रीचा विचारपूर्वक समावेश करणे आणि मॉडेलला पुन्हा प्रशिक्षण देणे महत्त्वाचे आहे. हा सक्रिय दृष्टिकोन हे सुनिश्चित करतो की तैवानचे अद्वितीय सांस्कृतिक आणि भाषिक स्वरूप डिजिटल जगात अचूकपणे दर्शविले जाईल, ज्यामुळे राष्ट्रीयत्वाची भावना वाढेल आणि जागतिक एआय विकासाच्या पार्श्वभूमीवर त्याचा वेगळा वारसा जतन केला जाईल. तैवानच्या ओळखीचे जतन करण्याच्या या समर्पणामुळे हे सुनिश्चित होते की या बेटाची (island nation) अनोखी संस्कृती आणि मूल्ये प्रभावी Narratives (कथा) द्वारे झाकली जाणार नाहीत.

या प्रयत्नात अनेक अडचणी आहेत. स्थानिक भाषेतील (localized content) डेटासेट्समध्ये प्रवेश आणि नैसर्गिक भाषा प्रक्रिया (natural language processing) क्षेत्रातील तज्ञांचा समावेश करून खर्‍या अर्थाने प्रातिनिधिक एआय मॉडेल (AI model) तयार करण्यासाठी महत्त्वपूर्ण संसाधनांची (resources) गुंतवणूक करणे आवश्यक आहे. याव्यतिरिक्त, चुकीच्या माहितीचा (disinformation) आणि Bias चा (पक्षपात) सामना करण्यासाठी सतत सुधारणा आणि अनुकूलन करण्याची प्रक्रिया आवश्यक आहे.

या आव्हानांना न जुमानता, तैवानची एआय सार्वभौमत्वाची बांधिलकी (commitment) कायम आहे. TAME आणि इतर स्थानिक LLMs चा विकास हे सुनिश्चित करण्याच्या दिशेने एक महत्त्वपूर्ण पाऊल आहे की आर्टिफिशियल इंटेलिजन्सचे भविष्य (future of artificial intelligence) बेटाची अनोखी सांस्कृतिक ओळख, लोकशाही मूल्ये आणि जगात त्याचे वेगळे स्थान जतन करण्याच्या अटळ बांधिलकीचे प्रतिबिंब आहे. एआय सार्वभौमत्वाला प्राधान्य देऊन, तैवान केवळ आपल्या सांस्कृतिक वारशाचे रक्षण करत नाही, तर जागतिक एआय क्षेत्रात एक महत्त्वाचा खेळाडू म्हणून स्वतःची ओळख निर्माण करत आहे, हे दर्शविते की तांत्रिक प्रगती सांस्कृतिक ओळख आणि लोकशाही तत्त्वांच्या जतनाशी जुळलेली असू शकते.

प्रवासाची सुरूवात

परिपूर्ण एआय सार्वभौमत्वाचा (AI sovereignty) प्रवास अजूनही सुरू आहे. या उपक्रमांमधील (initiatives) अडचणींवर मात करण्यासाठी आणि दीर्घकालीन यश सुनिश्चित करण्यासाठी पुढील संशोधन, विकास आणि सहकार्य महत्त्वपूर्ण आहे. एआय सार्वभौमत्वाला प्राधान्य देऊन, तैवान एक असे डिजिटल स्वरूप (digital landscape) तयार करू शकते, जेथील अद्वितीय सांस्कृतिक ओळख आणि लोकशाही मूल्यांचे योग्य प्रतिबिंब दिसेल. तसेच, इतर राष्ट्रांनाही एक आदर्श उदाहरण सादर करेल, जे अधिकाधिक जोडलेल्या जगात आपले वेगळे स्थान टिकवून ठेवण्यासाठी प्रयत्नशील आहेत.