چین کی جانب سے مصنوعی ذہانت (AI) کے میدان میں، خاص طور پر ڈیپ سیک (DeepSeek-R1) کے آغاز کے ساتھ حالیہ پیش رفت نے عالمی توجہ حاصل کی ہے، وہیں تائیوان ایک مختلف راہ پر گامزن ہے، جو کہ لسانی ماڈلز کی ترقی کو ترجیح دیتا ہے جو اس کی منفرد ثقافتی شناخت اور جمہوری اقدار کی عکاسی کرتے ہیں۔ اس کوشش کا مقصد آمرانہ حکومتوں سے متاثرہ مصنوعی ذہانت کے نظاموں کے خلاف ایک وزن بنانا ہے۔
ڈیپ سیک کا چیلنج
جنوری میں ڈیپ سیک-آر 1 کی نقاب کشائی نے ٹیک کمیونٹی کے اندر کافی دلچسپی پیدا کی۔ اس سے پہلے چینی لسانی ماڈلز، جیسے بیدو (Baidu) کا ایرنی (Ernie) اور بائٹ ڈانس (ByteDance) کا دوباو (Doubao)، نے چینی زبان کی ایپلی کیشنز، ریاضی اور کوڈنگ میں صلاحیت کا مظاہرہ کیا، لیکن وہ کمزور انگریزی مہارت اور محدود رسائی کی وجہ سے محدود تھے۔ تاہم، ڈیپ سیک-آر 1 نے ایک اہم سنگ میل عبور کیا کیونکہ یہ بین الاقوامی سطح پر پہچانے جانے والا پہلا چینی ایل ایل ایم (LLM) تھا۔
ڈیپ سیک-آر 1 کے سب سے نمایاں پہلوؤں میں سے ایک اس کی مبینہ طور پر کم ترقیاتی لاگت تھی۔ اوپن اے آئی (OpenAI) کے جی پی ٹی-4او (GPT-4o) کے برعکس، جس کی تربیت پر مبینہ طور پر 100 ملین امریکی ڈالر سے زیادہ لاگت آئی، ڈیپ سیک کے محققین نے دعویٰ کیا کہ ان کا چیٹ بوٹ محض 5.6 ملین امریکی ڈالر میں تیار کیا گیا تھا۔ مزید برآں، کارکردگی کی کہانی کو ہوا دیتے ہوئے، ڈیپ سیک کے انجینئرز نے آر 1 ماڈل کو Nvidia H800 جیسے درمیانے درجے کے CPUs کا استعمال کرتے ہوئے تربیت دی، بجائے اس کے کہ GPT-4o یا اینتھروپک کے کلاڈ (Claude) جیسے ماڈلز میں استعمال ہونے والے اعلیٰ درجے کے چپس استعمال کیے جائیں۔ امریکہ کی جانب سے چین کو اعلیٰ کارکردگی والے چپس کی برآمد پر پابندیوں کے باوجود، ڈیپ سیک-آر 1 نے صرف 2,048 پروسیسرز کا استعمال کرتے ہوئے دیگر سرکردہ بوٹس کو پیچھے چھوڑ دیا، جو 256 سرورز میں پھیلے ہوئے تھے۔
یہ قابل ذکر کارکردگی اور کم ترقیاتی لاگت بڑی حد تک جدید پروگرامنگ تکنیکوں سے منسوب کی گئی، بشمول پی ٹی ایکس (PTX)، جو اسمبلی جیسی زبان ہے جو ڈویلپرز کو کارکردگی کو ٹھیک کرنے اور ہارڈ ویئر کے استعمال کو زیادہ سے زیادہ کرنے کے قابل بناتی ہے۔
اس کی رہائی کے فوراً بعد، ڈیپ سیک-آر 1 ایپ امریکی ایپل ایپ اسٹور کی مفت ڈاؤن لوڈ رینکنگ میں سب سے اوپر آگئی، جس نے چیٹ جی پی ٹی، ٹک ٹاک، اور میٹا کے سوشل میڈیا پلیٹ فارمز کو بھی پیچھے چھوڑ دیا۔ ڈیپ سیک-آر 1 کے آغاز کے بعد نیس ڈیک (Nasdaq) میں کمی واقع ہوئی، اور Nvidia کے حصص گر گئے۔
ڈیپ سیک کے دعووں پر سوالات
ابتدائی جوش و خروش کے باوجود، بہت سے مبصرین نے ڈیپ سیک کی جانب سے اپنے ایل ایل ایم کے حوالے سے کیے گئے دعووں کی صداقت کے بارے میں سوالات اٹھائے ہیں۔ تجزیہ کاروں نے تجویز پیش کی ہے کہ بیان کردہ اعداد و شمار میں صرف کمپیوٹیشنل لاگت کو شامل کیا گیا ہے، جبکہ انفراسٹرکچر، ہارڈ ویئر اور انسانی وسائل کے اخراجات کو خارج یا کم کر کے بتایا گیا ہے۔
تائی پے میں مقیم جنریٹو اے آئی اور کلاؤڈ گیمنگ سروس فراہم کرنے والے یوبیٹس (Ubitus) کے بانی اور سی ای او ویسلی کو (Wesley Kuo) نے ان خدشات کا اعادہ کرتے ہوئے کہا کہ اصل لاگت بتائی جانے والی لاگت سے کہیں زیادہ ہونے کا امکان ہے۔ یوبیٹس نے، Nvidia کی حمایت کے ساتھ، پروجیکٹ ٹیم (Project TAME) کی حمایت کی، جو روایتی چینی حروف کا استعمال کرتے ہوئے ایک مقامی ایل ایل ایم ہے۔ انہوں نے ایچ 100 سی پی یوز (H100 CPUs) اور گیمنگ ڈیٹا فراہم کیا۔ یوبیٹس نے فوکس لنک (Foxlink) اور شن فوکس انرجی (Shinfox Energy) کے ساتھ مل کر یوبی لنک اے آئی (Ubilink.AI) بھی قائم کیا، جو اسس (Asus) کے تعاون سے تائیوان کا سب سے بڑا گرین انرجی سے چلنے والا اے آئی سپر کمپیوٹنگ سروس سینٹر بنا رہا ہے۔
کو اس بات پر زور دیتے ہیں کہ کمپنی حکومتی سطح پر ایل ایل ایم ایپلی کیشنز اور ماڈلز تیار کرنے میں شامل ہے، جن میں گیمنگ، سیاحت اور ریٹیل جیسے شعبوں میں جاپانی حکومت بھی شامل ہے، جو افرادی قوت کی قلت اور بوڑھی ہوتی آبادی سے نمٹنے کے لیے اے آئی کی صلاحیت کو اجاگر کرتی ہے۔
ڈیٹا کی سالمیت سے متعلق خدشات
کو اوپن اے آئی اور مائیکروسافٹ کے ساتھ اس تجویز میں شامل ہیں کہ ڈیپ سیک نے ماڈل ڈسٹلیشن (model distillation) کے ذریعے ڈیٹا حاصل کیا ہوگا۔ اس عمل میں بڑے ماڈلز کے نتائج کی نقل کرنے کے لیے چھوٹے لسانی ماڈلز کی تربیت شامل ہے۔ اوپن اے آئی اور مائیکروسافٹ کا الزام ہے کہ ڈیپ سیک نے اپنی ترقی کو آسان بنانے کے لیے اوپن اے آئی کے ایپلیکیشن پروگرامنگ انٹرفیس (application programming interface) کا استعمال کیا۔
کو کا دعویٰ ہے کہ ڈیپ سیک نے اوپن اے آئی سے ڈیٹا حاصل کیا اور یہ کہ کمپنی کے کارکردگی کے بارے میں دعووں کے حوالے سے غلط فہمیاں پائی جاتی ہیں۔ وہ نشاندہی کرتے ہیں کہ ڈیپ سیک-آر 1، جس میں 670 بلین پیرامیٹرز ہیں، میٹا اے آئی کے لاما 3.1 405B سے کہیں زیادہ بڑا ہے۔ پیرامیٹرز داخلی عددی اقدار ہیں جو ایک ماڈل پیشین گوئی کرنے کے لیے تربیت کے دوران سیکھتا ہے۔ کو یہ بھی تجویز کرتے ہیں کہ ڈیپ سیک کے ماڈلز کو لاما 3.1 سے ڈسٹل کیا گیا ہوگا۔
ان تردیدوں کے علاوہ، ڈیپ سیک-آر 1 کی صلاحیتوں کے حوالے سے بھی خدشات سامنے آئے ہیں۔ ماہرین کا کہنا ہے کہ، اپنے پیشروؤں کی طرح، آر 1 مخصوص، ٹاسک کے لیے مخصوص افعال میں بہترین ہے لیکن عام مقصد کی کارکردگی میں جی پی ٹی-4او کے ورژن سے پیچھے ہے۔
ڈیپ سیک کے ماڈلز کی ایک بڑی حد معلومات تک مفت رسائی پر پابندی ہے۔ صارفین نے دریافت کیا کہ حساس سیاسی موضوعات کے بارے میں پوچھ گچھ کا جواب مبہم جوابات سے دیا جاتا ہے۔ سنکیانگ کی ایغور اقلیت اور تائیوان جیسے موضوعات پر، ڈیپ سیک کے جوابات چینی کمیونسٹ پارٹی کے سرکاری موقف کی عکاسی کرتے ہیں۔ تحقیق سے پتہ چلتا ہے کہ ڈیپ سیک کے نتائج کا ایک اہم حصہ جمہوریت، انسانی حقوق، اور چین کے متنازعہ خودمختاری کے دعووں سے متعلق معلومات کو دبانے کے لیے سنسر کیا جاتا ہے۔
تائیوان کا متبادل: ٹی اے آئی ڈی ای اور اس سے آگے
جواب میں، تائیوان میں تیار کردہ ایل ایل ایم، جیسے کہ ٹیم (TAME)، سائنوسفیر (Sinosphere) کے اندر ڈیپ سیک کے متبادل کے طور پر سامنے آئے ہیں۔ ٹرسٹ ورتھی اے آئی ڈائیلاگ انجن (Trustworthy AI Dialogue Engine) (TAIDE)، جسے جون 2023 میں نیشنل انسٹی ٹیوٹ آف اپلائیڈ ریسرچ نے شروع کیا تھا، کا مقصد ایک ایسا ماڈل تیار کرنا ہے جو تائیوان کے سماجی، ثقافتی اور لسانی اصولوں کے مطابق ہو۔
اگرچہ ٹی اے آئی ڈی ای پر کام رک گیا ہے، لیکن اس نے پروجیکٹ ٹیم کے لیے ایک اہم معیار کے طور پر کام کیا۔ ٹیم، جو نیشنل تائیوان یونیورسٹی میں مشین انٹیلیجنس اینڈ انڈرسٹینڈنگ لیبارٹری (Machine Intelligence and Understanding Laboratory) (MiuLab) نے تیار کی ہے، جس میں مختلف تنظیموں کی جانب سے فنڈنگ کی گئی تھی، کو 500 بلین ٹوکنز پر تربیت دی گئی تھی۔ اس نے 39 جائزوں میں جی پی ٹی-4او سمیت حریفوں کو پیچھے چھوڑ دیا، اور یونیورسٹی کے داخلے، بار، اور روایتی چینی طب کے امتحانات میں زیادہ اسکور حاصل کیے۔
ٹیم کے مقاصد میں سے ایک مقامی ثقافت کو فروغ دینا ہے۔ مقامی لسانی صلاحیتوں کو کھولنا ایک اہم قدم ہے۔ کو نے وسپر (Whisper) پر مبنی تائیوانی آواز والے ایل ایل ایم کی ترقی کا ذکر کیا، جس نے زبانی تائیوانی کو سمجھنے میں مثبت نتائج حاصل کیے ہیں۔ ہکا (Hakka) زبان کی شناخت تیار کرنے کی کوششیں جاری ہیں۔
ان کوششوں کو ان علاقوں میں اداروں کی جانب سے سراہا گیا ہے جہاں یہ زبانیں عام ہیں۔ مقامی زبان کی شناخت میں ماڈل کو تربیت دینے کی بھی کوششیں کی جا رہی ہیں، لیکن محدود ڈیٹا ایک رکاوٹ ہے۔ اے آئی کو ایک نئی زبان سیکھنے کی تربیت دینے کے لیے آواز کی ریکارڈنگ کی ایک اہم مقدار کو متن کے ساتھ جوڑنا ضروری ہے۔
حکومتی آرکائیوز میں تاریخی ڈیٹا تک رسائی ایک اور موقع فراہم کرتی ہے۔ تاہم، کچھ ڈیٹا کاپی رائٹ کے ذریعے محفوظ ہے۔ مصنوعی عمومی ذہانت (artificial general intelligence) کا ظہور خطرے سے دوچار اور معدوم شدہ زبانوں کی بحالی میں مدد کرنے کی صلاحیت پیش کرتا ہے۔
اے آئی خودمختاری کی تلاش
زبان اور ثقافت کا اشتراک اے آئی خودمختاری کی اہمیت کو تائیوانی شناخت کو مضبوط کرنے، تائیوان کے بیانیے کو ابلاغ کرنے اور اس کے معلوماتی ماحول کے تحفظ کے ایک ذریعہ کے طور پر اجاگر کرتا ہے۔
جولیان چو (Julian Chu)، جو انڈسٹری کے مشیر اور مارکیٹ انٹیلیجنس اینڈ کنسلٹنگ انسٹی ٹیوٹ (Market Intelligence & Consulting Institute) (MIC) میں ڈائریکٹر ہیں، ایل ایل ایم ماڈلز اور تربیتی ڈیٹا میں تعصب کے امکان پر زور دیتے ہیں۔ وہ نوٹ کرتے ہیں کہ یہاں تک کہ روایتی حروف کا استعمال کرتے ہوئے بھی، ایل ایل ایم کے نتائج عوامی جمہوریہ چین کے انداز کی عکاسی کر سکتے ہیں اور تائیوان کی ثقافت کو پکڑنے میں ناکام رہتے ہیں۔ مقصد یہ ہے کہ تائیوانی کمپنیاں تائیوانی زبان یا ڈیٹا کا استعمال ایل ایل ایم کو تربیت دینے اور اے آئی خودمختاری بنانے کے لیے کریں۔
چو نے فارموسا فاؤنڈیشن ماڈل (Formosa Foundation Model) (FFM-Llama2) کا بھی ذکر کیا جو ایک اور امید افزا تائیوان ایل ایل ایم ہے۔ ستمبر 2023 میں تائیوان ویب سروس نے جاری کیا، اس کا مقصد اے آئی کو جمہوری بنانا تھا۔ فاکس کون (Foxconn) نے مارچ میں اپنا ایل ایل ایم، فاکس برین (FoxBrain) بھی لانچ کیا۔ تاہم، کچھ مبصرین بڑے کارپوریشنز کے ایل ایل ایم میں وینچرز کے بارے میں شکوک و شبہات کا شکار ہیں۔
لین ین ٹنگ (Lin Yen-ting)، جو میولاب ٹیم کے رکن ہیں جس نے ٹیم تیار کی، تائیوان کے حوالے سے معلوماتی ماحول میں موجود خلا کو دور کرنے کی ضرورت پر زور دیتے ہیں۔ وہ نوٹ کرتے ہیں کہ ڈیپ سیک-آر 1 اور دیگر چینی ایل ایل ایم تائیوان کا مسخ شدہ نظریہ پیش کرتے ہیں۔ امریکہ میں تیار کردہ ماڈلز بھی بعض اوقات تائیوان کی غلط نمائندگی کر سکتے ہیں۔ اوپن سورس ماڈلز تائیوان کو ترجیح نہیں دے سکتے ہیں، اور تربیتی ڈیٹا پر چین کا غلبہ ہے۔
اس لیے، تائیوانی مواد کو منتخب طور پر شامل کرنا اور اسے ماڈل میں دوبارہ تربیت دینا ضروری ہے۔ یہ فعال نقطہ نظر اس بات کو یقینی بناتا ہے کہ تائیوان کے منفرد ثقافتی اور لسانی منظرنامے کی ڈیجیٹل دائرے میں درست نمائندگی کی جائے، قومی شناخت کے احساس کو فروغ دیا جائے اور عالمی اے آئی کی ترقی کے پیش نظر اس کی الگ وراثت کو محفوظ رکھا جائے۔ تائیوانی شناخت کو محفوظ رکھنے کے لیے یہ لگن اس بات کو یقینی بناتا ہے کہ جزیرے کی قوم کی منفرد ثقافت اور اقدار غالب بیانیوں سے مغلوب نہ ہوں۔
اس کوشش میں شامل چیلنجز کافی ہیں۔ واقعی نمائندہ اے آئی ماڈل کی تعمیر کے لیے وسائل کی ایک اہم سرمایہ کاری کی ضرورت ہوتی ہے، بشمول مقامی مواد کے وسیع ڈیٹا سیٹس تک رسائی اور قدرتی لسانی پروسیسنگ میں مہارت۔ مزید برآں، غلط معلومات اور متعصبانہ معلومات کا مقابلہ کرنے کی جاری ضرورت کو مسلسل تطہیر اور موافقت کے عمل کی ضرورت ہے۔
ان چیلنجوں کے باوجود، تائیوان کی اے آئی خودمختاری سے وابستگی ثابت قدم ہے۔ ٹیم اور دیگر مقامی ایل ایل ایم کی ترقی اس بات کو یقینی بنانے کی جانب ایک اہم قدم کی نمائندگی کرتی ہے کہ مصنوعی ذہانت کا مستقبل جزیرے کی منفرد ثقافتی شناخت، جمہوری اقدار اور دنیا میں اپنی الگ جگہ کو محفوظ رکھنے کے غیر متزلزل عزم کی عکاسی کرے۔ اے آئی خودمختاری کو ترجیح دے کر، تائیوان نہ صرف اپنی ثقافتی وراثت کی حفاظت کر رہا ہے بلکہ خود کو عالمی اے آئی منظرنامے میں ایک اہم کھلاڑی کے طور پر بھی پیش کر رہا ہے، یہ ظاہر کرتا ہے کہ تکنیکی ترقی کو ثقافتی شناخت اور جمہوری اصولوں کے تحفظ کے ساتھ ہم آہنگ کیا جا سکتا ہے۔
سفر جاری رکھنا
مکمل اے آئی خودمختاری کی جانب سفر جاری ہے۔ مزید تحقیق، ترقی اور تعاون چیلنجوں پر قابو پانے اور ان اقدامات کی طویل مدتی کامیابی کو یقینی بنانے کے لیے بہت ضروری ہے۔ اے آئی خودمختاری کو ترجیح دینا جاری رکھ کر، تائیوان ایک ایسا ڈیجیٹل منظر نامہ تخلیق کر سکتا ہے جو واقعی اس کی منفرد ثقافتی شناخت اور جمہوری اقدار کی عکاسی کرے، جو دیگر ممالک کے لیے ایک مثال قائم کرے جو تیزی سے باہم مربوط دنیا میں اپنی الگ جگہ کو برقرار رکھنے کی کوشش کر رہے ہیں۔