شنگھائی گوکو ٹیکنالوجیز کی جانب سے نیا SASR ٹریننگ فریم ورک: کیا یہ ڈیپ سیک 2.0 کو مات دے سکتا ہے؟
شنگھائی میں قائم ایک کوانٹیٹیٹو ٹریڈنگ فنڈ مصنوعی ذہانت (AI) کے حلقوں میں ایک اہم مقام حاصل کر رہا ہے، جس کی وجہ ایک بین الاقوامی کانفرنس میں پیش کی جانے والی ایک اہم ترین ٹریننگ تکنیک ہے۔ اس جدت آمیز طریقہ کار کے بارے میں ایک ریسرچ پیپر نیورل انفارمیشن پروسیسنگ سسٹمز (NeurIPS) نامی کانفرنس میں پیش کیا گیا ہے۔ یہ طریقہ کار ڈیپ سیک اور اوپن اے آئی جیسی معروف ریسرچ تنظیموں کے زیر استعمال AI ٹریننگ کے مروجہ طریقوں کا مقابلہ کر سکتا ہے اور ممکنہ طور پر ان سے بہتر بھی ثابت ہو سکتا ہے۔ یہ قدم ڈیپ سیک کی اپنی پیشرفت کی عکاسی کرتا ہے، جس نے AI الگورتھم میں نمایاں پیش رفت کے باعث کافی توجہ حاصل کی ہے۔
گوکو کے SASR ٹریننگ فریم ورک کی تشریح
شنگھائی گوکو ٹیکنالوجیز، جس کی بنیاد 2015 میں رکھی گئی تھی، نے AI ٹریننگ کے لیے ایک نیا فریم ورک متعارف کرایا ہے، جسے SASR کا نام دیا گیا ہے، یعنی مرحلہ وار ایڈاپٹیو ہائبرڈ ٹریننگ۔ اس طریقہ کار کا مقصد مروجہ طریقوں جیسا کہ سپروائزڈ فائن ٹیوننگ (SFT) اور ری انفورسمنٹ لرننگ (RL) کی ظاہری خامیوں کو دور کرنا ہے۔ گوکو کا استدلال ہے کہ SASR، جو انسانوں کی استدلال کی مہارتوں کو فروغ دینے کے طریقے سے متاثر ہے، جدید AI ماڈلز کی تعمیر کے لیے ایک زیادہ ایڈاپٹیو اور موثر راستہ فراہم کرتا ہے۔
ایس ایف ٹی اور آرایل کو AI ٹریننگ کے عمل میں سنگ بنیاد سمجھا جاتا ہے، جنہیں اوپن اے آئی اور ڈیپ سیک جیسی صنعت کی بڑی کمپنیاں استعمال کرتی ہیں۔DeepSeek نے واضح طور پر ان تکنیکوں کے اہم کردار پر زور دیا ہے تاکہ اس کے V3 ماڈل کی کارکردگی کو بہتر بنایا جا سکے، جسے دسمبر میں جاری کیا گیا تھا اور اس نے ٹیکنالوجی کے شعبے میں کافی دلچسپی پیدا کی تھی۔
گوکو کے ریسرچ پیپر کے مطابق، جسے شنگھائی جیاؤ ٹونگ یونیورسٹی اور اس کی نئی قائم کردہ AI ذیلی کمپنی شنگھائی آل مائنڈ آرٹیفیشل انٹیلیجنس ٹیکنالوجی کے محققین کے ساتھ مل کر لکھا گیا ہے، SASR نے SFT، RL اور جامد ہائبرڈ ٹریننگ طریقہ کار کے مقابلے میں بہتر کارکردگی کا مظاہرہ کیا۔ گوکو ٹیم نے اپنے تحقیقی مقالے میں کہا کہ “تجرباتی نتائج ظاہر کرتے ہیں کہ SASR، ایس ایف ٹی، آر ایل اور جامد ہائبرڈ ٹریننگ طریقوں سے بہتر کارکردگی کا مظاہرہ کرتا ہے۔”
گوکو کی پیشرفت کے مضمرات
گوکو کی AI ٹریننگ میں کامیابی مبینہ طور پر AI کے میدان میں چین کی مسلسل ترقی کو اجاگر کرتی ہے۔ اس سے ممکنہ طور پر امریکی حکومت کی جانب سے عائد کردہ موجودہ پالیسیوں کی حدود بھی واضح ہوتی ہیں، جن کا مقصد ہارڈ ویئر کی پابندیوں کے ذریعے چین کی AI کی ترقی کو روکنا ہے۔ Nvidia کے سی ای او جینسن ہوانگ نے حال ہی میں ان پابندیوں کے غیر موثر ہونے پر تبصرہ کرتے ہوئے کہا کہ “دنیا کے 50 فیصد AI ڈویلپرز چین میں موجود ہیں۔”
ڈیپ سیک، ایک چینی AI اسٹارٹ اپ جو ہائی فلائیئر ہیج فنڈ سے نکلا ہے، نے جدید الگورتھم اور ہارڈ ویئر اور سافٹ ویئر کے انضمام کے ذریعے AI قیادت کے لیے چین کے امکانات کو ظاہر کرنے کے لیے وسیع پیمانے پر پہچان حاصل کی ہے۔
گوکو کی AI حکمت عملی میں AllMind کا کردار
آل مائنڈ کا قیام، گوکو کی تحقیق کی اشاعت کے ساتھ ہی، AI تحقیق اور ترقی کے لیے وسائل وقف کرنے کے لیے ایک اسٹریٹجک اقدام کی نشاندہی کرتا ہے۔ چینی کاروباری رجسٹری ریکارڈ سے پتہ چلتا ہے کہ آل مائنڈ کو باضابطہ طور پر اسی دن رجسٹر کیا گیا تھا جس دن گوکو نے اپنی تحقیق جاری کی تھی۔
گوکو کے بانی اور آل مائنڈ کے قانونی نمائندے وانگ شیاؤ نے کہا ہے کہ نئی اینٹیٹی کو AI کی نئی حدود دریافت کرنے کے لیے بنایا گیا ہے۔ یہ ہائی فلائیئر کے اختیار کیے گئے طریقہ کار کی عکاسی کرتا ہے، جس نے 2023 میں ڈیپ سیک کو ایک علیحدہ ادارے کے طور پر قائم کیا تھا۔
گزشتہ سال کے آخر تک، گوکو نے اپنے سرکاری ویب سائٹ پر دستیاب معلومات کے مطابق، AI سے چلنے والی حکمت عملیوں کا استعمال کرتے ہوئے، ملکی اور بین الاقوامی دونوں اثاثوں میں 15 بلین یوآن (تقریباً 2.1 بلین امریکی ڈالر) سے زیادہ کا انتظام کیا۔
SASR میں گہرائی سے جائزہ: ایک مرحلہ وار موافقت پذیر ہائبرڈ ٹریننگ فریم ورک
گوکو کا SASR فریم ورک AI ماڈل ٹریننگ کے منظر نامے میں ایک دلچسپ متبادل پیش کرتا ہے۔ اس کے ممکنہ اثرات کو صحیح معنوں میں سمجھنے کے لیے، اس کے اجزاء اور طریقہ کار کی مزید تفصیلی سمجھ ضروری ہے۔
SASR کا “مرحلہ وار” پہلو ایک کثیر الجہتی ٹریننگ کے عمل کی طرف اشارہ کرتا ہے جہاں AI ماڈل بار بار بہتری سے گزرتا ہے۔ ہر مرحلے میں ممکنہ طور پر مخصوص مقاصد شامل ہوتے ہیں اور ماڈل کے اندر مخصوص قابلیتوں کو پروان چڑھانے کے لیے واضح ٹریننگ ڈیٹا کا استعمال کیا جاتا ہے۔ یہ مرحلہ وار نقطہ نظر شروع سے ہی پیچیدہ ماڈلز کی ٹریننگ کے چیلنجوں کو کم کرنے اور ہر مرحلے پر موزوں اصلاح کی اجازت دینے جیسے فوائد فراہم کر سکتا ہے۔
“موافقت پذیر” عنصر بتاتا ہے کہ ٹریننگ کا عمل جامد نہیں ہے بلکہ ماڈل کی کارکردگی اور خصوصیات کے مطابق متحرک طور پر رد عمل ظاہر کرتا ہے۔ اس موافقت پذیری میں ہائپر پیرامیٹرز کو ایڈجسٹ کرنا، ٹریننگ ڈیٹا کی تقسیم میں ترمیم کرنا، یا مختلف تربیتی مقاصد کے تعاون کو متحرک طور پر وزن دینا شامل ہو سکتا ہے۔ ایک موافقت پذیر عمل AI کو زیادہ موثر طریقے سے سیکھنے اور بہتر بنانے کی اجازت دیتا ہے۔
SASR کی “ہائبرڈ” نوعیت سے پتہ چلتا ہے کہ یہ مختلف ٹریننگ طریقہ کار کے عناصر کو یکجا کرتا ہے۔ یہ ایک اہم پہلو ہے کیونکہ SFT اور RL میں طاقتیں اور کمزوریاں موجود ہیں۔ طریقوں کا ایک مرکب ماڈل کو ہر نقطہ نظر کے فوائد سے فائدہ اٹھانے کے قابل بناتا ہے جبکہ اس کی حدود کو دور کرتا ہے۔ ان تین خصوصیات کو ضم کرکے، SARS نظریاتی طور پر منطق اور استدلال کو فروغ دینے کے لیے بہتر ثابت ہوتا ہے۔
روایتی طریقوں کے ساتھ SASR کا موازنہ
سپروائزڈ فائن ٹیوننگ (SFT) روایتی طور پر بڑے، لیبل والے ڈیٹا سیٹ پر انحصار کرتی ہے جہاں AI ماڈل ان پٹ کو مطلوبہ آؤٹ پٹ میں میپ کرنا سیکھتا ہے۔ ری انفورسمنٹ لرننگ (RL) ایک مخصوص مقصد کو زیادہ سے زیادہ کرنے کے لیے اقدامات کو انعام یا جرمانہ دے کر آزمائش اور غلطی کے ذریعے ماڈل کو تربیت دینا شامل ہے۔
SASR دونوں کو مربوط کرنے کی کوشش کرتا ہے جبکہ ہر طریقہ کی حدود پر قابو پاتا ہے۔ مثال کے طور پر، ایس ایف ٹی لیبل والے ڈیٹا کے معیار اور جامعیت پر بہت زیادہ منحصر ہو سکتا ہے۔ بہت سے حقیقی دنیا کے منظرناموں میں، کافی، درست ڈیٹا حاصل کرنا وقت طلب اور مہنگا دونوں ہو سکتا ہے۔ اگرچہ آر ایل کو لیبل والے ڈیٹا کی ضرورت نہیں ہوتی، لیکن یہ غیر مستحکم اور انعام ہیکنگ کا شکار ہو سکتا ہے۔ انعام ہیکنگ اس وقت ہوتی ہے جب AI ماڈل اپنے انعام کو زیادہ سے زیادہ کرنے کے لیے غیر ارادی طریقے دریافت کرتا ہے، جس سے ممکنہ طور پر ناپسندیدہ رویہ پیدا ہوتا ہے۔
گوکو کے فریم ورک میں ایس ایف ٹی اور آر ایل کی حدود پر بہتری لانے کا امکان ہے۔ تاہم، کمپنی کے مقالے میں دستاویزی ابتدائی نتائج کی تصدیق کے لیے مزید اور مسلسل جانچ کی ضرورت ہے۔
الگورتھمک جدت طرازی اور ہارڈ ویئر کی رکاوٹیں
گوکو کے SASR فریم ورک کی خبریں خاص طور پر امریکہ اور چین کے درمیان تکنیکی تعلقات کے تناظر میں مناسب ہیں۔ کچھ عرصے سے، امریکی حکومت ایڈوانسڈ کمپیوٹنگ ہارڈ ویئر، خاص طور پر Nvidia جیسی کمپنیوں کے ہائی اینڈ GPUs تک رسائی کو محدود کر کے AI کے شعبے میں چین کے عروج کو روکنے کی کوشش کر رہی ہے۔ ان پابندیوں کے پیچھے خیال یہ ہے کہ چین کی طاقتور ہارڈ ویئر تک رسائی کو محدود کرنے سے ان کی AI ترقی کی کوششیں سست ہو جائیں گی۔
تاہم، Nvidia کے سی ای او جینسن ہوانگ کے تبصرے اور چینی AI لیبز سے نکلنے والی پیشرفتیں بتاتی ہیں کہ یہ پالیسیاں اتنی موثر نہیں ہو سکتیں جتنی کہ ان کا ارادہ تھا۔ ہوانگ نے مشہور طور پر نوٹ کیا ہے کہ چین کے پاس دنیا کے AI ڈویلپر ٹیلنٹ کا ایک اہم حصہ ہے، اور ہارڈ ویئر تک رسائی کو محدود کرنے سے انہیں متبادل حل تلاش کرنے کی ترغیب مل سکتی ہے۔
گوکو کا دعویٰ کردہ AI بریک تھرو بتاتا ہے کہ الگورتھمک جدت بالقوہ ہارڈ ویئر کی حدود کو کسی حد تک پورا کر سکتی ہے۔ اگر چینی محققین زیادہ موثر ٹریننگ الگورتھم تیار کر سکتے ہیں، تو وہ کم طاقتور ہارڈ ویئر کے ساتھ موازنہ AI کارکردگی حاصل کر سکتے ہیں۔ اس کے عالمی AI منظر نامے کے لیے اہم مضمرات ہو سکتے ہیں، کیونکہ یہ بتاتا ہے کہ چین جاری پابندیوں کے باوجود اپنی AI صلاحیتوں کو آگے بڑھانا جاری رکھ سکتا ہے۔
اس کا مطلب یہ نہیں ہے کہ ہارڈ ویئر غیر متعلق ہے۔ جدید ترین AI ماڈلز کی ٹریننگ کے لیے ایڈوانسڈ GPUs اب بھی بہت اہم ہیں، اور تازہ ترین ہارڈ ویئر تک رسائی بلاشبہ ایک اہم مسابقتی فائدہ فراہم کرتی ہے۔ تاہم، گوکو کا کام ہارڈ ویئر اور سافٹ ویئر دونوں میں سرمایہ کاری کی اہمیت کو ظاہر کرتا ہے، اور یہ کہ ایک شعبے میں ترقی ممکنہ طور پر دوسرے شعبے میں حدود کی تلافی کر سکتی ہے۔
چینی AI کا عروج: ڈیپ سیک سے ماورا
AI کے میدان میں ایک ممتاز کھلاڑی کے طور پر ڈیپ سیک کا ابھرنا ایک محرک رہا ہے، جو اس تبدیلی آمیز ٹیکنالوجی میں عالمی رہنما بننے کے لیے چین کے عزم کو ظاہر کرتا ہے۔ تاہم، ڈیپ سیک صرف ایک مثال ہے، اور SASR ٹریننگ فریم ورک کے ساتھ گوکو کا عروج، چینی AI ماحولیاتی نظام کے اندر بڑھتی ہوئی طاقت اور جدت طرازی کو مزید واضح کرتا ہے۔
اس رفتار میں کئی عوامل معاون ہیں۔ اول، چین کے پاس ڈیٹا کا ایک وسیع پول ہے، جو AI ماڈلز کی ٹریننگ کے لیے ضروری ہے۔ بڑی آبادی اور ڈیجیٹل ٹیکنالوجیز کے وسیع پیمANE پر اپنانے کے ساتھ، چینی کمپنیوں کو بڑے ڈیٹا سیٹس تک رسائی حاصل ہے جو ان کے AI الگورتھم تیار اور بہتر بنانے کے لیے استعمال کیے جا سکتے ہیں۔
دوم، چین STEM تعلیم پر ایک مضبوط زور دیتا ہے، جو باصلاحیت انجینئرز اور سائنسدانوں کی ایک بڑی تعداد پیدا کرتا ہے۔ اس نے AI اور متعلقہ شعبوں میں جدت کو آگے بڑھانے کے قابل ایک انتہائی ہنر مند افرادی قوت پیدا کی ہے۔
سوم، چینی حکومت نے AI کو ایک اسٹریٹجک ترجیح دی ہے، تحقیقی اور ترقی کے لیے اہم فنڈنگ اور مدد فراہم کی ہے۔ اس نے AI اسٹارٹ اپس کے لیے ایک زرخیز ماحول پیدا کیا ہے اور اکیڈمیا اور صنعت کے درمیان تعاون کو فروغ دیا ہے۔
آخر میں، چینی کمپنیاں اکثر جدت طرازی کے لیے زیادہ عملی اور خطرہ مول لینے کا طریقہ اختیار کرنے کے لیے تیار رہتی ہیں، جو انہیں تیزی سے آگے بڑھنے اور نئے خیالات کے ساتھ تجربہ کرنے کی اجازت دیتا ہے۔
ان عوامل کے نتیجے میں، چین AI صلاحیتوں کے لحاظ سے تیزی سے امریکہ تک پہنچ رہا ہے۔ اگرچہ امریکہ اب بھی بعض شعبوں میں برتری رکھتا ہے، جیسے کہ بنیادی تحقیق اور ہائی اینڈ ہارڈ ویئر، چین کمپیوٹر وژن، قدرتی زبان کی پروسیسنگ اور روبوٹکس جیسے شعبوں میں اہم پیشرفت کر رہا ہے۔
گوکو اور ڈیپ سیک جیسی کمپنیوں کا ابھرنا بتاتا ہے کہ چین آنے والے برسوں میں AI کے شعبے میں اپنے عروج کو جاری رکھنے کے لیے اچھی طرح سے پوزیشن میں ہے۔
شنگھائی گوکو ٹیکنالوجیز: جدت کے پیچھے کمپنی
شنگھائی گوکو ٹیکنالوجیز ایک کوانٹیٹیٹو ٹریڈنگ فنڈ ہے جس کی بنیاد 2015 میں رکھی گئی تھی۔ یہ AI سے چلنے والی حکمت عملیوں کا استعمال کرتے ہوئے اہم اثاثے کا انتظام کرتا ہے۔ کمپنی کا بیان کردہ مشن ہے کہ “ٹیکنالوجی اور بنیادی تجزیہ کو یکجا کیا جائے” تاکہ اس کے کلائنٹس کے لیے بہتر منافع حاصل کیا جا سکے۔ اثاثہ جات کے انتظام میں اپنے بنیادی کاروبار کے علاوہ، گوکو نے AI تحقیق کی حدود کو آگے بڑھانے کے لیے ایک عزم کا مظاہرہ کیا ہے۔ AllMindArtificial Intelligence Technology، AI ذیلی ادارہ، اس کی AI تحقیقی کوششوں کو باقاعدہ بنانے اور تیز کرنے کے لیے ایک اسٹریٹجک اقدام کی نمائندگی کرتا ہے۔
کمپنی کے داخلی ڈھانچے اور آپریشنل ڈائنامکس کے بارے میں تفصیلات نسبتاً کم ہیں۔ تاہم، اس کے عوامی بیانات اور حالیہ سرگرمیاں اس کے نقطہ نظر کے بارے میں بصیرت پیش کرتی ہیں۔ کمپنی کا سلوگن، جس کا ترجمہ “منطق اور سچائی وہ واحد اصول ہیں جن کی ہم اطاعت کرتے ہیں” ایک ڈیTA سے چلنے والی اور تجزیاتی ثقافت کی عکاسی کرتا ہے۔ AI تحقیق اور ترقی میں سرمایہ کاری ایک طویل المدت وژن اور AI کی تبدیلی کی صلاحیت سے آگاہی کی نشاندہی کرتی ہے، نہ صرف مالیاتی شعبے میں بلکہ مختلف صنعتوں میں بھی۔ امکان ہے کہ گوکو AI تحقیق سے حاصل ہونے والی بصیرت سے فائدہ اٹھا کر اپنی تجارتی حکمت عملیوں کو بہتر بنانے اور مارکیٹ میں مسابقتی برتری حاصل کرنے کا ارادہ رکھتا ہے۔