مصنوعی ذہانت (AI) کی ترقی کے بلند داؤ والے میدان میں، جدید ترین سیمی کنڈکٹر ٹیکنالوجی تک رسائی اکثر جدت طرازی کی رفتار کا تعین کرتی ہے۔ چینی ٹیکنالوجی کمپنیوں کے لیے، یہ رسائی جغرافیائی سیاسی تناؤ اور ریاستہائے متحدہ امریکہ (United States) کی طرف سے عائد کردہ سخت برآمدی کنٹرولز کی وجہ سے تیزی سے پیچیدہ ہو گئی ہے۔ اس مشکل منظر نامے کے درمیان، Ant Group، جو Alibaba سے وابستہ فنٹیک پاور ہاؤس ہے، ایک منفرد راستہ بنا رہا ہے۔ کمپنی حکمت عملی کے تحت امریکی اور گھریلو سپلائرز دونوں سے حاصل کردہ سیمی کنڈکٹرز کا ایک متضاد مرکب (heterogeneous mix) تعینات کر رہی ہے تاکہ اپنی AI کی امنگوں کو تقویت دی جا سکے، خاص طور پر جدید AI ماڈلز کی تربیت کی کارکردگی اور لاگت کی تاثیر کو بڑھانے پر توجہ مرکوز کرتے ہوئے۔
یہ سوچا سمجھا نقطہ نظر صرف ایک تکنیکی حل سے زیادہ ہے؛ یہ ایک بنیادی حکمت عملی کی موافقت کی نمائندگی کرتا ہے۔ جان بوجھ کر مختلف مینوفیکچررز کی چپس، بشمول گھریلو متبادل، کو مربوط کر کے، Ant Group کا مقصد سپلائی چین میں رکاوٹوں سے وابستہ خطرات کو کم کرنا اور کسی ایک وینڈر پر انحصار کم کرنا ہے، خاص طور پر ان پر جو بین الاقوامی تجارتی پابندیوں کے تابع ہیں۔ یہ تنوع اس کی AI تحقیق اور ترقیاتی پائپ لائن کے تسلسل اور لچک کو یقینی بنانے کے لیے اہم ہے۔ بنیادی مقصد دوہرا ہے: AI جدت طرازی میں رفتار برقرار رکھنا جبکہ بیک وقت بڑے پیمانے پر ماڈلز کی تربیت سے وابستہ خاطر خواہ اخراجات کو بہتر بنانا۔
مہارت کی طاقت: Mixture of Experts (MoE) کو اپنانا
Ant Group کی ہارڈویئر حکمت عملی کا مرکز اس کا ایک جدید AI آرکیٹیکچر کو اپنانا ہے جسے Mixture of Experts (MoE) کہا جاتا ہے۔ یہ تکنیک روایتی یک سنگی (monolithic) AI ماڈلز سے ایک اہم انحراف کی نمائندگی کرتی ہے، جہاں ایک واحد، بڑا نیورل نیٹ ورک کسی دیے گئے کام کے تمام پہلوؤں کو سیکھنے اور سنبھالنے کی کوشش کرتا ہے۔ MoE نقطہ نظر، اس کے برعکس، ایک زیادہ تقسیم شدہ اور خصوصی ڈھانچہ استعمال کرتا ہے۔ یہ ایک واحد ماہرِ عمومی (generalist) کے بجائے ماہرین کی کمیٹی کی طرح کام کرتا ہے۔
ایک پیچیدہ مسئلے کا تصور کریں جس کے لیے متنوع علم کی ضرورت ہو۔ ایک ہمہ دان پر انحصار کرنے کے بجائے، آپ ایک ٹیم جمع کرتے ہیں: ایک ریاضی دان، ایک ماہر لسانیات، ایک مورخ، اور شاید ایک ماہر طبیعیات۔ ایک ‘گیٹنگ نیٹ ورک’ (‘gating network’) ایک ڈسپیچر کے طور پر کام کرتا ہے، آنے والے کاموں یا ڈیٹا پوائنٹس کا تجزیہ کرتا ہے اور ذہانت سے انہیں بڑے نظام کے اندر سب سے موزوں ‘ماہر’ (‘expert’) ماڈل تک پہنچاتا ہے۔ ہر ماہر ماڈل کو مخصوص قسم کے ان پٹس یا ذیلی کاموں میں مہارت حاصل کرنے کے لیے تربیت دی جاتی ہے۔ مثال کے طور پر، ایک لینگویج ماڈل میں، ایک ماہر تکنیکی اصطلاحات کو سمجھنے میں مہارت حاصل کر سکتا ہے، دوسرا تخلیقی تحریری انداز میں، اور تیسرا بات چیت کے مکالمے میں۔
اس ماڈیولر ڈیزائن کا کلیدی فائدہ اس کی کمپیوٹیشنل کارکردگی میں مضمر ہے۔ تربیت یا اندازہ لگانے (inference) کے دوران (جب ماڈل پیشین گوئیاں کرتا ہے)، کسی دیے گئے ان پٹ کے لیے صرف متعلقہ ماہر ماڈلز اور گیٹنگ نیٹ ورک کو فعال کیا جاتا ہے۔ یہ منتخب کمپیوٹیشن گھنے ماڈلز (dense models) سے بالکل مختلف ہے جہاں پورے نیٹ ورک کو، اس کے اربوں یا کھربوں پیرامیٹرز کے ساتھ، ہر ایک حساب کے لیے مشغول ہونا پڑتا ہے۔ نتیجتاً، MoE ماڈلز اپنے گھنے ہم منصبوں کے مقابلے میں موازنہ یا اس سے بھی بہتر کارکردگی حاصل کر سکتے ہیں جبکہ نمایاں طور پر کم کمپیوٹیشنل طاقت اور اس وجہ سے کم توانائی کی ضرورت ہوتی ہے۔
Ant Group نے اس آرکیٹیکچرل فائدے کو مؤثر طریقے سے استعمال کیا ہے۔ اندرونی تحقیق اور عملی اطلاق نے ظاہر کیا ہے کہ MoE کمپنی کو کم طاقتور، زیادہ آسانی سے دستیاب، یا کم لاگت والے ہارڈویئر کا استعمال کرتے ہوئے بھی مضبوط تربیتی نتائج حاصل کرنے کی اجازت دیتا ہے۔ کمپنی کی طرف سے شیئر کردہ نتائج کے مطابق، MoE کے اس حکمت عملی پر مبنی نفاذ نے اس کے AI ماڈلز کی تربیت سے وابستہ کمپیوٹنگ لاگت میں قابل ذکر 20% کمی کو ممکن بنایا ہے۔ یہ لاگت کی اصلاح محض ایک اضافی بچت نہیں ہے؛ یہ ایک حکمت عملی کو ممکن بنانے والا عنصر ہے، جو Ant کو مہنگے ترین، اعلیٰ درجے کے گرافکس پروسیسنگ یونٹس (GPUs) پر مکمل انحصار کیے بغیر مہتواکانکشی AI منصوبوں کو آگے بڑھانے کی اجازت دیتا ہے جنہیں چینی فرموں کے لیے حاصل کرنا تیزی سے مشکل ہوتا جا رہا ہے۔ یہ کارکردگی کا فائدہ براہ راست بیرونی ماحول کی طرف سے عائد کردہ ہارڈویئر کی رکاوٹوں کو دور کرتا ہے۔
سلیکون کا ایک تانا بانا: Ant کا ہارڈویئر پورٹ فولیو
Ant Group کی حکمت عملی کے عملی نفاذ میں ایک پیچیدہ سیمی کنڈکٹر منظر نامے پر تشریف لانا شامل ہے۔ کمپنی کا AI تربیتی انفراسٹرکچر مبینہ طور پر چپس کی ایک متنوع صف سے چلتا ہے، جو لچک اور مضبوطی کے لیے اس کے عزم کی عکاسی کرتا ہے۔ اس میں اس کے الحاق شدہ ادارے، Alibaba کی طرف سے اندرون ملک ڈیزائن کردہ سلیکون شامل ہے، جو ممکنہ طور پر Alibaba کی T-Head سیمی کنڈکٹر یونٹ کی طرف سے تیار کردہ چپس کا حوالہ دیتا ہے۔ مزید برآں، Ant Huawei کی چپس کو شامل کرتا ہے، جو ایک اور چینی ٹیکنالوجی دیو ہے جس نے امریکی پابندیوں کے جواب میں اپنے AI ایکسلریٹرز (جیسے Ascend سیریز) تیار کرنے میں بھاری سرمایہ کاری کی ہے۔
جبکہ Ant Group نے تاریخی طور پر Nvidia سے اعلیٰ کارکردگی والے GPUs کا استعمال کیا ہے، جو AI تربیتی مارکیٹ میں غیر متنازعہ رہنما ہے، ترقی پذیر امریکی برآمدی کنٹرولز نے تبدیلی کی ضرورت پیدا کر دی ہے۔ یہ ضوابط خاص طور پر قومی سلامتی کے خدشات کا حوالہ دیتے ہوئے، چینی اداروں کو جدید ترین AI ایکسلریٹرز کی فروخت کو محدود کرتے ہیں۔ اگرچہ Nvidia اب بھی چینی مارکیٹ کو کم تفصیلات والی چپس فراہم کر سکتا ہے، Ant Group بظاہر اعلیٰ درجے کی Nvidia مصنوعات تک محدود رسائی کی تلافی کے لیے اپنے سپلائر بیس کو فعال طور پر وسیع کر رہا ہے۔
اس تنوع میں Advanced Micro Devices (AMD) کی چپس نمایاں طور پر شامل ہیں۔ AMD اعلیٰ کارکردگی والے کمپیوٹنگ اور AI کی جگہ میں Nvidia کے ایک اہم مدمقابل کے طور پر ابھرا ہے، جو طاقتور GPUs پیش کرتا ہے جو بعض کام کے بوجھ کے لیے ایک قابل عمل متبادل پیش کرتے ہیں۔ Alibaba اور Huawei سے گھریلو آپشنز کے ساتھ AMD ہارڈویئر کو شامل کر کے، Ant ایک متضاد کمپیوٹنگ ماحول (heterogeneous computing environment) تعمیر کرتا ہے۔ یہ مکس اینڈ میچ اپروچ، اگرچہ ممکنہ طور پر سافٹ ویئر آپٹیمائزیشن اور ورک لوڈ مینجمنٹ میں پیچیدگی کا اضافہ کرتا ہے، اہم لچک فراہم کرتا ہے۔ یہ کمپنی کو دستیابی، لاگت، اور مختلف AI ماڈلز اور کاموں کے مخصوص کمپیوٹیشنل مطالبات کی بنیاد پر اپنے ہارڈویئر کے استعمال کو تیار کرنے کی اجازت دیتا ہے، اس طرح ایک واحد، محدود ذریعہ پر انحصار کی وجہ سے پیدا ہونے والی رکاوٹوں کو دور کرتا ہے۔
اس حکمت عملی کا پس منظر امریکی برآمدی کنٹرولز کا پیچیدہ جال ہے۔ ان اقدامات کو بتدریج سخت کیا گیا ہے، جس کا مقصد جدید سیمی کنڈکٹر مینوفیکچرنگ اور AI کی ترقی میں چین کی پیش رفت کو روکنا ہے۔ اگرچہ ابتدائی طور پر بالکل اعلیٰ درجے کی چپس پر توجہ مرکوز کی گئی تھی، پابندیاں تیار ہوئی ہیں، جس سے ہارڈویئر اور سیمی کنڈکٹر مینوفیکچرنگ آلات کی ایک وسیع رینج متاثر ہوئی ہے۔ مثال کے طور پر، Nvidia کو ان ضوابط کی تعمیل کے لیے چینی مارکیٹ کے لیے اپنی فلیگ شپ AI چپس (جیسے A800 اور H800، جو A100 اور H100 سے ماخوذ ہیں) کے مخصوص، کم کارکردگی والے ورژن بنانے پڑے ہیں۔ AMD اور گھریلو کھلاڑیوں سے متبادل اپنانے کی Ant کی حکمت عملی اس ریگولیٹری دباؤ کا براہ راست، عملی جواب ہے، جو دی گئی رکاوٹوں کے اندر AI مسابقت کو برقرار رکھنے کی کوشش کو ظاہر کرتی ہے۔
عمل میں AI: صحت کی خدمات کو تبدیل کرنا
Ant Group کی AI کارکردگی میں پیشرفت محض نظریاتی مشقیں نہیں ہیں؛ انہیں فعال طور پر حقیقی دنیا کی ایپلی کیشنز میں تبدیل کیا جا رہا ہے، جس میں صحت کی دیکھ بھال کے شعبے پر قابل ذکر توجہ دی گئی ہے۔ کمپنی نے حال ہی میں صحت کی دیکھ بھال کے لیے تیار کردہ اپنے AI حلوں میں اہم اضافہ کا اعلان کیا، جو اس کی بنیادی ٹیکنالوجی حکمت عملی کے عملی اثرات کو اجاگر کرتا ہے۔
یہ اپ گریڈ شدہ AI صلاحیتیں مبینہ طور پر پہلے ہی کئی بڑے چینی شہروں، بشمول Beijing، Shanghai، Hangzhou (Ant کا ہیڈکوارٹر)، اور Ningbo میں کئی نمایاں صحت کی دیکھ بھال کے اداروں میں استعمال ہو رہی ہیں۔ سات بڑے ہسپتال اور صحت کی دیکھ بھال کی تنظیمیں Ant کے AI کا استعمال اپنے آپریشنز اور مریضوں کی دیکھ بھال کے مختلف پہلوؤں کو بہتر بنانے کے لیے کر رہی ہیں۔
Ant کے ہیلتھ کیئر AI ماڈل کی بنیاد خود باہمی تعاون پر مبنی جدت طرازی اور متنوع تکنیکی طاقتوں سے فائدہ اٹھانے کی ایک مثال ہے۔ یہ طاقتور بڑے لینگویج ماڈلز (LLMs) کے امتزاج پر بنایا گیا ہے:
- DeepSeek کے R1 اور V3 ماڈلز: DeepSeek ایک قابل ذکر چینی AI ریسرچ فرم ہے جو قابل اوپن سورس ماڈلز تیار کرنے کے لیے جانی جاتی ہے، جو اکثر مضبوط کارکردگی کے بینچ مارکس حاصل کرتی ہے۔
- Alibaba کا Qwen: یہ Ant کے الحاق شدہ ادارے، Alibaba کی طرف سے تیار کردہ ملکیتی بڑے لینگویج ماڈلز کا خاندان ہے، جو سائز اور صلاحیتوں کی ایک رینج کا احاطہ کرتا ہے۔
- Ant کا اپنا BaiLing ماڈل: یہ Ant Group کی اپنی مخصوص ضروریات کے مطابق تیار کردہ AI ماڈلز تیار کرنے میں اندرونی کوششوں کی نشاندہی کرتا ہے، جس میں ممکنہ طور پر مالیاتی اور ممکنہ طور پر صحت کی دیکھ بھال سے متعلق مخصوص ڈیٹا اور مہارت شامل ہے۔
یہ کثیر ماڈل بنیاد صحت کی دیکھ بھال کے AI حل کو علم اور صلاحیتوں کی ایک وسیع بنیاد سے فائدہ اٹھانے کی اجازت دیتی ہے۔ Ant Group کے مطابق، یہ نظام طبی موضوعات کی ایک وسیع صف پر سوالات کو حل کرنے میں ماہر ہے، جو ممکنہ طور پر فوری معلومات کے خواہاں صحت کی دیکھ بھال کے پیشہ ور افراد اور عام طبی علم کی تلاش میں مریضوں دونوں کے لیے ایک قیمتی ٹول کے طور پر کام کر سکتا ہے (حالانکہ پیشہ ورانہ طبی مشورے کے مقابلے میں اس کے کردار کی محتاط حد بندی اہم ہے)۔
معلومات کی بازیافت سے آگے، کمپنی کا کہنا ہے کہ AI ماڈل مریضوں کی خدمات کو بڑھانے کے لیے ڈیزائن کیا گیا ہے۔ اگرچہ مخصوص تفصیلات سامنے آ رہی ہیں، اس میں ایپلی کیشنز کی ایک رینج شامل ہو سکتی ہے، جیسے:
- ذہین ٹرائیج (Intelligent Triage): بیان کردہ علامات کی بنیاد پر مریض کی ضروریات کو ترجیح دینے میں مدد کرنا۔
- اپوائنٹمنٹ شیڈولنگ اور مینجمنٹ: بکنگ کے عمل کو خودکار اور بہتر بنانا۔
- ڈسچارج کے بعد فالو اپ: خودکار یاد دہانیاں فراہم کرنا یا مریضوں کی صحت یابی کی پیشرفت کی جانچ کرنا۔
- انتظامی معاونت: صحت کی دیکھ بھال کے عملے کو دستاویزات، خلاصہ سازی، یا ڈیٹا انٹری کے کاموں میں مدد کرنا، براہ راست مریضوں کی دیکھ بھال کے لیے وقت خالی کرنا۔
بڑے ہسپتالوں میں تعیناتی ٹیکنالوجی کی افادیت کی توثیق کرنے اور صحت کی دیکھ بھال کے ڈومین کی پیچیدگیوں پر تشریف لانے میں ایک اہم قدم کی نشاندہی کرتی ہے، جس میں درستگی، وشوسنییتا، اور ڈیٹا کی رازداری کے لیے سخت تقاضے شامل ہیں۔
پریمیم GPUs سے آگے ایک راستہ بنانا
آگے دیکھتے ہوئے، Ant Group کی حکمت عملی چینی ٹیک انڈسٹری کے اندر ایک وسیع تر عزائم کے ساتھ ہم آہنگ نظر آتی ہے: جدید ترین، اکثر محدود، GPUs پر مکمل انحصار کیے بغیر جدید ترین AI کارکردگی حاصل کرنا۔ کمپنی مبینہ طور پر DeepSeek جیسی تنظیموں کے ذریعے اختیار کردہ راستے کی تقلید کرنے کا ارادہ رکھتی ہے، جس میں ‘پریمیم GPUs کے بغیر’ اعلیٰ کارکردگی والے AI ماڈلز کو پیمانہ کرنے کے طریقوں پر توجہ مرکوز کی گئی ہے۔
یہ عزائم اس یقین کا اشارہ دیتا ہے کہ آرکیٹیکچرل اختراعات (جیسے MoE)، سافٹ ویئر آپٹیمائزیشنز، اور متنوع، ممکنہ طور پر کم طاقتور ہارڈویئر کا ہوشیار استعمال اجتماعی طور پر اعلیٰ درجے کے سلیکون تک محدود رسائی سے پیدا ہونے والے کارکردگی کے فرق کو ختم کر سکتا ہے۔ یہ ایک حکمت عملی ہے جو جزوی طور پر برآمدی کنٹرولز کی وجہ سے ضرورت سے پیدا ہوئی ہے، لیکن یہ زیادہ لاگت مؤثر اور جمہوری AI ترقی کی طرف ایک ممکنہ طور پر پائیدار راستے کی بھی عکاسی کرتی ہے۔
اس مقصد کو حاصل کرنے میں صرف MoE سے آگے مختلف راستے تلاش کرنا شامل ہے:
- الگورتھمک کارکردگی: نئے AI الگورتھم تیار کرنا جنہیں تربیت اور اندازہ لگانے کے لیے کم کمپیوٹیشنل طاقت کی ضرورت ہوتی ہے۔
- ماڈل آپٹیمائزیشن تکنیک: کوانٹائزیشن (quantization) (حسابات میں استعمال ہونے والے نمبروں کی درستگی کو کم کرنا) اور پروننگ (pruning) (نیورل نیٹ ورک کے بے کار حصوں کو ہٹانا) جیسے طریقوں کو استعمال کرنا تاکہ ماڈلز کو کارکردگی میں نمایاں کمی کے بغیر چھوٹا اور تیز بنایا جا سکے۔
- سافٹ ویئر فریم ورکس: جدید سافٹ ویئر بنانا جو متضاد ہارڈویئر ماحول میں AI ورک لوڈز کو مؤثر طریقے سے منظم اور تقسیم کر سکے، دستیاب کمپیوٹنگ وسائل کے استعمال کو زیادہ سے زیادہ بنا سکے۔
- خصوصی گھریلو ہارڈویئر: چینی کمپنیوں جیسے Huawei (Ascend)، Alibaba (T-Head)، اور ممکنہ طور پر دیگر کی طرف سے تیار کردہ AI ایکسلریٹرز میں مسلسل سرمایہ کاری اور استعمال، جو خاص طور پر AI کاموں کے لیے ڈیزائن کیے گئے ہیں۔
Ant Group کا اس راستے پر چلنا، چین کے ٹیک ایکو سسٹم میں دوسروں کے ساتھ، اہم مضمرات کا حامل ہو سکتا ہے۔ اگر کامیاب ہو جاتا ہے، تو یہ ظاہر کر سکتا ہے کہ AI میں قیادت صرف تیز ترین چپس تک رسائی پر منحصر نہیں ہے، بلکہ سافٹ ویئر، آرکیٹیکچر، اور سسٹم لیول آپٹیمائزیشن میں جدت طرازی پر بھی منحصر ہے۔ یہ ایک لچکدار اور خود کفیل AI صلاحیت کی تعمیر کے لیے ایک پرعزم کوشش کی نمائندگی کرتا ہے، جو حکمت عملی پر مبنی تنوع اور انتھک جدت طرازی کے ذریعے موجودہ عالمی ٹیکنالوجی کے منظر نامے کی پیچیدگیوں پر تشریف لے جاتا ہے۔ امریکی اور چینی سیمی کنڈکٹرز کا انضمام، MoE جیسی تکنیکوں کے ذریعے بہتر بنایا گیا اور صحت کی دیکھ بھال جیسے اہم شعبوں پر لاگو کیا گیا، دباؤ کے تحت AI کی پیشرفت کو برقرار رکھنے کے لیے ایک عملی اور موافق نقطہ نظر کو ظاہر کرتا ہے۔