بھارت کا AI منصوبہ: سَروَم AI کی قیادت

بھارت کا مصنوعی ذہانت کا بلند عزائم: سَروَم AI خود مختار LLM کی ترقی کی قیادت کرے گا۔

بھارت نے اپنی خود مختار مصنوعی ذہانت کی صلاحیتوں کو قائم کرنے کے لیے ایک تبدیلی آفریں سفر شروع کیا ہے۔ بنگلورو میں قائم ایک ابھرتی ہوئی اسٹارٹ اپ کمپنی سَروَم AI کو انڈیاAI مشن کے زیرِ اہتمام ملک کے پہلے خود مختار بڑے لسانی ماڈل (LLM) کی ترقی کی قیادت کرنے کا اہم کردار سونپا گیا ہے۔ یہ بلند عزائم پر مبنی اقدام تکنیکی خود انحصاری کو فروغ دینے اور اپنے شہریوں کے فائدے کے لیے AI کی طاقت کو بروئے کار لانے کے لیے بھارت کے عزم کو ظاہر کرتا ہے۔

دیسی AI کے لیے ایک وژن

اس اقدام کے مرکز میں ایک گہرا وژن پوشیدہ ہے: ایک ایسا AI ماڈل تخلیق کرنا جو نہ صرف دیسی ہو بلکہ اعلیٰ استدلال کی صلاحیتوں، جدید اسپیچ پروسیسنگ کی صلاحیتوں اور ہندوستانی زبانوں کی ایک متنوع صف میں روانی رکھتا ہو۔ یہ ماڈل ہندوستانی لسانی اور ثقافتی منظرنامے میں گہرا جڑا ہوگا، جو قوم کی منفرد شناخت اور ورثے کی عکاسی کرے گا۔

اس وژن کو حقیقت میں بدلنے کے لیے، سَروَم AI کو 4,086 NVIDIA H100 GPUs پر مشتمل کمپیوٹیشنل وسائل کا ایک زبردست ذخیرہ تک رسائی دی جائے گی، جو چھ ماہ کی مدت میں دستیاب ہوگا۔ یہ رسائی اسٹارٹ اپ کو LLM کو شروع سے بنانے، اور ہندوستانی تناظر کی مخصوص ضروریات اور خواہشات کے مطابق بنانے کے لیے بااختیار بنائے گی۔

تین مختلف قسمیں

اس خود مختار LLM کی ترقی میں تین مختلف قسمیں شامل ہوں گی، جن میں سے ہر ایک کو ایپلی کیشنز اور ضروریات کے ایک مخصوص سیٹ کو پورا کرنے کے لیے ڈیزائن کیا گیا ہے:

  • سَروَم-لارج: اس قسم کو پیچیدہ استدلال اور تخلیق کے کاموں میں بہترین کارکردگی کا مظاہرہ کرنے کے لیے تیار کیا جائے گا، جو اسے پیچیدہ مسائل سے نمٹنے اور نفیس مواد تیار کرنے کے قابل بنائے گا۔

  • سَروَم-اسمال: اس قسم کو ریئل ٹائم انٹرایکٹو ایپلی کیشنز کے لیے موزوں بنایا جائے گا، جو مختلف منظرناموں میں صارفین کے ساتھ تیز رفتار اور جوابی تعامل کو یقینی بنائے گا۔

  • سَروَم-ایج: اس قسم کو آن ڈیوائس آپریشنز کے لیے تیار کیا جائے گا، جو اسے کلاؤڈ سے مستقل رابطے کی ضرورت کے بغیر محدود وسائل والے آلات پر بغیر کسی رکاوٹ کے کام کرنے کی اجازت دے گا۔

ایک باہمی تعاون کے ساتھ، سَروَم AI، IIT مدراس کے ایک اقدام AI4Bharat کے ساتھ شراکت داری کرے گا تاکہ یہ یقینی بنایا جا سکے کہ ماڈلز ہندوستانی لسانی اور ثقافتی سیاق و سباق میں گہرائی سے پیوست ہیں۔ یہ تعاون قدرتی لسانی پروسیسنگ میں AI4Bharat کی مہارت اور ہندوستانی لسانی وسائل کے اس کے بھرپور ذخیرے سے فائدہ اٹھائے گا۔

سَروَم AI کا ثابت شدہ ٹریک ریکارڈ

سَروَم AI نے پہلے ہی ہندوستانی AI منظرنامے میں ایک صف اول کے کھلاڑی کے طور پر خود کو ممتاز کیا ہے، خاص طور پر کثیر لسانی AI کے دائرے میں۔ کمپنی کی جدت طرازی کے ٹریک ریکارڈ اور ہندوستانی تناظر کے منفرد چیلنجوں سے نمٹنے کے عزم نے اسے اس بلند عزائم پر مبنی منصوبے کی قیادت کرنے کے لیے ایک فطری انتخاب کے طور پر جگہ دی ہے۔

اکتوبر 2024 میں، سَروَم AI نے سَروَم-1 کی نقاب کشائی کی، جو ایک 2 ارب پیرامیٹر والا LLM ہے جسے خاص طور پر ہندوستانی زبانوں کے لیے ڈیزائن اور بہتر بنایا گیا ہے۔ یہ ماڈل انگریزی کے علاوہ بنگالی، گجراتی، ہندی، کنڑ، ملیالم، مراٹھی، اوڈیا، پنجابی، تامل اور تیلگو سمیت دس بڑی ہندوستانی زبانوں کے لیے معاونت کا حامل ہے۔

بہت سے موجودہ ماڈلز کے برعکس جو انڈیک اسکرپٹس پر کارروائی کرتے وقت ٹوکن کی نااہلی کے ساتھ جدوجہد کرتے ہیں، سَروَم-1 فی لفظ 1.4 سے 2.1 ٹوکن کی زرخیزی کی شرح حاصل کرتا ہے۔ یہ قابل ذکر کارنامہ پروسیسنگ کی کارکردگی کو نمایاں طور پر بڑھاتا ہے، جس سے ماڈل کو ہندوستانی زبانوں کو زیادہ رفتار اور درستگی کے ساتھ سنبھالنے کے قابل بنایا جاتا ہے۔

گھریلو تربیت اور انفراسٹرکچر

سَروَم-1 کی تربیت مکمل طور پر بھارت کے اندر کی گئی، جس میں NVIDIA H100 Tensor Core GPUs، Yotta کے ڈیٹا سینٹرز اور AI4Bharat کے لسانی وسائل کے ذریعے چلنے والے گھریلو AI انفراسٹرکچر کا فائدہ اٹھایا گیا۔ یہ مکمل طور پر گھریلو نقطہ نظر AI کی ترقی میں بھارت کی بڑھتی ہوئی صلاحیتوں اور ایک خود انحصار AI ایکو سسٹم کی تعمیر کے عزم کو ظاہر کرتا ہے۔

کارکردگی کے معیاروں نے ظاہر کیا ہے کہ سَروَم-1 نہ صرف Meta کے Llama 3.1 8B اور Google کے Gemma-2-9B جیسے بڑے ماڈلز سے میل کھاتا ہے بلکہ بعض صورتوں میں ان سے آگے بھی نکل جاتا ہے، خاص طور پر انڈیک زبانوں سے متعلق کاموں میں۔ یہ متاثر کن کارکردگی سَروَم AI کے نقطہ نظر کی تاثیر اور عالمی AI رہنماؤں کے ساتھ مقابلہ کرنے کی اس کی صلاحیت کو اجاگر کرتی ہے۔

انڈیک زبانوں میں TriviaQA بینچ مارک پر، سَروَم-1 نے 86.11 کی درستگی حاصل کی، جو Llama-3.1 8B کے 61.47 کے اسکور سے بہتر ہے۔ یہ اہم فرق ہندوستانی زبانوں میں معلومات کو سمجھنے اور پروسیس کرنے میں سَروَم-1 کی اعلیٰ صلاحیتوں کو ظاہر کرتا ہے۔

آگے کے چیلنجز

اگرچہ سَروَم AI نے سَروَم-1 کے ساتھ اپنی صلاحیتوں کا مظاہرہ کیا ہے، لیکن پہلے دیسی فاؤنڈیشن ماڈل کی تعمیر کا کام چیلنجوں سے خالی نہیں ہے۔ ان چیلنجوں پر قابو پانے کے لیے تخلیقی صلاحیتوں، ثابت قدمی اور ایک باہمی تعاون کے جذبے کی ضرورت ہوگی۔

انفراسٹرکچر کی توسیع

سب سے اہم رکاوٹوں میں سے ایک بڑے ماڈلز کی تربیت کے مطالبات کو پورا کرنے کے لیے انفراسٹرکچر کو وسعت دینا ہے۔ ان ماڈلز کی تربیت کے لیے طویل مدت تک بڑے پیمانے پر کمپیوٹیشنل طاقت تک رسائی درکار ہوتی ہے۔ اگرچہ حکومت کی جانب سے ہزاروں NVIDIA H100 GPUs کی فراہمی ایک اہم قدم ہے، لیکن اس طرح کے اعلیٰ درجے کے وسائل کا انتظام، اصلاح اور دیکھ بھال ایک پیچیدہ کام ہے۔

موثر وسائل کا انتظام اس بات کو یقینی بنانے کے لیے بہت ضروری ہوگا کہ تربیتی عمل موثر اور لاگت سے موثر ہو۔ اس میں GPUs کے استعمال کو بہتر بنانا، میموری کی الاٹمنٹ کا انتظام کرنا اور ممکنہ رکاوٹوں کو کم کرنے کے لیے حکمت عملیوں پر عمل درآمد کرنا شامل ہوگا۔

ڈیٹا کیوریٹنگ

ایک اور اہم چیلنج اعلیٰ معیار کے، متنوع ڈیٹا سیٹس کی کیوریٹنگ میں مضمر ہے۔ بھارت کا لسانی منظرنامہ ناقابل یقین حد تک پیچیدہ ہے، جس میں نہ صرف زبانوں کے درمیان اختلافات ہیں بلکہ بولیوں، ثقافتوں اور لکھنے کے انداز میں بھی اختلافات ہیں۔ ایک متوازن ڈیٹا سیٹ بنانا جو تعصبات کو متعارف کرائے بغیر اس تنوع کو صحیح معنوں میں گرفت میں لے، ضروری ہے لیکن انتہائی مشکل ہے۔

ڈیٹا سیٹ کو بھارت کے مختلف خطوں، برادریوں اور سماجی گروہوں کی نمائندگی کرنی چاہیے۔ یہ تعصبات سے بھی پاک ہونا چاہیے جو غیر منصفانہ یا امتیازی نتائج کا باعث بن سکتے ہیں۔ اس بات کو یقینی بنانے کے لیے ڈیٹا کے انتخاب اور تشریح پر پوری توجہ دی جانی چاہیے کہ یہ ان معیارات پر پورا اترتا ہے۔

لسانی باریکیاں

مزید برآں، ماڈلز کو ہندوستانی زبانوں کی لطیف باریکیوں، بشمول محاورے، استعارے اور ثقافتی حوالوں کو گرفت میں لینے کے قابل ہونا چاہیے۔ اس کے لیے اس ثقافتی سیاق و سباق کی گہری سمجھ کی ضرورت ہے جس میں ان زبانوں کا استعمال کیا جاتا ہے۔

AI4Bharat کے ساتھ سَروَم AI کا تعاون ان چیلنجوں سے نمٹنے میں مددگار ثابت ہوگا۔ ہندوستانی زبانوں میں AI4Bharat کی مہارت اور لسانی وسائل کے وسیع ذخیرے تک اس کی رسائی خود مختار LLM کی ترقی میں قیمتی مدد فراہم کرے گی۔

بھارت کے لیے مضمرات

ایک خود مختار LLM کی ترقی کے بھارت کے تکنیکی منظرنامے اور عالمی AI میدان میں اس کے کردار کے لیے گہرے مضمرات ہیں۔ اس اقدام میں تعلیم، صحت کی دیکھ بھال، مالیات اور حکمرانی سمیت مختلف شعبوں کو تبدیل کرنے کی صلاحیت موجود ہے۔

معاشی ترقی

جدت طرازی کو فروغ دے کر اور معاشی ترقی کو آگے بڑھا کر، خود مختار LLM ہندوستانی کاروباروں اور کاروباری افراد کے لیے نئے مواقع پیدا کر سکتا ہے۔ یہ مقامی زبانوں میں معلومات اور خدمات تک رسائی فراہم کرکے ڈیجیٹل تقسیم کو ختم کرنے میں بھی مدد کر سکتا ہے۔

بااختیار بنانا

مزید برآں، LLM شہریوں کو ذاتی نوعیت کی تعلیم، صحت کی دیکھ بھال اور دیگر ضروری خدمات تک رسائی فراہم کرکے بااختیار بنا سکتا ہے۔ یہ لسانی رکاوٹوں کو توڑ کر اور مختلف برادریوں کے درمیان رابطے کو فروغ دے کر سماجی شمولیت کو فروغ دینے میں بھی مدد کر سکتا ہے۔

اسٹریٹجک خود مختاری

بالآخر، ایک خود مختار LLM کی ترقی بھارت کے لیے ایک اسٹریٹجک ضرورت ہے۔ یہ قوم کو اپنی AI صلاحیتوں کو تیار کرنے، غیر ملکی ٹیکنالوجی پر اپنے انحصار کو کم کرنے اور اپنی ڈیجیٹل خود مختاری کو یقینی بنانے کے قابل بنائے گا۔

ایک باہمی تعاون پر مبنی ایکو سسٹم

اس بلند عزائم پر مبنی کوشش کی کامیابی ایک باہمی تعاون پر مبنی ایکو سسٹم کی تخلیق پر منحصر ہے جو حکومت، صنعت، اکیڈمی اور اسٹارٹ اپ کمیونٹی کو اکٹھا کرے۔ مل کر کام کرکے، یہ اسٹیک ہولڈرز اپنی اجتماعی مہارت اور وسائل سے فائدہ اٹھا کر بھارت میں AI کی ترقی کو آگے بڑھا سکتے ہیں۔

حکومت کی جانب سے سَروَم AI کے لیے تعاون اور کمپیوٹیشنل وسائل تک رسائی فراہم کرنے کا عزم اس ایکو سسٹم کے اہم محرک ہیں۔ صنعتی شراکت دار حقیقی دنیا کے ڈیٹا اور مہارت تک رسائی فراہم کر سکتے ہیں، جبکہ تعلیمی ادارے جدید ترین تحقیق اور ٹیلنٹ میں شراکت کر سکتے ہیں۔

AI سے چلنے والا مستقبل

جیسا کہ بھارت اس تبدیلی آفریں سفر پر گامزن ہے، قوم AI کی بے پناہ صلاحیت کو کھولنے اور جدت طرازی، شمولیت اور خود انحصاری سے چلنے والا مستقبل تخلیق کرنے کے لیے تیار ہے۔ ایک خود مختار LLM کی ترقی AI کے دور میں اپنی قسمت بنانے کے لیے بھارت کے عزائم اور اس کے غیر متزلزل عزم کا ثبوت ہے۔