Meta کا Llama ماڈلز کے ساتھ AI ہتھیاروں میں اضافہ

Meta نے حال ہی میں اپنے Llama مصنوعی ذہانت (AI) ماڈل کے تازہ ترین ورژن کی نقاب کشائی کی ہے، جو کمپنی کی جانب سے AI کی جدت طرازی کے لیے جاری عزم میں ایک اہم پیش رفت کی نشاندہی کرتا ہے۔ نئی پیشکشوں میں Llama 4 Scout اور Llama 4 Maverick شامل ہیں، جنہیں Meta نے “ملٹی ماڈل ماڈلز” کا نام دیا ہے، جو محض متن سے ہٹ کر مختلف قسم کے میڈیا کے ساتھ تعامل اور پروسیسنگ کرنے کی صلاحیت کو اجاگر کرتے ہیں۔

اس کے علاوہ، Meta نے Llama 4 Behemoth کو چھیڑا ہے، جسے عالمی سطح پر سب سے زیادہ ذہین LLMs میں سے ایک کے طور پر پیش کیا گیا ہے اور اس کا مقصد نئے جاری کردہ ماڈلز کے لیے ایک استاد کے طور پر کام کرنا ہے۔

اس اعلان سے AI میں Meta کی جانب سے گزشتہ دو سالوں میں کی جانے والی خاطر خواہ سرمایہ کاری کی نشاندہی ہوتی ہے۔ CEO مارک زکربرگ نے عوامی طور پر اپنی یہ مرضی ظاہر کی ہے کہ وہ 2025 میں کمپنی کی AI صلاحیتوں کو مزید بڑھانے کے لیے 65 بلین ڈالر تک مختص کریں گے۔ Meta کی امنگیں اس کے سوشل میڈیا ڈومین سے بھی آگے بڑھ گئی ہیں، اور اس کی AI اسسٹنٹ، Meta AI کے لیے ممکنہ پریمیم سبسکرپشنز کی تلاش کی جا رہی ہے تاکہ بکنگ ریزرویشن اور ویڈیو تخلیق جیسے کاموں کو سنبھالا جا سکے۔

OpenAI کی اوپن سورس کوشش

متوازی پیش رفت میں، OpenAI مبینہ طور پر اپنے LLM کا ایک اوپن سورس ورژن جاری کرنے پر غور کر رہا ہے، جو اس کے حالیہ طریقوں سے انحراف ہے۔ اس اقدام سے صارفین کو لائسنسنگ فیس ادا کیے بغیر ماڈل کو استعمال کرنے، اس میں ترمیم کرنے اور تقسیم کرنے کی آزادی مل جائے گی۔ OpenAI ماڈل کی افادیت کو بہتر بنانے کے لیے ڈویلپرز، محققین اور عام عوام سے کمیونٹی ان پٹ حاصل کرنے کی کوشش کر رہا ہے۔

توقع کی جا رہی ہے کہ اوپن سورس ماڈل چند مہینوں میں لانچ ہو جائے گا۔ آخری بار OpenAI نے اوپن سورس اصولوں کو 2019 میں GPT-2 LLM کے ساتھ اپنایا تھا۔ اس کا سب سے حالیہ LLM GPT-4.5 ہے۔ Microsoft سے ایک بلین ڈالر کی سرمایہ کاری حاصل کرنے کے بعد OpenAI ملکیتی ماڈلز کی طرف منتقل ہو گیا، اور AI ماڈل کی ترقی کو آگے بڑھانے کے لیے ایک قریبی اتحاد قائم کیا۔ Microsoft نے اس کے بعد سے OpenAI میں 13 بلین ڈالر سے زیادہ کی سرمایہ کاری کی ہے، اور OpenAI کے ماڈلز Microsoft کی Azure کلاؤڈ سروسز کے صارفین کے لیے خصوصی ہیں۔

Meta کا Llama، Mistral کا LLM، اور DeepSeek کچھ اوپن سورس ماڈلز ہیں جو حال ہی میں مقبولیت حاصل کر رہے ہیں۔ زکربرگ نے تھریڈز پر ذکر کیا کہ Llama کو 1 بلین بار ڈاؤن لوڈ کیا گیا ہے۔ Llama کو 2023 میں لانچ کیا گیا تھا۔

Meta کے “Behemoth” AI ماڈل میں تاخیر

تاہم، Meta مبینہ طور پر “Behemoth” کی ریلیز میں تاخیر کر رہا ہے، جو اصل میں موسم گرما میں لانچ ہونے والا تھا، اور اب جلد از جلد ممکنہ ریلیز خزاں کے لیے متوقع ہے۔ ذرائع کا کہنا ہے کہ ماڈل کی پیش رفت جون میں ریلیز کو جائز قرار دینے کے لیے کافی “اہم” نہیں رہی ہے، اور یہ Meta کی ڈیولپر کانفرنس کے بعد سے تاخیر کی علامت ہے۔

اس تاخیر سے بڑے لسانی ماڈلز کے Llama فلیگ شپ فیملی کی Meta کی ریلیز پر سایہ پڑتا ہے۔ وال اسٹریٹ جرنل کا کہنا ہے کہ ان کی ریلیز کی رفتار کے لیے ان کی تعریف کی گئی ہے۔ Llama چھوٹے کمپنیوں، غیر منافع بخش تنظیموں اور تعلیمی اداروں کے اندر ڈویلپرز کو بااختیار بنانے میں اہم کردار ادا کر رہا ہے۔ یہ OpenAI، Google اور Amazon جیسی کمپنیوں کی جانب سے پیش کردہ بند، ملکیتی ماڈلز کا ایک متبادل ہے۔

Behemoth کی تاخیر کا بڑے کمپنیوں پر اثر کم نمایاں ہے، کیونکہ وہ اکثر کلاؤڈ پر مبنی ملکیتی ماڈلز پر انحصار کرتے ہیں۔ یہاں تک کہ اگر چھوٹی کمپنیاں اوپن سورس Llama ماڈلز کو اپنی مرضی کے مطابق بنا سکتی ہیں، تو انہیں اضافی تعیناتی خدمات کی ضرورت ہوتی ہے جو Meta پیش نہیں کرتا ہے۔ Llama کا Meta کا استعمال اس کے اپنے سوشل میڈیا ٹولز کو بڑھانے کے لیے تیار کیا گیا ہے، جس سے زکربرگ کو AI کے راستے پر کنٹرول برقرار رکھنے کی اجازت ملتی ہے۔

تاخیر کے پیچھے ایک اہم عنصر یہ ہے کہ آیا ماڈل عوامی لانچ کو جائز قرار دینے کے لیے کافی حد تک ٹھوس بہتری کا مظاہرہ کرتا ہے۔

جدت طرازی کے لیے لازمی ضرورت

ٹیک انڈسٹری کی تیز رفتار دنیا میں، نئی ریلیز کو اپنی شروعات کو جائز قرار دینے کے لیے ٹھوس پیشرفت کا مظاہرہ کرنا چاہیے۔ LlamaCon میں، Meta نے دو چھوٹے Llama 4 ماڈلز دکھائے، جن میں سے ہر ایک میں متاثر کن صلاحیتیں موجود ہیں:

  • Maverick کے پاس 1 ملین ٹوکن کنٹیکسٹ ونڈو (750,000 الفاظ) کے ساتھ 400 بلین کل پیرامیٹرز ہیں۔
  • Scout میں 109 بلین پیرامیٹرز اور 10 ملین ٹوکن کنٹیکسٹ ونڈو (7.5 ملین الفاظ) ہیں۔

Behemoth کو ابتدائی طور پر بیک وقت ریلیز کے لیے تیار کیا گیا تھا، جس میں 2 ٹریلین پیرامیٹرز شامل تھے۔

وال اسٹریٹ جرنل کے مطابق، Meta اپنی Llama 4 ٹیم سے بے صبری کا مظاہرہ کر رہا ہے کیونکہ اس کی جانب سے AI میں مسلسل سرمایہ کاری کی جا رہی ہے۔ 2024 میں، کمپنی نے کیپٹل اخراجات میں 72 بلین ڈالر تک مختص کیے ہیں، جن میں سے زیادہ تر AI کی ترقی کی طرف ہدایت کی گئی ہے۔

بڑھتی ہوئی تشویشات

زکربرگ اور دیگر سینئر ایگزیکٹوز نے ابھی تک Behemoth کے لیے حتمی ریلیز کی تاریخ کا اعلان نہیں کیا ہے۔ اندرونی ذرائع کو خدشہ ہے کہ اس کی کارکردگی Meta کے عوامی بیانات سے متعین کردہ توقعات پر پورا نہیں اتر سکتی ہے۔

ذرائع اشارہ دیتے ہیں کہ Meta کی قیادت میں Llama 4 ماڈلز تیار کرنے والی ٹیم کی جانب سے کی جانے والی پیش رفت پر عدم اطمینان بڑھ رہا ہے۔ اس کی وجہ से اس کے AI پروڈکٹ گروپ میں ممکنہ قائدانہ تبدیلیوں کے بارے میں بات چیت ہو رہی ہے۔

Meta نے Behemoth کو ایک انتہائی قابل سسٹم کے طور پر پیش کیا ہے، جو مخصوص بینچ مارکس پر OpenAI، Google اور Anthropic جیسے حریفوں سے بہتر کارکردگی کا مظاہرہ کرتا ہے۔ اس کی ترقی سے واقف افراد کے مطابق، داخلی چیلنجوں نے اس کی کارکردگی میں رکاوٹ ڈالی ہے۔

OpenAI کو بھی تاخیر کا سامنا کرنا پڑا ہے۔ ان کا اگلا بڑا ماڈل، GPT-5، اصل میں 2024 کے وسط میں ریلیز ہونے والا تھا۔ وال اسٹریٹ جرنل نے دسمبر میں رپورٹ کیا تھا کہ ترقی شیڈول سے پیچھے رہ گئی ہے۔

فروری میں، OpenAI کے CEO سام آلٹ مین نے कहा کہ عبوری ماڈل GPT-4.5 ہوگا، جبکہ GPT-5 میں ابھی مہینوں باقی ہیں۔

تعطل کا شکار پیش رفت کے ممکنہ اسباب

AI ماڈل کی ترقی میں کمی کی رفتار میں کئی عوامل معاون ہو سکتے ہیں، جن میں درج ذیل شامل ہیں:

اعلیٰ معیار کے ڈیٹا میں کمی

بڑے لسانی ماڈلز کو تربیت کے لیے ڈیٹا کی وسیع مقدار کی ضرورت ہوتی ہے، جو انٹرنیٹ کی وسیع وسعت کی عکاسی کرتی ہے۔ وہ عوامی طور پر دستیاب ڈیٹا ذرائع کو ختم کر سکتے ہیں جبکہ کاپی رائٹ سے متعلق قانونی ذمہ داریوں का भी सामना कर सकते ہیں۔

اس کی वजह سے OpenAI، Google اور Microsoft نے کاپی رائٹ شدہ مواد پر تربیت دینے کے अपने अधिकार کو محفوظ رکھنے کی حمایت کی ہے۔

OpenAI نے कहा کہ सरकार अमेरिकी AI मॉडल کو کاپی رائٹ شدہ مواد سے सीख पाने کی صلاحیت کو برقرار रखते हुए امریکियों کو AI سے सीख पाने کی آزادی को محفوظ کر سکتی ہے، اور AI کی برتری کو PRC [پیپلز रिपब्लिक آف چائنا] کے ہاتھ میں सौंपنے से बच سکتی ہے۔

الگوریتھمک رکاوٹیں

یہ یقین رکھنا کہ ماڈل کا سائز بڑھانے، حساب لگانے کے لیے زیادہ کمپیوٹر کا استعمال کرنے اور مزید ڈیٹا پر تربیت देने سے قابل ذکر پیشرفت ہوگی، غلط ثابت हुआ ہے۔ بلومبرگ کا کہنا ہے کہ कम होते रिटर्न मिले हैं, जिसके कारण कुछ लोग कहते हैं कि पैमाने के कानून धीमे हो रहे हैं।