گوگل کا جیما 3: فون اور لیپ ٹاپ کیلئے ہلکا AI

جیما 3: اوپن اور موثر AI کا ایک نیا دور

مصنوعی ذہانت کے تیزی سے ارتقاء پذیر منظر نامے میں، کارکردگی اور رسائی کی جستجو نے ہلکے پھلکے ماڈلز کی تیاری میں اضافہ کیا ہے۔ یہ ماڈلز، محدود وسائل والے آلات پر متاثر کن کارکردگی فراہم کرنے کی صلاحیت رکھتے ہیں، AI کو جمہوری بنا رہے ہیں، اسے صارفین اور ایپلی کیشنز کی وسیع تر رینج کے لیے دستیاب کر رہے ہیں۔ چین کے DeepSeek کی جانب سے پیدا ہونے والی ہلچل کے بعد، گوگل نے جیما 3 کے تعارف کے ساتھ اس شعبے سے اپنی وابستگی کی تصدیق کی ہے، جو اس کے اوپن AI ماڈل سیریز کا تازہ ترین تکرار ہے۔

ایک سال سے کچھ عرصہ قبل، گوگل نے اپنی AI حکمت عملی میں ایک اہم تبدیلی کا آغاز کیا، جیما سیریز کے آغاز کے ساتھ اوپن سورس تحریک کو اپنانے کے لیے ایک مکمل ملکیتی نقطہ نظر سے ہٹ کر۔ اب، جیما 3 ایک بڑی چھلانگ کی نمائندگی کرتا ہے، جو ڈویلپرز کو طاقتور، ورسٹائل، اور ذمہ داری سے تیار کردہ اوپن ماڈلز فراہم کرنے کے لیے گوگل کے عزم کو ظاہر کرتا ہے۔

جیما 3 چار الگ الگ سائزز میں دستیاب ہے، جو کمپیوٹیشنل صلاحیتوں کے وسیع اسپیکٹرم کو پورا کرتا ہے۔ رینج ایک ناقابل یقین حد تک کمپیکٹ ماڈل سے شروع ہوتی ہے جس میں صرف 1 بلین پیرامیٹرز ہیں، جو اسے موبائل ڈیوائسز جیسے وسائل سے محروم ماحول کے لیے مثالی بناتا ہے۔ سپیکٹرم کے دوسرے سرے پر، جیما 3 ایک 27 بلین پیرامیٹر ماڈل پیش کرتا ہے، جو کارکردگی اور کارکردگی کے درمیان توازن قائم کرتا ہے۔ گوگل کا دعویٰ ہے کہ یہ ماڈلز نہ صرف اس کے ‘سب سے جدید’ اور ‘پورٹیبل’ اوپن ماڈلز ہیں بلکہ ذمہ دارانہ ترقی کے لیے ان کی وابستگی پر بھی زور دیتے ہیں۔

مقابلے کو پیچھے چھوڑنا

ہلکے پھلکے AI ماڈلز کے مسابقتی میدان میں، کارکردگی سب سے اہم ہے۔ گوگل کا دعویٰ ہے کہ جیما 3 اپنے حریفوں کو پیچھے چھوڑ دیتا ہے، جن میں DeepSeek-V3، Meta’s Llama-405B، اور OpenAI’s o3-mini شامل ہیں۔ گوگل کے مطابق، یہ اعلیٰ کارکردگی، جیما 3 کو ایک واحد AI ایکسلریٹر چپ پر چلنے کے قابل معروف ماڈل کے طور پر رکھتی ہے، جو کارکردگی اور لاگت کی تاثیر کے لحاظ سے ایک اہم کامیابی ہے۔

بہتر سیاق و سباق ونڈو: بہتر صلاحیتوں کے لیے مزید یاد رکھنا

کسی بھی AI ماڈل کا ایک اہم پہلو اس کی ‘سیاق و سباق ونڈو’ ہے، جو اس معلومات کی مقدار کا تعین کرتی ہے جسے ماڈل کسی بھی وقت برقرار رکھ سکتا ہے۔ ایک بڑی سیاق و سباق ونڈو ماڈل کو زیادہ وسیع ان پٹ پر کارروائی کرنے اور سمجھنے کے قابل بناتی ہے، جس سے سیاق و سباق کی وسیع تر تفہیم کی ضرورت والے کاموں میں بہتر کارکردگی ہوتی ہے۔

جبکہ جیما 3 کی 128,000 ٹوکنز کی سیاق و سباق ونڈو اپنے پیشروؤں کے مقابلے میں ایک اہم بہتری کی نمائندگی کرتی ہے، یہ بنیادی طور پر گوگل کے اوپن ماڈلز کو Llama اور DeepSeek جیسے حریفوں کے ساتھ ہم آہنگ کرتی ہے، جنہوں نے پہلے ہی اسی طرح کے سیاق و سباق ونڈو سائز حاصل کر لیے ہیں۔ بہر حال، یہ اضافہ جیما 3 کو زیادہ پیچیدہ کاموں کو سنبھالنے اور معلومات کے بڑے حصوں پر مؤثر طریقے سے کارروائی کرنے کے لیے تیار کرتا ہے۔

شیلڈ جیما 2: تصویر کی حفاظت کو ترجیح دینا

حفاظت اور ذمہ دار AI ترقی کی اہمیت کو تسلیم کرتے ہوئے، گوگل نے شیلڈ جیما 2 بھی متعارف کرایا ہے، جو جیما 3 فاؤنڈیشن پر بنایا گیا ایک امیج سیفٹی چیکر ہے۔ یہ ٹول ڈویلپرز کو تصاویر کے اندر ممکنہ طور پر نقصان دہ مواد کی شناخت کرنے کی طاقت دیتا ہے، جیسے کہ جنسی طور پر واضح یا پرتشدد مواد۔ شیلڈ جیما 2 AI سے تیار کردہ مواد سے وابستہ خطرات کو کم کرنے اور ایک محفوظ ڈیجیٹل ماحول کو فروغ دینے کے لیے گوگل کی لگن کو واضح کرتا ہے۔

گوگل کا روبوٹکس کا احیاء: جیمنی نے مرکز کا درجہ حاصل کیا۔

ہلکے پھلکے AI ماڈلز میں ہونے والی پیش رفت کے علاوہ، گوگل روبوٹکس کے میدان میں ایک نئی کوشش کر رہا ہے۔ اپنے فلیگ شپ جیمنی 2.0 ماڈل کی طاقت کا فائدہ اٹھاتے ہوئے، گوگل کے ڈیپ مائنڈ ڈویژن نے روبوٹکس ایپلی کیشنز کے لیے تیار کردہ دو خصوصی ماڈل تیار کیے ہیں۔

روبوٹکس پر یہ نئی توجہ ایک عرصے کی از سر نو تشخیص کے بعد سامنے آئی ہے، جس کی نشاندہی چند سال قبل الفابیٹ کے ایوری ڈے روبوٹس مون شاٹ کے بند ہونے سے ہوئی تھی۔ تاہم، دسمبر میں، گوگل نے Apptronik کے ساتھ ایک اسٹریٹجک پارٹنرشپ کا اعلان کرتے ہوئے اس شعبے میں اپنی مسلسل دلچسپی کا اشارہ دیا، جو ہیومنائیڈ روبوٹکس میں مہارت رکھنے والی ایک فرم ہے۔

جیمنی روبوٹکس: زبان اور عمل کے درمیان فرق کو ختم کرنا

نئے روبوٹکس ماڈلز میں سے ایک، جسے مناسب طور پر جیمنی روبوٹکس کا نام دیا گیا ہے، قدرتی زبان کی ہدایات کو جسمانی اعمال میں ترجمہ کرنے کی قابل ذکر صلاحیت رکھتا ہے۔ یہ ماڈل روبوٹ کے ماحول میں ہونے والی تبدیلیوں پر بھی غور کرتے ہوئے، اپنے اعمال کو اس کے مطابق ڈھال کر، سادہ کمانڈ پر عمل درآمد سے آگے بڑھتا ہے۔

گوگل کا دعویٰ ہے کہ جیمنی روبوٹکس متاثر کن مہارت کا مظاہرہ کرتا ہے، جو پیچیدہ کاموں کو سنبھالنے کی صلاحیت رکھتا ہے جیسے اوریگامی فولڈ کرنا اور اشیاء کو زپ لاک بیگز میں پیک کرنا۔ عمدہ موٹر کنٹرول اور موافقت کی یہ سطح اس ماڈل کی مینوفیکچرنگ سے لے کر لاجسٹکس تک مختلف صنعتوں میں انقلاب لانے کی صلاحیت کو اجاگر کرتی ہے۔

جیمنی روبوٹکس-ER: مقامی استدلال میں مہارت حاصل کرنا

دوسرا روبوٹکس ماڈل، جیمنی روبوٹکس-ER، مقامی استدلال پر توجہ مرکوز کرتا ہے، جو پیچیدہ اور متحرک ماحول میں کام کرنے والے روبوٹس کے لیے ایک اہم مہارت ہے۔ یہ ماڈل روبوٹس کو ایسے کام انجام دینے کی طاقت دیتا ہے جن کے لیے مقامی تعلقات کی سمجھ کی ضرورت ہوتی ہے، جیسے کہ اس کے سامنے رکھے گئے کافی کے مگ کو پکڑنے اور اٹھانے کا بہترین طریقہ طے کرنا۔

مقامی استدلال میں مہارت حاصل کرنے سے، جیمنی روبوٹکس-ER روبوٹس کے لیے اپنے ارد گرد کے ماحول کو زیادہ مؤثر طریقے سے نیویگیٹ کرنے اور ان کے ساتھ بات چیت کرنے کے امکانات کھولتا ہے، جس سے معاون نگہداشت، تلاش اور بچاؤ، اور تلاش جیسے شعبوں میں ایپلی کیشنز کی راہ ہموار ہوتی ہے۔

حفاظت سب سے پہلے: AI اور روبوٹکس میں ایک بنیادی اصول

جیما 3 اور روبوٹکس دونوں کے اعلانات حفاظت کے بارے میں بات چیت سے بھرے ہوئے ہیں، اور بجا طور پر۔ اوپن ماڈلز، اپنی نوعیت کے اعتبار سے، موروثی حفاظتی چیلنجز پیش کرتے ہیں کیونکہ وہ جاری کرنے والی کمپنی کے براہ راست کنٹرول میں نہیں ہوتے ہیں۔ گوگل اس بات پر زور دیتا ہے کہ جیما 3 کی سخت جانچ کی گئی ہے، خاص طور پر نقصان دہ مادوں کو پیدا کرنے کی اس کی صلاحیت پر توجہ دی گئی ہے، ماڈلز کی مضبوط STEM صلاحیتوں کو دیکھتے ہوئے۔

روبوٹکس کے میدان میں، جسمانی نقصان کا امکان حفاظت پر زیادہ زور دینے کی ضرورت ہے۔ جیمنی روبوٹکس-ER کو خاص طور پر اپنے اعمال کی حفاظت کا جائزہ لینے اور ‘مناسب ردعمل پیدا کرنے’ کے لیے ڈیزائن کیا گیا ہے، جس سے حادثات کا خطرہ کم ہوتا ہے اور ذمہ دارانہ آپریشن کو یقینی بنایا جاتا ہے۔

جیما 3 کے فن تعمیر اور صلاحیتوں میں گہرائی میں جانا

جیما 3 کی اہمیت کو پوری طرح سمجھنے کے لیے، اس کے آرکیٹیکچرل ڈیزائن اور اس کی پیش کردہ صلاحیتوں میں گہرائی میں جانا ضروری ہے۔ اگرچہ گوگل نے مکمل تکنیکی تفصیلات جاری نہیں کی ہیں، لیکن فراہم کردہ معلومات سے کچھ اہم پہلوؤں کا اندازہ لگایا جا سکتا ہے۔

‘پیرامیٹرز’ کی اصطلاح کا استعمال اندرونی متغیرات سے مراد ہے جو اس بات پر حکمرانی کرتے ہیں کہ AI ماڈل کیسے کام کرتا ہے۔ یہ پیرامیٹرز تربیتی عمل کے دوران سیکھے جاتے ہیں، جہاں ماڈل کو ڈیٹا کی بڑی مقدار کا سامنا کرنا پڑتا ہے اور مخصوص کاموں پر اپنی کارکردگی کو بہتر بنانے کے لیے اپنے پیرامیٹرز کو ایڈجسٹ کرتا ہے۔

یہ حقیقت کہ جیما 3 کو چار مختلف سائزز – 1B، 2B، 7B، اور 27B پیرامیٹرز میں پیش کیا جاتا ہے – ایک ماڈیولر ڈیزائن تجویز کرتا ہے۔ یہ ڈویلپرز کو ماڈل کا سائز منتخب کرنے کی اجازت دیتا ہے جو ان کی ضروریات اور کمپیوٹیشنل وسائل کے لیے بہترین ہو۔ چھوٹے ماڈلز محدود پروسیسنگ پاور اور میموری والے آلات، جیسے اسمارٹ فونز اور ایمبیڈڈ سسٹمز پر تعیناتی کے لیے مثالی ہیں، جبکہ بڑے ماڈلز کو زیادہ طاقتور ہارڈ ویئر پر زیادہ مطالبہ کرنے والی ایپلی کیشنز کے لیے استعمال کیا جا سکتا ہے۔

یہ دعویٰ کہ جیما 3 DeepSeek-V3، Meta’s Llama-405B، اور OpenAI’s o3-mini جیسے حریفوں کو پیچھے چھوڑ دیتا ہے، ایک جرات مندانہ دعویٰ ہے۔ اس کا مطلب ہے کہ گوگل نے ماڈل کی اصلاح اور تربیتی تکنیکوں میں اہم پیش رفت کی ہے۔ تاہم، آزاد بینچ مارکس اور موازنہ کے بغیر، ان دعووں کی حتمی طور پر توثیق کرنا مشکل ہے۔

128,000 ٹوکنز کی سیاق و سباق ونڈو، اگرچہ زمینی نہیں ہے، پیچیدہ کاموں کو سنبھالنے کے لیے ایک اہم خصوصیت ہے۔ ایک بڑی سیاق و سباق ونڈو ماڈل کو ان پٹ سے مزید معلومات ‘یاد رکھنے’ کی اجازت دیتی ہے، جس سے وہ طویل دستاویزات، بات چیت، یا کوڈ کی ترتیب کو بہتر طور پر سمجھ سکتا ہے۔ یہ خاص طور پر خلاصہ، سوال جواب، اور کوڈ جنریشن جیسے کاموں کے لیے اہم ہے۔

شیلڈ جیما 2: تصویر کی حفاظت پر ایک قریبی نظر

شیلڈ جیما 2 کا تعارف AI سے تیار کردہ تصاویر کے ممکنہ غلط استعمال کے بارے میں بڑھتی ہوئی تشویش کو اجاگر کرتا ہے۔ مثال کے طور پر، ڈیپ فیکس کا استعمال حقیقت پسندانہ لیکن من گھڑت ویڈیوز یا تصاویر بنانے کے لیے کیا جا سکتا ہے، جو ممکنہ طور پر افراد کو نقصان پہنچا سکتا ہے یا غلط معلومات پھیلا سکتا ہے۔

شیلڈ جیما 2 ممکنہ طور پر نقصان دہ مواد کی شناخت کے لیے تکنیکوں کے مجموعے کو استعمال کرتا ہے۔ ان میں شامل ہو سکتے ہیں:

  • تصویر کی درجہ بندی: نقصان دہ مواد کے مخصوص زمروں، جیسے عریانیت، تشدد، یا نفرت انگیز علامتوں کو پہچاننے کے لیے ایک ماڈل کی تربیت کرنا۔
  • آبجیکٹ کا پتہ لگانا: کسی تصویر کے اندر مخصوص اشیاء کی شناخت کرنا جو نقصان دہ مواد کی نشاندہی کر سکتی ہیں، جیسے ہتھیار یا منشیات کا سامان۔
  • چہرے کی شناخت: ممکنہ ڈیپ فیکس یا نقالی کی مثالوں کی شناخت کے لیے چہروں کا پتہ لگانا اور ان کا تجزیہ کرنا۔
  • بے ضابطگی کا پتہ لگانا: ایسی تصاویر کی شناخت کرنا جو عام نمونوں سے نمایاں طور پر ہٹ جاتی ہیں، جو ہیرا پھیری یا مصنوعی مواد کی نشاندہی کر سکتی ہیں۔

ڈویلپرز کو شیلڈ جیما 2 جیسا ٹول فراہم کر کے، گوگل انہیں محفوظ اور زیادہ ذمہ دار AI ایپلی کیشنز بنانے کی طاقت دے رہا ہے جو تصاویر کا استعمال کرتے ہیں۔

جیمنی روبوٹکس اور جیمنی روبوٹکس-ER: روبوٹکس کے مستقبل کی تلاش

گوگل کی روبوٹکس پر نئی توجہ، جو جیمنی 2.0 ماڈل سے چلتی ہے، زیادہ ذہین اور قابل روبوٹ بنانے کی جانب ایک اہم قدم کا اشارہ دیتی ہے۔ قدرتی زبان کی ہدایات کو اعمال میں ترجمہ کرنے کی صلاحیت (جیمنی روبوٹکس) اور مقامی استدلال (جیمنی روبوٹکس-ER) اہم پیش رفت ہیں۔

جیمنی روبوٹکس کی قدرتی زبان کی پروسیسنگ کی صلاحیتوں میں ممکنہ طور پر ان کا مجموعہ شامل ہے:

  • تقریر کی شناخت: بولی جانے والی زبان کو متن میں تبدیل کرنا۔
  • قدرتی زبان کی تفہیم (NLU): متن کے معنی کی تشریح کرنا، بشمول مطلوبہ عمل، شامل اشیاء، اور کسی بھی متعلقہ رکاوٹوں کی شناخت کرنا۔
  • موشن پلاننگ: روبوٹ کے لیے مطلوبہ عمل کو انجام دینے کے لیے حرکات کا ایک سلسلہ تیار کرنا۔
  • کنٹرول سسٹم: منصوبہ بند حرکات کو انجام دینا، روبوٹ کی جسمانی حدود اور ماحول کو مدنظر رکھتے ہوئے۔

اوریگامی فولڈ کرنے اور اشیاء کو زپ لاک بیگز میں پیک کرنے جیسے کاموں کو سنبھالنے کی صلاحیت اعلیٰ درجے کی مہارت اور عمدہ موٹر کنٹرول کی تجویز کرتی ہے۔ اس میں ممکنہ طور پر جدید سینسرز، ایکچیوٹرز اور کنٹرول الگورتھم شامل ہیں۔

جیمنی روبوٹکس-ER کی مقامی استدلال کی صلاحیتیں ان کاموں کے لیے بہت اہم ہیں جن کے لیے سہ جہتی دنیا کی سمجھ کی ضرورت ہوتی ہے۔ اس میں شامل ہو سکتے ہیں:

  • کمپیوٹر وژن: ماحول کو سمجھنے کے لیے کیمروں سے تصاویر پر کارروائی کرنا، بشمول اشیاء، ان کی پوزیشنوں اور ان کی سمتوں کی شناخت کرنا۔
  • 3D منظر کی تفہیم: ماحول کی ایک نمائندگی بنانا، بشمول اشیاء کے درمیان مقامی تعلقات۔
  • راستے کی منصوبہ بندی: روبوٹ کے لیے ماحول میں حرکت کرنے، رکاوٹوں سے بچنے اور اپنے مقصد تک پہنچنے کے لیے بہترین راستے کا تعین کرنا۔
  • پکڑنے اور ہیرا پھیری: اشیاء کو پکڑنے اور ہیرا پھیری کرنے کے لیے حرکات کی منصوبہ بندی اور عمل درآمد کرنا، ان کی شکل، وزن اور نزاکت کو مدنظر رکھتے ہوئے۔
  • حفاظت کے بارے میں استدلال: کارروائی کرنے سے پہلے، یہ استدلال کرنا کہ آیا اس پر عمل کرنا محفوظ ہے۔

دونوں ماڈلز میں حفاظت پر زور دینا سب سے اہم ہے۔ حقیقی دنیا میں کام کرنے والے روبوٹ ممکنہ طور پر نقصان پہنچا سکتے ہیں اگر وہ خراب ہو جائیں یا غلط فیصلے کریں۔ حفاظتی میکانزم میں شامل ہو سکتے ہیں:

  • تصادم کا پتہ لگانا: سینسر جو ممکنہ تصادم کا پتہ لگاتے ہیں اور ہنگامی اسٹاپ کو متحرک کرتے ہیں۔
  • فورس سینسنگ: سینسر جو روبوٹ کے ذریعے لگائی گئی قوت کی پیمائش کرتے ہیں، اسے اشیاء یا لوگوں پر ضرورت سے زیادہ طاقت لگانے سے روکتے ہیں۔
  • حفاظتی رکاوٹیں: روبوٹ کو کچھ ایسے اعمال یا علاقوں سے بچنے کے لیے پروگرام کرنا جو غیر محفوظ سمجھے جاتے ہیں۔
  • ہیومن-ان-دی-لوپ کنٹرول: ایک انسانی آپریٹر کو مداخلت کرنے اور روبوٹ کا کنٹرول سنبھالنے کی اجازت دینا اگر ضروری ہو۔

مضمرات اور مستقبل کی سمتیں

جیما 3 اور نئے جیمنی روبوٹکس ماڈلز کے اعلانات AI اور روبوٹکس کے مستقبل کے لیے اہم مضمرات رکھتے ہیں۔

جیما 3 کی کھلی اور ہلکی پھلکی نوعیت طاقتور AI ماڈلز تک رسائی کو جمہوری بناتی ہے، جس سے ڈویلپرز کو آلات کی وسیع رینج کے لیے جدید ایپلی کیشنز بنانے کے قابل بنایا جاتا ہے۔ اس کی وجہ سے ہو سکتا ہے:

  • مزید AI سے چلنے والی موبائل ایپس: اسمارٹ فونز اور ٹیبلٹس پر بہتر قدرتی زبان کی پروسیسنگ، امیج ریکگنیشن، اور دیگر AI صلاحیتیں۔
  • سمارٹ ایمبیڈڈ سسٹم: سمارٹ ہوم اپلائنسز، پہننے کے قابل، اور صنعتی سینسرز جیسے آلات میں بہتر ذہانت۔
  • وسائل سے محروم ماحول میں AI کو اپنانے میں اضافہ: ترقی پذیر ممالک یا دور دراز علاقوں میں محدود انٹرنیٹ کنیکٹیویٹی کے ساتھ AI ایپلی کیشنز کو فعال کرنا۔
  • مزید اوپن سورس AI ماڈلز

جیمنی سے چلنے والی روبوٹکس میں ہونے والی پیش رفت اس کا باعث بن سکتی ہے:

  • مزید قابل صنعتی روبوٹ: مینوفیکچرنگ، لاجسٹکس اور دیگر صنعتوں میں بڑھتی ہوئی آٹومیشن۔
  • صحت کی دیکھ بھال اور بزرگوں کی دیکھ بھال کے لیے معاون روبوٹ: روبوٹ جو ادویات کی تقسیم، نقل و حرکت میں مدد، اور صحبت جیسے کاموں میں مدد کر سکتے ہیں۔
  • تلاش اور بچاؤ کے لیے روبوٹ: روبوٹ جو خطرناک ماحول میں نیویگیٹ کر سکتے ہیں اور متاثرین کو تلاش کر سکتے ہیں۔
  • تلاش کے روبوٹ: روبوٹ جو دور دراز یا خطرناک مقامات، جیسے دوسرے سیاروں یا گہرے سمندری ماحول کو تلاش کر سکتے ہیں۔

حفاظت پر زور اس بات کو یقینی بنانے کے لیے بہت اہم ہے کہ ان پیش رفت کو ذمہ داری سے تعینات کیا جائے اور معاشرے کو مجموعی طور پر فائدہ پہنچے۔ جیسے جیسے AI اور روبوٹکس کا ارتقاء جاری ہے، اخلاقی خدشات کو دور کرنا، ممکنہ خطرات کو کم کرنا، اور اس بات کو یقینی بنانا ضروری ہوگا کہ یہ ٹیکنالوجیز اچھے کے لیے استعمال ہوں۔