موبائل آلات پر تیز تر، ہوشیار اور زیادہ نجی مصنوعی ذہانت کی مسلسل جستجو، AI ماڈلز کے ڈیزائن اور تعیناتی میں ایک گہری تبدیلی کا باعث بن رہی ہے۔ ہم ایک ایسے دور میں داخل ہو رہے ہیں جہاں AI محض ایک دور دراز سروس نہیں ہے۔ یہ ایک مقامی انٹیلی جنس ہے جو براہ راست ہمارے فون، ٹیبلٹس اور لیپ ٹاپس میں سرایت کر دی گئی ہے۔ یہ تبدیلی تقریباً فوری ردعمل، میموری کے مطالبات میں نمایاں کمی اور صارف کی رازداری پر تجدید شدہ زور کا وعدہ کرتی ہے۔ جیسے جیسے موبائل ہارڈ ویئر اپنی تیزی سے ترقی جاری رکھے ہوئے ہے، توجہ کمپیکٹ، بجلی کی رفتار کے ماڈلز بنانے پر ہے جو ہماری روزمرہ کی ڈیجیٹل تعاملات کی نئی تعریف کرنے کی صلاحیت رکھتے ہیں۔
آن ڈیوائس ملٹی موڈل AI کا چیلنج
اس کوشش میں سب سے اہم رکاوٹوں میں سے ایک موبائل آلات کے وسائل سے مجبور ماحول میں اعلیٰ معیار کی، ملٹی موڈل AI فراہم کرنا ہے۔ کلاؤڈ بیسڈ سسٹمز کے برعکس، جو کمپیوٹیشنل طاقت سے فائدہ اٹھاتے ہیں، آن ڈیوائس ماڈلز کو RAM اور پروسیسنگ صلاحیتوں پر سخت پابندیوں کے ساتھ کام کرنا چاہیے۔ ملٹی موڈل AI، جس میں متن، تصاویر، آڈیو اور ویڈیو کی تشریح کرنے کی صلاحیت شامل ہے، عام طور پر بڑے ماڈلز کی ضرورت ہوتی ہے جو زیادہ تر موبائل آلات کو مغلوب کر سکتے ہیں۔ مزید برآں، کلاؤڈ پر انحصار تاخیر اور رازداری کے خدشات کو جنم دیتا ہے، جو کارکردگی پر سمجھوتہ کیے بغیر مقامی طور پر چلانے کے قابل ماڈلز کی ضرورت پر زور دیتا ہے۔
Gemma 3n: موبائل AI میں ایک چھلانگ
ان چیلنجوں سے نمٹنے کے لیے، گوگل اور گوگل ڈیپ مائنڈ نے Gemma 3n متعارف کرایا ہے، جو ایک انقلابی AI ماڈل ہے جو خاص طور پر موبائل فرسٹ تعیناتی کے لیے ڈیزائن کیا گیا ہے۔ Gemma 3n کو Android اور Chrome پلیٹ فارمز پر کارکردگی کے لیے بہتر بنایا گیا ہے اور یہ Gemini Nano کی اگلی تکرار کی بنیاد کے طور پر کام کرتا ہے۔ یہ جدت ایک اہم پیش رفت کی نمائندگی کرتی ہے، جو بہت چھوٹے میموری فٹ پرنٹس والے آلات میں ملٹی موڈل AI صلاحیتوں کو ریئل ٹائم رسپانس ٹائمز کو برقرار رکھتے ہوئے لاتی ہے۔ یہ اس مشترکہ انفراسٹرکچر پر بنایا جانے والا پہلا کھلا ماڈل بھی ہے، جو ڈویلپرز کو تجربات کے لیے فوری رسائی فراہم کرتا ہے۔
فی لیئر ایمبیڈنگس (PLE): ایک اہم جدت
Gemma 3n کے مرکز میں Per-Layer Embeddings (PLE) کا اطلاق ہے، ایک ایسی تکنیک جو RAM کے استعمال کو ڈرامائی طور پر کم کرتی ہے۔ اگرچہ خام ماڈل سائز بالترتیب 5 بلین اور 8 بلین پیرامیٹرز ہیں، لیکن وہ 2 بلین اور 4 بلین پیرامیٹر ماڈلز کے مساوی میموری فٹ پرنٹس کے ساتھ کام کرتے ہیں۔ متحرک میموری کی کھپت 5B ماڈل کے لیے صرف 2GB اور 8B ورژن کے لیے 3GB ہے۔ یہ ایک نیسٹڈ ماڈل کنفیگریشن کے ذریعے حاصل کیا جاتا ہے جہاں 4B ایکٹو میموری فٹ پرنٹ ماڈل میں 2B سب ماڈل شامل ہے جو MatFormer نامی طریقہ استعمال کرکے تربیت یافتہ ہے۔ یہ ڈویلپرز کو علیحدہ ماڈلز لوڈ کرنے کی ضرورت کے بغیر متحرک طور پر کارکردگی کے طریقوں کو تبدیل کرنے کی اجازت دیتا ہے۔ مزید اضافہ، جیسے KVC شیئرنگ اور ایکٹیویشن کوانٹائزیشن، مزید تاخیر کو کم کرتے ہیں اور رسپانس سپیڈ کو تیز کرتے ہیں۔ مثال کے طور پر، Gemma 3 4B کے مقابلے میں موبائل پر رسپانس ٹائم 1.5 گنا بہتر ہوا ہے، یہ سب سپیریئر آؤٹ پٹ کوالٹی کو برقرار رکھتے ہوئے ہے۔
کارکردگی کے بینچ مارکس
Gemma 3n کے ذریعے حاصل کردہ کارکردگی کے میٹرکس موبائل تعیناتی کے لیے اس کی مناسبیت کو اجاگر کرتے ہیں۔ یہ خودکار اسپیچ ریکگنیشن اور ترجمہ جیسے کاموں میں بہترین کارکردگی کا مظاہرہ کرتا ہے، جو اسپیچ کو ترجمہ شدہ متن میں ہموار تبدیلی کو فعال کرتا ہے۔ ملٹی لسانی بینچ مارکس جیسے WMT24++ (ChrF) پر، یہ 50.1٪ کا اسکور حاصل کرتا ہے، جو جاپانی، جرمن، کوریائی، ہسپانوی اور فرانسیسی جیسی زبانوں میں اس کی طاقت کو ظاہر کرتا ہے۔ اس کی "مکس اینڈ میچ" کی صلاحیت مختلف معیار اور تاخیر کے امتزاج کے لیے موزوں سب ماڈلز کی تخلیق کو فعال کرتی ہے، جو ڈویلپرز کو اور بھی زیادہ کسٹمائزیشن کی پیشکش کرتی ہے۔
کثیر وضعی صلاحیتیں اور ایپلیکیشنز
Gemma 3n کا فن تعمیر مختلف طریقوں سے انٹرلیوڈ ان پُٹس کو سپورٹ کرتا ہے، بشمول متن، آڈیو، تصاویر اور ویڈیو، جو زیادہ قدرتی اور سیاق و سباق سے بھرپور تعاملات کی اجازت دیتا ہے۔ یہ آف لائن بھی کام کر سکتا ہے، نیٹ ورک کنیکٹیویٹی کے بغیر بھی رازداری اور وشوسنییتا کو یقینی بناتا ہے۔ ممکنہ استعمال کے معاملات وسیع ہیں، بشمول:
- لائیو بصری اور سمعی رائے: بصری اور سمعی دونوں چینلز کے ذریعے صارف ان پٹ پر ریئل ٹائم رسپانس فراہم کرنا۔
- سیاق و سباق کے لحاظ سے متعلقہ مواد تخلیق: صارف کے موجودہ سیاق و سباق پر مبنی موزوں مواد تیار کرنا، جیسا کہ مختلف سینسر ان پُٹس کے ذریعے طے کیا گیا ہے۔
- ایڈوانسڈ وائس بیسڈ ایپلیکیشنز: مزید نفیس آواز کے تعاملات اور کنٹرول کو فعال کرنا۔
Gemma 3n کی اہم خصوصیات
Gemma 3n میں خصوصیات کی ایک رینج شامل ہے، بشمول:
- موبائل فرسٹ ڈیزائن: گوگل، ڈیپ مائنڈ، کوالکوم، میڈیا ٹیک اور سیمسنگ سسٹم LSI کے درمیان بہترین موبائل کارکردگی کے لیے تعاون کے ذریعے تیار کیا گیا۔
- کم میموری فٹ پرنٹ: Per-Layer Embeddings (PLE) کا استعمال کرتے ہوئے بالترتیب 5B اور 8B پیرامیٹر ماڈلز کے لیے 2GB اور 3GB کے آپریشنل فٹ پرنٹس حاصل کرتا ہے۔
- بہتر رسپانس ٹائم: Gemma 3 4B کے مقابلے میں موبائل پر 1.5 گنا تیز رسپانس فراہم کرتا ہے۔
- ملٹی لسانی مہارت: WMT24++ (ChrF) پر 50.1% کا ملٹی لسانی بینچ مارک اسکور حاصل کرتا ہے۔
- ملٹی موڈل ان پٹ: آڈیو، ٹیکسٹ، تصویر اور ویڈیو کو قبول اور سمجھتا ہے، جو پیچیدہ ملٹی موڈل پروسیسنگ اور انٹرلیوڈ ان پُٹس کو فعال کرتا ہے۔
- ڈائنامک سب ماڈلز: نیسٹڈ سب ماڈلز اور مکس’ن’میچ کی صلاحیتوں کے ساتھ MatFormer ٹریننگ کا استعمال کرتے ہوئے ڈائنامک ٹریڈ آف کو سپورٹ کرتا ہے۔
- آف لائن آپریشن: انٹرنیٹ کنکشن کے بغیر کام کرتا ہے، رازداری اور وشوسنییتا کو یقینی بناتا ہے۔
- آسان رسائی گوگل AI اسٹوڈیو اور گوگل AI ایج کے ذریعے دستیاب ہے، جس میں ٹیکسٹ اور امیج پروسیسنگ کی صلاحیتیں ہیں۔
مضمرات اور مستقبل کی سمتیں
Gemma 3n اعلیٰ کارکردگی والی AI کو پورٹیبل اور نجی بنانے کے لیے ایک واضح راستہ پیش کرتا ہے۔ اختراعی فن تعمیر کے ذریعے RAM کی حدود کو دور کرتے ہوئے اور ملٹی لسانی اور ملٹی موڈل صلاحیتوں کو بڑھا کر، محققین نے جدید AI کو براہ راست روزمرہ کے آلات تک پہنچانے کے لیے ایک قابل عمل حل تیار کیا ہے۔ لچکدار سب ماڈل سوئچنگ، آف لائن ریڈی نیس اور تیز رسپانس ٹائمز موبائل فرسٹ AI کے لیے ایک جامع نقطہ نظر کی نمائندگی کرتے ہیں۔ مستقبل کی تحقیق کا امکان ہے کہ ماڈل کی صلاحیتوں کو بڑھانے، وسیع تر رینج کے آلات کے ساتھ اس کی مطابقت کو بڑھانے اور дополненная реальность، روبوٹکس اور IoT جیسے شعبوں میں نئی 애플리ケーションों کی تلاش پر توجہ دی جائے گی۔
آن ڈیوائس AI میں نیا دور: گوگل ڈیپ مائنڈ کی Gemma 3n کی نقاب کشائی
مصنوعی ذہانت (AI) کے ارتقاء کے ساتھ، ایک نیا رجحان ابھر رہا ہے جو ہماری ذاتی ڈیوائسز پر AI کی تیز رفتار، ہوشیار اور مزید نجی شکلوں کی تلاش پر مبنی ہے۔ اس رجحان کی وجہ سے AI ماڈلز کے ڈیزائن اور ان کے استعمال کے طریقوں میں ایک گہری تبدیلی رونما ہو رہی ہے۔ ہم ایک ایسے دور میں داخل ہو رہے ہیں جہاں AI اب محض ایک دور دراز سروس نہیں رہی، بلکہ ایک مقامی انٹیلی جنس بن کر ہمارے فونز، ٹیبلٹس اور لیپ ٹاپس میں براہِ راست ضم ہو گئی ہے۔ یہ تبدیلی تقریباً فوری ردعمل کی صلاحیت، میموری کے استعمال میں نمایاں کمی اور صارف کی رازداری پر مزید توجہ مرکوز کرنے کا عندیہ دیتی ہے۔ موبائل ہارڈ ویئر کی مسلسل ترقی کی بدولت، اب توجہ ایسے کمپیکٹ اور تیز رفتار ماڈلز بنانے پر مرکوز ہے جو ہمارے روزمرہ کے ڈیجیٹل تعاملات کو نئے سرے سے متعین کرنے کی صلاحیت رکھتے ہیں۔
آن ڈیوائس ملٹی موڈل AI کا چیلنج
اس پیش رفت میں سب سے بڑا چیلنج وسائل کی کمی کا شکار موبائل ڈیوائسز میں اعلیٰ معیار کی ملٹی موڈل AI فراہم کرنا ہے۔ کلاؤڈ بیسڈ سسٹمز کے مقابلے میں، جو کمپیوٹیشنل طاقت سے فائدہ اٹھاتے ہیں، آن ڈیوائس ماڈلز کو RAM اور پروسیسنگ کی صلاحیتوں پر سخت پابندیوں کے ساتھ کام کرنا ہوتا ہے۔ ملٹی موڈل AI، جس میں متن، تصاویر، آڈیو اور ویڈیو کی تشریح کرنے کی صلاحیت شامل ہے، عام طور پر بڑے ماڈلز کی ضرورت ہوتی ہے جو زیادہ تر موبائل ڈیوائسز کو زیر کر سکتے ہیں۔ مزید برآں، کلاؤڈ پر انحصار کرنے سے لیٹنسی اور رازداری کے خدشات پیدا ہوتے ہیں، جس کی وجہ سے ایسے ماڈلز کی ضرورت بڑھ جاتی ہے جو کارکردگی پر سمجھوتہ کیے بغیر مقامی طور پر چل سکیں۔
Gemma 3n: موبائل AI میں ایک بڑا قدم
ان چیلنجوں کا مقابلہ کرنے کے لیے، گوگل اور گوگل ڈیپ مائنڈ نے Gemma 3n کو متعارف کرایا ہے، جو ایک جدید AI ماڈل ہے جسے خاص طور پر موبائل فرسٹ تعیناتی کے لیے ڈیزائن کیا گیا ہے۔ Gemma 3n کو Android اور Chrome پلیٹ فارمز پر کارکردگی کے لیے بہتر بنایا گیا ہے اور یہ Gemini Nano کے اگلے ورژن کی بنیاد کے طور پر کام کرتا ہے۔ یہ اختراع ایک اہم پیش رفت کی نمائندگی کرتی ہے، جو کم میموری والے آلات میں بھی ملٹی موڈل AI کی صلاحیتوں کو ریئل ٹائم رسپانس ٹائم کے ساتھ فراہم کرتی ہے۔ یہ اس مشترکہ انفراسٹرکچر پر بنایا جانے والا پہلا اوپن ماڈل بھی ہے، جو ڈویلپرز کو تجربات کے لیے فوری رسائی فراہم کرتا ہے۔
فی لیئر ایمبیڈنگس (PLE): ایک اہم اختراع
Gemma 3n کی بنیاد Per-Layer Embeddings (PLE) کا استعمال ہے، جو ایک ایسی تکنیک ہے جو RAM کے استعمال کو ڈرامائی طور پر کم کرتی ہے۔ اگرچہ ماڈل کا اصل سائز 5 بلین اور 8 بلین پیرامیٹرز ہے، لیکن وہ 2 بلین اور 4 بلین پیرامیٹر ماڈلز کے مساوی میموری کے ساتھ کام کرتے ہیں۔ متحرک میموری کی کھپت 5B ماڈل کے لیے صرف 2GB اور 8B ورژن کے لیے 3GB ہے۔ یہ ایک نیسٹڈ ماڈل کنفیگریشن کے ذریعے حاصل کیا جاتا ہے جہاں 4B ایکٹو میموری فٹ پرنٹ ماڈل میں 2B سب ماڈل شامل ہوتا ہے جو MatFormer نامی طریقہ استعمال کرکے تربیت یافتہ ہوتا ہے۔ یہ ڈویلپرز کو علیحدہ ماڈلز لوڈ کرنے کی ضرورت کے بغیر کارکردگی کے طریقوں کو متحرک طور پر تبدیل کرنے کی اجازت دیتا ہے۔ مزید اضافہ، جیسے KVC شیئرنگ اور ایکٹیویشن کوانٹائزیشن، مزید تاخیر کو کم کرتے ہیں اور رسپانس سپیڈ کو تیز کرتے ہیں۔ مثال کے طور پر، Gemma 3 4B کے مقابلے میں موبائل پر رسپانس ٹائم 1.5 گنا بہتر ہوا ہے، یہ سب اعلیٰ معیار کے آؤٹ پٹ کو برقرار رکھتے ہوئے کیا گیا ہے۔
کارکردگی کے بینچ مارکس
Gemma 3n کے ذریعے حاصل کردہ کارکردگی کے میٹرکس موبائل تعیناتی کے لیے اس کی مناسبیت کو ظاہر کرتے ہیں۔ یہ خودکار اسپیچ ریکگنیشن اور ترجمہ جیسے کاموں میں بہترین کارکردگی کا مظاہرہ کرتا ہے، جو اسپیچ کو ترجمہ شدہ متن میں ہموار تبدیلی کو فعال کرتا ہے۔ ملٹی لسانی بینچ مارکس جیسے WMT24++ (ChrF) پر، یہ 50.1٪ کا اسکور حاصل کرتا ہے، جو جاپانی، جرمن، کوریائی، ہسپانوی اور فرانسیسی جیسی زبانوں میں اس کی مضبوطی کو ظاہر کرتا ہے۔ اس کی "مکس اینڈ میچ" کی صلاحیت مختلف معیار اور تاخیر کے امتزاج کے لیے موزوں سب ماڈلز کی تخلیق کو فعال کرتی ہے، جو ڈویلپرز کو مزید کسٹمائزیشن فراہم کرتی ہے۔
ملٹی موڈل صلاحیتیں اور ایپلیکیشنز
Gemma 3n کا فن تعمیر مختلف طریقوں سے انٹرلیوڈ ان پُٹس کو سپورٹ کرتا ہے، بشمول متن، آڈیو، تصاویر اور ویڈیو، جو زیادہ قدرتی اور سیاق و سباق سے بھرپور تعاملات کی اجازت دیتا ہے۔ یہ آف لائن بھی کام کر سکتا ہے، نیٹ ورک کنیکٹیویٹی کے بغیر بھی رازداری اور وشوسنییتا کو یقینی بناتا ہے۔ اس کے ممکنہ استعمال کے معاملات وسیع ہیں، جن میں شامل ہیں:
- لائیو بصری اور سمعی فیڈ بیک: بصری اور سمعی دونوں چینلز کے ذریعے صارف ان پٹ پر ریئل ٹائم رسپانس فراہم کرنا۔
- سیاق و سباق سے آگاہ مواد تخلیق: صارف کے موجودہ سیاق و سباق پر مبنی موزوں مواد تیار کرنا، جیسا کہ مختلف سینسر ان پُٹس کے ذریعے طے کیا گیا ہے۔
- ایڈوانسڈ وائس بیسڈ ایپلیکیشنز: مزید نفیس آواز کے تعاملات اور کنٹرول کو فعال کرنا۔
Gemma 3n کی اہم خصوصیات
Gemma 3n میں خصوصیات کی ਇੱਕ ਵੈਵੰਸ رینج شامل ہے، ان میں سے کچھ یہ ہیں:
- موبائل فرسٹ ڈیزائن: گوگل، ڈیپ مائنڈ، کوالکوم، میڈیا ٹیک اور سیمسنگ سسٹم LSI के درمیان بہترین موبائل کارکردگی کے لیے تعاون کے ذریعے تیار کیا گیا۔
- کم میموری فٹ پرنٹ: Per-Layer Embeddings (PLE) کا استعمال کرتے ہوئے بالترتیب 5B اور 8B پیرامیٹر ماڈلز کے لیے 2GB اور 3GB کے آپریشنل فٹ پرنٹس حاصل کرتا ہے۔
- بہتر رسپانس ٹائم: Gemma 3 4B کے مقابلے میں موبائل پر 1.5 گنا تیز رسپانس فراہم کرتا ہے۔
- ملٹی لسانی مہارت: WMT24++ (ChrF) پر 50.1٪ کا ملٹی لسانی بینچ مارک اسکور حاصل کرتا ہے۔
- ملٹی موڈل ان پٹ: آڈیو، ٹیکسٹ، تصویر اور ویڈیو کو قبول اور سمجھتا ہے، جو پیچیدہ ملٹی موڈل پروسیسنگ اور انٹرلیوڈ ان پُٹس کو فعال کرتا ہے۔
- ڈائنامک سب ماڈلز: نیسٹڈ سب ماڈلز اور مکس’ن’میچ کی صلاحیتوں کے ساتھ MatFormer ٹریننگ کا استعمال کرتے ہوئے ڈائنامک ٹریڈ آف کو سپورٹ کرتا ہے۔
- آف لائن آپریشن: انٹرنیٹ کنکشن کے بغیر کام کرتا ہے، رازداری اور وشوسنییتا کو یقینی بناتا ہے۔
- آسان رسائی: گوگل AI اسٹوڈیو اور گوگل AI ایج کے ذریعے دستیاب ہے، جس میں ٹیکسٹ اور امیج پروسیسنگ کی صلاحیتیں ہیں۔
مضمرات اور مستقبل کی سمتیں
Gemma 3n اعلیٰ کارکردگی والی AI کو پورٹیبل اور نجی بنانے کے لیے ایک واضح راستہ فراہم کرتا ہے۔ اختراعی فن تعمیر کے ذریعے RAM کی حدود کو دور کرتے ہوئے اور ملٹی لسانی اور ملٹی موڈل صلاحیتوں کو بڑھا کر، محققین نے جدید AI کو براہِ راست روزمرہ کے آلات تک پہنچانے کے لیے ایک قابل عمل حل تیار کیا ہے۔ لچکدار سب ماڈل سوئچنگ، آف لائن ریڈی نیس اور تیز رسپانس ٹائمز موبائل فرسٹ AI کے لیے ایک جامع نقطہ نظر کی نمائندگی करते ہیں۔ مستقبل کی تحقیق کا امکان ہے کہ ماڈل کی صلاحیتوں کو بڑھانے، وسیع तरين रेंज کے آلات کے ساتھ اس کی مطابقت کو بڑھانے اور дополненная реальность، روبوٹکس ਅਤੇ IoT जैसे क्षेत्रों میں نئی એપ્લિકೇಶनों کی تلاش پر توجہ दी जाए।
Gemma 3n: اگلی نسل کا آن ڈیوائس AI
گوگل ڈیپ مائنڈ نے Gemma 3n کو متعارف کرایا ہے، جو آن ڈیوائس artificial intelligence (AI) میں ایک انقلاب برپا کر سکتا ہے۔ یہ ماڈل موبائل آلات پر تیز رفتار، سمارٹ اور زیادہ نجی AI فراہم کرنے پر مرکوز ہے۔ اس پیش رفت کے نتیجے میں AI ماڈلز کے ڈیزائن اور ان کے استعمال کے طریقوں میں ایک گہری تبدیلی آرہی ہے۔ ہم ایک ऐसे دور میں داخل ہو رہے ہیں جہاں AI اب محض ایک دور دراز سروس نہیں رہی، بلکہ एक स्थानीय انٹیلی جنس بن کر हमारे फ़ोन, टैबलेट اور लैपटॉप्स में सीधे داخل ہو گئی ہے۔ یہ تبدیلی تقریباً فوری ردعمل کی صلاحیت، میموری کے استعمال میں نمایاں کمی اور صارفની گوپی نયતی برقرار رکھنے پر مزید توجہ دینے کا وعدہ کرتی ہے۔ جیسے جیسے موبائل ہارڈ ویئر اپنی ترقی کی رفتار برقرار رکھے ہوئے ہے، توجہ اب ایسے کمپیکٹ اور تیز رفتار ماڈلز بنانے پر مرکوز ہے जो हमारे रोजमर्रा के डिजिटल अनुभव को बिलकुल बदल सकता है।
آن ڈیوائس ملٹی موڈل AI کا چیلنج
اس پیش رفت میں سب سے بڑا چیلنج وسائل کی کمی کا شکار موبائل ڈیوائسز میں اعلیٰ معیار کی ملٹی موڈل AI فراہم करना ہے। کلاؤڈ بیسڈ سسٹمز کے مقابلے میں، جو کمپیوٹیشنل طاقت से फायदा उठाते हैं، آن ڈیوائس माڈلز को RAM اور پروسیسنگ کی صلاحیتوں پر سخت پابندیوں के साथ काम करना पड़ता है। मलट आई, जिसमें टेक्स्ट, तस्वीरें, ऑडियो और वीडियो से सीखने की क्षमता शामिल है, आमतौर पर बड़े मॉडलों की आवश्यकता ہوتی है जो अधिक मोबाइल डिवाइस को क्रैश कर सकते हैं। इसके علاوه, क्लाउड पर निर्भर रहने से देर और गोपनीयता की चिंताएं बढ़ जाती हैं, इसलिए ऐसे मॉडल की आवश्यकता होती है जो बिना किसी बाधा के مقامی طور پر کام कर सके।
Gemma 3n: موبائل AI में एक बहुत बड़ा कदम
ان چیلنجوں سے نمٹنے کے لیے, Google اور Google DeepMind نے Gemma 3n کو متعارف کرایا ہے, جو ایک جدید AI ماڈل है जिसे विशेष रूप से मोबाइल डिवाइस के लिए डिज़ाइन किया गया है। Google 2 Chrome platforms पर प्रदर्शनकरने के लिए अनुकूलित और Gemini Nano के अगले बदलाव की आधारशिला के रूप में कार्य करता है। यह अविश्वास एक महत्वपूर्ण प्रगति है, जो कम स्मृति वाले उपकरणों में भी बहुआयामी AI संभावनाओं को वास्तविक समय में प्रतिक्रिया समय के साथ प्रदान करता है। यह एक साझा बुनियादी ढांचे पर निर्मित पहला मॉडल है, जो इंजीनियरों को तुरंत इस्तेमाल করার সুযোগ প্রদান করে।
فی لیئر ایمبیڈنگس (PLE): ایک اہم تخلیق
Gemma 3n का આધાર Per-Layer Embeddings (PLE) का उपयोग है, जो एक ऐसी विधि है जो RAM के उपयोग को नाटकीय रूप से कम करती है। यद्यपि मॉडल का आधार आकार 5 अरब और 8 अरब पैरामीटर है, लेकिन वे 2 अरब और 4 अरब पैरामीटर मॉडल के समान ही स्मृति के সাথে काम करते हैं। कार्यशील