علی بابا نے Qwen3 متعارف کرایا ہے، جو کہ ان کا جدید ترین اوپن سورس بڑا لسانی ماڈل (LLM) ہے، جو مصنوعی ذہانت کی جدت میں ایک نیا معیار قائم کرتا ہے۔ LLM کی یہ سیریز ڈیولپرز کے لیے بے مثال لچک پیش کرتی ہے، جو متنوع آلات پر اگلی نسل کی AI کی تعیناتی کو ممکن بناتی ہے۔ اسمارٹ فونز اور اسمارٹ شیشوں سے لے کر خود مختار گاڑیوں اور روبوٹکس تک، Qwen3 AI کو ہماری روزمرہ کی زندگیوں میں ضم کرنے کے طریقے میں انقلاب برپا کرنے کے لیے تیار ہے۔
Qwen3 سیریز: ماڈلز میں گہری غوطہ
Qwen3 سیریز چھ ڈینس ماڈلز اور دو مکسچر آف ایکسپرٹس (MoE) ماڈلز پر مشتمل ہے۔ یہ ماڈلز کمپیوٹیشنل ضروریات اور اطلاق کے منظرناموں کی ایک وسیع صف کو پورا کرتے ہیں۔ 0.6B سے 32B پیرامیٹرز تک کے ڈینس ماڈلز کارکردگی اور کارآمدگی کے درمیان توازن پیش کرتے ہیں۔ 30B (3B فعال) اور 235B (22B فعال) پیرامیٹرز کے ساتھ MoE ماڈلز پیچیدہ کاموں کے لیے بہتر صلاحیتیں فراہم کرتے ہیں۔ یہ متنوع انتخاب ڈیولپرز کو اپنی مخصوص ضروریات کے مطابق بہترین ماڈل منتخب کرنے کی اجازت دیتا ہے۔
ڈینس ماڈلز: Qwen3 کے ورکھورسز
Qwen3 سیریز کے اندر موجود ڈینس ماڈلز عام مقصد کے AI کاموں کے لیے ڈیزائن کیے گئے ہیں۔ وہ لسانی سمجھ، جنریشن اور ترجمے میں بہترین ہیں۔ 0.6B اور 1.7B پیرامیٹر ماڈلز محدود وسائل والے آلات کے لیے مثالی ہیں، جیسے کہ اسمارٹ فونز اور ویئریبلز۔ 4B، 8B، 14B اور 32B ماڈلز تیزی سے نفیس صلاحیتیں پیش کرتے ہیں، جو زیادہ مطالبہ کرنے والی ایپلی کیشنز کے لیے موزوں ہیں۔
MoE ماڈلز: ایڈوانسڈ AI صلاحیتوں کو کھولنا
Qwen3 میں MoE ماڈلز پیچیدہ استدلال اور مسئلہ حل کرنے کے کاموں کے لیے بنائے گئے ہیں۔ وہ ماہرین کے فن تعمیر کے ایک مکسچر سے فائدہ اٹھاتے ہیں، جہاں ماڈل کے مختلف حصے کسی کام کے مختلف پہلوؤں میں مہارت رکھتے ہیں۔ یہ ماڈل کو زیادہ کارکردگی اور درستگی کے ساتھ پیچیدہ مسائل کو سنبھالنے کی اجازت دیتا ہے۔ 30B (3B فعال) ماڈل کارکردگی اور کمپیوٹیشنل لاگت کے درمیان توازن پیش کرتا ہے، جبکہ 235B (22B فعال) ماڈل انتہائی مشکل AI کاموں کے لیے جدید ترین صلاحیتیں فراہم کرتا ہے۔
ہائبرڈ استدلال: AI کے لیے ایک نیا طریقہ
Qwen3 روایتی LLM صلاحیتوں کو ایڈوانسڈ متحرک استدلال کے ساتھ جوڑ کر ہائبرڈ استدلال ماڈلز میں علی بابا کے داخلے کی نشاندہی کرتا ہے۔ یہ اختراعی طریقہ ماڈل کو پیچیدہ کاموں کے لیے سوچ کے مختلف طریقوں کے درمیان بغیر کسی رکاوٹ کے منتقلی کی اجازت دیتا ہے۔ یہ ہاتھ میں موجود کام کی مخصوص ضروریات کی بنیاد پر اپنے استدلال کے عمل کو متحرک طور پر ایڈجسٹ کر سکتا ہے، جس سے زیادہ درست اور موثر حل نکلتے ہیں۔
روایتی LLM صلاحیتیں
Qwen3 روایتی LLM کی بنیادی صلاحیتوں کو برقرار رکھتا ہے، جیسے کہ لسانی سمجھ، جنریشن اور ترجمہ۔ یہ متعدد زبانوں میں متن پر کارروائی اور تیار کر سکتا ہے، سوالات کے جوابات دے سکتا ہے، دستاویزات کا خلاصہ کر سکتا ہے، اور دیگر عام NLP کام انجام دے سکتا ہے۔ یہ صلاحیتیں Qwen3 کے ہائبرڈ استدلال کے طریقہ کار کی بنیاد بناتی ہیں۔
متحرک استدلال: پیچیدگی کے مطابق ڈھالنا
Qwen3 کا متحرک استدلال جزو ماڈل کو کام کی پیچیدگی کی بنیاد پر اپنے استدلال کے عمل کو ڈھالنے کی اجازت دیتا ہے۔ آسان کاموں کے لیے، یہ اپنے پہلے سے تربیت یافتہ علم پر انحصار کر سکتا ہے اور براہ راست قیاس آرائی کر سکتا ہے۔ زیادہ پیچیدہ کاموں کے لیے، یہ زیادہ نفیس استدلال کے عمل میں مشغول ہو سکتا ہے، جیسے کہ منصوبہ بندی، مسئلہ کشیدگی اور مفروضے کی جانچ۔ یہ موافقت Qwen3 کو AI چیلنجوں کی ایک وسیع رینج کو سنبھالنے کی اجازت دیتی ہے۔
Qwen3 کے اہم فوائد
Qwen3 سیریز موجودہ اوپن سورس LLM پر کئی اہم فوائد پیش کرتی ہے۔ ان میں کثیر لسانی تعاون، مقامی ماڈل کانٹیکسٹ پروٹوکول (MCP) سپورٹ، قابل اعتماد فنکشن کالنگ، اور مختلف بینچ مارکس میں اعلیٰ کارکردگی شامل ہیں۔
کثیر لسانی تعاون: لسانی رکاوٹوں کو توڑنا
Qwen3 119 زبانوں اور بولیوں کی حمایت کرتا ہے، جو اسے دستیاب سب سے زیادہ کثیر لسانی اوپن سورس LLM میں سے ایک بناتا ہے۔ یہ وسیع لسانی مدد ڈیولپرز کو AI ایپلی کیشنز بنانے کی اجازت دیتی ہے جو عالمی سامعین کو پورا کر سکتی ہیں۔ یہ وسیع پیمانے پر زبانوں میں متن کو سمجھ اور تیار کر سکتا ہے، جو اسے مشین ترجمہ، کثیر لسانی چیٹ بوٹس اور عالمی مواد کی تخلیق جیسی ایپلی کیشنز کے لیے مثالی بناتا ہے۔
مقامی MCP سپورٹ: ایجنٹ AI صلاحیتوں کو بڑھانا
Qwen3 میں ماڈل کانٹیکسٹ پروٹوکول (MCP) کے لیے مقامی مدد شامل ہے، جو زیادہ مضبوط اور قابل اعتماد فنکشن کالنگ کو ممکن بناتی ہے۔ یہ خاص طور پر ایجنٹ AI ایپلی کیشنز کے لیے اہم ہے، جہاں AI نظام کو کاموں کو انجام دینے کے لیے بیرونی ٹولز اور خدمات کے ساتھ تعامل کرنے کی ضرورت ہے۔ MCP AI ماڈل کو ان ٹولز کے ساتھ بات چیت کرنے کا ایک معیاری طریقہ فراہم کرتا ہے، ہموار انضمام اور قابل اعتماد کارکردگی کو یقینی بناتا ہے۔
فنکشن کالنگ: بیرونی ٹولز کے ساتھ ہموار انضمام
Qwen3 کی قابل اعتماد فنکشن کالنگ صلاحیتیں اسے بیرونی ٹولز اور خدمات کے ساتھ ہموار طور پر ضم کرنے کی اجازت دیتی ہیں۔ یہ ڈیولپرز کو AI ایجنٹس بنانے کے قابل بناتا ہے جو مختلف بیرونی نظاموں کی صلاحیتوں سے فائدہ اٹھا کر پیچیدہ کام انجام دے سکتے ہیں۔ مثال کے طور پر، ایک AI ایجنٹ موسم کی API تک رسائی، ڈیٹا بیس سے معلومات بازیافت کرنے یا روبوٹک بازو کو کنٹرول کرنے کے لیے فنکشن کالنگ کا استعمال کر سکتا ہے۔
اعلیٰ کارکردگی: پچھلے ماڈلز سے بہتر کارکردگی
Qwen3 ریاضی، کوڈنگ اور منطقی استدلال کے لیے بینچ مارکس میں پچھلے Qwen ماڈلز سے بہتر ہے۔ یہ تخلیقی تحریر، کردار ادا کرنے اور قدرتی آواز والے مکالمے میں مشغول ہونے میں بھی بہترین ہے۔ یہ بہتری Qwen3 کو AI ایپلی کیشنز کی ایک وسیع رینج کے لیے ایک طاقتور ٹول بناتی ہے۔
ڈیولپرز کے لیے Qwen3: جدت کو بااختیار بنانا
Qwen3 ڈیولپرز کو استدلال کی مدت پر باریک بینی سے کنٹرول پیش کرتا ہے، 38,000 ٹوکنز تک، جو ذہین کارکردگی اور کمپیوٹیشنل کارکردگی کے درمیان بہترین توازن کی اجازت دیتا ہے۔ یہ لچک ڈیولپرز کو ماڈل کے رویے کو مخصوص ایپلیکیشن کی ضروریات کے مطابق بنانے کی اجازت دیتی ہے۔
استدلال کی مدت کا کنٹرول: کارکردگی کو بہتر بنانا
استدلال کی مدت کو کنٹرول کرنے کی صلاحیت ڈیولپرز کو مختلف کاموں کے لیے Qwen3 کی کارکردگی کو بہتر بنانے کی اجازت دیتی ہے۔ ایسے کاموں کے لیے جن میں زیادہ گہرائی سے استدلال کی ضرورت ہوتی ہے، ڈیولپرز ماڈل کو مزید امکانات کو تلاش کرنے کی اجازت دینے کے لیے استدلال کی مدت کو بڑھا سکتے ہیں۔ ایسے کاموں کے لیے جن میں تیز تر ردعمل کی ضرورت ہوتی ہے، ڈیولپرز تاخیر کو کم کرنے کے لیے استدلال کی مدت کو کم کر سکتے ہیں۔
ٹوکن کی حد: درستگی اور کارآمدگی کو متوازن کرنا
38,000 ٹوکن کی حد درستگی اور کارآمدگی کے درمیان توازن فراہم کرتی ہے۔ یہ ماڈل کو فیصلے کرتے وقت سیاق و سباق کی ایک بڑی مقدار پر غور کرنے کی اجازت دیتا ہے، جبکہ اب بھی مناسب کمپیوٹیشنل اخراجات کو برقرار رکھتا ہے۔ یہ Qwen3 کو ایپلی کیشنز کی ایک وسیع رینج کے لیے موزوں بناتا ہے، طویل فارم ٹیکسٹ جنریشن سے لے کر پیچیدہ مسئلہ حل کرنے تک۔
Qwen3-235B-A22B کے ساتھ لاگت سے موثر تعیناتی
MoE ماڈل Qwen3-235B-A22B دیگر جدید ترین ماڈلز کے مقابلے میں تعیناتی کے اخراجات کو نمایاں طور پر کم کرتا ہے۔ 36 ٹریلین ٹوکنز کے ایک بڑے ڈیٹا سیٹ پر تربیت یافتہ، اس کے پیشرو Qwen2.5 کے سائز سے دوگنا، یہ لاگت کے ایک حصے پر غیر معمولی کارکردگی پیش کرتا ہے۔
کم تعیناتی اخراجات: AI کو جمہوری بنانا
Qwen3-235B-A22B کے کم تعیناتی اخراجات اسے محدود وسائل والے ڈیولپرز اور تنظیموں کے لیے زیادہ قابل رسائی بناتے ہیں۔ یہ AI جدت کو جمہوری بناتا ہے، جس سے افراد اور گروہوں کی ایک وسیع رینج کو جدید AI ایپلی کیشنزبنانے اور تعینات کرنے کی اجازت ملتی ہے۔
بڑا تربیتی ڈیٹا سیٹ: کارکردگی کو بڑھانا
36 ٹریلین ٹوکنز کے بڑے تربیتی ڈیٹا سیٹ Qwen3-235B-A22B کو لسانی ڈیٹا میں مزید پیچیدہ پیٹرن اور تعلقات سیکھنے کی اجازت دیتے ہیں۔ اس کے نتیجے میں AI کاموں کی ایک وسیع رینج میں بہتر کارکردگی حاصل ہوتی ہے۔
انڈسٹری بینچ مارک کامیابیاں
علی بابا کے تازہ ترین ماڈلز نے مختلف انڈسٹری بینچ مارکس میں شاندار نتائج حاصل کیے ہیں، جن میں AIME25 (ریاضیاتی استدلال)، LiveCodeBench (کوڈنگ کی صلاحیت)، BFCL (ٹول کا استعمال اور فنکشن پروسیسنگ)، اور Arena-Hard (ہدایت پر عمل کرنے والے LLM کے لیے ایک بینچ مارک) شامل ہیں۔ یہ کامیابیاں AI کے اہم شعبوں میں Qwen3 کی اعلیٰ صلاحیتوں کا مظاہرہ کرتی ہیں۔
AIME25: ریاضیاتی استدلال میں مہارت حاصل کرنا
AIME25 بینچ مارک پیچیدہ ریاضی کے مسائل کو حل کرنے کے لیے ماڈل کی صلاحیت کا جائزہ لیتا ہے۔ اس بینچ مارک پر Qwen3 کی مضبوط کارکردگی حقیقی دنیا کے مسائل کو حل کرنے کے لیے منطقی استدلال اور ریاضی کے تصورات کو لاگو کرنے کی اس کی صلاحیت کو اجاگر کرتی ہے۔
LiveCodeBench: کوڈنگ ٹاسکس میں شاندار کارکردگی
LiveCodeBench بینچ مارک کوڈ تیار کرنے اور سمجھنے کے لیے ماڈل کی صلاحیت کا جائزہ لیتا ہے۔ اس بینچ مارک پر Qwen3 کی مضبوط کارکردگی پروگرامنگ زبانوں میں اس کی مہارت اور کوڈنگ ٹاسکس میں ڈیولپرز کی مدد کرنے کی اس کی صلاحیت کا مظاہرہ کرتی ہے۔
BFCL: ٹول کے استعمال اور فنکشن پروسیسنگ میں ماہر
BFCL بینچ مارک بیرونی ٹولز استعمال کرنے اور افعال پر کارروائی کرنے کے لیے ماڈل کی صلاحیت کی پیمائش کرتا ہے۔ اس بینچ مارک پر Qwen3 کی مضبوط کارکردگی بیرونی نظاموں کے ساتھ ضم ہونے اور مختلف ٹولز کی صلاحیتوں سے فائدہ اٹھا کر پیچیدہ کام انجام دینے کی اس کی صلاحیت کو اجاگر کرتی ہے۔
Arena-Hard: ہدایت پر عمل کرنے میں پیش قدمی
Arena-Hard بینچ مارک پیچیدہ ہدایات پر عمل کرنے کے لیے ماڈل کی صلاحیت کا جائزہ لیتا ہے۔ اس بینچ مارک پر Qwen3 کی مضبوط کارکردگی تفصیلی ہدایات کو سمجھنے اور ان پر عمل درآمد کرنے کی اس کی صلاحیت کا مظاہرہ کرتی ہے، جو اسے ان ایپلی کیشنز کے لیے مثالی بناتی ہے جن کے لیے درست کنٹرول اور ہم آہنگی کی ضرورت ہوتی ہے۔
تربیتی عمل: ایک چار مرحلوں والا طریقہ
اس ہائبرڈ استدلال ماڈل کو تیار کرنے کے لیے، علی بابا نے ایک چار مرحلوں والا تربیتی عمل استعمال کیا، جس میں لمبی چین آف تھاٹ (CoT) کولڈ سٹارٹ، استدلال پر مبنی کمک سیکھنا (RL)، تھنکنگ موڈ فیوژن، اور عمومی کمک سیکھنا شامل ہے۔
لمبی چین آف تھاٹ (CoT) کولڈ سٹارٹ: ایک بنیاد بنانا
لمبی چین آف تھاٹ (CoT) کولڈ سٹارٹ مرحلے میں ماڈل کو اس کے استدلال کے عمل کی تفصیلی وضاحتیں تیار کرنے کے لیے تربیت دینا شامل ہے۔ اس سے ماڈل کو مسئلے کی گہری سمجھ پیدا کرنے اور اسے حل کرنے کے لیے درکار اہم اقدامات کی شناخت کرنے میں مدد ملتی ہے۔
استدلال پر مبنی کمک سیکھنا (RL): استدلال کے عمل کو بہتر بنانا
استدلال پر مبنی کمک سیکھنے (RL) کے مرحلے میں آزمائش اور غلطی کے ذریعے اپنے استدلال کے عمل کو بہتر بنانے کے لیے ماڈل کو تربیت دینا شامل ہے۔ ماڈل کو صحیح جوابات تیار کرنے پر انعامات اور غلط جوابات تیار کرنے پر جرمانے ملتے ہیں۔ اس سے ماڈل کو یہ سیکھنے میں مدد ملتی ہے کہ کون سی استدلال کی حکمت عملی سب سے زیادہ موثر ہیں۔
تھنکنگ موڈ فیوژن: مختلف طریقوں کو یکجا کرنا
تھنکنگ موڈ فیوژن مرحلے میں ایک ہائبرڈ استدلال ماڈل بنانے کے لیے مختلف استدلال کے طریقوں کو یکجا کرنا شامل ہے۔ یہ ماڈل کو پیچیدہ مسائل کو حل کرنے کے لیے مختلف طریقوں کی طاقتوں سے فائدہ اٹھانے کی اجازت دیتا ہے۔
عمومی کمک سیکھنا: مجموعی کارکردگی کو بہتر بنانا
عمومی کمک سیکھنے کے مرحلے میں کاموں کی ایک وسیع رینج میں اپنی مجموعی کارکردگی کو بہتر بنانے کے لیے ماڈل کو تربیت دینا شامل ہے۔ اس سے ماڈل کو اپنے علم کو عام کرنے اور نئی اور نہ دیکھی ہوئی صورتحال کے مطابق ڈھالنے میں مدد ملتی ہے۔
دستیابی اور رسائی
Qwen3 اب Hugging Face، GitHub اور ModelScope کے ذریعے مفت ڈاؤن لوڈ کے لیے دستیاب ہے۔ اسے براہ راست chat.qwen.ai کے ذریعے بھی حاصل کیا جا سکتا ہے۔ API تک رسائی جلد ہی علی بابا کے AI ماڈل ڈیولپمنٹ پلیٹ فارم، ماڈل سٹوڈیو کے ذریعے دستیاب ہوگی۔ مزید برآں، Qwen3 علی بابا کی فلیگ شپ AI سپر اسسٹنٹ ایپلیکیشن، Quark کے پیچھے بنیادی ٹیکنالوجی کے طور پر کام کرتا ہے۔
Hugging Face، GitHub اور ModelScope: جدت تک کھلی رسائی
Hugging Face، GitHub اور ModelScope پر Qwen3 کی دستیابی دنیا بھر کے ڈیولپرز اور محققین کے لیے ماڈل تک کھلی رسائی فراہم کرتی ہے۔ یہ تعاون کو فروغ دیتا ہے اور AI کے میدان میں جدت کو تیز کرتا ہے۔
chat.qwen.ai: Qwen3 کے ساتھ براہ راست تعامل
chat.qwen.ai پلیٹ فارم صارفین کو Qwen3 کے ساتھ براہ راست تعامل کرنے کی اجازت دیتا ہے، جو ماڈل کی صلاحیتوں کے ساتھ عملی تجربہ فراہم کرتا ہے۔ یہ ڈیولپرز کو اپنی ایپلی کیشنز میں ضم کرنے سے پہلے ماڈل کی جانچ اور جائزہ لینے کی اجازت دیتا ہے۔
ماڈل سٹوڈیو: ہموار AI ڈیولپمنٹ
علی بابا کے ماڈل سٹوڈیو پلیٹ فارم کے ذریعے آنے والی API تک رسائی ڈیولپرز کو Qwen3 کے ذریعے چلنے والی AI ایپلی کیشنز کی تعمیر اور تعیناتی کے لیے ایک ہموار ماحول فراہم کرے گی۔ یہ Qwen3 کے اختیار کو مزید تیز کرے گا اور اسے مصنوعات اور خدمات کی ایک وسیع رینج میں ضم کرے گا۔
Quark: علی بابا کے AI سپر اسسٹنٹ کو طاقت دینا
Qwen3 کا علی بابا کی فلیگ شپ AI سپر اسسٹنٹ ایپلیکیشن، Quark کے پیچھے بنیادی ٹیکنالوجی کے طور پر انضمام اپنی مصنوعات اور خدمات کو بڑھانے کے لیے AI سے فائدہ اٹھانے کے لیے کمپنی کے عزم کا مظاہرہ کرتا ہے۔ یہ انضمام صارفین کو Qwen3 کی جدید صلاحیتوں کے ذریعے چلنے والا ایک زیادہ ذہین اور بدیہی تجربہ فراہم کرے گا۔