اے آئی میدان جنگ: ڈیپ سیک آر 1 کا عالمی ردعمل | ur

سال 2025 کے آغاز میں مصنوعی ذہانت (artificial intelligence) کے میدان میں ایک زبردست واقعہ رونما ہوا: چینی ٹیم DeepSeek کی جانب سے DeepSeek-R1 کی نقاب کشائی۔ یہ اوپن سورس، 671 بلین پیرامیٹر لینگویج ماڈل (language model) ریاضی، پروگرامنگ اور منطقی استدلال جیسے اہم شعبوں میں OpenAI کے سرکردہ ماڈلز کا حریف بن گیا۔ DeepSeek-R1 کی پیچیدہ مسائل سے نمٹنے کی صلاحیت خاص طور پر قابل ذکر تھی، جس کی وجہ reinforcement learning کا استعمال تھا۔ ماڈل کے MIT لائسنس نے تجارتی رکاوٹوں کو ختم کرتے ہوئے مزید ہلچل مچا دی۔ DeepSeek-R1 کے آغاز کے اثرات پوری ٹیک دنیا اور یہاں تک کہ مالیاتی منڈیوں میں بھی محسوس کیے گئے، اطلاعات کے مطابق اس کی ریلیز کے ایک ہفتے کے اندر AI اسٹاک میں نمایاں گراوٹ دیکھی گئی۔

DeepSeek-R1 نے ہائی اینڈ لینگویج ماڈلز کے میدان میں چین کی اوپن سورس AI تحریک کے لیے ایک نمایاں پیش رفت کی نشاندہی کی۔ اس غیر متوقع چیلنج نے ریاستہائے متحدہ اور چین سے تعلق رکھنے والے عالمی AI رہنماؤں کو اپنی حکمت عملیوں کو ظاہر کرتے ہوئے اپنے اقدامات کو تیز کرنے پر مجبور کیا ہے۔ اس کی وجہ سے DeepSeek-R1 ماڈل کے ارد گرد ایک AI ریس شروع ہو گئی ہے۔

آئیے جائزہ لیتے ہیں کہ AI کے میدان میں بڑے کھلاڑیوں – Meta، Google، OpenAI، Anthropic، Alibaba اور Baidu – نے اس نئے مقابلے کا کیسے جواب دیا۔

میٹا: LLaMA 4 کے ساتھ پیمانے اور کارکردگی کو بڑھانا

میٹا، اوپن سورس ماڈل کمیونٹی میں ایک سرخیل، نے DeepSeek R1 کا جواب LLaMA 4 متعارف کروا کر دیا۔ اپریل 2025 میں، میٹا نے LLaMA 4 لانچ کیا، جو اس کا اب تک کا سب سے طاقتور ماڈل ہے، جو Cloudflare جیسے پلیٹ فارمز کے ذریعے API تک رسائی فراہم کرتا ہے۔ LLaMA 4 ایک Mixture-of-Experts (MoE) فن تعمیر کا استعمال کرتا ہے، جو ماڈل کو ذیلی ماڈلز میں تقسیم کرتا ہے اور ہر inference کے دوران ان میں سے صرف ایک حصہ کو فعال کرتا ہے۔ یہ ڈیزائن بڑے پیمانے پر پیرامیٹرز کو inference کی کارکردگی کے ساتھ متوازن کرتا ہے۔

LLaMA 4 سیریز میں کئی ذیلی ماڈلز شامل ہیں، جن میں “Scout” بھی شامل ہے، جس میں 109 بلین کل پیرامیٹرز ہیں اور صرف 17 بلین فعال پیرامیٹرز ہیں، جو اسے ایک ہی H100 کارڈ پر چلانے کی اجازت دیتے ہیں۔ “Maverick” ماڈل میں 400 بلین کل پیرامیٹرز (128 ماہرین) ہیں لیکن پھر بھی صرف 17 بلین فعال پیرامیٹرز ہیں، جس کے لیے DGX کلسٹر کی ضرورت ہے۔ یہ ڈیزائن LLaMA 4 کو 10 ملین ٹوکن تک context windows کو سپورٹ کرنے کے قابل بناتا ہے، جو اسے یہ صلاحیت فراہم کرنے والے پہلے اوپن سورس ماڈلز میں سے ایک بناتا ہے۔ یہ خاص طور پر طویل دستاویزات کا خلاصہ کرنے اور بڑے کوڈ ریپوزٹریز کا تجزیہ کرنے کے لیے مفید ہے۔

LLaMA 4 اپنی MoE فن تعمیر کی بدولت فوری ردعمل کے اوقات کو برقرار رکھتا ہے اور تصاویر، آڈیو اور ویڈیو کے لیے ملٹی ماڈل ان پُٹس کو سپورٹ کرتا ہے۔ میٹا نے کارکردگی کی حکمت عملی کا انتخاب کیا ہے، اپنی ملٹی ماڈل صلاحیتوں کو مضبوط بناتے ہوئے اور اپنے کاموں کو ہموار کرتے ہوئے، اوپن سورس سیکٹر میں اپنی پوزیشن کو مستحکم کیا ہے جبکہ DeepSeek inference کی صلاحیتوں پر توجہ مرکوز کرتا ہے۔

گوگل: خود مختار ذہین ایجنٹوں کی طرف جیمنی کا ارتقاء

OpenAI اور DeepSeek کے مشترکہ دباؤ کا سامنا کرتے ہوئے، گوگل نے تکنیکی جدت طرازی کی حکمت عملی کا انتخاب کیا ہے۔ فروری 2025 میں، گوگل نے Gemini 2.0 سیریز متعارف کرائی، جس میں Flash، Pro اور Lite ورژن شامل ہیں، جو “ذہین ایجنٹ” صلاحیتوں کی طرف ایک اقدام کی نشاندہی کرتے ہیں۔

Gemini 2.0 کی ایجنٹ صلاحیتیں ایک اہم پیش رفت کی نمائندگی کرتی ہیں۔ ماڈل ایک سے زیادہ طریقوں کو سمجھ سکتا ہے اور سرچ انجن، کوڈ سینڈ باکس اور ویب براؤزنگ کو فعال طور پر استعمال کر سکتا ہے۔ گوگل کا پروجیکٹ میرینر AI سے چلنے والے Chrome براؤزر آپریشنز کی اجازت دیتا ہے، جس سے AI فارم بھرنے اور بٹنوں پر کلک کرنے کے قابل ہوتا ہے۔

گوگل نے Agent2Agent پروٹوکول بھی متعارف کرایا ہے، جو مختلف ذہین ایجنٹوں کو بات چیت کرنے اور مل کر کام کرنے کی اجازت دیتا ہے، تاکہ اس کے ایجنٹ ایکو سسٹم کو سپورٹ کیا جا سکے۔ اس کے علاوہ، اس نے تھرڈ پارٹی ڈویلپرز کو حصہ لینے کی ترغیب دینے کے لیے Agent Garden بھی بنایا ہے۔

گوگل AI کے ٹول پر مبنی اور خود مختار صلاحیتوں کی طرف ارتقاء کے ساتھ ذہین ایجنٹ تعاون پر توجہ مرکوز کر کے اگلے دور کے بنیادی منظرناموں کی نئی تعریف کر رہا ہے، بجائے اس کے کہ DeepSeek اور OpenAI کے ساتھ پیرامیٹر ریس پر توجہ مرکوز کی جائے۔ جیمنی کا ارتقاء ایک اسٹریٹجک تبدیلی کی نمائندگی کرتا ہے اور صرف ماڈل کی اپ گریڈیشن نہیں۔

اوپن اے آئی: ماڈلز کو دہرانا اور وشوسنییتا اور قیادت کے لیے ایکو سسٹمز کو مربوط کرنا

OpenAI نے DeepSeek R1 کے جواب میں اپنے ماڈل کی تکرار اور پروڈکٹ تعیناتیوں کو تیز کیا ہے۔ فروری 2025 میں، OpenAI نے GPT-4.5 لانچ کیا، جو GPT-4 کا ایک عبوری ورژن ہے، جو منطقی مستقل مزاجی اور حقائق کی درستگی کو بہتر بناتا ہے، جبکہ GPT-5 کی راہ بھی ہموار کرتا ہے۔

GPT-4.5 کو آخری بڑا ماڈل سمجھا جاتا ہے جس میں چین آف تھاٹ ریزننگ شامل نہیں ہے۔ GPT-5 تجرباتی ریزننگ ماڈل o3-mini اور GPT سیریز کی خصوصیات کو یکجا کر کے ایک متحد “جنرل کاگنیٹیو ماڈل” تخلیق کرے گا۔ OpenAI نے یہ بھی بتایا ہے کہ GPT-5 میں انتہائی ایڈجسٹ ذہانت کی سطح اور ٹول کے استعمال کی صلاحیتیں ہوں گی۔

OpenAI نے ChatGPT کے مفت صارفین کو GPT-5 کا بنیادی ورژن استعمال کرنے کی اجازت دینے کا فیصلہ کیا، جبکہ ادا شدہ صارفین کو اوپن سورس متبادلوں کی طرف سوئچ کرنے والے صارفین کے خطرے کو کم کرنے کے لیے مزید جدید خصوصیات تک رسائی حاصل ہوگی۔ اس حکمت عملی کا مقصد وسیع کوریج کے ساتھ صارفین کو مشغول رکھنا ہے۔

OpenAI پلگ ان، براؤزر اور کوڈ ایگزیکیوٹرز جیسی صلاحیتوں کو GPT کور ماڈل میں ضم کر رہا ہے، بجائے اس کے کہ انہیں الگ رکھا جائے، تاکہ ایک “مکمل خصوصیات والا AI” تخلیق کیا جا سکے۔ OpenAI R1 کے چیلنج کا جواب منظم طریقے سے ذہانت کو مربوط اور بڑھا کر دے رہا ہے۔

اینتھراپک: مخلوط استدلال اور سوچنے کے بجٹ کے ساتھ مضبوط ذہانت کو گہرا کرنا

اینتھراپک نے فروری 2025 میں Claude 3.7 Sonnet متعارف کرایا، جو “مخلوط استدلال” اور “سوچنے کے بجٹ” پر مرکوز ہے۔ صارفین فوری جوابات کے لیے “اسٹینڈرڈ موڈ” کا انتخاب کر سکتے ہیں یا گہری، مرحلہ وار سوچ کے لیے “ایکسٹینڈڈ موڈ” کو فعال کر سکتے ہیں۔

یہ طریقہ اس وقت “زیادہ سوچنے” کے مترادف ہے جب لوگوں کو مشکل کاموں کا سامنا ہوتا ہے، کیونکہ یہ AI کو درستگی کو بہتر بنانے کے لیے استدلال کرنے میں زیادہ وقت لینے کی اجازت دیتا ہے۔ اینتھراپک صارفین کو استدلال کی گہرائی اور کالنگ اخراجات کو متوازن کرنے کے لیے “سوچنے کا وقت” مقرر کرنے کی بھی اجازت دیتا ہے۔

Claude 3.7 اپنے پیشرو، 3.5 کو، پروگرامنگ اور استدلال جیسے مشکل کاموں میں بہتر کارکردگی کا مظاہرہ کرتا ہے، اور صنعت کے ان چند ماڈلز میں سے ایک ہے جو استدلال کے عمل کی شفافیت پر توجہ مرکوز کرتا ہے۔ اس کی کوڈ کی صلاحیتوں نے بھی حالیہ جائزوں میں 70.3% درستگی کی شرح حاصل کی۔

Claude 3.7 پیرامیٹر اسٹیکنگ کے حصول کے بجائے قابل وضاحت، مستحکم اور حسب ضرورت سوچنے کے پیٹرن کے ساتھ ماڈلز بنانے پر توجہ مرکوز کرتے ہوئے، “قابل کنٹرول ذہانت” کے لیے اینتھراپک کے عزم کا مظاہرہ کرتا ہے۔ اینتھراپک R1 سے چلنے والی “استدلال کی ریس” میں اپنی رفتار سے مسلسل آگے بڑھ رہا ہے۔

علی بابا: Qwen کے ساتھ ایک چینی اوپن سورس ایکو سسٹم کی تعمیر

علی بابا کی ڈیمو اکیڈمی نے DeepSeek R1 کے جاری ہونے کے صرف ایک ہفتے بعد فروری 2025 میں Qwen 2.5 سیریز اور اپریل کے آخر میں نئی Qwen 3 سیریز جاری کرتے ہوئے تیزی سے اپنے Qwen ماڈل فیملی کو اپ ڈیٹ کیا، جو مضبوط پروڈکٹ ریسپانسیونیس اور اسٹریٹجک ویژن کا مظاہرہ کرتا ہے۔

Qwen 3 سیریز میں 600 ملین سے 235 بلین پیرامیٹرز تک ماڈل ورژن شامل ہیں۔ یہ کمپیوٹنگ وسائل کو کم استعمال کرتے ہوئے ماڈل کی کارکردگی کو برقرار رکھنے کے لیے MoE فن تعمیر کا استعمال کرتا ہے۔ فلیگ شپ ماڈل، Qwen3-235B-A22B، ایکٹیویشن پیرامیٹرز کو بہتر بنا کر تعیناتی کے لیے صرف چار ہائی پرفارمنس GPUs کیضرورت ہے، جس سے کاروباری اداروں کے لیے بڑے ماڈلز کو نافذ کرنے میں رکاوٹ بہت کم ہو جاتی ہے۔ کئی معیاری ٹیسٹوں میں، Qwen 3 کی مجموعی کارکردگی DeepSeek R1، OpenAI o1 اور Gemini 2.5 Pro جیسے ٹاپ بین الاقوامی ماڈلز سے زیادہ ہے۔

علی بابا تکنیکی مسابقت کے علاوہ ایک اوپن سورس ایکو سسٹم کی تعمیر پر زور دیتا ہے۔ Qwen 3 مکمل طور پر اپاچی 2.0 لائسنس کے تحت اوپن سورس ہے، جس میں اوپن ویٹس، ٹریننگ کوڈ اور تعیناتی ٹولز ہیں، جو عالمی ڈویلپرز کے ذریعے براہ راست استعمال اور اپنی مرضی کے مطابق بنائے جا سکنے والے بنیادی ماڈل بنانے کے مقصد کے ساتھ ملٹی لینگول (119 زبانیں) اور ملٹی ماڈل ایپلی کیشنز کی حمایت کرتے ہیں۔

علی بابا کی “ٹیکنالوجی + ایکو سسٹم” حکمت عملی DeepSeek کے ہلکے وزن والے بریک تھرو انداز کی تکمیل کرتی ہے۔ ایک تیز تکرار اور معروف استدلال پر زور دیتا ہے، جبکہ دوسرا ایکو سسٹم کی تعمیر اور پیمانے اور تنوع کو متوازن کرنے پر زور دیتا ہے۔ Qwen آہستہ آہستہ گھریلو مارکیٹ میں اوپن سورس بڑے ماڈلز کے “ایکو سسٹم حب” کے طور پر خود کو قائم کر رہا ہے، جو DeepSeek کی وجہ سے ہونے والی صنعت میں خلل کا ایک مستقل ردعمل ہے۔

بیدو: ERNIE بوٹ کی اپ گریڈ کے ساتھ ملٹی موڈلٹی اور پلگ ان ٹولز کو بڑھانا

بیدو نے مارچ میں اپنے فلیگ شپ ماڈل ERNIE بوٹ کو نمایاں طور پر اپ گریڈ کیا، ERNIE بوٹ 4.5 اور ERNIE X1 کو عوامی جانچ کے لیے جاری کیا۔ ERNIE X1 کو “گہری سوچنے والے ماڈل” کے طور پر پوزیشن دی گئی ہے، جو پیچیدہ کاموں کو سمجھنے، منصوبہ بنانے اور انجام دینے کے لیے AI کی صلاحیت کو بڑھانے پر توجہ مرکوز کرتا ہے۔

ERNIE 4.5 بیدو کا پہلا مقامی ملٹی ماڈل بڑا ماڈل ہے، جو متن، تصاویر، آڈیو اور ویڈیو کی مشترکہ ماڈلنگ کی حمایت کرتا ہے۔ یہ ورژن بھی hallucination جنریشن کو نمایاں طور پر کم کرتا ہے اور کوڈ کو سمجھنے اور منطقی استدلال کو بہتر بناتا ہے، متعدد چینی منظر ناموں کے کاموں میں GPT-4.5 کی سطح سے تجاوز کر جاتا ہے۔

بیدو ایک “AI ٹول ایکو سسٹم” بنا رہا ہے جو زیادہ مفید ہے۔ X1 ماڈل تلاش، دستاویز Q&A، PDF ریڈنگ، کوڈ ایگزیکیوشن، امیج ریکگنیشن، ویب تک رسائی اور کاروباری معلومات کے سوالات کے افعال کو استعمال کر سکتا ہے تاکہ AI کی “عملی صلاحیت” کو صحیح معنوں میں محسوس کیا جا سکے، جو گوگل جیمنی کے ایجنٹ روٹ کی بازگشت ہے۔

بیدو نے یہ بھی اعلان کیا کہ وہ جون 2025 کے آخر تک ERNIE ماڈل کے کچھ پیرامیٹرز کو اوپن سورس کرے گا اور انٹرپرائز سطح کے صارفین کے ساتھ ایپلی کیشن انٹیگریشن کو مزید وسعت دے گا۔ ERNIE سیریز ایک بند لوپ پروڈکٹ سے ایک پلیٹ فارم ایکو سسٹم میں منتقلی کر رہی ہے، APIs اور پلگ ان سسٹمز کے ذریعے ڈویلپرز اور کاروباری اداروں کو راغب کر رہی ہے۔

R1 اور Qwen کے ساتھ براہ راست اوپن سورس جگہ میں مقابلہ کرنے کے بجائے، بیدو چینی مواد، تلاش کی خدمات اور نالج گراف میں اپنی گہری جمع اندوزی کا فائدہ تلاش، دفتر اور انفارمیشن فلو جیسے پروڈکٹ منظرناموں کے ساتھ ماڈل کو گہرائی سے مربوط کرنے کے لیے کر رہا ہے، جس سے ایک زیادہ مقامی AI پروڈکٹ پورٹ فولیو تشکیل دیا جا رہا ہے۔

مختصراً، DeepSeek R1 کا اجراء محض ایک تکنیکی پیش رفت سے بڑھ کر تھا؛ یہ عالمی AI میدان میں ایک اتپریرک تھا۔ اس نے جنات کو استدلال کی کارکردگی کو بہتر بنانے پر مجبور کیا ہے، گھریلو کمپنیوں کو اوپن سورس کے لیے مقابلہ کرنے پر آمادہ کیا ہے، اور امریکی کمپنیوں کو ایجنٹوں، انضمام اور ملٹی ماڈلٹی کی ترقی کو تیز کرنے پر آمادہ کیا ہے۔

اگرچہ چینی اور امریکی AI جنات کے ردعمل مختلف ہیں، لیکن ان کے مقاصد ایک جیسے ہیں: مضبوط، زیادہ قابل اعتماد اور زیادہ لچکدار بڑے ماڈلز بنانا اور ٹیکنالوجی، ایکو سسٹم اور صارفین کے تین گنا مقابلے میں جیتنا۔ یہ عمل ابھی ختم نہیں ہوا ہے۔ جیسے جیسے GPT-5، Gemini 3، Claude 4 اور یہاں تک کہ DeepSeek R2 اور Qwen 4 یکے بعد دیگرے جاری ہوتے ہیں، عالمی AI “حلزونی عروج” کے ایک نئے مرحلے میں داخل ہو رہا ہے۔

انٹرپرائز صارفین اور ڈویلپرز کے لیے، یہ مقابلہ زیادہ انتخاب، کم لاگت اور زیادہ طاقتور بڑے ماڈل ٹولز لائے گا۔ عالمی AI صلاحیتیں غیر معمولی شرح سے پھیل رہی ہیں اور جمہوری بن رہی ہیں، اور اگلی فیصلہ کن تکنیکی پیش رفت پہلے سے ہی راستے میں ہو سکتی ہے۔

پر اپ ڈیٹ کیا گیا 2025-05-06

# Agent # DeepSeek # LLaMA