AI چلاتی کمپنیاں: مستقبل کی جھلک

یہ سوال کہ کیا مصنوعی ذہانت (AI) انسانی ملازمتوں کی جگہ لے گی ایک وسیع بحث کا موضوع رہا ہے۔ کچھ تنظیمیں پہلے ہی AI پر شرط لگا رہی ہیں، جبکہ دیگر ہچکچا رہی ہیں، اس کی موجودہ صلاحیتوں پر سوال اٹھا رہی ہیں۔ اس کی تحقیقات کے لیےCarnegie Mellon University کے محققین نے AI ایجنٹوں کے ذریعے مکمل طور پر چلائی جانے والی ایک فرضی کمپنی بنا کر ایک تجربہ کیا۔ Arxiv پر ایک پری پرنٹ مضمون میں پیش کردہ ان کے نتائج کام کی جگہ پر AI کی صلاحیت اور حدود کے بارے میں قیمتی بصیرت فراہم کرتے ہیں۔

مجازی افرادی قوت میں Anthropic کی Claude، OpenAI کی GPT-4o، Google Gemini، Amazon Nova، Meta Llama، اور Alibaba کی Qwen جیسے AI ماڈلز شامل تھے۔ ان AI ایجنٹوں کو مالیاتی تجزیہ کاروں، پروجیکٹ مینیجرز اور سافٹ ویئر انجینئرز سمیت متنوع کردار سونپے گئے تھے۔ محققین نے ساتھیوں سے مشابہت کے لیے ایک پلیٹ فارم بھی استعمال کیا، جس سے AI ایجنٹوں کو HR سے رابطہ کرنے جیسے مخصوص کاموں کے لیے ان کے ساتھ بات چیت کرنے کی اجازت دی گئی۔

AI تجربہ: ایک گہری نظر

اس تجربے کا مقصد ایک حقیقی کاروباری ماحول کی نقل تیار کرنا تھا جہاں AI ایجنٹ آزادانہ طور پر مختلف کام انجام دے سکیں۔ ہر AI ایجنٹ کو ڈیٹا کا تجزیہ کرنے کے لیے فائلوں کو نیویگیٹ کرنے اور نئے دفتری مقامات کو منتخب کرنے کے لیے ورچوئل دورے کرنے کا کام سونپا گیا تھا۔ ہر AI ماڈل کی کارکردگی کی قریبی نگرانی کی گئی تاکہ تفویض کردہ کاموں کو مکمل کرنے میں اس کی تاثیر کا اندازہ لگایا جا سکے۔

نتائج نے ایک بڑا چیلنج ظاہر کیا۔ AI ایجنٹ اپنے تفویض کردہ 75% سے زیادہ کام مکمل کرنے میں ناکام رہے۔ Claude 3.5 Sonnet، سب سے آگے ہونے کے باوجود، صرف 24% کام مکمل کرنے میں کامیاب رہا۔ جزوی طور پر مکمل شدہ کاموں کو شامل کرنے پر، اس کا اسکور محض 34.4% تک پہنچ گیا۔ Gemini 2.0 Flash نے دوسری پوزیشن حاصل کی لیکن صرف 11.4% کام مکمل کیا۔ کوئی دوسرا AI ایجنٹ 10% سے زیادہ کام مکمل نہیں کر سکا۔

لاگت بمقابلہ کارکردگی

تجربے کا ایک اور قابل ذکر پہلو ہر AI ایجنٹ سے وابستہ آپریٹنگ لاگت تھی۔ Claude 3.5 Sonnet، اپنی نسبتاً بہتر کارکردگی کے باوجود، $6.34 کی سب سے زیادہ آپریٹنگ لاگت برداشت کر رہا تھا۔ اس کے برعکس، Gemini 2.0 Flash کی آپریٹنگ لاگت صرف $0.79 تھی۔ یہ کاروباری کارروائیوں میں بعضAI ماڈلز کے استعمال کی لاگت سے متعلق سوالات اٹھاتا ہے۔

محققین نے مشاہدہ کیا کہ AI ایجنٹ ہدایات کے پوشیدہ پہلوؤں سے نبرد آزما ہیں۔ مثال کے طور پر، جب کسی نتیجے کو “.docx” فائل میں محفوظ کرنے کی ہدایت کی گئی، تو وہ یہ سمجھنے میں ناکام رہے کہ یہ مائیکروسافٹ ورڈ فارمیٹ سے مراد ہے۔ انہیں سماجی تعامل کی ضرورت والے کاموں میں بھی مشکلات کا سامنا کرنا پڑا، جس سے سماجی اشاروں کو سمجھنے اور ان کا جواب دینے میں AI کی حدود کو اجاگر کیا گیا۔

ویب نیویگیشن میں چیلنجز

AI ایجنٹوں کے لیے سب سے بڑی رکاوٹوں میں سے ایک ویب کو نیویگیٹ کرنا تھا، خاص طور پر پاپ اپ اور پیچیدہ ویب سائٹ لے آؤٹ کو ہینڈل کرنا۔ جب رکاوٹوں کا سامنا کرنا پڑا، تو انہوں نے بعض اوقات شارٹ کٹ کا سہارا لیا، کام کے مشکل حصوں کو چھوڑ کر یہ فرض کر لیا کہ انہوں نے اسے مکمل کر لیا ہے۔ چیلنجنگ حصوں کو نظر انداز کرنے کے اس رجحان سے AI کی پیچیدہ، حقیقی دنیا کے منظرناموں کو آزادانہ طور پر ہینڈل کرنے کی صلاحیت کو کم کیا جا سکتا ہے۔

ان نتائج سے اشارہ ملتا ہے کہ اگرچہ AI بعض کاموں، جیسے ڈیٹا کے تجزیے میں بہترین کارکردگی کا مظاہرہ کر سکتا ہے، لیکن یہ اب بھی کاروباری ماحول میں آزادانہ طور پر کام کرنے کی صلاحیت سے بہت دور ہے۔ AI ایجنٹ سیاق و سباق، سماجی تعامل اور مسئلہ حل کرنے کی مہارت کی گہری سمجھ کی ضرورت والے کاموں سے نبرد آزما ہیں۔

مطالعہ سے اہم مشاہدات

Carnegie Mellon University کے مطالعے سے AI کی موجودہ حالت اور کام کی جگہ پر اس کے ممکنہ کردار کے بارے میں کئی اہم مشاہدات حاصل ہوئے:

  1. محدود ٹاسک کی تکمیل: AI ایجنٹ آزادانہ طور پر کام مکمل کرنے کے لیے جدوجہد کر رہے ہیں، 75% سے زیادہ کوششوں میں ناکام ہو رہے ہیں۔ یہ AI سے چلنے والے کاموں میں انسانی نگرانی اور مداخلت کی ضرورت پر روشنی ڈالتا ہے۔

  2. پوشیدہ ہدایات میں دشواری: ایجنٹ اکثر ہدایات کے پوشیدہ یا سیاق و سباق کے پہلوؤں کو سمجھنے میں ناکام رہے، جو صریح احکامات سے آگے فہم کی کمی کی نشاندہی کرتے ہیں۔

  3. سماجی تعامل میں چیلنجز: AI ایجنٹ سماجی تعامل کی ضرورت والے کاموں کے لیے جدوجہد کر رہے ہیں، یہ تجویز کرتے ہیں کہ AI ابھی تک باہمی تعلقات کو مؤثر طریقے سے منظم کرنے یا سماجی حرکیات کو نیویگیٹ کرنے کی صلاحیت نہیں رکھتا ہے۔

  4. ویب نیویگیشن کے مسائل: ایجنٹوں کو ویب کو نیویگیٹ کرنے میں مسائل کا سامنا کرنا پڑا، یہ اشارہ کرتے ہوئے کہ AI کو پیچیدہ ویب سائٹس اور غیر متوقع پاپ اپ کو ہینڈل کرنے کے لیے مزید ترقی کی ضرورت ہے۔

  5. شارٹ کٹ رجحانات: ایجنٹ بعض اوقات شارٹ کٹ لیتے ہیں، کاموں کے مشکل حصوں کو چھوڑ دیتے ہیں، انسانی جیسی تنقیدی سوچ کے بغیر پیچیدہ مسئلہ حل کرنے کی صلاحیت کو ظاہر کرتے ہیں۔

مستقبل کے کام کے لیے مضمرات

اس مطالعے کے نتائج کا مستقبل کے کام کے لیے اہم مضمرات ہیں۔ اگرچہ AI میں بعض کاموں کو خودکار کرنے اور کارکردگی کو بہتر بنانے کی صلاحیت موجود ہے، لیکن مستقبل قریب میں یہ مکمل طور پر انسانی کارکنوں کی جگہ لینے کا امکان نہیں ہے۔ اس کے بجائے، AI کے انسانی صلاحیتوں کو بڑھانے کا زیادہ امکان ہے، جس سے کارکنوں کو زیادہ اسٹریٹجک اور تخلیقی سرگرمیوں پر توجہ مرکوز کرنے کی اجازت ملتی ہے۔

مطالعہ سیاق و سباق، سماجی اشاروں اور پیچیدہ مسئلہ حل کرنے کو بہتر طور پر سمجھنے کے لیے AI ماڈلز کو تربیت دینے کی اہمیت کو بھی اجاگر کرتا ہے۔ جیسے جیسے AI ٹیکنالوجی تیار ہوتی رہے گی، اس بات کو یقینی بنانے کے لیے ان حدود کو دور کرنا بہت ضروری ہوگا کہ AI مختلف قسم کے کرداروں میں انسانی کارکنوں کو مؤثر طریقے سے سپورٹ کر سکے۔

ملاوٹ والی افرادی قوت: انسان اور AI

کام کا مستقبل ممکنہ طور پر ایک ملاوٹ والی افرادی قوت پر مشتمل ہوگا، جہاں انسان اور AI مشترکہ مقاصد حاصل کرنے کے لیے مل کر کام کرتے ہیں۔ انسانی کارکن تنقیدی سوچ، تخلیقی صلاحیتوں اور سماجی مہارتیں فراہم کر سکتے ہیں جو AI میں فی الحال موجود نہیں ہیں، جبکہ AI معمول کے کاموں کو خودکار کر سکتا ہے اور انسانوں سے زیادہ مؤثر طریقے سے ڈیٹا کی بڑی مقدار کا تجزیہ کر سکتا ہے۔

اس مرکب افرادی قوت کے لیے مہارت اور تربیت میں تبدیلی کی ضرورت ہوگی۔ کارکنوں کو AI سسٹمز کے ساتھ تعاون کرنے، AI سے تیار کردہ بصیرت کو سمجھنے اور تبدیل ہوتے ہوئے کرداروں کے مطابق ڈھالنے کی صلاحیت تیار کرنے کی ضرورت ہوگی کیونکہ AI مزید کاموں کو سنبھالتا ہے۔

اخلاقیات اور نگرانی کا کردار

چونکہ AI کام کی جگہ پر زیادہ عام ہوتا جا رہا ہے، اس لیے AI کے استعمال کے اخلاقی مضمرات پر غور کرنا بھی ضروری ہے۔ تعصب، رازداری اور ملازمتوں کے خاتمے جیسے مسائل کو احتیاط سے حل کرنے کی ضرورت ہے تاکہ اس بات کو یقینی بنایا جا سکے کہ AI کو ذمہ داری اور اخلاقی طور پر استعمال کیا جائے۔

تنظیموں کو کام کی جگہ پر AI کے استعمال کے لیے واضح رہنما خطوط اور نگرانی کے طریقہ کار قائم کرنے چاہئیں۔ ان رہنما خطوط میں ڈیٹا کی رازداری، الگورتھمک تعصب اور ملازمت پر AI کے اثرات جیسے مسائل کو حل کرنا چاہیے۔

انفرادي AI ماڈل چیلنجز کا تجزيه

تجربے میں استعمال ہونے والے AI ماڈلز کی خصوصیات میں گہرائی میں جانے سے چیلنجز اور ممکنہ حل کے بارے میں مزید بصیرت ملتی ہے۔ Claude ، GPT-4o ، Gemini ، Llama اور دیگر جیسے ماڈلز میں سے ہر ایک کے پاس منفرد فن تعمیر اور تربیتی ڈیٹا سیٹ ہیں، جو براہ راست ان کی کارکردگی اور آپریٹنگ اخراجات کو متاثر کرتے ہیں۔

Claude: صلاحیتوں اور حدود کو سمجھنا

Claude ، قدرتی زبان پروسیسنگ میں اپنی صلاحیتوں کے لیے جانا جاتا ہے، نے اس تجربے میں نسبتاً زیادہ تکمیل کی شرح کا مظاہرہ کیا۔ تاہم، اس کے ساتھ سب سے زیادہ آپریٹنگ لاگت بھی آئی، جو کارکردگی اور لاگت تاثیر کے درمیان توازن کی نشاندہی کرتی ہے۔ پوشیدہ ہدایات اور سماجی تعامل کے ساتھ Claude کو درپیش مسائل سے پتہ چلتا ہے کہ اگرچہ جدید ہے، لیکن اسے اب بھی سیاق و سباق کی تفہیم میں اصلاح کرنے کی ضرورت ہے۔

Claude کی کارکردگی کو بہتر بنانے کے لیے، مستقبل کی تکراریں زیادہ متنوع تربیتی ڈیٹا سیٹس سے فائدہ اٹھا سکتی ہیں جن میں پیچیدہ سماجی اشاروں اور پوشیدہ ہدایات کے ساتھ منظرنامے شامل ہیں۔ مزید برآں، لاگت کی تاثیر کے لیے ماڈل کو بہتر بنانا اسے کاروباری ایپلی کیشنز کے لیے زیادہ قابل عمل آپشن بنا سکتا ہے۔

GPT-4o: کیا تمام اطراف کا اداکار؟

OpenAI کے ذریعہ تیار کردہ GPT-4o، متنوع صلاحیتوں کے ساتھ ایک اور جدید ماڈل کی نمائندگی کرتا ہے۔ اس تجربے میں اس کی کارکردگی سے پتہ چلتا ہے کہ اپنی طاقتوں کے باوجود، وہ اب بھی عملی، حقیقی دنیا کی ایپلی کیشنز سے جدوجہد کرتا ہے جن کے لیے تکنیکی اور سماجی مہارتوں کے امتزاج کی ضرورت ہوتی ہے۔ اضافہ ویب پر مبنی ٹولز کے ساتھ بہتر انضمام اور غیر متوقع مداخلتوں، جیسے پاپ اپ کو بہتر طریقے سے ہینڈل کرنے پر توجہ مرکوز کر سکتا ہے۔

Gemini: کیا لاگت سے موثر متبادل؟

Google کی Gemini نسبتاً کم آپریٹنگ لاگت کے لیے نمایاں ہے، جو اسے ایسے کاروباروں کے لیے ایک پرکشش آپشن بناتی ہے جو اخراجات کو کم کرنا چاہتے ہیں۔ تاہم، اس کی ٹاسک کی تکمیل کی شرح سے پتہ چلتا ہے کہ اس کی مجموعی کارکردگی میں بہتری کی گنجائش ہے۔ اس مسئلے کو حل کرنے کے لیے، ڈویلپرز Gemini کی مسئلہ حل کرنے کی صلاحیتوں اور کھلی ہدایات میں سیاق و سباق کو سمجھنے کی اس کی صلاحیت کو بہتر بنانے پر توجہ مرکوز کر سکتے ہیں۔

Llama: اوپن سورس کی صلاحیت

Meta کی Llama، ایک اوپن سورس ماڈل کے طور پر، کمیونٹی سے چلنے والی ترقی اور حسب ضرورت کا فائدہ پیش کرتی ہے۔ اگرچہ اس تجربے میں اس کی کارکردگی شاندار نہیں تھی، لیکن Llama کی اوپن سورس نوعیت کا مطلب ہے کہ وسیع پیمانے پر ڈویلپرز کے ذریعے بہتری لائی جا سکتی ہے۔ فوکس ایریاز میں اس کی ویب نیویگیشن کی مہارتوں کو بڑھانا اور پیچیدہ ڈیٹا سیٹس کو نیویگیٹ کرنے کی اس کی صلاحیت کو بڑھانا شامل ہو سکتا ہے۔

کاروباری ترتیبات میں AI کی کمزوریوں پر قابو پانا

تجربہ اس بات پر زور دیتا ہے کہ کاروباری ماحول میں AI ماڈلز کو صحیح معنوں میں بہترین کارکردگی کا مظاہرہ کرنے کے لیے، ڈویلپرز کو کئی اہم شعبوں پر توجہ مرکوز کرنی چاہیے:

  • سیاق و سباق کی تفہیم: AI کی سمجھنے اور سیاق و سباق کی تشریح کرنے کی صلاحیت کو بہتر بنانا بہت ضروری ہے۔ اس میں متنوع ڈیٹا سیٹس پر ماڈلز کی تربیت شامل ہے جس میں پوشیدہ ہدایات اور سماجی اشارے شامل ہیں۔

  • سماجی تعامل: سماجی تعامل کے لیے AI کی صلاحیت کو بڑھانا اسے باہمی تعلقات کو منظم کرنے اور سماجی حرکیات کو زیادہ مؤثر طریقے سے نیویگیٹ کرنے کے قابل بنائے گا۔

  • ویب نیویگیشن: AI کی ویب نیویگیشن کی مہارتوں کو تیار کرنے سے اسے پیچیدہ ویب سائٹس، پاپ اپ اور دیگر غیر متوقع مداخلتوں کو ہینڈل کرنے میں مدد ملے گی۔

  • مسئلہ حل کرنا: AI کی مسئلہ حل کرنے کی صلاحیتوں کو بہتر بنانے سے اسے شارٹ کٹ کا سہارا لیے یا مفروضے بنائے بغیر پیچیدہ کاموں کو ہینڈل کرنے کی اجازت ملے گی۔

AI کا جاری ارتقاء

Carnegie Mellon University کے مطالعہ سے AI کی موجودہ حالت کا ایک سنیپ شاٹ پیش کیا گیا ہے۔ جیسے جیسے AI ٹیکنالوجی تیار ہوتی رہتی ہے، اس کی پیشرفت کو ٹریک کرنا اور اس کی حدود کو دور کرنا ضروری ہے۔ ان اہم شعبوں پر توجہ مرکوز کر کے، AI انسانی صلاحیتوں کو بڑھانے اور کام کی جگہ پر کارکردگی کو بہتر بنانے کے لیے ایک قیمتی آلہ بن سکتا ہے۔

اخلاقی خدشات کو دور کرنا

کاروبار میں AI کے انضمام سے کئی اخلاقی خدشات بھی جنم لیتے ہیں جنہیں فعال طور پر دور کیا جانا چاہیے۔ الگورتھمک تعصب، ڈیٹا کی رازداری اور کاموں کا خاتمہ سب سے اہم مسائل میں شامل ہیں۔

  • الگورتھمک تعصب: AI ماڈلز ان اعداد و شمار میں موجود موجودہ تعصبات کو برقراررکھ سکتے ہیں اور ان کو بڑھا سکتے ہیں جن پر انہیں تربیت دی جاتی ہے۔ اس سے بھرتی، ترقی اور کارکردگی کی تشخیص جیسے شعبوں میں امتیازی نتائج سامنے آ سکتے ہیں۔ تنظیموں کو AI سسٹمز کا احتیاط سے آڈٹ کرنا چاہیے تاکہ یہ یقینی بنایا جا سکے کہ وہ تعصب سے پاک ہیں اور لوگوں کے کسی بھی گروہ کے خلاف امتیازی سلوک نہیں کرتے ہیں۔

  • ڈیٹا کی رازداری: AI سسٹمز کو اکثر اعداد و شمار کی بڑی مقدار تک رسائی کی ضرورت ہوتی ہے، جو رازداری کے بارے میں خدشات پیدا کر سکتی ہے۔ تنظیموں کو مضبوط ڈیٹا تحفظ کے اقدامات پر عمل درآمد کرنا چاہیے تاکہ یہ یقینی بنایا جا سکے کہ حساس معلومات سے سمجھوتہ نہیں کیا گیا ہے۔

  • ملازمتوں کا خاتمہ: AI کے ذریعے کاموں کو خودکار کرنے سے ملازمتوں کا خاتمہ ہو سکتا ہے، خاص طور پر معمول اور بار بار ہونے والے کرداروں میں۔ تنظیموں کو ملازمتوں کے خاتمے کے اثرات کو کم کرنے کے لیے اقدامات کرنے چاہئیں، کارکنوں کو نئی ملازمتوں میں منتقلی کے لیے تربیت اور مدد فراہم کی جائے۔

مستقبل باہمی تعاون پر مبنی ہے

مستقبل کے کام میں انسانوں اور AI کے درمیان باہمی تعاون پر مبنی تعلق شامل ہے، جہاں ہر ایک دوسرے کی طاقتوں کی تکمیل کرتا ہے۔ انسانی کارکن تخلیقی صلاحیتوں، تنقیدی سوچ اور سماجی صلاحیتیں لے کر آتے ہیں، جبکہ AI معمول کے کاموں کو خودکار کرتا ہے اور اعداد و شمار کی بڑی مقدار کا تجزیہ کرتا ہے۔ تنظیمیں جو اس باہمی تعاون پر مبنی ماڈل کو اپناتی ہیں وہ کام کے بدلتے ہوئے منظر نامے میں کامیابی کے لیے بہترین پوزیشن میں ہوں گی۔

جیسے جیسے AI ٹیکنالوجی ترقی کرتی جارہی ہے، تنظیموں کو چاہیے کہ وہ AI کی جانب سے پیش کردہ چیلنجز اور مواقع کو حل کرنے میں موافق اور فعال رہیں۔ تربیت میں سرمایہ کاری کرکے، اخلاقی رہنما خطوط قائم کرکے اور ایک باہمی تعاون کو فروغ دے کر، وہ زیادہ نتیجہ خیز، موثر اور مساوی کام کی جگہ بنانے کے لیے AI کی طاقت کا استعمال کر سکتے ہیں۔ خلاصہ یہ ہے کہ اگرچہ AI وعدہ ظاہر کرتا ہے، لیکن اس کی صلاحیتوں اور مختلف کاموں اور کارروائیوں میں انسانی محنت کی جگہ لینے کی صلاحیت کے حوالے سے فی الحال واضح حدود موجود ہیں۔ ان حدود کو سمجھنا ان کاروباروں کے لیے ضروری ہے جو آنے والے سالوں میں AI کی صلاحیت کو بروئے کار لانے کی امید رکھتے ہیں۔