Archives: 1

ویو فارمز اے آئی: جذباتی ذہانت کے ساتھ آڈیو ماڈل کا آغاز

ویو فارمز اے آئی نے 40 ملین ڈالر کی ابتدائی فنڈنگ حاصل کی ہے، جو جذباتی ذہانت پر توجہ مرکوز کرتے ہوئے جدید آڈیو ماڈلز تیار کر رہا ہے۔ یہ کمپنی براہ راست آڈیو پروسیسنگ کے ذریعے انسانی جذبات کو سمجھنے اور ان کا جواب دینے کے لیے مصنوعی ذہانت کو تیار کرنے کا ارادہ رکھتی ہے۔

ویو فارمز اے آئی: جذباتی ذہانت کے ساتھ آڈیو ماڈل کا آغاز

کیمی کے 1.5 ماڈل نے اوپن اے آئی کے o1 ماڈل کو ٹکر دی

مون شاٹ اے آئی نے کیمی کے 1.5 ملٹی موڈل ماڈل کا انکشاف کیا ہے، جو اوپن اے آئی کے مکمل ورژن o1 کے مقابلے میں کارکردگی دکھاتا ہے۔ یہ ماڈل ریاضی، کوڈنگ اور ملٹی موڈل استدلال میں اپنی صلاحیتوں کے لیے نمایاں ہے۔ کیمی کے 1.5 شارٹ ویرینٹ نے جی پی ٹی-4o اور کلاڈ 3.5 سونیٹ کو 550% سے زیادہ سے پیچھے چھوڑ دیا ہے۔ مون شاٹ اے آئی نے اپنی تکنیکی رپورٹ شائع کی ہے، جو مصنوعی عمومی ذہانت کی جانب ایک اجتماعی کوشش کی نشاندہی کرتی ہے۔

کیمی کے 1.5 ماڈل نے اوپن اے آئی کے o1 ماڈل کو ٹکر دی

اوپن اے آئی ڈاکٹر کی سطح کے سپر اے آئی ایجنٹ کو جاری کرنے کے لیے تیار

اوپن اے آئی کے شریک بانی اور سی ای او سیم آلٹمین 30 جنوری کو امریکی حکومتی عہدیداروں کو ڈاکٹر کی سطح کے سپر اے آئی ایجنٹ پر بریفنگ دینے والے ہیں۔ اس پیش رفت نے اوپن اے آئی کے ملازمین میں جوش و خروش اور بے چینی دونوں کو جنم دیا ہے، کیونکہ یہ جدید اے آئی ایجنٹ ممکنہ طور پر درمیانی سطح کے سافٹ ویئر انجینئرز کی جگہ لینے کے لیے تیار ہے۔ میٹا، فیس بک کی پیرنٹ کمپنی، نے اپنے افرادی قوت میں تقریباً 5 فیصد کمی کرنے کا منصوبہ بنایا ہے۔ سیلز فورس نے بھی سافٹ ویئر انجینئرنگ میں نئی ​​بھرتیوں کو روکنے کا منصوبہ بنایا ہے۔ سپر اے آئی ایجنٹ پیچیدہ، کثیر سطحی حقیقی دنیا کے مسائل سے نمٹنے کے لیے بنائے گئے ہیں۔ یہ ایجنٹ خود مختار طور پر اہداف طے کر سکتے ہیں اور ان کا تعاقب کر سکتے ہیں۔

اوپن اے آئی ڈاکٹر کی سطح کے سپر اے آئی ایجنٹ کو جاری کرنے کے لیے تیار

اوپن اے آئی کی جانب سے 20 منٹ میں ریئل ٹائم اے آئی ایجنٹ

آرٹیفیشل انٹیلیجنس جنریٹڈ کنٹینٹ (AIGC) کی فیلڈ تیزی سے ترقی کر رہی ہے۔ اس مضمون میں مائیکروسافٹ اور اوپن اے آئی، بیدو کے ارنی بوٹ اور آئی فلائیٹیک کے سپارک جیسے بڑے لینگویج ماڈلز (LLM) کی ترقی اور نفاذ پر توجہ دی گئی ہے۔ یہ مضمون ایک اہم پیش رفت کو اجاگر کرتا ہے: اوپن اے آئی کی جانب سے ایک ریئل ٹائم اے آئی ایجنٹ کا اجراء جسے صرف 20 منٹ میں تیار کیا جا سکتا ہے۔ یہ پیش رفت اے آئی سے چلنے والی ایپلیکیشنز کے دائرے میں اعلیٰ کارکردگی کی ترقی کے امکان کو ظاہر کرتی ہے۔

اوپن اے آئی کی جانب سے 20 منٹ میں ریئل ٹائم اے آئی ایجنٹ

ڈیفیوژن ماڈل انفرنس اسکیلنگ نیا پیراڈائم

یہ تحقیق ڈیفیوژن ماڈلز میں انفرنس ٹائم اسکیلنگ کے تصور کو تلاش کرتی ہے، جس میں انفرینس کے دوران کمپیوٹیشنل وسائل میں اضافہ کرکے نمونوں کے معیار کو بہتر بنایا جاتا ہے۔ ایک عمومی سرچ فریم ورک کے ذریعے، محققین نے پایا کہ بہتر نمونہ سازی کے لیے شور کی تلاش کلیدی حیثیت رکھتی ہے۔ یہ فریم ورک دو اہم ڈیزائن محوروں پر مرکوز ہے: تصدیق کنندگان (جو نمونوں کا جائزہ لیتے ہیں) اور الگورتھم (جو بہتر شور کے امیدوار تلاش کرتے ہیں)۔ نتائج سے پتہ چلتا ہے کہ یہ طریقہ کار نہ صرف امیج نیٹ جیسے بنیادی سیٹ اپ میں موثر ہے، بلکہ بڑے پیمانے پر ٹیکسٹ ٹو امیج ٹاسک میں بھی کارآمد ہے، جو مختلف ایپلی کیشنز کے لیے لچک فراہم کرتا ہے۔

ڈیفیوژن ماڈل انفرنس اسکیلنگ نیا پیراڈائم

اوپن اے آئی کا o3-Mini ماڈل جلد متوقع ہے

اوپن اے آئی کا o3-Mini ماڈل جلد متوقع ہے۔ یہ ماڈل API اور ویب انٹرفیس دونوں کے ذریعے دستیاب ہوگا۔ اس ماڈل کی تین قسمیں جاری کی جائیں گی: ہائی، میڈیم اور لو۔ اس ماڈل کی رفتار زیادہ ہوگی لیکن کارکردگی O1-Pro سے کم ہوگی۔ اوپن اے آئی کے سی ای او سیم آلٹمین نے AGI کے بارے میں بھی بات کی، جس کے لیے 872 میگاواٹ بجلی کی ضرورت ہوگی۔

اوپن اے آئی کا o3-Mini ماڈل جلد متوقع ہے

بڑے لسانی ماڈلز میں میموری کی رکاوٹ کو کم کرنے کے لیے ملٹی میٹرکس فیکٹرائزیشن توجہ

بڑے لسانی ماڈلز (LLMs) میں موثر پیمانے پر استدلال ایک اہم چیلنج ہے۔ روایتی توجہ کے طریقہ کار میں کلیدی قدر (KV) کیش ایک بڑی رکاوٹ ہے، جو بیچ سائز اور ترتیب کی لمبائی کے ساتھ خطی طور پر بڑھتی ہے۔ ملٹی میٹرکس فیکٹرائزیشن اٹینشن (MFA) اور MFA-Key-Reuse (MFA-KR) ایک نیا طریقہ کار ہے جو کارکردگی کو بہتر بناتے ہوئے KV کیش کے استعمال کو 93.7 فیصد تک کم کرتا ہے۔ MFA ڈیزائن میں سادگی، آسانی سے دوبارہ پیدا کرنے کی صلاحیت، کم حساسیت اور مختلف پوزیشن ایمبیڈنگ طریقوں کے ساتھ مطابقت رکھتا ہے۔ یہ طریقہ کار ماڈل کی صلاحیت کو زیادہ سے زیادہ کرنے، پیرامیٹر کی کارکردگی کو برقرار رکھنے، اور میموری کے استعمال کو کم سے کم کرنے کے لیے ڈیزائن کیا گیا ہے۔ تجرباتی نتائج سے پتہ چلتا ہے کہ MFA روایتی MHA کے مقابلے میں بڑے پیمانے پر صلاحیتوں کو برقرار رکھتا ہے، جبکہ MFA-KR میموری کے استعمال کو نمایاں طور پر کم کرتا ہے۔

بڑے لسانی ماڈلز میں میموری کی رکاوٹ کو کم کرنے کے لیے ملٹی میٹرکس فیکٹرائزیشن توجہ

ای ایس ایم3 پروٹین ریسرچ میں ایک چھلانگ

ایوولوشنری اسکیل کا ESM3 ایک انقلابی حیاتیاتی ماڈل ہے جس میں 98 بلین پیرامیٹرز ہیں جو اسے دنیا کا سب سے بڑا ماڈل بناتا ہے۔ یہ ماڈل پروٹین کو سمجھنے اور ان میں ترمیم کرنے کے طریقے میں ایک اہم پیش رفت کی نمائندگی کرتا ہے۔ ESM3 پروٹین کے تین جہتی ڈھانچے اور فنکشن کو ایک مجرد حروف تہجی میں تبدیل کرتا ہے۔ یہ اختراعی طریقہ ہر 3D ڈھانچے کو حروف کی ترتیب کے طور پر پیش کرنے کی اجازت دیتا ہے۔ نتیجتاً، ESM3 ایک پروٹین کی ترتیب، ساخت اور فنکشن پر بیک وقت کارروائی کر سکتا ہے، جوہری سطح کی تفصیلات کو اعلیٰ سطحی ہدایات کے ساتھ جوڑ کر مکمل طور پر نئے پروٹین تیار کرنے کے پیچیدہ اشارے کا جواب دیتا ہے۔ متاثر کن طور پر، ESM3 کی ارتقاء کی نقالی قدرتی ارتقاء کے 5 ٹریلین سالوں کے برابر ہے۔ حال ہی میں، ایوولوشنری اسکیل نے دنیا بھر کے سائنسدانوں کے لیے پروٹین کی پیشن گوئی کو تیز کرنے کے مقصد سے ESM3 API کی مفت دستیابی کا اعلان کیا۔ اس اقدام کا خیرمقدم ٹورنگ ایوارڈ یافتہ اور میٹا کے چیف سائنسدان یان لیکون نے کیا، جنہوں نے ایوولوشنری اسکیل کی کامیابی کو 'ایک بہت اچھی چیز' قرار دیا۔ ESM3 صرف ایک ماڈل سے زیادہ ہے۔ یہ ایٹمی سطح پر پروٹین کو سمجھنے اور تیار کرنے میں ایک پیش رفت ہے، جس سے طبی میدان پر گہرا اثر پڑنے کا وعدہ کیا گیا ہے۔

ای ایس ایم3 پروٹین ریسرچ میں ایک چھلانگ

مائیکروسافٹ کا میٹریل ڈیزائن بریک تھرو اے آئی ماڈل ایکوریسی میں 10 گنا اضافہ

مائیکروسافٹ نے MatterGen متعارف کرایا ہے، جو غیر نامیاتی مواد کی تخلیق کے لیے ایک انقلابی AI ماڈل ہے۔ یہ ماڈل ایٹم کی اقسام، کوآرڈینیٹس اور پیریوڈک جالیوں کو بہتر بناتا ہے۔ یہ بیٹری کی کارکردگی کو بہتر بنا سکتا ہے اور AGI کی طرف ایک قدم ہے۔

مائیکروسافٹ کا میٹریل ڈیزائن بریک تھرو اے آئی ماڈل ایکوریسی میں 10 گنا اضافہ

سٹینفورڈ اور یو سی برکلے کی جانب سے چیٹ جی پی ٹی کی کارکردگی پر تحقیق

سٹینفورڈ اور یو سی برکلے کے محققین کی جانب سے کی جانے والی ایک حالیہ تحقیق میں جی پی ٹی 3.5 اور جی پی ٹی 4 کی کارکردگی میں تین مہینوں کے دوران نمایاں اتار چڑھاؤ دیکھنے میں آیا ہے۔ تحقیق سے پتہ چلتا ہے کہ ان ماڈلز کی ریاضی کے مسائل حل کرنے، کوڈ جنریشن، اور دیگر شعبوں میں کارکردگی میں تبدیلی آئی ہے۔

سٹینفورڈ اور یو سی برکلے کی جانب سے چیٹ جی پی ٹی کی کارکردگی پر تحقیق