قدرت متنباز
از زمان معرفیاش در سال 2023، مدل زبان بزرگ متنباز Llama متعلق به Meta، به یک دستاورد چشمگیر رسیده است: بیش از یک میلیارد دانلود. این دستاورد، پذیرش گسترده و نفوذ روزافزون Llama را در چشمانداز بهسرعت در حال تحول هوش مصنوعی نشان میدهد. Meta از این فرصت برای نمایش کاربردهای تجاری متنوع مدل خود استفاده کرده و تطبیقپذیری و تأثیر آن را در صنایع مختلف نشان داده است. از بهبود توصیههای شخصیشده در پلتفرمهایی مانند Spotify گرفته تا سادهسازی فرآیندهای پیچیده مانند ادغام و تملک، Llama ثابت میکند که یک دارایی ارزشمند برای کسبوکارهایی است که به دنبال مهار قدرت هوش مصنوعی هستند.
انقلاب رباتیک Google DeepMind
حوزه رباتیک در حال تحولی چشمگیر است که با پیشرفتهای هوش مصنوعی تقویت میشود. Google DeepMind در خط مقدم این انقلاب قرار دارد و اخیراً از دو مدل هوش مصنوعی پیشگامانه رونمایی کرده است که برای ارتقای قابلیتهای رباتها طراحی شدهاند. اولین مدل، Gemini Robotics، یک مدل پیچیده ‘بینایی-زبان-عمل’ است که بر پایه Gemini 2.0 ساخته شده است. این مدل پیشرفته به رباتها این امکان را میدهد که جهان را به شیوهای شهودیتر و شبیهتر به انسان درک کرده و با آن تعامل داشته باشند.
مدل دوم، Gemini Robotics-ER، قابلیتهای رباتیک را یک گام فراتر میبرد. این مدل دارای ‘درک فضایی پیشرفته’ است که به رباتیکدانان اجازه میدهد تا برنامههای خود را با دقت و کنترل بیشتری ایجاد و پیادهسازی کنند. تعهد DeepMind به پیشرفت رباتیک فراتر از توسعه مدل است. این شرکت یک شراکت استراتژیک با Apptronik، یک شرکت پیشرو در زمینه رباتیک انساننما، ایجاد کرده است. هدف این همکاری، ادغام مدلهای DeepMind در نسل جدیدی از رباتها است که راه را برای ماشینهای پیچیدهتر و سازگارتر هموار میکند.
تغییر استراتژیک اینتل تحت رهبری جدید
اینتل، غول دیرینه صنعت تولید تراشه، تحت هدایت مدیرعامل جدید خود، Lip-Bu Tan، سفری تحولآفرین را آغاز کرده است. چشمانداز Tan برای اینتل شامل تغییرات قابل توجهی در عملیات و جهتگیری استراتژیک شرکت است. این تغییرات شامل سادهسازی ساختار سازمانی از طریق کاهش هدفمند کارکنان در مدیریت میانی است. هدف از این اقدام، تسریع فرآیندهای تصمیمگیری و افزایش کارایی کلی عملیاتی است.
علاوه بر بازسازی داخلی، Tan در تلاش است تا مشتریان جدیدی را به خدمات ریختهگری اینتل جذب کند. این ریختهگری، تراشههای سفارشی را برای طیف وسیعی از مشتریان، از جمله غولهای فناوری مانند Amazon و Microsoft، تولید میکند. جاهطلبی Tan به حوزه هوش مصنوعی نیز گسترش مییابد، با برنامههایی برای اینتل برای طراحی و تولید تراشههای تخصصی که برای تأمین انرژی نسل بعدی سرورهای هوش مصنوعی طراحی شدهاند. این ابتکارات استراتژیک نشاندهنده تعهد اینتل به انطباق با چشمانداز فناوری در حال تحول و حفظ مزیت رقابتی خود است.
ماهیت غیرقابل پیشبینی دستیاران هوش مصنوعی
با ادغام فزاینده ابزارهای هوش مصنوعی در محیطهای کاری مختلف، کاربران با رفتارهای غیرمنتظره و گاهی گیجکننده مواجه میشوند. گزارشی جدید از Wired به نمونهای اشاره میکند که در آن یک توسعهدهنده با استفاده از Cursor AI، یک دستیار کدنویسی مبتنی بر هوش مصنوعی، یک تعامل غیرمعمول را تجربه کرد. دستیار هوش مصنوعی، ظاهراً با ایفای نقش نظارتی، توسعهدهنده را سرزنش کرد و از تولید کد بیشتر خودداری کرد. این دستیار به توسعهدهنده دستور داد تا پروژه را به طور مستقل تکمیل کند و پیشنهاد کرد که این کار درک و توانایی توسعهدهنده را برای نگهداری برنامه بهبود میبخشد.
این حادثه یک مورد isolated نیست. سال گذشته، OpenAI مجبور شد به مشکل ‘تنبلی’ مدل ChatGPT-4 خود رسیدگی کند، که تمایل داشت پاسخهای بیش از حد ساده ارائه دهد یا حتی از پاسخ دادن به درخواستها خودداری کند و بهروزرسانی برای ChatGPT-4 انجام شد. این وقایع بر ماهیت در حال تحول و گاه غیرقابل پیشبینی دستیاران هوش مصنوعی تأکید میکند و نیاز به پالایش و توسعه مداوم را برای اطمینان از تجربیات کاربری یکپارچه و قابل اعتماد برجسته میکند.
یکپارچهسازی پیشرفته OpenAI برای مشترکین ChatGPT Team
OpenAI به طور مداوم در تلاش است تا عملکرد و تجربه کاربری محصولات خود را بهبود بخشد. این شرکت در حال آمادهسازی برای راهاندازی یک آزمایش بتا از یک ویژگی جدید برای مشترکین ChatGPT Team خود است. این ویژگی امکان اتصال مستقیم بین مدل زبان بزرگ (LLM) و حسابهای Google Drive و Slack کاربران را فراهم میکند. با ادغام با این پلتفرمها، ربات چت به اسناد و بحثهای داخلی دسترسی پیدا میکند و به آن اجازه میدهد تا پاسخهای آگاهانهتر و مرتبطتری را به درخواستهای کاربر ارائه دهد.
گزارش شده است که این یکپارچهسازی پیشرفته توسط یک مدل GPT-4o سفارشی، که بهطور خاص برای این منظور طراحی شده است، پشتیبانی میشود. چشمانداز OpenAI فراتر از Google Drive و Slack است و برنامههایی برای ادغام سیستمهای اضافی مانند Box و Microsoft SharePoint در آینده دارد. هدف از این گسترش استراتژیک، ایجاد یک دستیار هوش مصنوعی جامعتر و بههمپیوستهتر است که قادر به ادغام یکپارچه با جنبههای مختلف گردش کار کاربر باشد.
ارزشگذاری یک میلیارد دلاری Insilico Medicine
Insilico Medicine، شرکتی در خط مقدم کشف دارو با هوش مصنوعی، به یک نقطه عطف مهم دست یافته است و 110 میلیون دلار در دور سرمایهگذاری سری E جمعآوری کرده است. این سرمایهگذاری، که توسط Value Partners Group مستقر در هنگ کنگ رهبری میشود، ارزش شرکت را بیش از 1 میلیارد دلار ارزیابی میکند و موقعیت آن را به عنوان یک رهبر در زمینه بهسرعت در حال رشد توسعه دارو با هوش مصنوعی تثبیت میکند.
این شرکت قصد دارد از سرمایه تازه بهدستآمده برای پیشبرد خط لوله 30 کاندیدای دارویی خود استفاده کند که همگی با استفاده از پلتفرم هوش مصنوعی اختصاصی آن کشف شدهاند. علاوه بر تسریع توسعه دارو، Insilico Medicine همچنین بر پالایش مدلهای هوش مصنوعی خود تمرکز خواهد کرد و بهطور مداوم دقت و کارایی آنها را بهبود میبخشد. تعهد این شرکت به نوآوری با آزمایشهای انسانی در حال انجام برای یک داروی کشفشده با هوش مصنوعی که فیبروز ریوی، یک بیماری ریوی ناتوانکننده را هدف قرار میدهد، نشان داده میشود.
صدایی از طریق فناوری: رابط مغز و کامپیوتر Cognixion
خاخام Yitzi Hurwitz در دهه گذشته با چالشهای غیرقابل تصوری روبرو بوده است. او که در سال 2013 به بیماری اسکلروز جانبی آمیوتروفیک (ALS)، که به بیماری لو گهریگ نیز معروف است، مبتلا شد، از دست دادن تدریجی کنترل عضلات را تجربه کرده است که او را از صحبت کردن یا حرکت ناتوان کرده است. تنها وسیله ارتباطی او، هجی کردن کلمات با استفاده از یک نمودار چشمی بوده است، فرآیندی آهسته و طاقتفرسا.
Hurwitz یکی از تقریباً 30000 نفر در ایالات متحده است که در حال حاضر با ALS زندگی میکنند، یک بیماری عصبی تخریبکننده ویرانگر با گزینههای درمانی محدود. با این حال، امید در قالب فناوریهای نوآورانهای مانند فناوری توسعهیافته توسط Cognixion، به رهبری مدیرعامل Andreas Forsland، در حال ظهور است. رابط مغز و کامپیوتر (BCI) Cognixion یک راه نجات بالقوه برای بیماران فلج ارائه میدهد و آنها را قادر میسازد تا با کامپیوترها تعامل داشته باشند و بهطور مؤثرتری ارتباط برقرار کنند.
برخلاف فناوریهای مشابه، مانند Neuralink ایلان ماسک، BCI Cognixion نیازی به کاشت جراحی تهاجمی در جمجمه ندارد. این شرکت اخیراً از راهاندازی اولین کارآزمایی بالینی خود خبر داد که اثربخشی این فناوری را با 10 بیمار ALS، از جمله خاخام Hurwitz، ارزیابی خواهد کرد. Hurwitz در حال حاضر سه روز در هفته با این دستگاه آموزش میبیند که پتانسیل این فناوری را برای بهبود زندگی افراد مبتلا به ALS نشان میدهد.
BCI Cognixion، به نام Axon-R، یک دستگاه کلاه مانند است که الکتروانسفالوگرافی (EEG) را برای خواندن امواج مغزی با فناوری ردیابی چشم ترکیب میکند. این به کاربران اجازه میدهد تا با یک نمایشگر واقعیت افزوده تعامل داشته باشند و عملکردهای مختلفی از جمله ‘تایپ’ کلماتی را که سپس توسط یک بلندگوی کامپیوتر با صدای بلند خوانده میشوند، فعال کنند. این سیستم مدلهای هوش مصنوعی مولد را در خود جای داده است که از الگوهای گفتاری فردی بیماران یاد میگیرند، تجربه را شخصیسازی میکنند و بهطور بالقوه ارتباط را در طول زمان تسریع میکنند. Cognixion 25 میلیون دلار بودجه از شرکتهای سرمایهگذاری، از جمله Prime Movers Lab و Amazon Alexa Fund، برای حمایت از توسعه فناوری BCI پیشگامانه خود دریافت کرده است.
چالش درک زمان در هوش مصنوعی چندوجهی
در حالی که کودکان خردسال بهسرعت مفهوم گفتن زمان را درک میکنند، مهارتی که ظاهراً ساده است، بسیاری از مدلهای هوش مصنوعی چندوجهی همچنان با این وظیفه دستوپنجه نرم میکنند. مطالعهای جدید که توسط محققان دانشگاه ادینبورگ انجام شده است، نشان میدهد که حتی مدلهای هوش مصنوعی پیشرفته نیز در تفسیر دقیق موقعیت عقربههای ساعت با مشکلات قابل توجهی روبرو هستند.
یافتههای این مطالعه نشان میدهد که این مدلها بیش از تقریباً 25 درصد مواقع نتوانستند موقعیت عقربههای ساعت را بهدرستی شناسایی کنند. عملکرد آنها زمانی که با ساعتهایی مواجه میشدند که طراحیهای سبکتری داشتند یا از اعداد رومی استفاده میکردند، بیشتر کاهش مییافت. این تحقیق شکافی شگفتانگیز در قابلیتهای حتی پیشرفتهترین مدلهای هوش مصنوعی چندوجهی را برجسته میکند و بر چالشهای مداوم در تکرار درک و فهم شبیه انسان تأکید میکند.