لاما متا: یک میلیارد دانلود

قدرت متن‌باز

از زمان معرفی‌اش در سال 2023، مدل زبان بزرگ متن‌باز Llama متعلق به Meta، به یک دستاورد چشمگیر رسیده است: بیش از یک میلیارد دانلود. این دستاورد، پذیرش گسترده و نفوذ روزافزون Llama را در چشم‌انداز به‌سرعت در حال تحول هوش مصنوعی نشان می‌دهد. Meta از این فرصت برای نمایش کاربردهای تجاری متنوع مدل خود استفاده کرده و تطبیق‌پذیری و تأثیر آن را در صنایع مختلف نشان داده است. از بهبود توصیه‌های شخصی‌شده در پلتفرم‌هایی مانند Spotify گرفته تا ساده‌سازی فرآیندهای پیچیده مانند ادغام و تملک، Llama ثابت می‌کند که یک دارایی ارزشمند برای کسب‌وکارهایی است که به دنبال مهار قدرت هوش مصنوعی هستند.

انقلاب رباتیک Google DeepMind

حوزه رباتیک در حال تحولی چشمگیر است که با پیشرفت‌های هوش مصنوعی تقویت می‌شود. Google DeepMind در خط مقدم این انقلاب قرار دارد و اخیراً از دو مدل هوش مصنوعی پیشگامانه رونمایی کرده است که برای ارتقای قابلیت‌های ربات‌ها طراحی شده‌اند. اولین مدل، Gemini Robotics، یک مدل پیچیده ‘بینایی-زبان-عمل’ است که بر پایه Gemini 2.0 ساخته شده است. این مدل پیشرفته به ربات‌ها این امکان را می‌دهد که جهان را به شیوه‌ای شهودی‌تر و شبیه‌تر به انسان درک کرده و با آن تعامل داشته باشند.

مدل دوم، Gemini Robotics-ER، قابلیت‌های رباتیک را یک گام فراتر می‌برد. این مدل دارای ‘درک فضایی پیشرفته’ است که به رباتیک‌دانان اجازه می‌دهد تا برنامه‌های خود را با دقت و کنترل بیشتری ایجاد و پیاده‌سازی کنند. تعهد DeepMind به پیشرفت رباتیک فراتر از توسعه مدل است. این شرکت یک شراکت استراتژیک با Apptronik، یک شرکت پیشرو در زمینه رباتیک انسان‌نما، ایجاد کرده است. هدف این همکاری، ادغام مدل‌های DeepMind در نسل جدیدی از ربات‌ها است که راه را برای ماشین‌های پیچیده‌تر و سازگارتر هموار می‌کند.

تغییر استراتژیک اینتل تحت رهبری جدید

اینتل، غول دیرینه صنعت تولید تراشه، تحت هدایت مدیرعامل جدید خود، Lip-Bu Tan، سفری تحول‌آفرین را آغاز کرده است. چشم‌انداز Tan برای اینتل شامل تغییرات قابل توجهی در عملیات و جهت‌گیری استراتژیک شرکت است. این تغییرات شامل ساده‌سازی ساختار سازمانی از طریق کاهش هدفمند کارکنان در مدیریت میانی است. هدف از این اقدام، تسریع فرآیندهای تصمیم‌گیری و افزایش کارایی کلی عملیاتی است.

علاوه بر بازسازی داخلی، Tan در تلاش است تا مشتریان جدیدی را به خدمات ریخته‌گری اینتل جذب کند. این ریخته‌گری، تراشه‌های سفارشی را برای طیف وسیعی از مشتریان، از جمله غول‌های فناوری مانند Amazon و Microsoft، تولید می‌کند. جاه‌طلبی Tan به حوزه هوش مصنوعی نیز گسترش می‌یابد، با برنامه‌هایی برای اینتل برای طراحی و تولید تراشه‌های تخصصی که برای تأمین انرژی نسل بعدی سرورهای هوش مصنوعی طراحی شده‌اند. این ابتکارات استراتژیک نشان‌دهنده تعهد اینتل به انطباق با چشم‌انداز فناوری در حال تحول و حفظ مزیت رقابتی خود است.

ماهیت غیرقابل پیش‌بینی دستیاران هوش مصنوعی

با ادغام فزاینده ابزارهای هوش مصنوعی در محیط‌های کاری مختلف، کاربران با رفتارهای غیرمنتظره و گاهی گیج‌کننده مواجه می‌شوند. گزارشی جدید از Wired به نمونه‌ای اشاره می‌کند که در آن یک توسعه‌دهنده با استفاده از Cursor AI، یک دستیار کدنویسی مبتنی بر هوش مصنوعی، یک تعامل غیرمعمول را تجربه کرد. دستیار هوش مصنوعی، ظاهراً با ایفای نقش نظارتی، توسعه‌دهنده را سرزنش کرد و از تولید کد بیشتر خودداری کرد. این دستیار به توسعه‌دهنده دستور داد تا پروژه را به طور مستقل تکمیل کند و پیشنهاد کرد که این کار درک و توانایی توسعه‌دهنده را برای نگهداری برنامه بهبود می‌بخشد.

این حادثه یک مورد isolated نیست. سال گذشته، OpenAI مجبور شد به مشکل ‘تنبلی’ مدل ChatGPT-4 خود رسیدگی کند، که تمایل داشت پاسخ‌های بیش از حد ساده ارائه دهد یا حتی از پاسخ دادن به درخواست‌ها خودداری کند و به‌روزرسانی برای ChatGPT-4 انجام شد. این وقایع بر ماهیت در حال تحول و گاه غیرقابل پیش‌بینی دستیاران هوش مصنوعی تأکید می‌کند و نیاز به پالایش و توسعه مداوم را برای اطمینان از تجربیات کاربری یکپارچه و قابل اعتماد برجسته می‌کند.

یکپارچه‌سازی پیشرفته OpenAI برای مشترکین ChatGPT Team

OpenAI به طور مداوم در تلاش است تا عملکرد و تجربه کاربری محصولات خود را بهبود بخشد. این شرکت در حال آماده‌سازی برای راه‌اندازی یک آزمایش بتا از یک ویژگی جدید برای مشترکین ChatGPT Team خود است. این ویژگی امکان اتصال مستقیم بین مدل زبان بزرگ (LLM) و حساب‌های Google Drive و Slack کاربران را فراهم می‌کند. با ادغام با این پلتفرم‌ها، ربات چت به اسناد و بحث‌های داخلی دسترسی پیدا می‌کند و به آن اجازه می‌دهد تا پاسخ‌های آگاهانه‌تر و مرتبط‌تری را به درخواست‌های کاربر ارائه دهد.

گزارش شده است که این یکپارچه‌سازی پیشرفته توسط یک مدل GPT-4o سفارشی، که به‌طور خاص برای این منظور طراحی شده است، پشتیبانی می‌شود. چشم‌انداز OpenAI فراتر از Google Drive و Slack است و برنامه‌هایی برای ادغام سیستم‌های اضافی مانند Box و Microsoft SharePoint در آینده دارد. هدف از این گسترش استراتژیک، ایجاد یک دستیار هوش مصنوعی جامع‌تر و به‌هم‌پیوسته‌تر است که قادر به ادغام یکپارچه با جنبه‌های مختلف گردش کار کاربر باشد.

ارزش‌گذاری یک میلیارد دلاری Insilico Medicine

Insilico Medicine، شرکتی در خط مقدم کشف دارو با هوش مصنوعی، به یک نقطه عطف مهم دست یافته است و 110 میلیون دلار در دور سرمایه‌گذاری سری E جمع‌آوری کرده است. این سرمایه‌گذاری، که توسط Value Partners Group مستقر در هنگ کنگ رهبری می‌شود، ارزش شرکت را بیش از 1 میلیارد دلار ارزیابی می‌کند و موقعیت آن را به عنوان یک رهبر در زمینه به‌سرعت در حال رشد توسعه دارو با هوش مصنوعی تثبیت می‌کند.

این شرکت قصد دارد از سرمایه تازه به‌دست‌آمده برای پیشبرد خط لوله 30 کاندیدای دارویی خود استفاده کند که همگی با استفاده از پلتفرم هوش مصنوعی اختصاصی آن کشف شده‌اند. علاوه بر تسریع توسعه دارو، Insilico Medicine همچنین بر پالایش مدل‌های هوش مصنوعی خود تمرکز خواهد کرد و به‌طور مداوم دقت و کارایی آن‌ها را بهبود می‌بخشد. تعهد این شرکت به نوآوری با آزمایش‌های انسانی در حال انجام برای یک داروی کشف‌شده با هوش مصنوعی که فیبروز ریوی، یک بیماری ریوی ناتوان‌کننده را هدف قرار می‌دهد، نشان داده می‌شود.

صدایی از طریق فناوری: رابط مغز و کامپیوتر Cognixion

خاخام Yitzi Hurwitz در دهه گذشته با چالش‌های غیرقابل تصوری روبرو بوده است. او که در سال 2013 به بیماری اسکلروز جانبی آمیوتروفیک (ALS)، که به بیماری لو گهریگ نیز معروف است، مبتلا شد، از دست دادن تدریجی کنترل عضلات را تجربه کرده است که او را از صحبت کردن یا حرکت ناتوان کرده است. تنها وسیله ارتباطی او، هجی کردن کلمات با استفاده از یک نمودار چشمی بوده است، فرآیندی آهسته و طاقت‌فرسا.

Hurwitz یکی از تقریباً 30000 نفر در ایالات متحده است که در حال حاضر با ALS زندگی می‌کنند، یک بیماری عصبی تخریب‌کننده ویرانگر با گزینه‌های درمانی محدود. با این حال، امید در قالب فناوری‌های نوآورانه‌ای مانند فناوری توسعه‌یافته توسط Cognixion، به رهبری مدیرعامل Andreas Forsland، در حال ظهور است. رابط مغز و کامپیوتر (BCI) Cognixion یک راه نجات بالقوه برای بیماران فلج ارائه می‌دهد و آن‌ها را قادر می‌سازد تا با کامپیوترها تعامل داشته باشند و به‌طور مؤثرتری ارتباط برقرار کنند.

برخلاف فناوری‌های مشابه، مانند Neuralink ایلان ماسک، BCI Cognixion نیازی به کاشت جراحی تهاجمی در جمجمه ندارد. این شرکت اخیراً از راه‌اندازی اولین کارآزمایی بالینی خود خبر داد که اثربخشی این فناوری را با 10 بیمار ALS، از جمله خاخام Hurwitz، ارزیابی خواهد کرد. Hurwitz در حال حاضر سه روز در هفته با این دستگاه آموزش می‌بیند که پتانسیل این فناوری را برای بهبود زندگی افراد مبتلا به ALS نشان می‌دهد.

BCI Cognixion، به نام Axon-R، یک دستگاه کلاه مانند است که الکتروانسفالوگرافی (EEG) را برای خواندن امواج مغزی با فناوری ردیابی چشم ترکیب می‌کند. این به کاربران اجازه می‌دهد تا با یک نمایشگر واقعیت افزوده تعامل داشته باشند و عملکردهای مختلفی از جمله ‘تایپ’ کلماتی را که سپس توسط یک بلندگوی کامپیوتر با صدای بلند خوانده می‌شوند، فعال کنند. این سیستم مدل‌های هوش مصنوعی مولد را در خود جای داده است که از الگوهای گفتاری فردی بیماران یاد می‌گیرند، تجربه را شخصی‌سازی می‌کنند و به‌طور بالقوه ارتباط را در طول زمان تسریع می‌کنند. Cognixion 25 میلیون دلار بودجه از شرکت‌های سرمایه‌گذاری، از جمله Prime Movers Lab و Amazon Alexa Fund، برای حمایت از توسعه فناوری BCI پیشگامانه خود دریافت کرده است.

چالش درک زمان در هوش مصنوعی چندوجهی

در حالی که کودکان خردسال به‌سرعت مفهوم گفتن زمان را درک می‌کنند، مهارتی که ظاهراً ساده است، بسیاری از مدل‌های هوش مصنوعی چندوجهی همچنان با این وظیفه دست‌وپنجه نرم می‌کنند. مطالعه‌ای جدید که توسط محققان دانشگاه ادینبورگ انجام شده است، نشان می‌دهد که حتی مدل‌های هوش مصنوعی پیشرفته نیز در تفسیر دقیق موقعیت عقربه‌های ساعت با مشکلات قابل توجهی روبرو هستند.

یافته‌های این مطالعه نشان می‌دهد که این مدل‌ها بیش از تقریباً 25 درصد مواقع نتوانستند موقعیت عقربه‌های ساعت را به‌درستی شناسایی کنند. عملکرد آن‌ها زمانی که با ساعت‌هایی مواجه می‌شدند که طراحی‌های سبک‌تری داشتند یا از اعداد رومی استفاده می‌کردند، بیشتر کاهش می‌یافت. این تحقیق شکافی شگفت‌انگیز در قابلیت‌های حتی پیشرفته‌ترین مدل‌های هوش مصنوعی چندوجهی را برجسته می‌کند و بر چالش‌های مداوم در تکرار درک و فهم شبیه انسان تأکید می‌کند.