پیشروی بیوقفه هوش مصنوعی ادامه دارد و از پاسخهای ساده به پرسشها و تولید محتوا فراتر رفته و وارد قلمرو مشارکت فعال در زندگی دیجیتال ما میشود. به نظر میرسد هر هفته رقیب جدیدی ظهور میکند، الگوریتمی پیشرفته که وعده سادهسازی وظایف، افزایش بهرهوری یا صرفاً آسانتر کردن پیمایش پیچیدگیهای دنیای آنلاین را میدهد. Amazon، شرکتی که جاهطلبیهایش همیشه بسیار فراتر از خردهفروشی آنلاین بوده، قاطعانه وارد این عرصه در حال تحول شده است. جدیدترین محصول آنها، که Nova Act نامگذاری شده، گامی مهم به سوی آیندهای است که در آن عوامل هوش مصنوعی نه تنها به انسانها کمک میکنند، بلکه فعالانه وظایفی را به نمایندگی از آنها، مستقیماً در محیط آشنای مرورگر وب، انجام میدهند.
این صرفاً یک چتبات دیگر با قابلیت مکالمه نیست. Amazon، Nova Act را به عنوان یک مدل هوش مصنوعی پیچیده و نسل بعدی معرفی میکند که با درجهای از آزادی عملیاتی طراحی شده که به ندرت در برنامههای کاربردی رو به مصرفکننده دیده میشود. وعده اصلی چیست؟ عاملی که قادر به عمل نیمهخودکار، درک هدف کاربر و اجرای فرآیندهای چند مرحلهای آنلاین با نظارت بالقوه حداقلی انسان است. این تغییر از دستیار منفعل به مشارکتکننده فعال، لحظهای محوری در توسعه و استقرار فناوریهای هوش مصنوعی محسوب میشود.
تعریف کمکخلبان دیجیتال: قابلیتهای Nova Act
آنچه واقعاً Nova Act را متمایز میکند، توانایی ادعایی آن در به دست گرفتن کنترل مرورگر وب و انجام اقداماتی است که به طور سنتی نیازمند ورودی مستقیم انسان هستند. دستیاری را تصور کنید که نه تنها اطلاعات را پیدا میکند، بلکه بر اساس آن عمل میکند. Amazon اشاره کرده است که Nova Act دارای قابلیتهای بنیادی برای پیمایش وبسایتها، تفسیر محتوا و اجرای دستوراتی است که به نفع کاربر طراحی شدهاند. این شامل وظایفی میشود که دنیای دیجیتال و حتی بالقوه دنیای فیزیکی را با هم ترکیب میکنند و مرزهای بین بازیابی اطلاعات و اقدام در دنیای واقعی را کمرنگ میسازند.
شاید جالبتوجهترین ادعا، ظرفیت بالقوه این عامل برای انجام خرید بدون دخالت مستقیم انسان در هر مرحله باشد. در حالی که جزئیات و تدابیر امنیتی پیرامون این ویژگی در مراحل اولیه آن محرمانه باقی مانده است، پیامد آن عمیق است. یک هوش مصنوعی که گزینهها را ارزیابی میکند، انتخابها را انجام میدهد و تراکنشها را تکمیل میکند، جهشی به سوی استقلال واقعی دیجیتال است. فراتر از تجارت، Amazon سناریویی را نشان داد که در آن Nova Act میتوانست به طور مستقل اینترنت را جستجو کند، به طور خاص وظیفه یافتن آپارتمانهای موجود در Redwood City، California را داشت که معیارهای خاصی را برآورده میکردند، مانند قرار داشتن در فاصله دوچرخهسواری از ایستگاه قطار. این نشاندهنده توانایی درک درخواستهای پیچیده و چند لایه و تعامل با رابطهای وب برای برآورده کردن آنها است.
به نظر میرسد Amazon در حال ساختاربندی قابلیتهای Nova Act در سطوح مختلف است، که نشاندهنده یک پلتفرم همهکاره و سازگار با نیازهای مختلف است:
- تولید متن: در سه سطح متمایز ارائه میشود – Micro، Lite و Pro. این رویکرد لایهبندی شده احتمالاً منعکسکننده درجات مختلف پیچیدگی، سرعت یا شاید دسترسی به ویژگیهای پردازش زبان پیشرفتهتر است که نیازهای مختلف کاربران از قطعههای متنی ساده تا ایجاد محتوای پیچیدهتر را برآورده میکند.
- تولید تصویر: مدل Canvas برای تولید محتوای بصری تعیین شده است و از حوزه رو به رشد هوش مصنوعی مولد برای تصاویر بهره میبرد.
- تولید ویدئو: به طور مشابه، مدل Reel بر ایجاد محتوای ویدئویی تمرکز دارد و قابلیتهای چندرسانهای عامل را بیشتر گسترش میدهد.
درک این نکته حیاتی است که Nova Act در حال حاضر مراحل اولیه توسعه خود را طی میکند. Amazon صراحتاً بیان میکند که این عامل هنوز مقدماتی است اما بر ظرفیت آن برای بهبود در طول زمان از طریق یادگیری و اصلاح مداوم تأکید میکند. این فرآیند یادگیری حیاتی خواهد بود، به ویژه برای وظایفی که نیازمند درک دقیق و تعامل با چشمانداز همیشه در حال تغییر وبسایتها و خدمات آنلاین هستند.
دسترسی اولیه: مرحله پیشنمایش تحقیقاتی
در حال حاضر، Nova Act برای عموم عرضه نمیشود. در عوض، Amazon رویکرد محتاطانهتری را انتخاب کرده و این ابزار هوش مصنوعی را در آنچه ‘پیشنمایش تحقیقاتی’ مینامند، در دسترس قرار داده است. این مرحله به کاربران منتخب، که صراحتاً شامل فروشندگان، تبلیغکنندگان و خریداران در اکوسیستم Amazon میشوند، اجازه میدهد تا با این عامل تعامل داشته باشند و بازخورد ارزشمندی ارائه دهند. این استراتژی انتشار کنترلشده به Amazon امکان میدهد تا دادههای استفاده در دنیای واقعی را جمعآوری کند، مشکلات بالقوه را شناسایی کند، الگوریتمها را اصلاح کند و قبل از استقرار گستردهتر، درک بهتری از نحوه استفاده کاربران از چنین ابزار قدرتمندی به دست آورد.
در حال حاضر، به نظر میرسد دسترسی از نظر جغرافیایی محدود است. مشتریان علاقهمند Amazon واقع در United States میتوانند به nova.amazon.com
مراجعه کرده و برای کاوش در پلتفرم وارد شوند. با این حال، به نظر میرسد کاربران خارج از ایالات متحده در حال حاضر از این مرحله پیشنمایش اولیه مستثنی هستند. این عرضه مرحلهای برای فناوریهای بالقوه مخرب معمول است و امکان بهبودهای تکراری و بررسیهای انطباق منطقهای را فراهم میکند. بازخورد بهدستآمده از فروشندگان و تبلیغکنندگان بهویژه روشنگر خواهد بود و نشان میدهد که کسبوکارها چگونه ممکن است Nova Act را در جریانهای کاری خود برای تحقیقات بازار، مدیریت کمپینهای تبلیغاتی یا تجزیه و تحلیل تعامل با مشتری ادغام کنند. از سوی دیگر، خریداران دادههای حیاتی در مورد قابلیت استفاده، قابلیت اطمینان و قابل اعتماد بودن عاملی که وظایفی مانند جستجوی محصول یا مقایسه را انجام میدهد، ارائه خواهند کرد.
تجهیز نوآوران: کیت توسعه نرمافزار (SDK) Nova Act
Amazon با درک اینکه پتانسیل واقعی یک پلتفرم اغلب در خلاقیت جامعه گستردهتر توسعهدهندگان نهفته است، همزمان Nova Act SDK را معرفی کرد. این کیت توسعه نرمافزار (Software Development Kit) یک قطعه همراه حیاتی است که به طور خاص برای توانمندسازی توسعهدهندگان طراحی شده است تا عوامل هوش مصنوعی سفارشی خود را با استفاده از قابلیتهای اصلی Nova Act، به ویژه ویژگیهای تعامل با مرورگر آن، بسازند.
Rohit Prasad، معاون ارشد هوش مصنوعی عمومی Amazon، دیدگاه پشت این حرکت را بیان کرد: ‘Nova.amazon.com قدرت هوش مرزی Amazon را در اختیار هر توسعهدهنده و علاقهمند به فناوری قرار میدهد و کاوش در قابلیتهای Amazon Nova را آسانتر از همیشه میکند.’ این بیانیه بر استراتژی Amazon تأکید میکند: نه تنها ساخت یک عامل قدرتمند واحد، بلکه پرورش یک اکوسیستم کامل از ابزارهای هوش مصنوعی تخصصی که بر پایه فناوری بنیادی آنها ساخته شدهاند.
SDK دری را به روی مجموعه وسیعی از برنامههای کاربردی بالقوه باز میکند که بسیار فراتر از نمونههای اولیه ارائه شده توسط Amazon است. توسعهدهندگان از نظر تئوری میتوانند رباتهایی را ایجاد کنند که برای وظایف بسیار خاص طراحی شدهاند:
- سفارش خودکار: طراحی عواملی که قادر به پیمایش پلتفرمهای پیچیده تحویل غذا یا سفارش مجدد خودکار لوازم پرمصرف هستند.
- سفر و اقامت: ساخت رباتهایی که میتوانند چندین سایت مسافرتی را جستجو کنند، امکانات و قیمتهای هتل را مقایسه کنند و حتی بر اساس اولویتهای از پیش تعریفشده کاربر، رزرو را انجام دهند.
- ورود دادهها و پر کردن فرم: خودکارسازی فرآیند اغلب خستهکننده پر کردن فرمهای آنلاین، درخواستها یا نظرسنجیها با دقت و سرعت.
- مدیریت تقویم: ایجاد عواملی که میتوانند به طور هوشمند ایمیلها یا پیامها را برای جزئیات رویداد اسکن کنند و به طور خودکار قرارها، یادآوریها یا مهلتها را به تقویم دیجیتال کاربر اضافه کنند.
- تحلیل رقابتی: توسعه ابزارهایی برای کسبوکارها که میتوانند وبسایتهای رقبا را برای تغییرات قیمت، بهروزرسانی محصول یا فعالیتهای تبلیغاتی نظارت کنند.
- تجمیع اطلاعات شخصیسازیشده: ساخت عواملی که وب را برای اخبار، مقالات یا مقالات تحقیقاتی مرتبط با علایق خاص یا حوزه حرفهای کاربر جستجو میکنند و اطلاعات را به طور مؤثر تجمیع میکنند.
Amazon با ارائه SDK، اساساً از توسعهدهندگان دعوت میکند تا بر روی Nova Act نوآوری کنند، که به طور بالقوه منجر به تکثیر عوامل هوش مصنوعی مبتنی بر مرورگر میشود که برای کاربردهای بیشمار خاص در صنایع مختلف طراحی شدهاند. این رویکرد نه تنها کاوش پتانسیل Nova Act را تسریع میکند، بلکه با ایجاد جامعهای پیرامون فناوری خود، به تثبیت موقعیت Amazon در چشمانداز رقابتی هوش مصنوعی کمک میکند.
پیدایش: آزمایشگاه AGI SF آمازون
مرکز توسعه قدرتمند پشت مدل Nova Act، Amazon AGI SF Lab است که به طور استراتژیک در San Francisco، California واقع شده است. این آزمایشگاه نشاندهنده تلاش متمرکز Amazon برای گرد هم آوردن استعدادهای برتر در هوش مصنوعی است. مأموریت صریح آن گرد هم آوردن متخصصان و مهندسان برجسته هوش مصنوعی با هدف واحد ایجاد مدلهای هوش مصنوعی بنیادی و پیشرفته است.
رهبری AGI SF Lab گویای تعهد Amazon است. این آزمایشگاه توسط چهرههای برجستهای هدایت میشود که قبلاً نقشهای مهمی در OpenAI داشتند، یعنی David Luan و Pieter Abbeel. تخصص آنها، که در یکی از سازمانهای تحقیقاتی پیشرو در زمینه هوش مصنوعی در جهان تقویت شده است، نشاندهنده قصد Amazon برای رقابت در بالاترین سطح در توسعه قابلیتهای پیشرفته هوش مصنوعی عمومی است. تأسیس این آزمایشگاه اختصاصی، با کارکنانی از کهنهکاران صنعت، تأکید میکند که Nova Act یک پروژه مجزا نیست، بلکه بخشی از یک فشار گستردهتر، با بودجه خوب و از نظر استراتژیک حیاتی توسط Amazon به سوی آینده هوش مصنوعی است.
این سرمایهگذاری سنگین، اقدامات تقریباً هر غول فناوری بزرگ دیگری را منعکس میکند. رقابت برای توسعه و استقرار هوش مصنوعی برتر به خوبی در جریان است و برای رشد آینده، کارایی و مزیت رقابتی در بخشهای مختلف، امری بنیادین تلقی میشود. Nova Act، که برای اولین بار به صورت مفهومی در اواخر سال گذشته به عنوان بخشی از مجموعه رو به رشد مدلهای هوش مصنوعی Amazon رونمایی شد، اکنون به عنوان یک پلتفرم ملموس ظاهر شده و پیشرفتهای حاصل شده در واحدهای تخصصی مانند AGI SF Lab را نشان میدهد.
پیمایش در میدان شلوغ: ظهور عوامل خودمختار
Nova Act آمازون در خلاء وارد بازار نمیشود. این به حوزه به سرعت در حال گسترش عوامل هوش مصنوعی میپیوندد که برای عملیات خودمختار یا نیمهخودمختار، به ویژه در مورد تعامل وب، طراحی شدهاند. این اعلامیه به دنبال ابتکارات رقبا صورت میگیرد. قابل ذکر است که رهبر هوش مصنوعی OpenAI خود Operator را در ژانویه راهاندازی کرد - که به عنوان یک چتبات خودمختار توصیف میشود که همچنین قابلیت مرور وب بدون نظارت مداوم انسان را دارد.
این روند به سمت عواملی که میتوانند به طور مستقل در دنیای دیجیتال پیمایش و تعامل داشته باشند، نشاندهنده یک تحول بزرگ در کاربرد هوش مصنوعی است. چتباتهای اولیه عمدتاً رابطهای مکالمهای بودند که به پردازش اطلاعات ارائه شده به آنها یا بازیابی دادهها از طریق APIهای محدود، محدود میشدند. عواملی مانند Nova Act و Operator نشاندهنده حرکتی به سوی هوش مصنوعی هستند که میتواند در همان محیطهایی که انسانها روزانه استفاده میکنند عمل کند - مرورگرهای وب که به اطلاعات و قابلیتهای گسترده و بدون ساختار اینترنت دسترسی دارند.
این قابلیت امکانات عظیمی را برای اتوماسیون و کارایی باز میکند اما سوالات مهمی را نیز مطرح میکند. این عوامل چگونه وبسایتهای پیچیده و پویا را مدیریت خواهند کرد؟ وقتی با خطاها یا درخواستهای امنیتی غیرمنتظره مواجه میشوند چه اتفاقی میافتد؟ کاربران چگونه میتوانند اطمینان حاصل کنند که عوامل به نفع آنها عمل میکنند، به خصوص زمانی که تراکنشهای مالی در میان باشد؟ توسعه مکانیسمهای کنترل قوی، گزارشهای عملیاتی شفاف و پروتکلهای امنیتی قابل اعتماد با بلوغ این فناوریها اهمیت حیاتی خواهد داشت. رقابت بین Amazon، OpenAI، Google، Microsoft و دیگران در این فضا احتمالاً نوآوری را تسریع میکند و مرزهای آنچه عوامل خودمختار میتوانند به دست آورند را جابجا میکند و همزمان صنعت را مجبور به مقابله با چالشهای مرتبط میکند. به ویژه، توسعه Nova Act SDK میتواند به عنوان استراتژی Amazon برای متمایز کردن خود با فعال کردن ایجاد عامل سفارشی، به جای ارائه صرفاً یک عامل واحد و یکپارچه، تلقی شود.