مرز بعدی: Nova Act آمازون و چالش اتوماسیون وب با هوش مصنوعی

هوش مصنوعی به طور قاطع از قلمرو داستان‌های علمی تخیلی فراتر رفته و وارد تار و پود زندگی دیجیتال روزمره ما شده است. سال‌ها، هیاهو حول مدل‌های مولد متمرکز بود - الگوریتم‌هایی که قادر به تولید متن‌های شگفت‌انگیز شبیه به انسان یا تصاویر پیچیده خیره‌کننده بودند. با این حال، جریان فناوری به سمت یک کاربرد جدید، شاید حتی تحول‌آفرین‌تر، در حال چرخش است: عامل‌های هوش مصنوعی که نه تنها برای ایجاد، بلکه برای عمل طراحی شده‌اند. تمرکز از تولید منفعل به اجرای فعال تغییر می‌کند و نرم‌افزار را قادر می‌سازد تا پیچیدگی‌های وب را پیمایش کرده و وظایف را به طور مستقل از طرف کاربران انجام دهد. این حوزه نوظهور نشان‌دهنده یک جهش قابل توجه است که نویدبخش سطوح بی‌سابقه‌ای از راحتی و کارایی است و غول‌های فناوری برای تثبیت جایگاه خود در تلاش هستند. در میان این هیاهو، Amazon با یک ابتکار جدید قابل توجه وارد میدان شده است.

در حالی که فناوری زیربنایی دهه‌ها در آزمایشگاه‌های تحقیقاتی در حال توسعه بوده است، دوران پس از همه‌گیری شاهد انفجار علاقه و توسعه، به ویژه در برنامه‌های کاربردی رو به کاربر بود. تقریباً هر شرکت بزرگ فناوری اکنون در حال نمایش توانایی‌های خود است و از مدل‌های هوش مصنوعی متناسب با ساده‌سازی گردش کار، افزایش بهره‌وری یا صرفاً روان‌تر کردن تعاملات دیجیتال روزمره رونمایی می‌کند. Amazon، شرکتی که بر پایه بهینه‌سازی عملیات پیچیده لجستیکی و دیجیتال بنا شده است، طبیعتاً یک بازیگر کلیدی در این چشم‌انداز در حال تحول است. با این حال، آخرین ورود آن فقط تکرار دیگری از پارادایم‌های موجود نیست؛ بلکه یک فشار مستقیم به حوزه چالش‌برانگیز اتوماسیون وظایف مبتنی بر وب است.

ورود Amazon: ابتکار Nova Act

سهم Amazon در این موج جدید در Nova Act تجسم یافته است. این صرفاً یک چت‌بات یا تولیدکننده تصویر دیگر نیست؛ بلکه یک فناوری بنیادی است که برای توانمندسازی توسعه‌دهندگان طراحی شده است. هدف اصلی Nova Act ارائه بلوک‌های سازنده برای ایجاد عامل‌های هوش مصنوعی پیچیده‌ای است که می‌توانند به طور مستقل در محیط مرورگر وب عمل کنند. دستیاری را تصور کنید که قادر به درک یک درخواست چند مرحله‌ای و سپس اجرای آن در وب‌سایت‌های مختلف بدون دخالت مداوم انسان باشد.

یک مثال گویا پتانسیل را نشان داد: دستور دادن به یک عامل برای شناسایی آپارتمان‌های موجود واقع در شعاع دوچرخه‌سواری معقول از یک ایستگاه قطار خاص. این وظیفه، که برای یک انسان به ظاهر ساده است، شامل یک توالی پیچیده برای هوش مصنوعی است: درک محدودیت‌های جغرافیایی، پیمایش وب‌سایت‌های لیست آپارتمان‌ها، فیلتر کردن نتایج بر اساس معیارهای مکان (احتمالاً تفسیر داده‌های نقشه)، استخراج اطلاعات مرتبط مانند در دسترس بودن و قیمت، و ارائه یافته‌ها به طور منسجم. Nova Act قصد دارد توسعه‌دهندگان را به ابزارهایی مجهز کند تا عامل‌هایی را بسازند که دقیقاً قادر به انجام این نوع عملیات پیچیده و چند مرحله‌ای باشند.

اهمیت راه‌اندازی اولیه Nova Act به عنوان ابزاری برای توسعه‌دهندگان را نمی‌توان نادیده گرفت. این نشان‌دهنده یک رویکرد استراتژیک متمرکز بر ساختن یک اکوسیستم قوی است. Amazon با توانمندسازی سازندگان شخص ثالث، می‌تواند نوآوری را تقویت کرده و طیف وسیع‌تری از برنامه‌های کاربردی را نسبت به آنچه که صرفاً از طریق توسعه داخلی می‌توانست، کشف کند. این استراتژی همچنین امکان جمع‌آوری بازخورد ارزشمند و اصلاح فناوری بر اساس چالش‌های پیاده‌سازی در دنیای واقعی را قبل از عرضه گسترده‌تر برای مصرف‌کنندگان فراهم می‌کند.

میدان نبرد شلوغ: ظهور عامل‌های رقیب

با افزایش علاقه به عامل‌های هوش مصنوعی که از خروجی‌های متنی یا تصویری ساده فراتر می‌روند، چشم‌انداز رقابتی به طور فزاینده‌ای متراکم می‌شود. جذابیت عامل‌های خودمختار قادر به اجرای عملیات پیچیده بدون نظارت مستقیم انسان، مقاومت‌ناپذیر است و Amazon در تشخیص این پتانسیل تنها نیست. چندین رقیب قدرتمند در حال حاضر برای تسلط در این فضا رقابت می‌کنند.

OpenAI، که مدت‌ها به عنوان پیشگام در تحقیق و توسعه هوش مصنوعی، به ویژه پس از اولین نمایش پر سر و صدای ChatGPT، در نظر گرفته می‌شد، گام‌های مهمی برداشته است. OpenAI با تقویت سرمایه‌گذاری قابل توجه از سوی Microsoft، اوایل امسال برنامه‌هایی را برای ویژگی‌ای که به طور آزمایشی ‘Operator’ نامیده می‌شود، رونمایی کرد. توضیحات تصویری از عاملی را ترسیم می‌کنند که برای انجام وظایفی مانند برنامه‌ریزی پیچیده سفر، پر کردن خودکار فرم‌ها، رزرو رستوران و حتی مدیریت سفارشات آنلاین خواربار طراحی شده است. این شرکت به صراحت این قابلیت را به عنوان عاملی که از وب برای دستیابی به اهداف کاربر استفاده می‌کند، چارچوب‌بندی کرد و یک چرخش استراتژیک آشکار به سمت هوش مصنوعی عمل‌گرا را نشان داد.

با این حال، جدول زمانی روایت پیچیده‌تری را آشکار می‌کند. Anthropic، یک استارت‌آپ هوش مصنوعی با پیشینه‌ای قانع‌کننده - که توسط محققان سابق OpenAI تأسیس شده و به طور قابل توجهی توسط سرمایه‌گذاری قابل توجه خود Amazon پشتیبانی می‌شود - حتی زودتر مفهوم مشابهی را معرفی کرد. در اکتبر سال گذشته، Anthropic ابزار ‘Computer Use’ خود را معرفی کرد. این فناوری به طور خاص برای فعال کردن مدل‌های هوش مصنوعی برای تعامل مستقیم با رابط کاربری گرافیکی رایانه طراحی شده بود. این شامل شبیه‌سازی کلیک بر روی دکمه‌ها، وارد کردن متن در فیلدها، پیمایش وب‌سایت‌های متنوع و اجرای وظایف در برنامه‌های نرم‌افزاری مختلف است، همه اینها در حالی که به طور پویا به داده‌های اینترنتی در زمان واقعی دسترسی پیدا می‌کند. همپوشانی عملکردی با ‘Operator’ پیشنهادی OpenAI قابل توجه است و توسعه موازی شدیدی را که در صنعت رخ می‌دهد، برجسته می‌کند. ارتباط Amazon-Anthropic لایه دیگری از جذابیت را اضافه می‌کند و هم‌افزایی بالقوه یا حتی رقابت داخلی را در استراتژی گسترده‌تر هوش مصنوعی Amazon نشان می‌دهد.

OpenAI از زمان اعلامیه‌های اولیه خود بیکار ننشسته است. این شرکت با به‌روزرسانی‌هایی، از جمله معرفی ‘Deep Research’ اندکی پس از رونمایی Anthropic، ادامه داد. این ابزار یک عامل هوش مصنوعی را قادر می‌سازد تا وظایف تحقیقاتی پیچیده‌ای را بر عهده بگیرد، گزارش‌های مفصلی را گردآوری کند و تحلیل‌های عمیقی را در مورد موضوعات مشخص شده توسط کاربر انجام دهد، که بیشتر نشان‌دهنده فشار به سمت وظایف پیچیده و مبتنی بر دانش است.

Google، غولی در نمایه‌سازی وب و تجزیه و تحلیل داده‌ها، نیز نباید تحت‌الشعاع قرار گیرد و وارد این عرصه شد. دسامبر گذشته، Google ابزار قابل مقایسه خود را راه‌اندازی کرد که به عنوان یک ‘دستیار تحقیقاتی’ قدرتمند معرفی شد. هدف این عامل کمک به کاربران با کاوش در موضوعات پیچیده، بررسی اطلاعات در سراسر وب و ترکیب یافته‌ها در گزارش‌های جامع است که قابلیت‌های تبلیغ شده توسط رقبای خود را منعکس می‌کند.

با استقرار فناوری‌های مشابه توسط چنین غول‌هایی، برنده نهایی به هیچ وجه مشخص نیست. موفقیت احتمالاً به ترکیبی از عوامل بستگی دارد: عمق بودجه موجود برای تحقیق و توسعه پایدار، سرعت و کیفیت پیشرفت‌های فناوری، طراحی بصری رابط کاربری، و به طور حیاتی، توانایی غلبه بر چالش‌های ذاتی که مدل‌های هوش مصنوعی فعلی را آزار می‌دهند - به ویژه مشکلات گاه به گاه آنها در تفسیر دقیق و پیروی مداوم از دستورالعمل‌های پیچیده یا ظریف.

رمزگشایی عامل: قابلیت‌ها و پیچیدگی‌ها

درک اینکه این عامل‌های هوش مصنوعی نوظهور واقعاً چه کاری انجام می‌دهند، مستلزم نگاهی فراتر از دستورات ساده است. پتانسیل آنها در اجرای عملیات چند مرحله‌ای نهفته است که تعامل انسان با رابط‌های دیجیتال را تقلید می‌کند. این شامل چندین قابلیت کلیدی است:

  1. پیمایش و تعامل وب: عامل‌ها باید بتوانند ساختار یک صفحه وب را ‘ببینند’ و تفسیر کنند - شناسایی فیلدهای متنی، دکمه‌ها، منوهای کشویی، پیوندها و سایر عناصر تعاملی. آنها باید اقداماتی مانند کلیک کردن، تایپ کردن، پیمایش و انتخاب گزینه‌ها را شبیه‌سازی کنند.
  2. درک متنی: صرفاً تعامل کافی نیست. عامل باید هدف اقدامات خود را در چارچوب گسترده‌تر وظیفه درک کند. پر کردن فیلد ‘شهر مبدأ’ مستلزم درک این است که به برنامه‌ریزی سفر مربوط می‌شود، نه خرید آنلاین.
  3. استخراج اطلاعات: عامل‌ها باید قطعات خاصی از داده‌ها را از صفحات وب شناسایی و استخراج کنند - قیمت، زمان پرواز، آدرس، وضعیت در دسترس بودن - و این اطلاعات را به طور معناداری ذخیره یا پردازش کنند.
  4. عملیات بین پلتفرمی: بسیاری از وظایف شامل تعامل با چندین وب‌سایت یا حتی انواع مختلف برنامه‌ها (به عنوان مثال، بررسی ایمیل برای کد تأیید هنگام رزرو پرواز) است. انتقال یکپارچه بین این پلتفرم‌ها بسیار مهم است.
  5. حل مسئله و انطباق: وب‌سایت‌ها مرتباً تغییر می‌کنند. عامل‌ها به درجه‌ای از انعطاف‌پذیری برای مدیریت تغییرات در طرح‌بندی یا خطاهای غیرمنتظره (به عنوان مثال، عدم پاسخگویی یک دکمه، عدم بارگیری یک صفحه) نیاز دارند. ممکن است لازم باشد رویکردهای جایگزین را امتحان کنند یا خرابی‌ها را به آرامی گزارش دهند.

موارد استفاده بالقوه طیف وسیعی را در بر می‌گیرد:

  • بهره‌وری شخصی: مدیریت برنامه‌های سفر پیچیده (پروازها، هتل‌ها، اجاره اتومبیل، فعالیت‌ها بر اساس ترجیحات)، خودکارسازی پرداخت قبوض در پورتال‌های مختلف، تجمیع اطلاعات مالی از حساب‌های مختلف، برنامه‌ریزی قرار ملاقات‌ها بر اساس در دسترس بودن تقویم و فرم‌های پیش‌نیاز مورد نیاز.
  • تجارت الکترونیک: مقایسه قیمت در چندین فروشنده برای محصولات خاص، ردیابی اقلام کمیاب یا ناموجود، مدیریت خودکار فرآیندهای بازگشت کالا.
  • عملیات تجاری: تحقیقات بازار خودکار (جمع‌آوری قیمت‌گذاری رقبا، نظرات مشتریان، روندهای صنعت)، تولید سرنخ (شناسایی مشتریان بالقوه بر اساس معیارهای خاص از دایرکتوری‌های آنلاین)، ورود داده‌ها و انتقال بین سیستم‌های مبتنی بر وب، تولید گزارش‌های معمول با تجمیع داده‌ها از داشبوردهای آنلاین مختلف.
  • مدیریت محتوا: خودکارسازی فرآیند ارسال محتوا در پلتفرم‌های مختلف رسانه‌های اجتماعی، به‌روزرسانی پویای اطلاعات وب‌سایت بر اساس منابع داده خارجی.

پیچیدگی در ایجاد این تعاملات قابل اعتماد، ایمن و واقعاً خودمختار نهفته است و کاربر را از کارهای دیجیتالی خسته‌کننده و تکراری رها می‌کند.

پیمایش موانع: چالش خودمختاری قابل اعتماد

علیرغم وعده‌های عظیم، مسیر به سوی عامل‌های وب واقعاً خودمختار و قابل اعتماد مملو از چالش‌ها است. ‘دشواری در پیروی از دستورالعمل‌ها’، که اغلب به عنوان محدودیتی برای هوش مصنوعی فعلی ذکر می‌شود، تنها نوک کوه یخ است. چندین مانع مهم باید برطرف شوند:

  • ابهام و تفسیر: زبان انسان ذاتاً مبهم است. دستوری مانند ‘یک پرواز ارزان به پاریس برای ماه آینده پیدا کن’ مستلزم آن است که هوش مصنوعی ‘ارزان’ (نسبت به چه چیزی؟)، ‘ماه آینده’ (کدام تاریخ‌های خاص؟) را تفسیر کند و به طور بالقوه ترجیحات مربوط به خطوط هوایی، توقف‌ها یا زمان‌های حرکت را استنباط کند. تفسیر نادرست می‌تواند منجر به اقدامات کاملاً نادرست شود.
  • محیط‌های وب پویا و ناسازگار: وب‌سایت‌ها ایستا نیستند. طرح‌بندی‌ها تغییر می‌کنند، عناصر تغییر نام می‌دهند، گردش کار به‌روز می‌شوند. عاملی که بر روی یک نسخه از یک سایت آموزش دیده است ممکن است هنگام مواجهه با یک رابط بازطراحی شده کاملاً شکست بخورد. استحکام در برابر چنین تغییراتی یک چالش فنی بزرگ است.
  • مدیریت خطا و بازیابی: وقتی یک وب‌سایت از کار افتاده است، ورود به سیستم ناموفق است یا یک پنجره بازشو غیرمنتظره ظاهر می‌شود، چه اتفاقی می‌افتد؟ عامل به مکانیسم‌های پیچیده تشخیص خطا و بازیابی نیاز دارد. آیا باید دوباره تلاش کند؟ آیا باید از کاربر کمک بخواهد؟ آیا باید وظیفه را رها کند؟ تعریف این پروتکل‌ها پیچیده است.
  • امنیت و مجوزها: اعطای خودمختاری به یک عامل هوش مصنوعی برای ورود به حساب‌ها، پر کردن فرم‌ها با داده‌های شخصی و به طور بالقوه انجام خریدها، نگرانی‌های امنیتی قابل توجهی را ایجاد می‌کند. اطمینان از اینکه عامل در مرزهای تعریف شده عمل می‌کند، به راحتی قابل ربودن نیست و اطلاعات حساس را به طور ایمن مدیریت می‌کند، بسیار مهم است. ایجاد اعتماد کاربر ضروری است.
  • مقیاس‌پذیری و هزینه: اجرای مدل‌های پیچیده هوش مصنوعی قادر به تعامل وب در زمان واقعی می‌تواند از نظر محاسباتی گران باشد. در دسترس قرار دادن و مقرون به صرفه کردن این عامل‌ها برای استفاده گسترده مستلزم بهینه‌سازی مداوم الگوریتم‌ها و زیرساخت‌های زیربنایی است.
  • ملاحظات اخلاقی: با توانمندتر شدن عامل‌ها، سؤالاتی در مورد سوء استفاده بالقوه آنها (به عنوان مثال، خودکارسازی هرزنامه، خراش دادن داده‌های دارای حق چاپ) و تأثیر آن بر اشتغال در بخش‌های متکی به وظایف دستی مبتنی بر وب مطرح می‌شود.

تصمیم Amazon برای راه‌اندازی اولیه Nova Act در یک پیش‌نمایش تحقیقاتی برای توسعه‌دهندگان با توجه به این چالش‌ها، یک استراتژی محتاطانه به نظر می‌رسد. این رویکرد به شرکت اجازه می‌دهد تا بازخورد حیاتی را از کاربران با دانش فنی جمع‌آوری کند که برای شناسایی اشکالات، آزمایش موارد لبه‌ای و ارائه انتقادات سازنده مجهزتر هستند. این یک محیط کنترل شده برای اصلاح فناوری، بهبود قابلیت‌های پیروی از دستورالعمل‌ها و تقویت اقدامات امنیتی قبل از قرار دادن آن در معرض خواسته‌های کمتر قابل پیش‌بینی و تحمل بالقوه پایین‌تر برای خطاهای بازار مصرف عمومی ایجاد می‌کند. این رویکرد تکراری و توسعه‌دهنده محور به Amazon اجازه می‌دهد تا ‘کارهای خود را مرتب کند’، مشکلات را برطرف کرده و قبل از عرضه گسترده‌تر در بازار، استحکام را ایجاد کند.

استراتژی بزرگ Amazon: فراتر از Nova Act

Nova Act، اگرچه قابل توجه است، نباید به صورت مجزا دیده شود. این نشان‌دهنده یک جزء حیاتی در سرمایه‌گذاری بسیار گسترده‌تر و به سرعت در حال شتاب Amazon در هوش مصنوعی مولد و اتوماسیون هوشمند است. این شرکت در حال بافتن هوش مصنوعی در هسته اصلی عملیات و پیشنهادات محصول خود از طریق یک استراتژی چند جانبه است:

  • زیرساخت و مدل‌های بنیادی: Amazon در حال توسعه سیلیکون سفارشی خود، مانند تراشه‌های Trainium است که به طور خاص برای بهینه‌سازی آموزش مدل‌های هوش مصنوعی در مقیاس بزرگ به طور کارآمد و مقرون به صرفه طراحی شده‌اند. علاوه بر این، پلتفرم Bedrock آن به عنوان یک بازار عمل می‌کند و دسترسی نه تنها به مدل‌های بنیادی خود Amazon (مانند Titan) بلکه به مدل‌های پیشرو از شرکت‌های هوش مصنوعی شخص ثالث (از جمله Anthropic) را نیز ارائه می‌دهد. این امر Amazon Web Services (AWS) را به عنوان یک مرکز اصلی برای توسعه هوش مصنوعی قرار می‌دهد.
  • هوش مصنوعی ویژه برنامه: این شرکت در حال استقرار هوش مصنوعی برای تقویت کسب‌وکارهای موجود خود است. مثال‌ها شامل دستیاران خرید مبتنی بر هوش مصنوعی طراحی شده برای شخصی‌سازی توصیه‌ها و بهبود تجربه مشتری، و دستیاران سلامت مبتنی بر هوش مصنوعی با هدف ساده‌سازی وظایف مرتبط با مراقبت‌های بهداشتی و دسترسی به اطلاعات است.
  • تکامل محصولات اصلی: Alexa، دستیار صوتی Amazon که بیش از یک دهه پیش راه‌اندازی شد، در حال ارتقاء قابل توجهی با قابلیت‌های پیشرفته هوش مصنوعی مولد است. هدف ایناست که تعاملات را محاوره‌ای‌تر، آگاه از زمینه و قادر به رسیدگی به درخواست‌های پیچیده‌تر کند، و به طور بالقوه با عامل‌های ساخته شده با استفاده از فناوری‌هایی مانند Nova Act یکپارچه شود.

در این زمینه، Nova Act به عنوان یک پل حیاتی عمل می‌کند. این از مدل‌های بنیادی موجود از طریق Bedrock (که به طور بالقوه بر روی سخت‌افزار بهینه‌سازی شده مانند Trainium اجرا می‌شوند) استفاده می‌کند و قابلیت خاصی را برای این مدل‌ها فراهم می‌کند تا در محیط وب عمل کنند. این قابلیت عمل‌گرا می‌تواند به طور چشمگیری عملکرد Alexa را افزایش دهد، ویژگی‌های پیچیده جدیدی را در پلتفرم تجارت الکترونیک خود تقویت کند، یا خدمات کاملاً جدیدی را که از طریق AWS ارائه می‌شوند، فعال کند. این قطعه‌ای از یک پازل بزرگتر است که هدف آن ایجاد اکوسیستمی است که در آن هوش مصنوعی نه تنها درک و تولید می‌کند، بلکه وظایف را در سراسر چشم‌انداز دیجیتال اجرا می‌کند و تسلط Amazon را در محاسبات ابری و تجارت الکترونیک تقویت می‌کند.

مخاطرات: تغییر شکل چشم‌انداز دیجیتال

توسعه عامل‌های وب هوش مصنوعی توانمند مانند آنهایی که توسط Nova Act، Operator، Computer Use و ابتکارات Google وعده داده شده‌اند، چیزی بیش از یک پیشرفت فناوری تدریجی را نشان می‌دهد. این نشان‌دهنده یک تغییر پارادایم بالقوه در نحوه تعامل انسان با دنیای دیجیتال است. اگر این عامل‌ها به پتانسیل خود عمل کنند، پیامدها می‌توانند عمیق باشند:

  • تعریف مجدد تجربه کاربر: فرآیندهای آنلاین خسته‌کننده و چند مرحله‌ای می‌توانند بدون زحمت شوند. به جای پیمایش دستی چندین وب‌سایت برای رزرو سفر یا تحقیق در مورد محصول، کاربران می‌توانند به سادگی هدف خود را بیان کنند و اجازه دهند عامل اجرا را انجام دهد. این می‌تواند اساساً انتظارات برای راحتی دیجیتال را تغییر دهد.
  • اختلال در صنعت: بخش‌هایی که به شدت به وظایف دستی مبتنی بر وب متکی هستند یا به عنوان واسطه عمل می‌کنند، می‌توانند با اختلال قابل توجهی روبرو شوند. آژانس‌های مسافرتی، شرکت‌های تحقیقات بازار متکی به جمع‌آوری دستی داده‌ها، خدمات دستیار مجازی که وظایف اداری معمول را انجام می‌دهند - همه ممکن است نیاز به انطباق داشته باشند زیرا عامل‌های هوش مصنوعی عملکردهای اصلی را خودکار می‌کنند.
  • افزایش بهره‌وری: هم افراد و هم کسب‌وکارها می‌توانند با واگذاری کارهای دیجیتالی تکراری به عامل‌های هوش مصنوعی، افزایش بهره‌وری قابل توجهی را به دست آورند. این می‌تواند تلاش انسان را برای کارهای پیچیده‌تر، خلاقانه‌تر یا استراتژیک‌تر آزاد کند.
  • مدل‌های کسب‌وکار جدید: توانایی خودکارسازی تعاملات پیچیده وب می‌تواند خدمات و مدل‌های کسب‌وکار کاملاً جدیدی را ایجاد کند که حول اتوماسیون فوق‌العاده شخصی‌سازی شده، تجمیع داده‌های پیچیده و کمک دیجیتال فعال ساخته شده‌اند.
  • دسترسی‌پذیری: برای افراد دارای معلولیت‌های خاص، عامل‌های هوش مصنوعی می‌توانند کمک ارزشمندی در پیمایش رابط‌های وب پیچیده ارائه دهند و شمول دیجیتال را افزایش دهند.

با این حال، تحقق این آینده مستلزم غلبه بر موانع فنی و اخلاقی قابل توجهی است که قبلاً مورد بحث قرار گرفت. رقابت بین Amazon، OpenAI، Anthropic، Google و به طور بالقوه سایر بازیگران فقط مربوط به لاف‌زنی‌های فناوری نیست؛ بلکه مربوط به تعریف استانداردها، ایجاد اعتماد و در نهایت شکل دادن به آینده تعامل وب است. شرکتی که با موفقیت قابلیت‌های قدرتمند را با قابلیت اطمینان، امنیت و تجربه کاربری بصری ترکیب کند، می‌تواند مزیت استراتژیک قابل توجهی را در دوره بعدی هوش مصنوعی به دست آورد. Nova Act آمازون سیگنال واضحی است مبنی بر اینکه غول تجارت الکترونیک و ابر قصد دارد بازیگر اصلی در نوشتن فصل بعدی باشد.