چالش واقعی: ساخت برنامه‌های هوش مصنوعی سازمانی

در حالی که منابع بی‌شماری هر ساله صرف آموزش مدل‌های زبانی بزرگ (LLM) می‌شود، یک مانع مهم همچنان باقی است: ادغام موثر این مدل‌ها در برنامه‌های کاربردی و مفید.

توهم تنظیم دقیق

تنظیم دقیق (Fine-tuning) و تولید افزوده بازیابی (RAG) به طور کلی روش‌های تثبیت‌شده‌ای برای افزایش دانش و قابلیت‌های مدل‌های هوش مصنوعی از پیش آموزش‌دیده در نظر گرفته می‌شوند. با این حال، مدیرعامل Aleph Alpha، جوناس آندرولیس، اشاره می‌کند که واقعیت پیچیده‌تر است.

او توضیح داد: “یک سال پیش، این باور گسترده وجود داشت که تنظیم دقیق یک راه حل جادویی است. اگر یک سیستم هوش مصنوعی آنطور که مطلوب بود عمل نمی‌کرد، پاسخ به سادگی تنظیم دقیق بود. اینقدرها هم ساده نیست.”

در حالی که تنظیم دقیق می‌تواند سبک یا رفتار یک مدل را تغییر دهد، اما موثرترین رویکرد برای آموزش اطلاعات جدید نیست. این انتظار که تنظیم دقیق به تنهایی می‌تواند تمام مسائل مربوط به کاربرد هوش مصنوعی را حل کند، یک تصور غلط است.

RAG: یک رویکرد جایگزین

RAG یک رویکرد جایگزین را با عملکردی شبیه به یک کتابدار ارائه می‌دهد که اطلاعات را از یک بایگانی خارجی بازیابی می‌کند. این رویکرد امکان به‌روزرسانی و تغییر اطلاعات در پایگاه داده را بدون آموزش مجدد یا تنظیم دقیق مدل فراهم می‌کند. علاوه بر این، نتایج تولید شده را می‌توان برای دقت استناد و ممیزی کرد.

آندرولیس تاکید کرد: “دانش خاص همیشه باید مستند شود و در پارامترهای LLM ذخیره نشود.”

در حالی که RAG مزایای متعددی را ارائه می‌دهد، موفقیت آن به مستندسازی مناسب فرآیندهای کلیدی، رویه‌ها و دانش سازمانی در قالبی که مدل بتواند درک کند، بستگی دارد. متاسفانه، این اغلب اینطور نیست.

حتی زمانی که مستندات وجود دارد، شرکت‌ها ممکن است با مشکلاتی مواجه شوند اگر اسناد یا فرآیندها به داده‌های خارج از توزیع (out-of-distribution data) متکی باشند - داده‌هایی که به طور قابل توجهی با داده‌های مورد استفاده برای آموزش مدل پایه متفاوت هستند. به عنوان مثال، مدلی که صرفاً بر روی مجموعه‌داده‌های انگلیسی آموزش داده شده است، با مستندات آلمانی، به ویژه اگر حاوی فرمول‌های علمی باشد، مشکل خواهد داشت. در بسیاری از موارد، مدل ممکن است اصلاً قادر به تفسیر داده‌ها نباشد.

بنابراین، آندرولیس پیشنهاد می‌کند که ترکیبی از تنظیم دقیق و RAG معمولاً برای دستیابی به نتایج معنادار ضروری است. این رویکرد ترکیبی از نقاط قوت هر دو روش برای غلبه بر محدودیت‌های فردی آنها استفاده می‌کند.

پر کردن شکاف

هدف Aleph Alpha این است که با پرداختن به چالش‌هایی که مانع از توسعه هوش مصنوعی مستقل خود توسط شرکت‌ها و ملت‌ها می‌شود، خود را به عنوان یک DeepMind اروپایی متمایز کند.

هوش مصنوعی مستقل به مدل‌هایی اطلاق می‌شود که با استفاده از مجموعه‌داده‌های داخلی یک کشور بر روی سخت‌افزاری که در داخل مرزهای آن ساخته یا مستقر شده است، آموزش داده یا تنظیم دقیق شده‌اند. این رویکرد امنیت، حریم خصوصی و کنترل داده‌ها را تضمین می‌کند که برای بسیاری از سازمان‌ها و دولت‌ها حیاتی است.

آندرولیس اظهار داشت: “ما تلاش می‌کنیم سیستم عامل، پایه و اساس برای شرکت‌ها و دولت‌ها باشیم تا استراتژی هوش مصنوعی مستقل خود را بسازند. هدف ما نوآوری در جایی است که لازم است، در حالی که در صورت امکان از فناوری‌های متن باز و پیشرفته نیز استفاده می‌کنیم.”

در حالی که این گاهی اوقات شامل آموزش مدل‌ها می‌شود، مانند Pharia-1-LLM Aleph، آندرولیس تاکید می‌کند که آنها سعی نمی‌کنند مدل‌های موجود مانند Llama یا DeepSeek را تکرار کنند. تمرکز آنها بر ایجاد راه حل‌های منحصر به فردی است که به چالش‌های خاص می‌پردازند.

آندرولیس گفت: “من همیشه تحقیقات خود را به سمت تمرکز بر چیزهای معنادار متفاوت هدایت می‌کنم، نه فقط کپی کردن کاری که همه انجام می‌دهند، زیرا آن از قبل وجود دارد. ما نیازی به ساخت Llama یا DeepSeek دیگری نداریم زیرا آنها از قبل وجود دارند.”

در عوض، Aleph Alpha بر ساخت چارچوب‌هایی تمرکز دارد که پذیرش این فناوری‌ها را ساده و تسریع می‌کند. یک مثال اخیر، معماری آموزشی بدون توکن‌ساز یا “T-Free” آنها است که هدف آن تنظیم دقیق مدل‌هایی است که می‌توانند داده‌های خارج از توزیع را به طور موثرتری درک کنند.

رویکردهای سنتی مبتنی بر توکن‌ساز اغلب به مقادیر زیادی داده‌های خارج از توزیع برای تنظیم دقیق موثر یک مدل نیاز دارند. این از نظر محاسباتی پرهزینه است و فرض می‌کند که داده‌های کافی در دسترس است.

معماری T-Free Aleph Alpha با حذف توکن‌ساز این مشکل را دور می‌زند. آزمایش‌های اولیه بر روی Pharia LLM آنها در زبان فنلاندی نشان داد که در مقایسه با رویکردهای مبتنی بر توکن‌ساز، 70 درصد کاهش در هزینه آموزش و ردپای کربن وجود دارد. این رویکرد نوآورانه تنظیم دقیق را در دسترس‌تر و پایدارتر می‌کند.

Aleph Alpha همچنین ابزارهایی را برای رفع شکاف‌های موجود در دانش مستند شده توسعه داده است که می‌تواند منجر به نتایج نادرست یا غیرمفید شود.

به عنوان مثال، اگر دو قرارداد مرتبط با یک سوال انطباق با یکدیگر مغایرت داشته باشند، آندرولیس توضیح داد: “سیستم می‌تواند به انسان نزدیک شود و بگوید، ‘من یک اختلاف پیدا کردم… آیا می‌توانید بازخورد ارائه دهید که آیا این یک تعارض واقعی است؟’”

اطلاعات جمع‌آوری شده از طریق این چارچوب، به نام Pharia Catch، می‌تواند به پایگاه دانش برنامه بازگردانده شود یا برای تنظیم دقیق مدل‌های موثرتر استفاده شود. این حلقه بازخورد دقت و قابلیت اطمینان سیستم هوش مصنوعی را در طول زمان بهبود می‌بخشد.

به گفته آندرولیس، این ابزارها شرکایی مانند PwC، Deloitte، Capgemini و Supra را جذب کرده‌اند که با مشتریان نهایی برای پیاده‌سازی فناوری Aleph Alpha همکاری می‌کنند. این مشارکت‌ها ارزش و کاربردی بودن راه حل‌های Aleph Alpha را در برنامه‌های کاربردی دنیای واقعی نشان می‌دهد.

عامل سخت افزار

نرم افزار و داده ها تنها چالش های پیش روی پذیرندگان هوش مصنوعی مستقل نیستند. سخت افزار یکی دیگر از ملاحظات مهم است.

شرکت‌ها و ملت‌های مختلف ممکن است الزامات خاصی برای اجرا بر روی سخت‌افزار توسعه‌یافته داخلی داشته باشند یا به سادگی تعیین کنند که حجم کاری در کجا می‌تواند اجرا شود. این محدودیت‌ها می‌تواند به طور قابل توجهی بر انتخاب سخت افزار و زیرساخت تأثیر بگذارد.

این بدان معناست که آندرولیس و تیمش باید از طیف گسترده‌ای از گزینه‌های سخت افزاری پشتیبانی کنند. Aleph Alpha گروهی التقاطی از شرکای سخت افزاری، از جمله AMD، Graphcore و Cerebras را جذب کرده است.

ماه گذشته، Aleph Alpha از مشارکت با AMD برای استفاده از شتاب‌دهنده‌های سری MI300 خود خبر داد. این همکاری از سخت افزار پیشرفته AMD برای تسریع آموزش و استنتاج هوش مصنوعی استفاده خواهد کرد.

آندرولیس همچنین بر همکاری با Graphcore، که توسط Softbank خریداری شده است، و Cerebras، که شتاب‌دهنده‌های مقیاس ویفر CS-3 آن برای آموزش مدل‌های هوش مصنوعی برای نیروهای مسلح آلمان استفاده می‌شود، تاکید کرد. این مشارکت‌ها تعهد Aleph Alpha به همکاری با ارائه دهندگان سخت افزار متنوع برای رفع نیازهای خاص مشتریان خود را نشان می‌دهد.

علیرغم این همکاری‌ها، آندرولیس اصرار دارد که هدف Aleph Alpha تبدیل شدن به یک سرویس مدیریت شده یا ارائه دهنده ابر نیست. او اظهار داشت: “ما هرگز ارائه دهنده ابر نخواهیم شد. من می‌خواهم مشتریانم آزاد باشند و بدون اینکه قفل شوند.” این تعهد به آزادی و انعطاف پذیری مشتری، Aleph Alpha را از بسیاری از شرکت‌های هوش مصنوعی دیگر متمایز می‌کند.

مسیر پیش رو: افزایش پیچیدگی

آندرولیس با نگاهی به آینده، پیش‌بینی می‌کند که ساخت برنامه‌های هوش مصنوعی با تغییر صنعت از چت‌بات‌ها به سیستم‌های هوش مصنوعی عامل‌محور که قادر به حل مسائل پیچیده‌تر هستند، پیچیده‌تر خواهد شد.

هوش مصنوعی عامل‌محور در سال گذشته توجه قابل توجهی را به خود جلب کرده است، به طوری که سازندگان مدل، توسعه دهندگان نرم افزار و فروشندگان سخت افزار سیستم‌هایی را وعده می‌دهند که می‌توانند فرآیندهای چند مرحله‌ای را به صورت ناهمزمان تکمیل کنند. نمونه‌های اولیه شامل Operator OpenAI و API استفاده از رایانه Anthropic است. این سیستم‌های هوش مصنوعی عامل‌محور نشان دهنده پیشرفت قابل توجهی در قابلیت‌های هوش مصنوعی هستند.

او گفت: “سال گذشته، ما عمدتاً بر روی وظایف ساده‌ای مانند خلاصه‌سازی اسناد یا کمک به نوشتن تمرکز کردیم. اکنون، با چیزهایی که در نگاه اول حتی به نظر نمی‌رسد مشکلات genAI باشند، جایی که تجربه کاربر یک چت‌بات نیست، هیجان‌انگیزتر می‌شود.” این تغییر به سمت برنامه‌های هوش مصنوعی پیچیده‌تر و یکپارچه‌تر، چالش‌ها و فرصت‌های جدیدی را برای صنعت ایجاد می‌کند.

چالش‌های کلیدی در ساخت برنامه‌های هوش مصنوعی سازمانی:

پر کردن شکاف بین آموزش مدل و ادغام برنامه: ترجمه موثر قابلیت‌های LLM به برنامه‌های کاربردی عملی همچنان یک مانع مهم است.
غلبه بر محدودیت‌های تنظیم دقیق: تنظیم دقیق به تنهایی اغلب برای آموزش اطلاعات جدید به مدل‌های هوش مصنوعی یا تطبیق آنها با وظایف خاص کافی نیست.
تضمین کیفیت و دسترسی به داده‌ها: RAG به داده‌های مستند شده و به راحتی در دسترس متکی است که اغلب در بسیاری از سازمان‌ها وجود ندارد.
رسیدگی به داده‌های خارج از توزیع: مدل‌های هوش مصنوعی باید بتوانند داده‌هایی را که با داده‌هایی که روی آنها آموزش داده شده‌اند متفاوت است، مدیریت کنند، که نیاز به تکنیک‌های تخصصی دارد.
رسیدگی به محدودیت‌های سخت افزاری: شرکت‌ها و ملت‌های مختلف الزامات سخت افزاری متفاوتی دارند که باید در نظر گرفته شود.
حفظ حریم خصوصی و امنیت داده‌ها: هوش مصنوعی مستقل مستلزم اطمینان از پردازش و ذخیره ایمن داده‌ها در داخل مرزهای یک کشور است.
توسعه سیستم‌های هوش مصنوعی عامل‌محور: ساخت برنامه‌های هوش مصنوعی که می‌توانند فرآیندهای پیچیده چند مرحله‌ای را به صورت ناهمزمان انجام دهند، یک حوزه چالش برانگیز اما امیدوارکننده تحقیقات است.

فرصت‌های کلیدی در ساخت برنامه‌های هوش مصنوعی سازمانی:

توسعه راه حل‌های نوآورانه هوش مصنوعی: چالش‌های موجود در ساخت برنامه‌های هوش مصنوعی سازمانی فرصت‌هایی را برای توسعه راه حل‌های نوآورانه که به نیازهای خاص می‌پردازند، ایجاد می‌کند.
استفاده از فناوری‌های متن باز: فناوری‌های متن باز می‌توانند به کاهش هزینه‌ها و تسریع توسعه برنامه‌های هوش مصنوعی کمک کنند.
همکاری با شرکای سخت افزاری: همکاری با شرکای سخت افزاری می‌تواند به اطمینان از بهینه سازی برنامه‌های هوش مصنوعی برای پلتفرم‌های سخت افزاری خاص کمک کند.
ایجاد قابلیت‌های هوش مصنوعی مستقل: هوش مصنوعی مستقل می‌تواند کنترل بیشتری بر داده‌ها و زیرساخت هوش مصنوعی خود به ملت‌ها و سازمان‌ها ارائه دهد.
تغییر صنایع با هوش مصنوعی: هوش مصنوعی این پتانسیل را دارد که صنایع را با خودکارسازی وظایف، بهبود تصمیم گیری و ایجاد محصولات و خدمات جدید متحول کند.

آینده برنامه‌های هوش مصنوعی سازمانی:

آینده برنامه‌های هوش مصنوعی سازمانی احتمالاً با موارد زیر مشخص می‌شود:

افزایش پیچیدگی: برنامه‌های هوش مصنوعی پیچیده‌تر و یکپارچه‌تر خواهند شد و نیاز به تخصص و ابزارهای تخصصی دارند.
تمرکز بیشتر بر کیفیت داده‌ها: کیفیت داده‌ها با تکیه برنامه‌های هوش مصنوعی بر داده‌های دقیق و قابل اعتماد، اهمیت بیشتری پیدا می‌کند.
تاکید بیشتر بر امنیت و حریم خصوصی: امنیت و حریم خصوصی با رسیدگی برنامه‌های هوش مصنوعی به داده‌های حساس، از اهمیت بالایی برخوردار خواهد بود.
پذیرش گسترده‌تر هوش مصنوعی عامل‌محور: سیستم‌های هوش مصنوعی عامل‌محور با تلاش سازمان‌ها برای خودکارسازی وظایف پیچیده، رایج‌تر می‌شوند.
نوآوری مداوم: زمینه هوش مصنوعی به سرعت به تکامل خود ادامه می‌دهد و منجر به پیشرفت‌ها و فرصت‌های جدید می‌شود.

سازمان‌ها با پرداختن به چالش‌ها و استقبال از فرصت‌ها، می‌توانند از قدرت هوش مصنوعی برای متحول کردن کسب و کار خود و ایجاد آینده‌ای بهتر استفاده کنند.

به‌روزرسانی‌شده در ۲۰۲۵-۰۲-۲۴

# AI # LLM # RAG