با رشد روزافزون حوزه عاملهای هوش مصنوعی (AI agents) که آماده دگرگونی سناریوهای کاربردی متعددی است، تقاضای بیسابقهای برای طول پنجره زمینه (context window length) در مدلهای زبانی بزرگ (LLMs) ایجاد شده است. چه مدیریت حافظه تولیدشده توسط یک عامل هوش مصنوعی در طول عملیات آن و چه هماهنگی دادههای زمینهای ناشی از فعالیت مشترک چندین عامل، توانایی پردازش توالیهای گسترده اطلاعات از اهمیت بالایی برخوردار شده است.
در پاسخ به این نیاز روزافزون، پلتفرم اینترنت ملی سوپرکامپیوتر به تازگی از مدلهای بزرگ چندوجهی با زمینه گسترده خود پرده برداشته است. این مدلها که توسط شرکت فناوری سنگ نادر شانگهای (Rare Stone Technology Co., Ltd.) توسعه یافتهاند، با نامهای MiniMax-Text-01 و MiniMax-VL-01 معرفی شدهاند.
اینترنت ملی سوپرکامپیوتر: کاتالیزوری برای نوآوری هوش مصنوعی
اینترنت ملی سوپرکامپیوتر که رسماً در آوریل 2024 راهاندازی شد، به عنوان یک پلتفرم ملی برای خدمات سوپرکامپیوتر عمل میکند. در فوریه همان سال، این پلتفرم “برنامه تسریع مشارکت اکوسیستم هوش مصنوعی” را آغاز کرد. این برنامه برای تقویت رشد شرکای اکوسیستم خود از طریق یک رویکرد چندوجهی طراحی شده است که شامل توانمندسازی فنی، همکاری در بازار و پشتیبانی منابع میشود. مشوقهایی مانند دسترسی رایگان به رابط API DeepSeek به مدت سه ماه و یک مجموعه قابل توجه از منابع محاسباتی به ارزش میلیونها ساعت هسته (core-hours) ارائه میشود.
پلتفرم اینترنت ملی سوپرکامپیوتر از زمان آغاز به کار خود، رشد چشمگیری را تجربه کرده است. این پلتفرم بیش از 350,000 کاربر را به خود جذب کرده و با بیش از 20 مرکز سوپرکامپیوتر و محاسبات هوشمند در 14 استان و شهرداری در چین ارتباط برقرار کرده است. این پلتفرم دارای یک فهرست چشمگیر از بیش از 6,500 محصول محاسباتی است که شامل نزدیک به 240 سرویس مدل هوش مصنوعی میشود. این انتخاب متنوع شامل مدلهای متنباز داخلی مانند Tongyi Qianwen Qwen و DeepSeek از Alibaba و همچنین مدلهای متنباز هوش مصنوعی بینالمللی مانند Llama، Stable Diffusion و Gemma میشود.
فناوری سنگ نادر و انقلاب زمینه گسترده
فناوری سنگ نادر معتقد است که همکاری آن با پلتفرم اینترنت ملی سوپرکامپیوتر، نوآوری در تحقیقات فناوری زمینه طولانی و کاربردهای عملی آن را تسریع خواهد کرد. با بهبود قابلیتهای زمینه طولانی و قابلیتهای پردازش چندوجهی، عاملهای هوش مصنوعی میتوانند راهحلهای جامعتر و کارآمدتری را در صنایع مختلف ارائه دهند.
به گفته رئیس تحقیق و توسعه در فناوری سنگ نادر، مدلهای بزرگ فعلی، علیرغم “مغزهای” بزرگ خود، اغلب از “حافظه” ناکافی رنج میبرند. چالش اصلی این است که مدلها بتوانند اسناد گستردهای مانند قراردادهای قانونی 1000 صفحهای، رمانهای طولانی یا پروژههای کدنویسی متشکل از صدها هزار خط را درک کنند. هدف این است که مدلها بتوانند خلاصههای دقیقی تولید کنند، خطرات احتمالی را شناسایی کنند و توصیههای ساختاریافته ارائه دهند. با این حال، بیشتر مدلهای زبانی بزرگ موجود حتی نمیتوانند این مطالب را به طور کامل بخوانند، چه برسد به پردازش اطلاعات چندوجهی مانند صدا و تصویر. هدف MiniMax-01 غلبه بر این محدودیت با پنجره زمینه تقریباً 7 میلیون کاراکتری خود است که آن را قادر میسازد تا تمام چهار رمان بزرگ کلاسیک چین و مجموعه کامل هری پاتر را به طور همزمان پردازش کند.
MiniMax-01: پارادایم جدیدی در قابلیتهای مدل زبانی
نسل جدید مدلهای MiniMax-01 که در اوایل سال جاری منتشر و متنباز شدند، با گسترش مکانیسم توجه خطی به مدلهای تجاری برای اولین بار، یک گام بزرگ رو به جلو را نشان میدهد. این پیشرفت قابلیتهای کلی آن را به بالاترین سطح در سطح جهانی سوق داده است. به طور خاص، MiniMax-01 در “طول زمینه” برتری دارد و به 20 تا 32 برابر ظرفیت برخی از مدلهای پیشرو در سراسر جهان دست مییابد. پنجره زمینه استنتاج آن میتواند به 4 میلیون توکن (واحد کلمه) برسد.
از نظر معماری، MiniMax-Text-01 دارای یک بازسازی تقریباً کامل از سیستمهای آموزش و استنتاج خود است. این مدل دارای 456 میلیارد پارامتر است که هر بار 45.9 میلیارد از آنها فعال میشوند. معماری نوآورانه آن شامل 80 لایه توجه است که مدل را قادر میسازد تا ضمن پردازش موثر ورودیهای طولانی، تأخیر کمی را حفظ کند. این امر به مدل اجازه میدهد تا حجم زیادی از متن را به یکباره تجزیه و تحلیل کند و محتوای فوقالعاده طولانی را به طور واقعی درک و به طور کارآمد پردازش کند.
رشد همافزایی: MiniMax و اینترنت ملی سوپرکامپیوتر
ادغام MiniMax در اینترنت ملی سوپرکامپیوتر، از منابع محاسباتی قوی، اکوسیستم مشارکتی و شبکه گسترده توسعهدهندگان این پلتفرم بهره خواهد برد. به گفته فناوری سنگ نادر، این مشارکت نه تنها الهامبخش تحقیقات نوآورانه بیشتر و کاربردهای عملی برای فناوری زمینه طولانی خواهد بود و ظهور عصر عامل را تسریع خواهد کرد، بلکه توسعه و نوآوری مدل عمیقتر و با کیفیتتر را از طریق ابتکارات متنباز تشویق خواهد کرد. در آینده، این شرکت قصد دارد به انتشار نسخههای جدیدی از مدلهای پرچمدار خود در قالب متنباز ادامه دهد و همکاری خود را با اینترنت ملی سوپرکامپیوتر عمیقتر کند تا به طور مشترک توسعه شتابیافته فناوری هوش مصنوعی داخلی را ترویج کند.
مبانی فنی MiniMax-01
پیشرفتهای MiniMax-01 ریشه در چندین نوآوری فنی کلیدی دارد. پذیرش یک مکانیسم توجه خطی به طور قابل توجهی پیچیدگی محاسباتی مرتبط با پردازش توالیهای طولانی را کاهش میدهد و مدل را قادر میسازد تا زمینههای بسیار بزرگتری را بدون قربانی کردن سرعت یا کارایی مدیریت کند. معماری این مدل به گونهای طراحی شده است که هم آموزش و هم استنتاج را بهینه کند و به آن اجازه میدهد تا از حجم عظیمی از دادهها یاد بگیرد و پیشبینیهای دقیقی را در زمان واقعی انجام دهد. آرایش نوآورانه 80 لایه توجه نقش مهمی در متعادل کردن اثربخشی پردازش و تأخیر ایفا میکند و تضمین میکند که مدل میتواند ورودیهای طولانی را بدون گیر کردن مدیریت کند.
اهمیت طول زمینه
توانایی پردازش زمینههای طولانی برای طیف گستردهای از کاربردهای هوش مصنوعی ضروری است. در سناریوهایی مانند تجزیه و تحلیل اسناد حقوقی، مدلسازی مالی و تحقیقات علمی، سیستمهای هوش مصنوعی باید بتوانند اطلاعات پیچیدهای را که در بسیاری از صفحات یا حتی کل اسناد گسترده شده است، درک و درباره آنها استدلال کنند. به طور مشابه، در خدمات مشتری و پشتیبانی فنی، عاملهای هوش مصنوعی باید بتوانند زمینه را در طول مکالمات طولانی حفظ کنند تا کمک موثری ارائه دهند. MiniMax-01 و سایر مدلهای زمینه گسترده با افزایش طول زمینهای که مدلهای هوش مصنوعی میتوانند مدیریت کنند، امکانات جدیدی را برای کاربردهای هوش مصنوعی در این و سایر حوزهها باز میکنند.
پردازش چندوجهی: گسترش دامنه هوش مصنوعی
MiniMax-01 علاوه بر قابلیتهای چشمگیر طول زمینه خود، از پردازش چندوجهی نیز پشتیبانی میکند. این بدان معناست که مدل میتواند اطلاعات را از منابع متعددی مانند متن، تصاویر، صدا و فیلم درک و درباره آنها استدلال کند. پردازش چندوجهی برای کاربردهایی مانند رانندگی خودکار، رباتیک و واقعیت مجازی ضروری است، جایی که سیستمهای هوش مصنوعی باید بتوانند به طور طبیعی و شهودی با دنیای واقعی تعامل داشته باشند. MiniMax-01 با ترکیب قابلیتهای زمینه طولانی با پردازش چندوجهی، راه را برای نسل جدیدی از سیستمهای هوش مصنوعی هموار میکند که همهکارهتر و توانمندتر از همیشه هستند.
تأثیر گستردهتر اینترنت ملی سوپرکامپیوتر
اینترنت ملی سوپرکامپیوتر نقش مهمی در تسریع توسعه هوش مصنوعی در چین ایفا میکند. این پلتفرم با فراهم کردن دسترسی به منابع محاسباتی پیشرفته، تقویت همکاری بین محققان و توسعهدهندگان و ترویج ابتکارات متنباز، یک اکوسیستم پویا برای نوآوری هوش مصنوعی ایجاد میکند. راهاندازی مدلهای بزرگ چندوجهی با زمینه گسترده مانند MiniMax-01 تنها نمونهای از تأثیر این پلتفرم است. با ادامه رشد و تکامل این پلتفرم، احتمالاً نقش مهمتری در شکلدهی به آینده هوش مصنوعی ایفا خواهد کرد.
تقویت همکاری و نوآوری
اینترنت ملی سوپرکامپیوتر برای تقویت همکاری و نوآوری در بین محققان، توسعهدهندگان و مشاغل طراحی شده است. این پلتفرم یک زیرساخت مشترک فراهم میکند که این گروههای مختلف را قادر میسازد تا به طور موثرتری با یکدیگر همکاری کنند. همچنین ابتکارات متنباز را ترویج میکند که مشوقی برای به اشتراک گذاری دانش و منابع است. این پلتفرم با ایجاد یک اکوسیستم مشارکتی، سرعت نوآوری هوش مصنوعی را تسریع میکند.
حمایت از رشد و توسعه اقتصادی
توسعه هوش مصنوعی این پتانسیل را دارد که رشد و توسعه اقتصادی قابل توجهی را به همراه داشته باشد. هوش مصنوعی با خودکارسازی وظایف، بهبود کارایی و ایجاد محصولات و خدمات جدید، میتواند به مشاغل کمک کند تا رقابتیتر شوند و مشاغل جدید ایجاد کنند. اینترنت ملی سوپرکامپیوتر با فراهم کردن زیرساخت و منابع مورد نیاز برای توسعه و استقرار راهحلهای هوش مصنوعی، نقش کلیدی در حمایت از این رشد اقتصادی ایفا میکند.
آینده عاملهای هوش مصنوعی و مدلهای زمینه گسترده
توسعه عاملهای هوش مصنوعی هنوز در مراحل اولیه خود قرار دارد، اما کاربردهای بالقوه آن بسیار گسترده است. از عاملهای هوش مصنوعی میتوان برای خودکارسازی وظایف در طیف گستردهای از صنایع، از مراقبتهای بهداشتی و مالی گرفته تا تولید و حمل و نقل استفاده کرد. همچنین میتوان از آنها برای ارائه خدمات شخصیسازیشده به افراد، مانند آموزش، سرگرمی و مراقبتهای بهداشتی استفاده کرد. با پیشرفتهتر و توانمندتر شدن عاملهای هوش مصنوعی، احتمالاً تأثیر عمیقی بر جامعه خواهند داشت.
مدلهای زمینه گسترده مانند MiniMax-01 برای توسعه عاملهای هوش مصنوعی پیشرفته ضروری هستند. این مدلها عاملهای هوش مصنوعی را قادر میسازند تا اطلاعات پیچیده را درک و درباره آنها استدلال کنند، زمینه را در طول مکالمات طولانی حفظ کنند و به طور طبیعی و شهودی با دنیای واقعی تعامل داشته باشند. با ادامه افزایش طول زمینهها، عاملهای هوش مصنوعی قدرتمندتر و همهکارهتر خواهند شد.
راهاندازی مدلهای بزرگ چندوجهی با زمینه گسترده در پلتفرم اینترنت ملی سوپرکامپیوتر، یک نقطه عطف مهم در توسعه هوش مصنوعی است. این مدلها امکانات جدیدی را برای کاربردهای هوش مصنوعی در طیف گستردهای از صنایع باز میکنند. با ادامه رشد و تکامل این پلتفرم، احتمالاً نقش مهمتری در شکلدهی به آینده هوش مصنوعی ایفا خواهد کرد. همکاری بین فناوری سنگ نادر و اینترنت ملی سوپرکامپیوتر نمونهای از قدرت ترکیب تحقیقات پیشرفته با زیرساخت قوی برای پیشبرد نوآوری است. آنها با هم راه را برای عصر جدیدی از هوش مصنوعی هموار میکنند، جایی که عاملهای هوشمند میتوانند جهان را به گونهای درک، استدلال و تعامل کنند که قبلاً غیرقابل تصور بود.
ملاحظات اخلاقی هوش مصنوعی
با قدرتمندتر شدن هوش مصنوعی، مهم است که پیامدهای اخلاقی استفاده از آن را در نظر بگیریم. سیستمهای هوش مصنوعی باید به گونهای توسعه و مستقر شوند که منصفانه، شفاف و پاسخگو باشند. نباید از آنها برای تبعیض علیه افراد یا گروهها استفاده شود و نباید برای نقض حقوق بشر استفاده شوند. همچنین مهم است که اطمینان حاصل شود که سیستمهای هوش مصنوعی ایمن و قابل اعتماد هستند و در برابر حملات مخرب آسیبپذیر نیستند. با پرداختن به این ملاحظات اخلاقی، میتوانیم اطمینان حاصل کنیم که از هوش مصنوعی به نفع بشریت استفاده میشود.
اهمیت آموزش
برای تحقق کامل پتانسیل هوش مصنوعی، مهم است که در آموزش سرمایهگذاری کنیم. مردم باید در مورد قابلیتها و محدودیتهای هوش مصنوعی آموزش ببینند و باید برای استفاده مؤثر از ابزارهای هوش مصنوعی آموزش ببینند. این شامل آموزش دانشمندان داده، مهندسان نرمافزار و سایر متخصصان فنی، و همچنین آموزش عموم مردم در مورد هوش مصنوعی و تأثیر بالقوه آن بر جامعه است. با سرمایهگذاری در آموزش، میتوانیم اطمینان حاصل کنیم که مردم مهارتها و دانش مورد نیاز برای پیشرفت در دنیای مبتنی بر هوش مصنوعی را دارند.
همکاری کلید است
توسعه هوش مصنوعی یک تلاش پیچیده و چالشبرانگیز است که نیاز به همکاری در بین محققان، توسعهدهندگان، سیاستگذاران و مردم دارد. با همکاری، میتوانیم اطمینان حاصل کنیم که هوش مصنوعی به گونهای توسعه یافته و مورد استفاده قرار میگیرد که برای همه بشریت سودمند باشد.