GOSIM AI প্যারিস ২০২৫: এক গভীর অনুসন্ধান

গত এক বছরে এআই ল্যান্ডস্কেপের নাটকীয় পরিবর্তন হয়েছে, যার মূলে রয়েছে ওপেন সোর্স ডেভেলপমেন্টের সহযোগী মনোভাব। এখন আর শুধুমাত্র টেক জায়ান্টদের ক্ষেত্র নয়, লার্জ ল্যাঙ্গুয়েজ মডেল (LLMs) কমিউনিটির প্রচেষ্টা এবং সকলের সাথে অবাধে শেয়ার করার মাধ্যমে বিকশিত হচ্ছে, যা ইনফ্রাস্ট্রাকচার থেকে শুরু করে অ্যালগরিদম অপটিমাইজেশন এবং ডেপ্লয়মেন্ট পর্যন্ত সবকিছুকে প্রভাবিত করছে। এই ওপেন সোর্স মুভমেন্ট এআই-এর অগ্রগতিকে ত্বরান্বিত করছে, এটিকে আরও সহজলভ্য করে তুলছে এবং বুদ্ধিমান সিস্টেমের পরবর্তী প্রজন্মে অবদান রাখার সুযোগকে গণতান্ত্রিক করছে।

এই প্রেক্ষাপটে, GOSIM, CSDN, এবং 1ms.ai এর যৌথ উদ্যোগে GOSIM AI প্যারিস ২০২৫ সম্মেলন ফ্রান্সের প্যারিসে ৬ই মে শুরু হয়েছে। এই ইভেন্টটি একটি গুরুত্বপূর্ণ প্ল্যাটফর্ম হিসেবে কাজ করে, যা বিশ্বব্যাপী প্রযুক্তিবিদ এবং গবেষকদের একত্রিত করে ওপেন সোর্স এআই-এর সর্বশেষ অগ্রগতি এবং ভবিষ্যতের দিকনির্দেশনা নিয়ে আলোচনা করতে সাহায্য করে।

সম্মেলনে আলিবাবা, Hugging Face, BAAI, MiniMax, Neo4j, Dify, MetaGPT, Zhipu AI, Eigent.AI, Docker, Inflow, পিকিং ইউনিভার্সিটি, Fraunhofer, অক্সফোর্ড ইউনিভার্সিটি এবং ফ্রেঞ্চ ওপেনএলএলএম কমিউনিটির মতো শীর্ষস্থানীয় সংস্থা থেকে ৮০ জনেরও বেশি প্রযুক্তি বিশেষজ্ঞ এবং পণ্ডিত অংশ নিয়েছেন। হুয়াওয়ে, ফ্রান্সের অল-চায়না ইয়ুথ ইনোভেশন অ্যান্ড এন্টারপ্রেনারশিপ অ্যাসোসিয়েশন, সিনো-ফ্রেঞ্চ আর্টিফিশিয়াল ইন্টেলিজেন্স অ্যাসোসিয়েশন, অ্যাপাচি সফটওয়্যার ফাউন্ডেশন, Eclipse Foundation, The Khronos Group, WasmEdgeRuntime, LF Generative AI Commons, লিনাক্স ফাউন্ডেশন রিসার্চ, ওপেনওয়ালেট ফাউন্ডেশন, ওপেন সোর্স ইনিশিয়েটিভ (OSI), সফটওয়্যার হেরিটেজ এবং K8SUG-এর মতো মূল অংশীদাররাও সক্রিয়ভাবে অংশগ্রহণ করছেন। সম্মেলনে এআই মডেল, ইনফ্রাস্ট্রাকচার, অ্যাপ্লিকেশন ডেপ্লয়মেন্ট এবং এমবডায়েড ইন্টেলিজেন্সের মতো মূল থিমগুলোর উপর ভিত্তি করে ৬০টির বেশি টেকনিক্যাল সেশন অনুষ্ঠিত হয়েছে, যা ওপেন সোর্স ইকোসিস্টেমের বিবর্তন এবং নতুন প্রবণতাগুলোর একটি বিস্তৃত চিত্র প্রদান করে।

এআই এবং ওপেন সোর্সের মধ্যে মিথোজীবী সম্পর্ক

GOSIM-এর সহ-প্রতিষ্ঠাতা মাইকেল ইউয়ান "ওপেন সোর্স ধরে ফেলেছে, এরপর কী?" শীর্ষক একটি মূল বক্তব্য দিয়ে সম্মেলনের সূচনা করেন। তিনি ওপেন সোর্স এআই-এর বর্তমান অবস্থা এবং ভবিষ্যতের গতিপথ নিয়ে তার মতামত তুলে ধরেন এবং জোর দিয়ে বলেন যে এটি একটি গুরুত্বপূর্ণ মুহূর্তে পৌঁছেছে।

ইউয়ান বলেন, "আমরা একবার ভবিষ্যদ্বাণী করেছিলাম যে ওপেন সোর্সকে ক্লোজড-সোর্স মডেলগুলোর সাথে তাল মেলাতে ৫-১০ বছর লাগবে, তবে মনে হচ্ছে এই লক্ষ্য নির্ধারিত সময়ের আগেই অর্জিত হয়েছে।" তিনি Qwen 3-এর সাম্প্রতিক প্রকাশকে উদাহরণ হিসেবে উল্লেখ করেন এবং বলেন যে ওপেন সোর্স মডেলগুলো এখন আর কেবল নিজেদের মধ্যে প্রতিযোগিতা করছে না, বরং সরাসরি মালিকানাধীন ফ্ল্যাগশিপ মডেলগুলোকে চ্যালেঞ্জ জানাচ্ছে, এমনকি কিছু ক্ষেত্রে সেগুলোকে ছাড়িয়েও যাচ্ছে। ইউয়ান আরও বলেন যে এই অগ্রগতি শুধুমাত্র ওপেন সোর্সের উন্নতির কারণে নয়, বরং ক্লোজড-সোর্স ডেভেলপমেন্ট প্রত্যাশা পূরণ করতে ব্যর্থ হয়েছে এবং কর্মক্ষমতা সংক্রান্ত সমস্যাগুলোর সম্মুখীন হয়েছে। বিপরীতে, ওপেন সোর্স মডেলগুলো দ্রুত বিকশিত হচ্ছে, একটি দ্রুত কর্মক্ষমতা বৃদ্ধির кривая প্রদর্শন করছে এবং একটি உண்மையான "ক্যাচ-আপ"現象 দেখাচ্ছে।

এই পর্যবেক্ষণ একটি মৌলিক প্রশ্ন উত্থাপন করে: আমরা আর্টিফিশিয়াল জেনারেল ইন্টেলিজেন্স (AGI) অর্জন থেকে কতটা দূরে? ইউয়ান বিশ্বাস করেন যে AGI-এর ভবিষ্যত কোনো একক, সর্বব্যাপী মডেলের মধ্যে নিহিত নাও থাকতে পারে, বরং ব্যক্তিগত হার্ডওয়্যার বা রোবোটিক ডিভাইসে স্থাপন করা বিশেষ মডেল, জ্ঞানভিত্তি এবং সরঞ্জামগুলোর একটি নেটওয়ার্কের মধ্যে থাকতে পারে।

তিনি আরও ব্যাখ্যা করেন যে এআই আর্কিটেকচার কেন্দ্রীভূত থেকে বিকেন্দ্রীভূত দৃষ্টান্তের দিকে স্থানান্তরিত হচ্ছে। তিনি OpenAI-এর Completion API থেকে নতুন Responses API-তে পরিবর্তনের কথা তুলে ধরেন, যার লক্ষ্য একটি বৃহৎ আকারের বুদ্ধিমান এজেন্ট প্ল্যাটফর্ম তৈরি করা। প্রায় ৬০০,০০০ ব্যবহারকারী এবং ডেভেলপার ইতিমধ্যেই এই পরিবর্তনে যোগ দিয়েছেন, যা বিতরণ করা এআই অ্যাপ্লিকেশনগুলোর বিকাশে অবদান রাখছে।

ইউয়ান জোর দিয়ে বলেন, "AGI-এর ভবিষ্যত কোনো একক, ভালোভাবে অর্থায়ন করা সংস্থা দ্বারা একচেটিয়াভাবে তৈরি করা উচিত নয়।" "পরিবর্তে, এটি বিশ্বব্যাপী সহযোগিতার মাধ্যমে তৈরি করা উচিত, মডেল, জ্ঞানভিত্তি, রোবট এবং এক্সিকিউশন সিস্টেমগুলোকে অন্তর্ভুক্ত করে একটি ইকোসিস্টেম নেটওয়ার্ক তৈরি করা উচিত।"

ইউয়ানের বক্তব্যের পর, ওপেনওয়ালেট ফাউন্ডেশনের নির্বাহী পরিচালক ড্যানিয়েল গোল্ডশাইডার "GDC ওয়ালেটস অ্যান্ড ক্রেডেনশিয়ালস"-এর উপর একটি উপস্থাপনা দেন, যা জাতিসংঘের সাধারণ পরিষদ কর্তৃক গৃহীত গ্লোবাল ডিজিটাল কমপ্যাক্ট (GDC) প্রকল্পের উপর দৃষ্টি নিবদ্ধ করে। তিনি ব্যাখ্যা করেন যে GDC-এর দুটি মূল উদ্দেশ্য রয়েছে:

  • স্বীকৃতি দেওয়া যে ডিজিটাল প্রযুক্তি আমাদের জীবন এবং সামাজিক উন্নয়নে গভীরভাবে পরিবর্তন এনেছে, যা অভূতপূর্ব সুযোগ এবং অপ্রত্যাশিত ঝুঁকি উভয়ই নিয়ে এসেছে।
  • মানবতার সুবিধার জন্য ডিজিটাল প্রযুক্তির সম্পূর্ণ সম্ভাবনা উপলব্ধি করতে বিশ্বব্যাপী সহযোগিতা প্রয়োজন, দেশ, শিল্প এবং এমনকি সরকারি ও বেসরকারি খাতের মধ্যে বাধা ভেঙে দেওয়া প্রয়োজন।

এই অভিন্ন ধারণার উপর ভিত্তি করে, GDC "গ্লোবাল ডিজিটাল কোলাবরেশন" উদ্যোগের জন্ম দিয়েছে, যার লক্ষ্য সরকার, ব্যবসা, অলাভজনক সংস্থা এবং অন্যান্য স্টেকহোল্ডারদের মধ্যে প্রকৃত সহযোগিতা গড়ে তোলা।

কার্যকরী দিক নিয়ে আলোচনার সময়, গোল্ডশাইডার জোর দিয়ে বলেন যে এই সহযোগিতা কোনো একক সংস্থা দ্বারা নির্ধারিত নয়, বরং একটি "যৌথ আহ্বায়ক" পদ্ধতি গ্রহণ করে, যেখানে আগ্রহী সকল আন্তর্জাতিক সংস্থা, স্ট্যান্ডার্ড-সেটিং বডি, ওপেন সোর্স কমিউনিটি এবং আন্তঃসরকারি সংস্থাকে অংশগ্রহণের জন্য আমন্ত্রণ জানানো হয়। তিনি স্পষ্ট করেন যে এটি "কে কাকে নেতৃত্ব দেয়" প্রকল্প নয়, বরং একটি সমান সহযোগিতা প্ল্যাটফর্ম যেখানে প্রতিটি দলের একটি কণ্ঠস্বর রয়েছে এবং কেউ অন্যের চেয়ে বেশি গুরুত্বপূর্ণ নয়।

তিনি আরও ব্যাখ্যা করেন যে গ্লোবাল ডিজিটাল কোলাবরেশনের লক্ষ্য সরাসরি কোনো স্ট্যান্ডার্ড বা প্রযুক্তি তৈরি করা নয়, বরং বিভিন্ন পটভূমির সংস্থাগুলোর মধ্যে একটি সংলাপের সুবিধা তৈরি করা, যাতে তারা একটি ঐকমত্যে পৌঁছানোর জন্য তাদের দৃষ্টিকোণ এবং চাহিদা উপস্থাপন করতে পারে। পরবর্তীতে, নির্দিষ্ট স্ট্যান্ডার্ড এবং প্রযুক্তিগত কাজগুলো প্রাসঙ্গিক বিশেষ সংস্থাগুলো দ্বারা এগিয়ে নিয়ে যাওয়া হবে। তিনি "ডিজিটাল পরিচয়" এবং "বায়োমেট্রিক প্রযুক্তি"-কে উদাহরণ হিসেবে উল্লেখ করেন, এবং বলেন যে অনেক সংস্থা ইতিমধ্যেই এই ক্ষেত্রগুলোতে কাজ করছে, যেখানে সকলকে একত্রিত করার জন্য একটি নিরপেক্ষ প্ল্যাটফর্মের প্রয়োজনীয়তার উপর জোর দেওয়া হয়েছে, যাতে পুনরাবৃত্তি, দ্বন্দ্ব এবং সম্পদের অপচয় এড়ানো যায়।

চারটি ডেডিকেটেড ফোরাম: ওপেন সোর্স এআই-এর একটি বিস্তৃত বিশ্লেষণ

সম্মেলনে চারটি বিশেষ ফোরাম ছিল: এআই মডেল, এআই ইনফ্রাস্ট্রাকচার, এআই অ্যাপ্লিকেশন এবং এমবডায়েড ইন্টেলিজেন্স। এই ফোরামগুলোতে অন্তর্নিহিত আর্কিটেকচার থেকে শুরু করে অ্যাপ্লিকেশন ডেপ্লয়মেন্ট, মডেলের ক্ষমতা থেকে শুরু করে ইন্টেলিজেন্ট এজেন্ট অনুশীলন পর্যন্ত গুরুত্বপূর্ণ বিষয়গুলো অন্তর্ভুক্ত ছিল। প্রতিটি ফোরামে বিশ্বব্যাপী বিভিন্ন এন্টারপ্রাইজ এবং গবেষণা প্রতিষ্ঠানের শীর্ষস্থানীয় বিশেষজ্ঞরা অংশ নিয়েছিলেন, যা সর্বশেষ প্রযুক্তিগত প্রবণতাগুলোর গভীর বিশ্লেষণ এবং প্রকৌশল অনুশীলনের সমৃদ্ধ উদাহরণ উপস্থাপন করে, যা একাধিক ক্ষেত্রে ওপেন সোর্স এআই-এর ব্যাপক интеграция এবং বিবর্তন প্রদর্শন করে।

এআই লার্জ মডেলের অন্তর্নিহিত যুক্তির বিশ্লেষণ

এআই মডেল ফোরাম ওপেন সোর্স কমিউনিটি এবং গবেষণা প্রতিষ্ঠানের বিশেষজ্ঞদের একত্রিত করেছে, যাতে লার্জ মডেলের ক্ষেত্রে স্থাপত্য উদ্ভাবন, ওপেন সোর্স সহযোগিতা এবং ইকোসিস্টেমের বিবর্তন সম্পর্কে মতামত আদান প্রদান করা যায়।

Hugging Face-এর মেশিন লার্নিং রিসার্চ ইঞ্জিনিয়ার গুইলার্ম পেন্ডো "Open-R1: DeepSeek-R1-এর একটি সম্পূর্ণ ওপেন সোর্স পুনরুৎপাদন" উপস্থাপন করেন, যেখানে DeepSeek-R1 মডেলটিকে প্রতিলিপি করার জন্য Open-R1 প্রকল্পের প্রচেষ্টা তুলে ধরা হয়, যার মূল লক্ষ্য ছিল ইনফারেন্স বিষয়ক ডেটার উন্মুক্ততা এবং মান standardization-কে बढ़ावा দেওয়া। Zhiyuan Research Institute-এর ডেটা রিসার্চ টিমের টেকনোলজি লিডার গুয়াং লিউ "OpenSeek: পরবর্তী প্রজন্মের লার্জ মডেলের দিকে সহযোগী উদ্ভাবন" শেয়ার করেন, যেখানে অ্যালগরিদম, ডেটা এবং সিস্টেম স্তরে মডেল কর্মক্ষমতার অগ্রগতিতে বিশ্বব্যাপী সহযোগিতার গুরুত্বের উপর জোর দেওয়া হয়, যার লক্ষ্য DeepSeek-কে ছাড়িয়ে যাওয়া পরবর্তী প্রজন্মের লার্জ মডেল তৈরি করা।

CSDN-এর সিনিয়র ভাইস প্রেসিডেন্ট জেসন লি "Decoding DeepSeek: প্রযুক্তিগত উদ্ভাবন এবং এআই ইকোসিস্টেমে এর প্রভাব" প্রদান করেন, যেখানে প্রযুক্তিগত দৃষ্টান্ত, মডেল আর্কিটেকচার এবং শিল্প বাস্তুসংস্থানে DeepSeek-এর উদ্ভাবনগুলোর একটি গভীর বিশ্লেষণ এবং বিশ্বব্যাপী এআই ইকোসিস্টেমে এর সম্ভাব্য প্রভাব নিয়ে আলোচনা করা হয়। MiniMax-এর সিনিয়র রিসার্চ ডিরেক্টর ইরান ঝং "লিনিয়ার ফিউচার: লার্জ ল্যাঙ্গুয়েজ মডেল আর্কিটেকচারের বিবর্তন" উপস্থাপন করেন, যেখানে দলের প্রস্তাবিত লাইটনিং অ্যাটেনশন মেকানিজম উপস্থাপন করা হয়, যা কার্যকারিতা এবং কর্মক্ষমতার দিক থেকে ট্রান্সফরমার আর্কিটেকচারের একটি বিকল্প প্রস্তাব করে। অক্সফোর্ড ইউনিভার্সিটির রয়্যাল সোসাইটি নিউটন ইন্টারন্যাশনাল ফেলো শিওয়েই লিউ "লার্জ ল্যাঙ্গুয়েজ মডেলগুলোতে গভীরতার অভিশাপ" নিয়ে আলোচনা করেন, যেখানে মডেল গভীর হওয়ার সাথে সাথে ডিপ নিউরাল নেটওয়ার্কগুলোর ক্রমহ্রাসমান অবদান এবং গভীর স্তরের ব্যবহার এবং সামগ্রিক কার্যকারিতা উন্নত করতে Pre-LN মেকানিজম উন্নত করার জন্য LayerNorm স্কেলিং ব্যবহারের প্রস্তাব করা হয়। Zhipu AI-এর রিসার্চ ইঞ্জিনিয়ার ডিয়েগো রোজাস "কোড লার্জ ল্যাঙ্গুয়েজ মডেলস: টোকেন ছাড়িয়ে অনুসন্ধান"-এ উল্লেখ করেন যে বর্তমান লার্জ মডেলগুলো শক্তিশালী হলেও এখনও টোকেনাইজেশনের উপর নির্ভর করে, যা অকার্যকর, এবং মডেলগুলোকে দ্রুত এবং শক্তিশালী করার জন্য টোকেনাইজেশন এড়িয়ে যাওয়ার নতুন পদ্ধতি শেয়ার করেন। Fraunhofer IAIS-এর বেসিক মডেল টিমের প্রধান নিকোলাস ফ্লোরেস-হের "কীভাবে বিশ্বব্যাপী প্রতিযোগিতামূলক ‘ইউরোপীয়-তৈরি’ লার্জ ল্যাঙ্গুয়েজ মডেল তৈরি করা যায়?" এর মাধ্যমে ফোরামটি শেষ করেন, যেখানে তিনি জোর দিয়ে বলেন যে ইউরোপ ডেটা, বৈচিত্র্য এবং নিয়ন্ত্রক চ্যালেঞ্জগুলো কাটিয়ে উঠছে বহুভাষিক, ওপেন সোর্স এবং বিশ্বস্ত স্থানীয় লার্জ মডেল প্রকল্পের মাধ্যমে, যাতে ইউরোপীয় মূল্যবোধের প্রতিফলন ঘটানো যায় এমন পরবর্তী প্রজন্মের এআই তৈরি করা যায়।

এআই ইনফ্রাস্ট্রাকচারের ত্রয়ী: ডেটা, কম্পিউটিং পাওয়ার এবং অ্যালগরিদমিক বিবর্তন

লার্জ মডেলগুলোর জন্য আরও উন্মুক্ত, দক্ষ এবং অন্তর্ভুক্তিমূলক ভিত্তি তৈরির উপর দৃষ্টি নিবদ্ধ করে, এআই ইনফ্রাস্ট্রাকচার ফোরাম গবেষণা প্রতিষ্ঠান এবং এন্টারপ্রাইজগুলোর শীর্ষস্থানীয় বিশেষজ্ঞদের একত্রিত করেছে, যাতে ডেটা, কম্পিউটিং পাওয়ার এবং সিস্টেম আর্কিটেকচারের মতো গুরুত্বপূর্ণ বিষয়গুলোতে গভীরভাবে আলোচনা করা যায়।

Zhiyuan Research Institute (BAAI)-এর ভাইস প্রেসিডেন্ট ইয়ংহুয়া লিন "AI Open Source for Good: অন্তর্ভুক্তিমূলক অ্যাপ্লিকেশন, ন্যায্য ডেটা এবং সার্বজনীন কম্পিউটিং পাওয়ার"-এ চাইনিজ ইন্টারনেট কর্পাস CCI 4.0 চালু করেন, जिसमें তিনটি প্রধান ডেটাসেট ছিল: CCI4.0-M2-Base V1, CCI4.0-M2-CoT V1, এবং CCI4.0-M2-Extra V1। CCI4.0-M2-Base V1-এর ডেটার পরিমাণ হল 35000GB, এটি চীনা এবং ইংরেজি উভয় ভাষাতেই উপলব্ধ, যার মধ্যে 5000GB চীনা ডেটা রয়েছে, যা CCI3.0-এর তুলনায় ডেটার அளவில் ৫ গুণ বৃদ্ধি পেয়েছে। CCI4.0-M2-CoT V1-এ যুক্তিবোধ ক্ষমতা উন্নত করার জন্য 450 মিলিয়ন রিভার্স সিনথেসাইজড হিউম্যান থট ট্র্যাজেক্টোরি ডেটা রয়েছে, যার মোট টোকেন সংখ্যা 425B (425 বিলিয়ন), যা বর্তমানে বিশ্বব্যাপী উপলব্ধ বৃহত্তম ওপেন সোর্স সিনথেটিক ডেটাসেট Cosmopedia (Hugging Face দ্বারা ওপেন সোর্স করা) থেকে প্রায় 20 গুণ বড়।

এরপর Huawei-এর সিনিয়র সফটওয়্যার ইঞ্জিনিয়ার জিয়ুয়ান ওয়াং "Ascend CANN-এর উপর ভিত্তি করে প্রশিক্ষণ এবং অনুমানের জন্য সেরা অনুশীলন"-এ Ascend CANN আর্কিটেকচার কীভাবে এআই ফ্রেমওয়ার্ক এবং Ascend হার্ডওয়্যারকে সংযুক্ত করে, এবং PyTorch এবং vLLM-এর মতো সমর্থনকারী ইকোসিস্টেমের মাধ্যমে কীভাবে оптимальный প্রশিক্ষণ অনুমান অর্জন করা যায় তা তুলে ধরেন। Carrefour-এর ডেটা আর্কিটেক্ট গুইলাম ব্ল্যাকুইয়ার "আপনার LLM-কে সার্ভারলেস বানানো"-তে Google Cloud Run-এর মাধ্যমে GPU সমর্থনকারী সার্ভারলেস লার্জ মডেল ইনস্ট্যান্সগুলো কীভাবে স্থাপন করা যায় যাতে খরচ কমানো যায় এবং রিসোর্স ব্যবহারের দক্ষতা বাড়ানো যায় তা প্রদর্শন করেন। পিকিং ইউনিভার্সিটির ইঞ্জিনিয়ার ইনপিং মা "ওপেন সোর্স ইন্টেলিজেন্ট কম্পিউটিং ইন্টিগ্রেটেড ম্যানেজমেন্ট এবং শিডিউলিং বেসিক সফটওয়্যার - SCOW এবং CraneSched"-এর উপর একটি মূল বক্তব্য রাখেন, যেখানে পিকিং ইউনিভার্সিটি দ্বারা তৈরি দুটি প্রধান ওপেন সোর্স বেসিক সফটওয়্যার SCOW এবং CraneSched-এর বিষয়ে আলোচনা করা হয়, যা দেশজুড়ে কয়েক ডজন বিশ্ববিদ্যালয় এবং এন্টারপ্রাইজে স্থাপন করা হয়েছে, যা বুদ্ধিমান কম্পিউটিং রিসোর্সগুলোর সমন্বিত ব্যবস্থাপনা এবং উচ্চ-কর্মক্ষমতা সম্পন্ন শিডিউলিং সমর্থন করে। Beihang University-এর পিএইচডি প্রার্থী ইয়াওয়েই ঝেং "verl: হাইব্রিড কন্ট্রোলারের উপর ভিত্তি করে একটি RLHF সিস্টেম" বক্তৃতায় Verl সিস্টেমে হাইব্রিড কন্ট্রোলার আর্কিটেকচারের নকশা ধারণাটি শেয়ার করেন, এবং বৃহৎ আকারের রিইনফোর্সমেন্ট লার্নিং প্রশিক্ষণে এর দক্ষতার সুবিধাগুলো নিয়ে আলোচনা করেন। Oxen.ai-এর সিইও গ্রেগ শোনিংগার "ডিপসিক-আর1 স্টাইল রিইনফোর্সমেন্ট লার্নিং (GRPO) এর জন্য প্রশিক্ষণ ডেটাসেট এবং ইনফ্রাস্ট্রাকচার" উপস্থাপন করেন এবং ডেটাসেট নির্মাণ, ইনফ্রাস্ট্রাকচার তৈরি এবং স্থানীয় প্রশিক্ষণ কোড জেনারেশন মডেলসহ রিজনিং এলএলএমগুলোর জন্য রিইনফোর্সমেন্ট লার্নিং প্রশিক্ষণ প্রক্রিয়ার অনুশীলনের পথ বিশদভাবে বর্ণনা করেন।

"এটি ব্যবহার করা যেতে পারে" থেকে "এটি কি ভালোভাবে ব্যবহার করা হচ্ছে": এআই অ্যাপ্লিকেশনগুলো ব্যবহারিক পর্যায়ে প্রবেশ করেছে

এআই অ্যাপ্লিকেশন ফোরামে, শীর্ষস্থানীয় কোম্পানিগুলোর গবেষণা ও উন্নয়ন অনুশীলনকারীরা এবং প্রযুক্তি সিদ্ধান্ত গ্রহণকারীরা বিভিন্ন ধরনের মতামত শেয়ার করেছেন, যেখানে লার্জ মডেল দ্বারা চালিত এআই অ্যাপ্লিকেশনগুলোর বাস্তব-বিশ্বের স্থাপন পথ এবং ভবিষ্যতের সম্ভাবনাগুলো তুলে ধরা হয়েছে।

Alibaba Tongyi Lab-এর প্রধান গবেষক ইয়ংবিন লি "Tongyi Lingma: কোডিং কোপাইলট থেকে কোডিং এজেন্ট"-এ প্রযুক্তিগত বিবর্তন এবং পণ্য প্রয়োগে Tongyi Lingma-এর সর্বশেষ অগ্রগতি শেয়ার করেছেন। Huawei-এর সফটওয়্যার ইঞ্জিনিয়ার ডংজি চেন "Cangjie Magic: লার্জ মডেলের যুগে ডেভেলপারদের জন্য একটি নতুন পছন্দ"-এর উপর একটি মূল বক্তব্য রাখেন, যেখানে Cangjie প্রোগ্রামিং ভাষার উপর ভিত্তি করে এআই লার্জ মডেল এজেন্ট ডেভেলপমেন্ট ফ্রেমওয়ার্কের বিষয়ে আলোচনা করা হয়, যা বুদ্ধিমান HarmonyOS অ্যাপ্লিকেশন তৈরি করার ক্ষেত্রে ডেভেলপারদের দক্ষতা উল্লেখযোগ্যভাবে বাড়াতে পারে এবং চমৎকার বিকাশের অভিজ্ঞতা নিয়ে আসতে পারে। LangGenius ডেভেলপার ইকোসিস্টেমের পরিচালক Xinrui Liu "একসাথে কাজ করা, Dify দ্বারা সক্ষম প্রযুক্তিগত শক্তি"-এর উপর দৃষ্টি নিবদ্ধ করেন, যেখানে Dify-এর ওপেন সোর্স ইকোসিস্টেম এবং এআই অ্যাপ্লিকেশনগুলোর জনপ্রিয়তাকে ত্বরান্বিত করতে এর ভূমিকার উপর জোর দেওয়া হয়।

এআই এবং সিস্টেম ইঞ্জিনিয়ারিংয়ের সমন্বয় সম্পর্কে, Makepad-এর সহ-প্রতিষ্ঠাতা Rik Arends একটি অনন্য উপস্থাপনা দিয়েছেন: "অ্যাম্বিয়েন্ট কোডিং ব্যবহার করে, মোবাইল ডিভাইস, ওয়েব পেজ এবং মিক্সড রিয়েলিটির জন্য রাস্ট ইউআই তৈরি করতে এআই ব্যবহার করুন", যেখানে ইউআই-এর জন্য একটি নতুন দৃষ্টান্ত তৈরি করতে অ্যাম্বিয়েন্ট কোডিং কীভাবে ব্যবহার করা যায় তা নিয়ে আলোচনা করা হয়েছে। Broadcom Spring টিমের R&D সফটওয়্যার ইঞ্জিনিয়ার ক্রিশ্চিয়ান Tzolov "MCP এর মাধ্যমে এআই ইন্টিগ্রেশনের জন্য একটি ইউনিফাইড প্যারাডাইম"-এ এমসিপি জাভা এসডিকে এবং স্প্রিং এআই এমসিপির মাধ্যমে কীভাবে বিদ্যমান সিস্টেম এবং রিসোর্সগুলোর সাথে এআই মডেলগুলোকে দক্ষতার সাথে ஒருங்கிணைக்க করা যায় তা প্রদর্শন করার উপর দৃষ্টি নিবদ্ধ করেছেন। Futurewei-এর টেকনোলজি স্ট্র্যাটেজির সিনিয়র ডিরেক্টর ওয়েনজিং চু "MCP এবং A2A-এর ‘T’ মানে হল ট্রাস্ট"-এ দৃষ্টিভঙ্গি আরও উন্নত করেছেন, যেখানে এজেন্ট-ভিত্তিক অ্যাপ্লিকেশনগুলোতে কীভাবে সত্যিকারের নির্ভরযোগ্য এআই সিস্টেম তৈরি করা যায় তা গভীরভাবে বিশ্লেষণ করা হয়েছে। এছাড়াও, Cegid-এর সফটওয়্যার ইঞ্জিনিয়ারিং ম্যানেজার হং-থাই নগুয়েন "Cegid Pulse: মাল্টি-এজেন্ট বিজনেস ম্যানেজমেন্ট প্ল্যাটফর্ম" বক্তৃতায় ব্যবহারিক পরিস্থিতির সাথে মিলিয়ে কীভাবে মাল্টি-এজেন্ট ব্যবসায়িক প্রক্রিয়াগুলোকে নতুন আকার দিতে পারে এবং আরও স্মার্ট এন্টারপ্রাইজ সিদ্ধান্ত গ্রহণ এবং পরিচালনা অর্জন করতে পারে তা তুলে ধরেন।

যখন লার্জ মডেলগুলো "শরীর" দিয়ে সজ্জিত হয়: এমবডায়েড ইন্টেলিজেন্সের আগমন

এমবডায়েড ইন্টেলিজেন্স এআই ক্ষেত্রের সবচেয়ে চ্যালেঞ্জিং এবং перспективный উন্নয়ন направленияগুলোর মধ্যে একটি হয়ে উঠছে। এই ফোরামে, শিল্পের শীর্ষস্থানীয় অনেক প্রযুক্তি বিশেষজ্ঞ "এমবডায়েড ইন্টেলিজেন্স" থিমের চারপাশে গভীরভাবে আলোচনা করেছেন, স্থাপত্য নকশা, মডেল অ্যাপ্লিকেশন এবং দৃশ্যকল্প স্থাপনে তাদের ব্যবহারিক অনুসন্ধানগুলো শেয়ার করেছেন।

ZettaScale-এর সিইও এবং সিটিও অ্যাঞ্জেলো Corsaro "মন, শরীর এবং Zenoh"-এ পরিচয় করিয়ে দিয়েছেন কিভাবে Zenoh প্রোটোকল বুদ্ধিমান রোবট যুগে উপলব্ধি, নির্বাহ এবং জ্ঞানের মধ্যে বাধা ভেঙে দিতে পারে। Dora প্রকল্পের প্রকল্প ব্যবস্থাপক ফিলিপ Oppermann "বিতরণ ডেটা প্রবাহ বাস্তবায়নের জন্য Dora-তে Zenoh ব্যবহার করা" নিয়ে এসেছেন, যেখানে বিতরণ ডেটা প্রবাহ বাস্তবায়নের জন্য Dora-তে Zenoh প্রোটোকলের গুরুত্বপূর্ণ প্রয়োগ ব্যাখ্যা করা হয়েছে। চীনের বিজ্ঞান ও প্রযুক্তি বিশ্ববিদ্যালয়ের অধ্যাপক জেমস ইয়াং "স্বায়ত্তশাসিত ড্রাইভিং-এ বিরূপ নিরাপত্তা-সমালোচনামূলক পরিস্থিতি তৈরি করা" বিষয়ে একটি বক্তব্য রেখেছেন, যেখানে জটিল পরিবেশে স্থিতিশীলতা এবং নির্ভরযোগ্যতা নিশ্চিত করার জন্য বিরূপ পরিস্থিতি তৈরি করে স্বায়ত্তশাসিত ড্রাইভিং প্রযুক্তির সুরক্ষা কীভাবে উন্নত করা যায় সে বিষয়ে আলোচনা করা হয়েছে।

এছাড়াও, Zhiyuan Research Institute-এর একজন এমবডায়েড ইন্টেলিজেন্স গবেষক মিংলান লিন "RoboBrain: রোবট অপারেশন এবং RoboOS-এর জন্য একটি ইউনিফাইড ব্রেইন মডেল: RoboBrain এবং রোবট ইন্টেলিজেন্ট এজেন্টদের জন্য একটি শ্রেণিবদ্ধ সহযোগিতা কাঠামো" বিষয়ে আলোকপাত করেছেন, যেখানে RoboBrain কীভাবে রোবটগুলোর বুদ্ধিমত্তার স্তর উন্নত করতে পারে এবং রোবট সহযোগিতায় RoboOS-এর গুরুত্বপূর্ণ ভূমিকা নিয়ে আলোচনা করা হয়েছে। Voyage Robotics-এর প্রতিষ্ঠাতা Ville Kuosmanen "ওপেন সোর্স ভিএলএ মডেলের সাথে রোবট অ্যাপ্লিকেশন তৈরি করা" বিষয়ে একটি চমৎকার বক্তব্য দিয়েছেন, যেখানে রোবট অ্যাপ্লিকেশনগুলোর জন্য শক্তিশালী সমর্থন প্রদানের জন্য কীভাবে ওপেন সোর্স ভিএলএ মডেল ব্যবহার করা যায় সে বিষয়ে ব্যাখ্যা করা হয়েছে। সবশেষে, Menlo Research-এর লার্জ ল্যাঙ্গুয়েজ মডেল গবেষক Huy Hoang Ha "স্থানিক রিজনিং এলএলএম: রোবট পরিচালনা এবং নেভিগেশনকে সমর্থন করার জন্য 2D এবং 3D-এর বোধগম্যতা বৃদ্ধি করা" মূল বক্তব্যে স্থানিক রিজনিং কীভাবে রোবটগুলোকে জটিল 2D এবং 3D পরিবেশ আরও ভালোভাবে বুঝতে সাহায্য করতে পারে, যার ফলে তাদের পরিচালনা এবং নেভিগেশন ক্ষমতা উন্নত হবে সে বিষয়ে আলোচনা করেছেন।

স্পটলাইট টকস: কাটিং-এজ প্রযুক্তি এবং উদ্ভাবনী অ্যাপ্লিকেশনগুলোর উপর আলোকপাত

স্পটলাইট টকস ডে 1-এ শিল্পের বিশেষজ্ঞদের কাটিং-এজ প্রযুক্তি এবং উদ্ভাবনী অ্যাপ্লিকেশনগুলোর উপর আকর্ষক উপস্থাপনা ছিল। এই বিভাগটি বিভিন্ন ডোমেইন থেকে আসা প্রযুক্তি অনুশীলনকারীদের জন্য এআই-এর সর্বশেষ অগ্রগতি এবং ব্যবহারিক অ্যাপ্লিকেশনগুলো নিয়ে আলোচনার একটি প্ল্যাটফর্ম হিসেবে কাজ করেছে। ফরাসি অ্যাটমিক এনার্জি কমিশনের (CEA) গবেষণা প্রকৌশলী সিরিল Moineau "Aidge" বক্তৃতায় পরিচয় করিয়ে দিয়েছেন কীভাবে Eclipse Aidge প্রকল্পটি এম্বেডেড প্ল্যাটফর্মগুলোতে ডিপ নিউরাল নেটওয়ার্কগুলোর স্থাপন এবং অপ্টিমাইজেশন সমর্থন করে একটি সম্পূর্ণ টুলচেইন প্রদানের মাধ্যমে, যা প্রান্তিক বুদ্ধিমান সিস্টেমগুলোর বিকাশকে ত্বরান্বিত করে।

Bielik.ai-এর ডেটা সায়েন্টিস্ট Paweł Kiszczak প্রথমবারের মতো এই সম্মেলনে পোলিশ নেটিভ এআই প্রকল্প Bielik-এর সর্বশেষ অগ্রগতি জনসম্মুখে তুলে ধরেছেন, এবং "The Rise of Bielik.AI" শিরোনামে একটি বক্তব্য দিয়েছেন, যেখানে প্রকল্পটি কীভাবে ওপেন সোর্স ল্যাঙ্গুয়েজ মডেল এবং একটি সম্পূর্ণ টুল ইকোসিস্টেমের মাধ্যমে একটি স্থানীয় স্বায়ত্তশাসিত এআই সিস্টেমের নির্মাণকে উৎসাহিত করে তা তুলে ধরা হয়েছে। Bielik প্রকল্পটি শুধুমাত্র একাধিক ওপেন সোর্স ল্যাঙ্গুয়েজ মডেল (1.5B, 4.5B এবং 11B প্যারামিটার স্কেলসহ) প্রকাশ করেনি, সেইসাথে ডেটাসেট, মূল্যায়ন, প্রশিক্ষণ এবং সূক্ষ্ম সুরকরণকে কভার করে একটি এন্ড-টু-এন্ড টুলচেইন তৈরি করেছে, যা গবেষণা দল এবং ডেভেলপারদের মৌলিক মডেলগুলোর উপর ভিত্তি করে সূক্ষ্ম সুরকরণ বা ক্রমাগত প্রি-ট্রেনিং সমর্থন করে, যা লার্জ মডেলগুলোর জন্য R&D থ্রেশহোল্ডকে ব্যাপকভাবে কমিয়ে দেয় এবং স্থানীয় প্রযুক্তি উদ্ভাবন ক্ষমতাকে উৎসাহিত করে।

Second State-এর টেকনিক্যাল লিড Hung-Ying Tai "LlamaEdge-এর সাথে প্রান্তিক ডিভাইসগুলোতে GenAI মডেল চালানো" শেয়ার করেছেন, যেখানে প্রান্তিক ডিভাইসগুলোতে জেনারেটিভ এআই মডেল স্থাপনে LlamaEdge-এর হালকা ওজনের এবং উচ্চ-কর্মক্ষমতা সম্পন্ন ক্ষমতা প্রদর্শন করা হয়েছে, যা আরও নমনীয় এবং দক্ষ স্থানীয় রিজনিং অভিজ্ঞতা নিয়ে আসে। পিকিং ইউনিভার্সিটির পিএইচডি প্রার্থী Tianyu Chen পরিচয় করিয়ে দিয়েছেন কীভাবে SAFE ফ্রেমওয়ার্ক "ডেটা সিন্থেসিস-মডেল ফাইন-টিউনিং"-এর স্ব-বিবর্তন মেকানিজমের মাধ্যমে স্বল্প প্রশিক্ষণ ডেটার সমস্যা কমায়, যার ফলে "স্ব-বিবর্তন ফ্রেমওয়ার্কের উপর ভিত্তি করে রাস্ট কোডের স্বয়ংক্রিয় আনুষ্ঠানিক যাচাইকরণ অর্জন"-এ রাস্ট কোড আনুষ্ঠানিক যাচাইকরণের দক্ষতা এবং নির্ভুলতা উল্লেখযোগ্যভাবে উন্নত হয়। Illuin Technology-এর R&D ডিরেক্টর Gautier Viaud শেয়ার করেছেন কীভাবে দল ColBERT আর্কিটেকচার এবং PaliGemma মডেলের উপর ভিত্তি করে নির্মিত ColPali সিস্টেমটি গ্রাফিক এবং টেক্সট তথ্যের সমন্বয় করে ডকুমেন্ট পুনরুদ্ধারের নির্ভুলতা এবং দক্ষতা কার্যকরভাবে উন্নত করে "ColPali: ভিজ্যুয়াল ল্যাঙ্গুয়েজ মডেলের উপর ভিত্তি করে দক্ষ ডকুমেন্ট পুনরুদ্ধার" বক্তৃতায়। সবশেষে, Dynamia.ai-এর সিইও Xiao Zhang পরিচয় করিয়ে দিয়েছেন কীভাবে HAMi-এর সাহায্যে আরও ভালোভাবে বিভিন্ন GPU রিসোর্স পরিচালনা এবং শিডিউল করা যায় এবং এআই অবকাঠামোর ব্যবহার হার এবং পর্যবেক্ষণযোগ্যতা উন্নত করা যায় "বৈচিত্র্যপূর্ণ এআই অবকাঠামোর K8s ক্লাস্টার ক্ষমতা আনলক করা: HAMi-এর শক্তি প্রকাশ করা"-তে।

বিভিন্ন মিথস্ক্রিয়া এবং প্রথম দিনের হাইলাইট

উচ্চ-ঘনত্বের মূল বক্তব্য ছাড়াও, সম্মেলনে বেশ কয়েকটি বিশেষ ইউনিট ছিল। ক্লোজড-ডোর মিটিং ইউনিট কৌশলগত সংলাপ এবং গভীর শিল্প বিনিময়ের উপর দৃষ্টি নিবদ্ধ করে সীমান্ত-পারাপার সহযোগিতা প্রচারের জন্য। শোকেস সেশনগুলো এন্টারপ্রাইজ এবং গবেষণা প্রতিষ্ঠানের সর্বশেষ এআই প্রযুক্তি পণ্য উপস্থাপনের উপর দৃষ্টি নিবদ্ধ করে, যা বিপুল সংখ্যক দর্শককে আকৃষ্ট করে এবং যোগাযোগ স্থাপনে উৎসাহিত করে। প্রতিযোগিতা সেশনগুলোতে, বিশ্বজুড়ে এআই এবং রোবোটিক্স ডেভেলপার, ইঞ্জিনিয়ার এবং রোবোটিক্স উত্সাহীরা ওপেন সোর্স SO-ARM100 রোবোটিক আর্ম কিটের উপর দৃষ্টি নিবদ্ধ করে অনুকরণ শেখার ব্যবহারিক অনুসন্ধান চালায়। কিটটি Hugging Face-এর LeRobot ফ্রেমওয়ার্ককে সংহত করে এবং NVIDIA-এর এআই এবং রোবোটিক্স প্রযুক্তিকে একত্রিত করে ACT এবং ডিফিউশন পলিসি সহ কাটিং-এজ এআই আর্কিটেকচার সমর্থন করে, যা অংশগ্রহণকারীদের একটি ठोस প্রযুক্তিগত ভিত্তি প্রদান করে। অংশগ্রহণকারীরা বাস্তব পরিস্থিতিতে ব্যবহারিক অনুসন্ধান পরিচালনা করে এর প্রভাব এবং সম্ভাব্যতা সম্পূর্ণরূপে মূল্যায়ন করেছে।

ওয়ার্কশপ সেশনগুলো OpenHarmony ইকোসিস্টেমকে মূল বিষয় হিসেবে গ্রহণ করে এবং Open Atom Open Source Foundation দ্বারা ইনকিউবেট ও পরিচালিত ওপেন সোর্স প্রকল্পটি অন্বেষণ করে। OpenHarmony সর্ব-দৃশ্য, সর্ব-সংযোগ এবং সর্ব-বুদ্ধিমত্তার যুগে একটি বুদ্ধিমান টার্মিনাল অপারেটিং সিস্টেম কাঠামো তৈরি করতে প্রতিশ্রুতিবদ্ধ, একটি উন্মুক্ত, বিশ্বব্যাপী এবং উদ্ভাবনী শীর্ষস্থানীয় বিতরণ করা অপারেটিং সিস্টেম প্ল্যাটফর্ম তৈরি করে, বিভিন্ন বুদ্ধিমান ডিভাইসগুলোকে পরিবেশন করে এবং ইন্টারনেট অফ এভরিথিং শিল্পের বিকাশে সহায়তা করে। সম্মেলনের সাইটে, অংশগ্রহণকারীরা একাধিক ডিভাইস সহযোগিতা এবং লাইটওয়েট সিস্টেম ডিজাইনে OpenHarmony-এর মূল সুবিধাগুলো গভীরভাবে উপলব্ধি করেছে ধারাবাহিক ব্যবহারিক কর্মশালার মাধ্যমে, ড্রাইভার ডেভেলপমেন্ট থেকে অ্যাপ্লিকেশন স্থাপন পর্যন্ত গুরুত্বপূর্ণ প্রক্রিয়াগুলোতে ব্যক্তিগতভাবে অংশগ্রহণ করে। হাতে-কলমে অনুশীলন শুধুমাত্র ডেভেলপারদের "নীচ থেকে শেষ" প্রযুক্তিগত পথ খুলে দিতে সাহায্য করে না, সেইসাথে সিস্টেম-স্তরের উন্নয়ন এবং ডিবাগিং ক্ষমতাও ব্যাপকভাবে উন্নত করে।

GOSIM AI প্যারিস ২০২৫-এর প্রথম দিনের আলোচ্যসূচি সফলভাবে শেষ হয়েছে, তবে উত্তেজনা এখনও অব্যাহত রয়েছে। আগামীকাল, সম্মেলনটি এআই মডেল, এআই ইনফ্রাস্ট্রাকচার, এআই অ্যাপ্লিকেশন এবং এমবডায়েড ইন্টেলিজেন্সের চারটি প্রধান ফোরামের চারপাশে অগ্রসর হতে থাকবে এবং বহু প্রতীক্ষিত PyTorch দিবসকে স্বাগত জানাবে, যেখানে আরও গুরুত্বপূর্ণ অতিথি এবং প্রথম সারির ব্যবহারিক বিষয়বস্তু শীঘ্রই আসছে, তাই আমাদের সাথেই থাকুন!