পশু বিবর্তন থেকে মানুষ | bn

এই বছরের মার্চ মাসে, এনভিডিয়ার ২০২৫ স্প্রিং জিটিসি সম্মেলনে লি অটো-এর স্বায়ত্তশাসিত ড্রাইভিং প্রযুক্তি গবেষণা ও উন্নয়ন বিভাগের প্রধান জিয়া পেং তাদের সর্বশেষ কৃতিত্ব মিন্দভিএলএ বৃহৎ মডেলের প্রবর্তন করেন।

এই মডেলটি ২.২ বিলিয়ন প্যারামিটারযুক্ত একটি ভিশন-ল্যাঙ্গুয়েজ-অ্যাকশন মডেল (ভিএলএ)। জিয়া পেং আরও বলেন যে তারা সফলভাবে এই মডেলটি গাড়িতে স্থাপন করেছেন। লি অটো মনে করে যে ভিএলএ মডেলগুলি শারীরিক জগতের সাথে এআই-এর মিথস্ক্রিয়া করার সমস্যাগুলি সমাধানের সবচেয়ে কার্যকর পদ্ধতি।

গত এক বছরে, এন্ড-টু-এন্ড আর্কিটেকচার বুদ্ধিমান ড্রাইভিংয়ের ক্ষেত্রে একটি প্রযুক্তিগত হটস্পট হয়ে উঠেছে, যা গাড়ি কোম্পানিগুলোকে ঐতিহ্যবাহী মডুলার নিয়ম ডিজাইন থেকে সমন্বিত সিস্টেমের দিকে স্থানান্তরিত করতে চালিত করছে। যে গাড়ি কোম্পানিগুলি পূর্বে নিয়ম-ভিত্তিক অ্যালগরিদম দিয়ে নেতৃত্ব দিত, তারা পরিবর্তনশীল কষ্টের সম্মুখীন হচ্ছে, যেখানে নবাগতরা প্রতিযোগিতামূলক সুবিধার সুযোগ পেয়েছে।

লি অটো এর প্রধান উদাহরণ।

গত বছর বুদ্ধিমান ড্রাইভিংয়ের ক্ষেত্রে লি অটো-এর অগ্রগতি দ্রুত বলা চলে। জুলাই মাসে, এটি দেশব্যাপী নো-ম্যাপ এনওএ (ন্যাভিগেশন অন অটো পাইলট) অর্জনে নেতৃত্ব দেয় এবং একটি অনন্য "এন্ড-টু-এন্ড (ফাস্ট সিস্টেম) + ভিএলএম (স্লো সিস্টেম)" আর্কিটেকচার চালু করে, যা শিল্পে ব্যাপক মনোযোগ আকর্ষণ করেছে।

আজ রাতে, লি অটো এআই টকের দ্বিতীয় সিজনের সাথে, আমরা লি শিয়াং যাকে "কৃত্রিম বুদ্ধিমত্তা কোম্পানি" বলেন, সে সম্পর্কে আরও গভীর ধারণা পেয়েছি।

"ড্রাইভার লার্জ মডেল" আপনার ড্রাইভারও

লি অটো-এর সিইও লি শিয়াং প্রথম গত ডিসেম্বরে টেনসেন্ট নিউজের প্রধান প্রযুক্তি লেখক ঝাং জিয়াওজুনের সাথে একটি কথোপকথনে এআই টকের প্রথম সিজনে ভিএলএ-এর কথা উল্লেখ করেন। সেই সময় তিনি বলেছিলেন:

লি অটো কম্প্যানিয়ন এবং স্বায়ত্তশাসিত ড্রাইভিং নিয়ে আমরা যা করছি তা আসলে শিল্প মান অনুযায়ী পৃথক, এবং এটি প্রাথমিক পর্যায়ে রয়েছে। আমরা যে মাইন্ড জিপিটি করছি তা আসলে একটি বৃহৎ ভাষা মডেল; আমরা স্বায়ত্তশাসিত ড্রাইভিং যা করছি, অভ্যন্তরীণভাবে আমরা এটিকে আচরণগত বুদ্ধিমত্তা বলি, তবে লি ফেইফেই (স্ট্যানফোর্ডের আজীবন অধ্যাপক, গুগলের প্রাক্তন প্রধান বিজ্ঞানী) দ্বারা সংজ্ঞায়িত, এটিকে স্থানিক বুদ্ধিমত্তা বলা হয়। আপনি যখন সত্যিই বড় আকারে এটি করবেন তখনই জানতে পারবেন যে এই দুটি একদিন অবশ্যই সংযুক্ত হবে। অভ্যন্তরীণভাবে আমরা এটিকে ভিএলএ (ভিশন ল্যাঙ্গুয়েজ অ্যাকশন মডেল) বলি।

লি শিয়াং মনে করেন যে বেস মডেলটি একটি নির্দিষ্ট মুহূর্তে অবশ্যই ভিএলএ হয়ে উঠবে। কারণ ভাষা মডেলগুলি শুধুমাত্র ভাষা এবং জ্ঞানের মাধ্যমে ত্রিমাত্রিক বিশ্বকে বুঝতে পারে, যা স্পষ্টতই যথেষ্ট নয়। "এটি সত্যিই ভেক্টর-ভিত্তিক হতে হবে, ডিফিউশন (ডিফিউশন মডেল) ব্যবহার করে এবং জেনারেটিভ পদ্ধতি ব্যবহার করে (বিশ্বকে বুঝতে হবে)।"

বলা যেতে পারে যে ভিএলএ-এর জন্ম শুধুমাত্র ভাষা বুদ্ধি এবং স্থানিক বুদ্ধিমত্তাকে গভীরভাবে সংহত করার একটি সাহসী প্রচেষ্টা নয়, বরং লি অটো দ্বারা "বুদ্ধিমান গাড়ি" ধারণার একটি নতুন ব্যাখ্যা।

আজ রাতের এআই টকে লি শিয়াং আরও সংজ্ঞায়িত করেছেন: "ভিএলএ একটি ড্রাইভার লার্জ মডেল, যা একজন মানুষের ড্রাইভারের মতো কাজ করে।" এটি কেবল একটি প্রযুক্তি নয়, একটি বুদ্ধিমান অংশীদার যা ব্যবহারকারীদের সাথে স্বাভাবিকভাবে যোগাযোগ করতে এবং স্বাধীন সিদ্ধান্ত নিতে পারে।

তাহলে, ভিএলএ আসলে কী? এর মূল বিষয়টা হল চাক্ষুষ ধারণা, স্বাভাবিক ভাষা বোঝা এবং কর্ম উৎপাদন ক্ষমতাকে একত্রিত করে গাড়িটিকে এমন একটি "ড্রাইভার এজেন্ট" এ পরিণত করা, যা মানুষের সাথে যোগাযোগ করতে এবং নিজের সিদ্ধান্ত নিতে পারে।

কল্পনা করুন আপনি আপনার গাড়িতে বসে আছেন এবং বলছেন, "আজ আমি একটু ক্লান্ত, ধীরে চালান", এবং গাড়িটি শুধু আপনার কথার মানে বুঝবে না, সেই সাথে গতি কমিয়ে দেবে এবং এমনকি মসৃণ রাস্তা বেছে নেবে। এই স্বাভাবিক এবং সাবলীল মিথস্ক্রিয়াই ভিএলএ-এর লক্ষ্য। লি শিয়াং জানান, ছোট কমান্ডগুলি সরাসরি গাড়ি দ্বারা প্রক্রিয়াকরণ করা হয়, যেখানে জটিল কমান্ডগুলি ক্লাউড-ভিত্তিক ৩.২ বিলিয়ন প্যারামিটার মডেল দ্বারা বিশ্লেষণ করা হয়, যা দক্ষতা এবং বুদ্ধিমত্তা উভয়ই নিশ্চিত করে।

এই লক্ষ্য অর্জন করা সহজ নয়। ভিএলএ-এর বিশেষত্ব হল এটি দৃষ্টি, ভাষা এবং কর্মের তিনটি মাত্রাকে সংযুক্ত করে। ব্যবহারকারীর একটি সাধারণ কমান্ডের জন্য আশেপাশের পরিবেশের রিয়েল-টাইম উপলব্ধি, ভাষার সঠিক অর্থ বোঝা এবং ড্রাইভিং আচরণের দ্রুত সমন্বয় জড়িত থাকতে পারে। তিনটি বিষয়ই অপরিহার্য।

এবং ভিএলএ-এর সবচেয়ে বড় বিষয় হল এটি এই তিনটিকে নির্বিঘ্নে একসাথে কাজ করতে দেয়।

দৃষ্টি থেকে বাস্তবে, ভিএলএ-এর গবেষণা ও উন্নয়ন একটি অচেনা অঞ্চল। লি শিয়াং স্বীকার করেছেন: "চাক্ষুষ এবং কর্ম ডেটা অর্জন করা সবচেয়ে কঠিন। কোনো কোম্পানি এটি প্রতিস্থাপন করতে পারবে না।"

ভিএলএ-এর প্রযুক্তিগত পটভূমি বুঝতে হলে লি অটো-এর বুদ্ধিমান ড্রাইভিংয়ের বিবর্তনও দেখতে হবে।

লি শিয়াং বলেন, প্রথম দিকের সিস্টেমটি ছিল "কীট-স্তরের" বুদ্ধিমত্তা, যেখানে কয়েক মিলিয়ন প্যারামিটার ছিল, যা নিয়ম এবং উচ্চ-নির্ভুলতা মানচিত্র দ্বারা চালিত হত এবং জটিল রাস্তার পরিস্থিতিতে অসহায় ছিল। পরবর্তীতে, এন্ড-টু-এন্ড আর্কিটেকচার এবং চাক্ষুষ-ভাষা মডেলগুলি প্রযুক্তিকে "স্তন্যপায়ী-স্তরে" উন্নীত করতে, মানচিত্র নির্ভরতা থেকে মুক্তি পেতে এবং দেশব্যাপী নো-ম্যাপ এনওএ বাস্তবে পরিণত করতে সহায়তা করেছে।

আসলে, এই পদক্ষেপটি ইতিমধ্যেই লি অটোকে শিল্পের একেবারে সামনে সারিতে নিয়ে এসেছে, কিন্তু তারা এতে সন্তুষ্ট নয়। লি শিয়াংয়ের মতে, ভিএলএ-এর আবির্ভাব চিহ্নিত করে যে লি অটো-এর বুদ্ধিমান ড্রাইভিং প্রযুক্তি "মানুষের বুদ্ধিমত্তা"-র একটি নতুন স্তরে প্রবেশ করেছে।

পূর্ববর্তী সিস্টেমের তুলনায়, ভিএলএ কেবল ত্রিমাত্রিক ভৌত জগৎকে উপলব্ধি করতে পারে না, সেই সাথে যৌক্তিক যুক্তিও দিতে পারে এবং এমনকি মানুষের স্তরের কাছাকাছি ড্রাইভিং আচরণ তৈরি করতে পারে।

একটি সাধারণ উদাহরণস্বরূপ, ধরুন আপনি একটি যানজটপূর্ণ রাস্তায় বললেন "ঘুরতে একটি জায়গা খুঁজে বের করুন", ভিএলএ যান্ত্রিকভাবে কমান্ডটি কার্যকর করবে না, বরং ইউ-টার্ন সম্পন্ন করার জন্য সবচেয়ে যুক্তিসঙ্গত সময় এবং স্থান খুঁজে বের করতে রাস্তার অবস্থা, ট্র্যাফিক প্রবাহ এবং ট্র্যাফিক নিয়মগুলি বিবেচনা করবে।

লি শিয়াং বলেন, ভিএলএ ডেটা তৈরি করে দ্রুত নতুন পরিস্থিতিতে মানিয়ে নিতে পারে এবং এমনকি প্রথমবার জটিল রাস্তা মেরামতের সম্মুখীন হলেও তিন দিনের মধ্যে প্রতিক্রিয়া অপ্টিমাইজ করতে পারে। এই নমনীয়তা এবং বিচার ভিএলএ-এর মূল সুবিধা।

লি অটো-এর শিক্ষক হলেন ডিপসিক

ভিএলএ-কে সমর্থন করে লি অটো দ্বারা স্বাধীনভাবে তৈরি একটি জটিল এবং অত্যাধুনিক প্রযুক্তিগত সিস্টেম। এই সিস্টেমটি গাড়িকে কেবল বিশ্বকে "বুঝতে" নয়, মানুষের ড্রাইভারের মতো চিন্তা করতে এবং কাজ করতেও সহায়তা করে।

প্রথমটি হল থ্রিডি গাউসিয়ান উপস্থাপনা প্রযুক্তি, যা একটি থ্রিডি বস্তু তৈরি করতে অনেকগুলি "গাউসিয়ান পয়েন্ট" ব্যবহার করে। প্রতিটি পয়েন্টের নিজস্ব অবস্থান, রঙ এবং আকারের তথ্য রয়েছে। এই প্রযুক্তিটি বিশাল পরিমাণ বাস্তব ডেটা ব্যবহার করে একটি শক্তিশালী থ্রিডি স্থানিক বোঝার মডেলকে প্রশিক্ষণ দিতে স্ব-supervised লার্নিং ব্যবহার করে। এর মাধ্যমে ভিএলএ মানুষের মতো আশেপাশের বিশ্বকে "বুঝতে" পারে, কোথায় বাধা আছে এবং কোথায় যাওয়ার মতো জায়গা আছে তা জানতে পারে।

এর পরে রয়েছে মিক্সচার অফ এক্সপার্টস (এমওই) আর্কিটেকচার, যা বিশেষজ্ঞ নেটওয়ার্ক, গেটিং নেটওয়ার্ক এবং কম্বাইনার নিয়ে গঠিত। যখন মডেল প্যারামিটার শত বিলিয়ন ছাড়িয়ে যায়, তখন ঐতিহ্যবাহী পদ্ধতি প্রতিটি গণনায় সমস্ত নিউরনকে অংশ নিতে বাধ্য করে, যা সম্পদের অপচয়। এমওই আর্কিটেকচারের গেটিং নেটওয়ার্ক বিভিন্ন কাজের জন্য বিভিন্ন বিশেষজ্ঞদের কল করবে যাতে অ্যাক্টিভেশন প্যারামিটার উল্লেখযোগ্যভাবে বৃদ্ধি না পায়।

এ বিষয়ে কথা বলতে গিয়ে লি শিয়াং ডিপসিকের প্রশংসাও করেন:

ডিপসিক মানবজাতির সেরা অনুশীলনগুলি ব্যবহার করে… যখন তারা ডিপসিক ভি৩ করছিল, ভি৩-ও একটি এমওই ছিল, একটি ৬৭১বি মডেল। আমি মনে করি এমওই একটি খুব ভালো আর্কিটেকচার। এটি একগুচ্ছ বিশেষজ্ঞকে একত্রিত করার সমতুল্য, এবং প্রত্যেকেই একটি বিশেষজ্ঞ ক্ষমতা।

অবশেষে, লি অটো ভিএলএ-তে স্পার্স অ্যাটেনশন চালু করেছে, যা সাধারণ ভাষায় বোঝায় যে ভিএলএ স্বয়ংক্রিয়ভাবে মূল ক্ষেত্রগুলির মনোযোগ ওজন সামঞ্জস্য করবে, যার ফলে শেষ দিকের অনুমানের দক্ষতা উন্নত হবে।

লি শিয়াং বলেন, এই নতুন বেস মডেলের প্রশিক্ষণ প্রক্রিয়ায় লি অটো-এর প্রকৌশলীরা সেরা ডেটা অনুপাত খুঁজে বের করতে, স্বায়ত্তশাসিত ড্রাইভিং সম্পর্কিত প্রচুর থ্রিডি ডেটা এবং টেক্সট ও ইমেজ ডেটা সংহত করতে এবং সাহিত্য ও ঐতিহাসিক ডেটার অনুপাত কমাতে অনেক সময় ব্যয় করেছেন।

অনুমান থেকে সিদ্ধান্ত গ্রহণ পর্যন্ত ভিএলএ মানুষের চিন্তাভাবনার দ্রুত এবং ধীর গতির সংমিশ্রণ মোড ব্যবহার করে। এটি দ্রুত সাধারণ কর্ম সিদ্ধান্তের আউটপুট দিতে পারে, যেমন জরুরি প্রতিরোধ এবং আরও জটিল পরিস্থিতি মোকাবিলার জন্য ছোট চিন্তাভাবনার শৃঙ্খলা ব্যবহার করে "ধীরে ধীরে চিন্তা" করতে পারে, যেমন নির্মাণ এলাকা বাইপাস করার জন্য অস্থায়ীভাবে একটি রাস্তা পরিকল্পনা করা। রিয়েল-টাইম কর্মক্ষমতা আরও উন্নত করতে ভিএলএ স্পেকুলেটিভ রিজনিং এবং প্যারালাল ডিকোডিং প্রযুক্তি চালু করেছে, যা গাড়ির দিকের চিপের কম্পিউটিং শক্তি সম্পূর্ণরূপে ব্যবহার করে যাতে সিদ্ধান্ত গ্রহণ প্রক্রিয়া দ্রুত এবং বিশৃঙ্খল না হয়।

ড্রাইভিং আচরণ তৈরি করার সময় ভিএলএ ডিফিউশন মডেল এবং রিইনফোর্সমেন্ট লার্নিং ফ্রম হিউম্যান ফিডব্যাক (আরএলএইচএফ) ব্যবহার করে। ডিফিউশন মডেল অপ্টিমাইজড ড্রাইভিং ট্র্যাজেক্টরি তৈরি করার জন্য দায়ী, যেখানে আরএলএইচএফ এই ট্র্যাজেক্টরিগুলোকে মানুষের অভ্যাসের কাছাকাছি করে তোলে, যা নিরাপদ এবং আরামদায়ক উভয়ই। উদাহরণস্বরূপ, ভিএলএ বাঁক নেওয়ার সময় স্বয়ংক্রিয়ভাবে গতি কমিয়ে দেবে বা লেন মার্জ করার সময় পর্যাপ্ত নিরাপদ দূরত্ব রাখবে। এই বিবরণগুলি মানুষের ড্রাইভিং আচরণের গভীর শিক্ষা প্রতিফলিত করে।

ওয়ার্ল্ড মডেল আরেকটি গুরুত্বপূর্ণ প্রযুক্তি। লি অটো দৃশ্য পুনর্গঠন এবং তৈরির মাধ্যমে রিইনফোর্সমেন্ট লার্নিংয়ের জন্য একটি উচ্চ-মানের ভার্চুয়াল পরিবেশ সরবরাহ করে। লি শিয়াং জানান, ওয়ার্ল্ড মডেল প্রতি ১০,০০০ কিলোমিটারে যাচাইকরণের খরচ ১৭০,০০০-১৮০,০০০ ইউয়ান থেকে কমিয়ে ৪,০০০ ইউয়ানে নামিয়ে এনেছে। এটি ভিএলএকে সিমুলেশনে ক্রমাগত অপ্টিমাইজ করতে এবং জটিল পরিস্থিতি সহজে মোকাবেলা করতে দেয়।

প্রশিক্ষণ সম্পর্কে বলতে গেলে ভিএলএ-এর বিকাশের প্রক্রিয়াটিও বেশ সুসংগঠিত। পুরো প্রক্রিয়াটিকে তিনটি ধাপে ভাগ করা হয়েছে: প্রি-ট্রেনিং, পোস্ট-ট্রেনিং এবং রিইনফোর্সমেন্ট লার্নিং। লি শিয়াং বলেন, "প্রি-ট্রেনিং জ্ঞান অর্জনের মতো, পোস্ট-ট্রেনিং ড্রাইভিং স্কুলে ড্রাইভিং শেখার মতো এবং রিইনফোর্সমেন্ট লার্নিং সামাজিক অনুশীলনের মতো।"

প্রি-ট্রেনিং পর্যায়ে লি অটো ভিএলএ-এর জন্য একটি ভিজ্যুয়াল-ভাষা বেস মডেল তৈরি করেছে, এটিকে সমৃদ্ধ থ্রিডি ভিজ্যুয়াল ডেটা, টুডি হাই-ডেফিনেশন ছবি এবং ড্রাইভিং সম্পর্কিত কর্পোরা দিয়ে সজ্জিত করেছে, যা এটিকে প্রথমে "দেখতে" এবং "শুনতে" শেখায়; প্রশিক্ষণের পরে অ্যাকশন মডিউল যোগ করা হয়, ৪-৮ সেকেন্ডের ড্রাইভিং ট্র্যাজেক্টরি তৈরি করা হয় এবং মডেলটি ৩.২ বিলিয়ন প্যারামিটার থেকে ৪ বিলিয়নে প্রসারিত হয়।

রিইনফোর্সমেন্ট লার্নিংকে দুটি ধাপে ভাগ করা হয়েছে: প্রথমত, মানুষের অভ্যাসগুলিকে সারিবদ্ধ করতে আরএলএইচএফ ব্যবহার করুন, টেকওভার ডেটা বিশ্লেষণ করুন এবং নিরাপত্তা ও আরাম নিশ্চিত করুন; তারপরে, জি-ভ্যালু (আরাম), সংঘর্ষ এবং ট্র্যাফিক নিয়ম প্রতিক্রিয়ার উপর ভিত্তি করে অপ্টিমাইজ করতে বিশুদ্ধ রিইনফোর্সমেন্ট লার্নিং ব্যবহার করুন, যাতে ভিএলএ "মানুষের চেয়ে ভালো চালায়।" লি শিয়াং উল্লেখ করেছেন যে এই পর্যায়টি ওয়ার্ল্ড মডেলে সম্পন্ন হয়েছে, বাস্তব ট্র্যাফিক পরিস্থিতি অনুকরণ করে এবং ঐতিহ্যবাহী যাচাইকরণের চেয়ে দক্ষতা অনেক বেশি।

এই প্রশিক্ষণ পদ্ধতি কেবল প্রযুক্তিগত অগ্রগতি নিশ্চিত করে না, বাস্তব প্রয়োগে ভিএলএকে যথেষ্ট নির্ভরযোগ্যও করে তোলে।

লি শিয়াং স্বীকার করেছেন যে ভিএলএ-এর সাফল্য শিল্পের মানদণ্ডের অনুপ্রেরণা থেকে অবিচ্ছেদ্য। ডিপসিকের এমওই আর্কিটেকচার কেবল প্রশিক্ষণের দক্ষতাই বাড়ায়নি, লি অটোর জন্য মূল্যবান অভিজ্ঞতাও দিয়েছে। তিনি আক্ষেপ করে বলেন: "আমরা জায়ান্টদের কাঁধে দাঁড়িয়ে ভিএলএ-এর গবেষণা ও উন্নয়নকে ত্বরান্বিত করছি।" এই উন্মুক্ত শিক্ষার মনোভাব লি অটোকে অচেনা ভূমিতে আরও এগিয়ে যেতে দেয়।

"তথ্য সরঞ্জাম" থেকে "উৎপাদন সরঞ্জাম"

বর্তমানে এআই শিল্প "তথ্য সরঞ্জাম" থেকে "উৎপাদন সরঞ্জাম"-এ একটি গভীর পরিবর্তনের মধ্য দিয়ে যাচ্ছে। বৃহৎ মডেল প্রযুক্তির পরিপক্কতার সাথে এআই আর ডেটা প্রক্রিয়াকরণ এবং পরামর্শ দেওয়ার মধ্যে সীমাবদ্ধ নেই, তবে স্বাধীন সিদ্ধান্ত নেওয়ার এবং কাজ করার ক্ষমতা অর্জন করতে শুরু করেছে।

লি শিয়াং এআই টকের দ্বিতীয় সিজনে প্রস্তাব করেন যে এআইকে তথ্য সরঞ্জাম (যেমন সার্চ), সহায়ক সরঞ্জাম (যেমন ভয়েস নেভিগেশন) এবং উৎপাদন সরঞ্জামগুলিতে ভাগ করা যেতে পারে। তিনি জোর দেন: "কৃত্রিম বুদ্ধিমত্তা যখন উৎপাদন সরঞ্জাম হয়ে উঠবে, তখন সত্যিকারের প্রাদুর্ভাব ঘটবে।" বৃহৎ মডেল প্রযুক্তির পরিপক্কতার সাথে এআই আর ডেটা প্রক্রিয়াকরণের মধ্যে সীমাবদ্ধ নয়, তবে স্বাধীন সিদ্ধান্ত নেওয়ার এবং কাজ করার ক্ষমতা অর্জন করতে শুরু করেছে।

এই প্রবণতাটি বিশেষভাবে "এম্বেডেড ইন্টেলিজেন্স"-এর ধারণায় স্পষ্ট - এআই সিস্টেমগুলিকে শারীরিক সত্তা দেওয়া হয়, যা পরিবেশকে অনুভব করতে, বুঝতে এবং তার সাথে যোগাযোগ করতে সক্ষম।

লি অটোর ভিএলএ মডেল এই প্রবণতার একটি সুস্পষ্ট অনুশীলন। দৃষ্টি, ভাষা এবং কর্ম বুদ্ধিমত্তাকে সংহত করে এটি গাড়িটিকে একটি বুদ্ধিমান এজেন্টে রূপান্তরিত করে, যা স্বয়ংক্রিয়ভাবে চালাতে এবং ব্যবহারকারীদের সাথে স্বাভাবিকভাবে যোগাযোগ করতে পারে, যা "এম্বেডেড ইন্টেলিজেন্স"-এর মূল ধারণাকে সম্পূর্ণরূপে ব্যাখ্যা করে।

যতক্ষণ মানুষ পেশাদার ড্রাইভার নিয়োগ করে, ততক্ষণ কৃত্রিম বুদ্ধিমত্তা একটি উৎপাদন সরঞ্জাম হয়ে উঠতে পারে। যখন এআই একটি উৎপাদন সরঞ্জাম হয়ে উঠবে, তখন কৃত্রিম বুদ্ধিমত্তা সত্যিকার অর্থে বিস্ফোরিত হবে।

লি শিয়াংয়ের মন্তব্যগুলি ভিএলএ-এর মূল মূল্যকে স্পষ্ট করেছে - এটি আর কোনও সাধারণ সহায়ক সরঞ্জাম নয়, একটি "ড্রাইভার এজেন্ট" যা স্বাধীনভাবে কাজ করতে এবং দায়িত্ব নিতে পারে। এই রূপান্তর কেবল গাড়ির ব্যবহারিক মূল্যকেই উন্নত করে না, অন্যান্য ক্ষেত্রে এআই-এর প্রয়োগের জন্য কল্পনার জগতও উন্মোচন করে।

এআই সম্পর্কে লি শিয়াংয়ের চিন্তাভাবনা সবসময় একটি দৃষ্টিভঙ্গি রাখে যা বাক্স থেকে বেরিয়ে আসে। তিনি আরও উল্লেখ করেছেন: "ভিএলএ কোনও আকস্মিক পরিবর্তনের প্রক্রিয়া নয়, একটি বিবর্তনীয় প্রক্রিয়া।" এই বাক্যটি সঠিকভাবে লি অটোর প্রযুক্তিগত পথ সংক্ষিপ্ত করে -

প্রথম দিকের নিয়ম-চালিত থেকে শুরু করে এন্ড-টু-এন্ড ব্রেক-থ্রু, আজকের ভিএলএ-এর "মানুষের বুদ্ধিমত্তা" স্তর পর্যন্ত। এই বিবর্তনীয় চিন্তাভাবনা কেবল ভিএলএকে প্রযুক্তিতে আরও বাস্তবসম্মত করে তোলে না, শিল্পের জন্য একটি রেফারেন্স দৃষ্টান্তও সরবরাহ করে। কিছু প্রচেষ্টা অন্ধভাবে বিপর্যয় অনুসরণ করার চেয়ে লি অটোর বাস্তবসম্মত পথ জটিল চীনা বাজারের জন্য আরও উপযুক্ত হতে পারে।

প্রযুক্তি থেকে বিশ্বাস পর্যন্ত লি অটোর এআই অনুসন্ধান মসৃণ নয়। লি শিয়াং স্বীকার করেছেন: "আমরা এআই ক্ষেত্রে অনেক চ্যালেঞ্জের সম্মুখীন হয়েছি, ভোরের আগের অন্ধকারের মতো, তবে আমরা বিশ্বাস করি যে আমরা যদি অধ্যবসায় করি তবে আলো দেখতে পাব।" ভিএলএ-এর গবেষণা ও উন্নয়ন কম্পিউটিং পাওয়ারের সীমাবদ্ধতা এবং ডেটা এথিক্সের মতো সমস্যার সম্মুখীন হয়েছে, তবে লি অটো স্ব-উন্নত বেস মডেল এবং ওয়ার্ল্ড মডেলের মাধ্যমে ধীরে ধীরে তাদের প্রযুক্তিগত ভোর এনেছে।

লি শিয়াং আরও উল্লেখ করেছেন যে ভিএলএ-এর সাফল্য চীনা এআই-এর উত্থান থেকে অবিচ্ছেদ্য।

তিনি বলেন, ডিপসিক এবং টঙ্গী কিয়ানওয়েনের মতো মডেলের উত্থান চীনের এআই স্তরকে দ্রুত আমেরিকার কাছাকাছি নিয়ে এসেছে। এর মধ্যে ডিপসিক কর্তৃক সমর্থিত ওপেন সোর্স স্পিরিট বিশেষভাবে উৎসাহজনক, যা সরাসরি লি অটোকে জিনহুয়ান ওএস ওপেন সোর্স করতে প্ররোচিত করেছে। লি শিয়াং বলেন: "এটি কোম্পানির কৌশলগত বিবেচনার বাইরে নয়। ডিপসিক আমাদের এত সাহায্য করেছে, সমাজের জন্য আমাদের কিছু অবদান রাখা উচিত।"

প্রযুক্তিগত অগ্রগতি অনুসরণ করার পাশাপাশি লি অটো এআই প্রযুক্তির নিরাপত্তা এবং নৈতিক বিষয়গুলিকে উপেক্ষা করেনি। ভিএলএ দ্বারা প্রবর্তিত "সুপার অ্যালাইনমেন্ট" প্রযুক্তি রিইনফোর্সমেন্ট লার্নিং ফ্রম হিউম্যান ফিডব্যাক (আরএলএইচএফ) এর মাধ্যমে মডেলের আচরণকে মানুষের অভ্যাসের কাছাকাছি করে তোলে। ডেটা দেখায় যে ভিএলএ-এর প্রয়োগ উচ্চ-গতির এমপিআই (গড় হস্তক্ষেপ মাইলেজ) ২৪০ কিমি থেকে ৩০০ কিমিতে বাড়িয়েছে।

আরও গুরুত্বপূর্ণ বিষয় হল লি অটো "মানব মূল্যবোধের সাথে এআই" নির্মাণের উপর জোর দেয় এবং নৈতিকতা ও বিশ্বাসকে প্রযুক্তিগত উন্নয়নের ভিত্তি হিসেবে বিবেচনা করে। আরও বৃহত্তর দৃষ্টিকোণ থেকে ভিএলএ-এর তাৎপর্য এই কারণে যে এটি গাড়ি কোম্পানিগুলির ভূমিকাকে নতুন করে সংজ্ঞায়িত করে।

অতীতে গাড়ি ছিল শিল্প যুগের পরিবহনের মাধ্যম; আজ তারা কৃত্রিম বুদ্ধিমত্তা যুগে "স্থানিক রোবট"-এ রূপান্তরিত হচ্ছে। লি শিয়াং এআই টকে উল্লেখ করেছেন: "লি অটো আগে গাড়ির অচেনা ভূমিতে হাঁটত, এবং ভবিষ্যতে কৃত্রিম বুদ্ধিমত্তার অচেনা ভূমিতে হাঁটবে।" লি অটোর এই রূপান্তর স্বয়ংচালিত শিল্পের ব্যবসায়িক মডেলে নতুন কল্পনার জগত নিয়ে আসে।

অবশ্য ভিএলএ-এর বিকাশ চ্যালেঞ্জবিহীন নয়। কম্পিউটিং পাওয়ারের অবিচ্ছিন্ন বিনিয়োগ, ডেটা এথিক্স এবং স্বায়ত্তশাসিত ড্রাইভিংয়ের প্রতি গ্রাহকদের আস্থা স্থাপন এমন সব বিষয় যা লি অটোকে মোকাবেলা করতে হবে। এছাড়াও এআই শিল্পের প্রতিযোগিতা ক্রমশ তীব্র হচ্ছে। টেসলা, ওয়েমো এবং ওপেনএআই-এর মতো দেশীয় এবং বিদেশী জায়ান্টরা মাল্টি-মোডাল মডেলের বিন্যাসকে ত্বরান্বিত করছে। লি অটোকে প্রযুক্তি পুনরাবৃত্তি এবং বাজার প্রচারে তার শীর্ষস্থানীয় অবস্থান বজায় রাখতে হবে। লি শিয়াং বলেন, "আমাদের কোনও শর্টকাট নেই, আমাদের কেবল গভীরভাবে চাষ করতে হবে।"

সন্দেহ নেই ভিএলএ-এর অবতরণ একটি গুরুত্বপূর্ণ মুহূর্ত হবে।

লি অটো ২০২৫ সালের জুলাই মাসে বিশুদ্ধ বৈদ্যুতিক এসইউভি লি অটো আই৮-এর সাথে একই সাথে ভিএলএ প্রকাশের পরিকল্পনা করেছে এবং ২০২৬ সালে ব্যাপক উৎপাদন অর্জনকরবে। এটি কেবল প্রযুক্তির একটি বিস্তৃত পরীক্ষা নয়, বাজারের জন্য একটি গুরুত্বপূর্ণ পরীক্ষা।

হালনাগাদ করা হয়েছে ২০২৫-০৫-০৯

# Agent # Li Auto # VLA