मार्च महिन्यामध्ये NVIDIA च्या 2025 स्प्रिंग GTC परिषदेत, Li Auto चे स्वायत्त ड्रायव्हिंग टेक्नॉलॉजी R&D चे प्रमुख जिया पेंग यांनी त्यांचे MindVLA हे मोठे मॉडेल सादर केले.
हे मॉडेल 2.2 अब्ज पॅरामीटर्स असलेले व्हिजन-लँग्वेज-ॲक्शन मॉडेल (VLA) आहे. जिया पेंग यांनी पुढे सांगितले की, त्यांनी हे मॉडेल गाड्यांमध्ये यशस्वीपणे तैनात केले आहे. Li Auto चा असा विश्वास आहे की VLA मॉडेल हे AI ला भौतिक जगाशी संवाद साधण्यासाठी सर्वात प्रभावी पद्धत आहे.
गेल्या वर्षभरात, एंड-टू-एंड आर्किटेक्चर हे इंटेलिजेंट ड्रायव्हिंगच्या क्षेत्रातील एक महत्त्वाचे तंत्रज्ञान ठरले आहे, ज्यामुळे कार कंपन्या पारंपरिक modular rule design पासून इंटिग्रेटेड सिस्टीमकडे वळल्या आहेत. पूर्वी rule-based अल्गोरिदममध्ये आघाडीवर असलेल्या कार कंपन्यांना बदलांमध्ये अडचणी येत आहेत, तर नव्याने सुरुवात करणाऱ्या कंपन्यांना स्पर्धात्मक advantage मिळवण्याची संधी मिळाली आहे.
Li Auto हे याचे उत्तम उदाहरण आहे.
इंटेलिजेंट ड्रायव्हिंगमध्ये Li Auto ची गेल्या वर्षीची प्रगती खूपच जलद होती. जुलैमध्ये, कंपनीने nationwide no-map NOA (Navigation on Autopilot) साध्य केले आणि "एंड-टू-एंड (fast system) + VLM (slow system)" आर्किटेक्चर लाँच केले, ज्यामुळे ते industry मध्ये चर्चेत आले.
Li Auto AI Talk च्या दुसऱ्या season मध्ये, ली शियांग ज्याला "कृत्रिम बुद्धिमत्ता कंपनी" म्हणतात, त्याबद्दल अधिक माहिती मिळाली आहे.
"ड्रायव्हर लार्ज मॉडेल" म्हणजे तुमचा ड्रायव्हर
Li Auto चे CEO ली शियांग यांनी AI Talk च्या पहिल्या season मध्ये गेल्या वर्षी डिसेंबरमध्ये टेनसेंट न्यूजचे मुख्य तंत्रज्ञान लेखक झांग शियाओजुन यांच्याशी बोलताना VLA चा उल्लेख केला होता. त्यावेळी ते म्हणाले:
Li Auto Companion आणि autonomous driving सोबत आम्ही जे करत आहोत, ते industry standard नुसार वेगळे आहे आणि ते प्राथमिक अवस्थेत आहे. आम्ही जे Mind GPT करत आहोत, ते एक मोठे language model आहे; autonomous driving ला आम्ही अंतर्गत स्तरावर behavioral intelligence म्हणतो, परंतु ली फेईफेई (स्टॅनफोर्ड लाइफटाइम प्रोफेसर, माजी Google चीफ सायंटिस्ट) यांनी त्याला spatial intelligence म्हटले आहे. जेव्हा तुम्ही हे मोठ्या प्रमाणावर करता, तेव्हा तुम्हाला कळेल की हे दोन्ही एक दिवस नक्कीच connect होतील. आम्ही याला VLA (Vision Language Action Model) म्हणतो.
ली शियांग यांचा असा विश्वास आहे की base model नक्कीच VLA बनेल. याचे कारण असे आहे की language model केवळ भाषेच्या आणि cognitive आधारावर त्रिमितीय जग समजू शकत नाही, जे पुरेसे नाही. "ते खऱ्या अर्थाने vector-based असणे आवश्यक आहे, Diffusion (diffusion model) आणि generative methods चा वापर करून जगाला समजून घेणे आवश्यक आहे."
VLA चा जन्म केवळ भाषिक बुद्धिमत्ता आणि spatial बुद्धिमत्ता यांना एकत्रित करण्याचा प्रयत्न नाही, तर Li Auto द्वारे "इंटेलिजेंट कार" या संकल्पनेचा पुनर्विचार आहे.
ली शियांग यांनी AI Talk मध्ये पुढे व्याख्या केली: "VLA हे ड्रायव्हर large model आहे, जे मानवी ड्रायव्हरप्रमाणे कार्य करते." हे केवळ एक तंत्रज्ञान नाही, तर एक intelligent partner आहे, जे users सोबत नैसर्गिकरित्या संवाद साधू शकते आणि स्वतंत्र निर्णय घेऊ शकते.
VLA म्हणजे काय? याचा core concept अगदी सोपा आहे: व्हिज्युअल परसेप्शन, नॅचरल लँग्वेज अंडरस्टँडिंग आणि ॲक्शन जनरेशन क्षमता एकत्रित करून, वाहन एक "ड्रायव्हर एजंट" बनते, जे लोकांशी संवाद साधू शकते आणि स्वतःचे निर्णय घेऊ शकते.
कल्पना करा की तुम्ही तुमच्या कारमध्ये बसला आहात आणि सहजपणे म्हणता, "आज मला थोडा थकवा आला आहे, हळू चालवा," आणि वाहन केवळ तुमचा अर्थ समजून घेणार नाही, तर वेग adjust करेल आणि अधिक सोपा मार्ग निवडेल. हा नैसर्गिक संवाद VLA ला साध्य करायचा आहे. ली शियांग यांनी सांगितले की, सर्व short commands थेट वाहनाद्वारे process केल्या जातात, तर complex commands क्लाउड-आधारित 3.2 अब्ज पॅरामीटर मॉडेलद्वारे parse केल्या जातात, ज्यामुळे कार्यक्षमता आणि बुद्धिमत्ता दोन्ही सुनिश्चित होतात.
हे ध्येय साध्य करणे सोपे नाही. VLA ची विशेष गोष्ट म्हणजे ते व्हिजन, लँग्वेज आणि ॲक्शन या तीन dimensions ला connect करते. यूजरच्या एका साध्या command मध्ये आसपासच्या वातावरणाची real-time माहिती, भाषेचा अचूक अर्थ आणि ड्रायव्हिंगच्या वर्तनात rapid adjustment करणे आवश्यक असते. हे तीनही घटक आवश्यक आहेत.
VLA ची सर्वात मोठी गोष्ट म्हणजे हे तीनही घटक एकत्रितपणे कार्य करू शकतात.
व्हिजनपासून रिॲलिटीपर्यंत, VLA चा R&D एक uncharted territory आहे. ली शियांग यांनी मान्य केले: "व्हिज्युअल आणि ॲक्शन डेटा मिळवणे सर्वात कठीण आहे. कोणतीही कंपनी हे करू शकत नाही."
VLA ची टेक्निकल पार्श्वभूमी समजून घेण्यासाठी, Li Auto च्या इंटेलिजेंट ड्रायव्हिंगच्या उत्क्रांतीकडे पाहणे आवश्यक आहे.
ली शियांग म्हणाले की, सुरुवातीची सिस्टीम "insect-level" बुद्धिमत्तेची होती, ज्यामध्ये केवळ million parameters होते, rules आणि high-precision maps द्वारे चालत होती आणि complex road conditions मध्ये असहाय्य होती. नंतर, end-to-end आर्किटेक्चर आणि व्हिज्युअल-लँग्वेज मॉडेलमुळे तंत्रज्ञानाने "mammal-level" पर्यंत झेप घेतली, नकाशावरील अवलंबित्व कमी झाले आणि nationwide no-map NOA reality ठरले.
खरं तर, या स्टेपमुळे Li Auto industry मध्ये आघाडीवर आहे, पण ते यावर समाधानी नाहीत. ली शियांग यांच्या मते, VLA च्या उदयामुळे Li Auto चे इंटेलिजेंट ड्रायव्हिंग तंत्रज्ञान "human intelligence" च्या एका नवीन टप्प्यात पोहोचले आहे.
मागील सिस्टीमच्या तुलनेत, VLA केवळ 3D physical world ला perceive करू शकत नाही, तर लॉजिकल रिझनिंग करू शकते आणि human level च्या जवळपास ड्रायव्हिंग बिहेवियर generate करू शकते.
उदाहरणार्थ, जर तुम्ही congested रस्त्यावर "वळण्यासाठी जागा शोधा" असे म्हटले, तर VLA command mechanically execute करणार नाही, तर रस्त्याची स्थिती, traffic flow आणि traffic rules विचारात घेऊन U-turn पूर्ण करण्यासाठी योग्य वेळ आणि ठिकाण शोधेल.
ली शियांग म्हणाले की, VLA डेटा generate करून नवीन परिस्थितीशी जुळवून घेऊ शकते आणि complex road repairs चा सामना करताना तीन दिवसांच्या आत responses optimize करू शकते. ही लवचिकता आणि judgment हे VLA चे core advantages आहेत.
Li Auto चे शिक्षक आहेत DeepSeek
VLA ला सपोर्ट करण्यासाठी Li Auto ने स्वतंत्रपणे विकसित केलेली एक complex technical system आहे. ही सिस्टीम कारला केवळ जग "समजण्यास" मदत करत नाही, तर मानवी ड्रायव्हरप्रमाणे विचार करण्यास आणि कार्य करण्यास मदत करते.
पहिली आहे 3D Gaussian representation technology, जी 3D ऑब्जेक्ट तयार करण्यासाठी अनेक "Gaussian points" वापरते. प्रत्येक पॉइंटमध्ये त्याची स्वतःची position, color आणि size information असते. हे तंत्रज्ञान मोठ्या प्रमाणात real data वापरून powerful 3D spatial understanding model train करण्यासाठी self-supervised learning वापरते. याच्या मदतीने VLA मानवाप्रमाणे आसपासचे जग "समजू" शकते, अडथळे कुठे आहेत आणि passable areas कुठे आहेत, हे जाणू शकते.
नंतर आहे Mixture of Experts (MoE) आर्किटेक्चर, ज्यात expert networks, gating networks आणि combiners असतात. जेव्हा model parameters शेकडो अब्जांपेक्षा जास्त असतात, तेव्हा traditional method प्रत्येक calculation मध्ये सर्व neurons ला सहभागी करते, ज्यामुळे resources चा अपव्यय होतो. MoE आर्किटेक्चरमधील gating network वेगवेगळ्या tasks नुसार वेगवेगळ्या experts ला कॉल करेल, ज्यामुळे activation parameters मध्ये लक्षणीय वाढ होणार नाही.
याबद्दल बोलताना ली शियांग यांनी DeepSeek ची प्रशंसा केली:
DeepSeek मानवाच्या सर्वोत्तम पद्धती वापरते… जेव्हा ते DeepSeek V3 करत होते, तेव्हा V3 देखील MoE होते, एक 671B मॉडेल. मला वाटते की MoE हे खूप चांगले आर्किटेक्चर आहे. हे experts ना एकत्र आणण्यासारखे आहे आणि प्रत्येकजण एक expert ability आहे.
शेवटी, Li Auto ने VLA मध्ये Sparse Attention introduce केले, ज्याचा अर्थ VLA आपोआप key areas चे attention weights adjust करेल, ज्यामुळे end side ची inference efficiency सुधारेल.
ली शियांग म्हणाले की, या नवीन base model च्या ट्रेनिंग प्रक्रियेत, Li Auto च्या इंजिनिअर्सनी सर्वोत्तम डेटा रेशो शोधण्यात खूप वेळ घालवला, 3D डेटा आणि autonomous driving शी संबंधित टेक्स्ट आणि इमेज डेटा मोठ्या प्रमाणात integrate केला आणि साहित्यिक आणि ऐतिहासिक डेटाचे प्रमाण कमी केले.
परसेप्शनपासून डिसिजन-मेकिंगपर्यंत, VLA मानवी विचारांच्या fast आणि slow combination मोडचा वापर करते. हे साधे ॲक्शन डिसिजन्स, जसे की इमर्जन्सी अव्हॉइडन्स, पटकन आउटपुट करू शकते आणि बांधकाम क्षेत्र टाळण्यासाठी तात्पुरता मार्ग प्लॅन करण्यासाठी short thinking chains वापरू शकते. real-time परफॉरमन्स अधिक सुधारण्यासाठी, VLA ने speculative reasoning आणि parallel decoding technology देखील introduce केली, ज्यामुळे व्हेईकल-साइड चिपच्या computing power चा पुरेपूर वापर केला जातो आणि डिसिजन-मेकिंग प्रक्रिया जलद आणि व्यवस्थित होते.
ड्रायव्हिंग बिहेवियर generate करताना, VLA Diffusion models आणि Reinforcement Learning from Human Feedback (RLHF) वापरते. Diffusion model ऑप्टिमाइज्ड ड्रायव्हिंग ट्रॅजेक्टरीज generate करण्यास जबाबदार आहे, तर RLHF या ट्रॅजेक्टरीज् मानवी सवयींच्या जवळ आणते, ज्यामुळे त्या सुरक्षित आणि आरामदायक बनतात. उदाहरणार्थ, VLA टर्न घेताना आपोआप वेग कमी करेल किंवा लेन merge करताना पुरेसे सुरक्षित अंतर ठेवेल. हे डिटेल्स मानवी ड्रायव्हिंग बिहेवियरच्या डीप लर्निंगला दर्शवतात.
वर्ल्ड मॉडेल हे आणखी एक key technology आहे. Li Auto सीन रिकन्स्ट्रक्शन आणि जनरेशनद्वारे reinforcement learning साठी high-quality व्हर्च्युअल वातावरण पुरवते. ली शियांग यांनी सांगितले की, वर्ल्ड मॉडेलने व्हेरिफिकेशन कॉस्ट 10,000 किलोमीटरसाठी 170,000-180,000 युआनवरून 4,000 युआनपर्यंत कमी केली आहे. हे VLA ला सिम्युलेशनमध्ये सतत ऑप्टिमाइज करण्याची आणि complex परिस्थितींना सहजपणे सामोरे जाण्याची परवानगी देते.
ट्रेनिंगबद्दल बोलायचं झाल्यास, VLA ची वाढ प्रक्रिया देखील व्यवस्थित आहे. संपूर्ण process तीन टप्प्यात विभागलेली आहे: प्री-ट्रेनिंग, पोस्ट-ट्रेनिंग आणि reinforcement learning. ली शियांग म्हणाले, "प्री-ट्रेनिंग म्हणजे ज्ञान शिकणे, पोस्ट-ट्रेनिंग म्हणजे ड्रायव्हिंग स्कूलमध्ये ड्रायव्हिंग शिकणे आणि reinforcement learning म्हणजे सोशल प्रॅक्टिस."
प्री-ट्रेनिंग टप्प्यात, Li Auto ने VLA साठी व्हिज्युअल-लँग्वेज base model तयार केले, ज्यामध्ये 3D व्हिज्युअल डेटा, 2D high-definition इमेजेस आणि ड्रायव्हिंग-संबंधित corpora भरपूर प्रमाणात भरले, ज्यामुळे ते प्रथम "पाहणे" आणि "ऐकणे" शिकेल; ट्रेनिंगनंतर, ॲक्शन मॉडेल ॲड केले जाते, 4-8 सेकंदांच्या ड्रायव्हिंग ट्रॅजेक्टरीज generate केल्या जातात आणि मॉडेल 3.2 अब्ज पॅरामीटरवरून 4 अब्जांपर्यंत वाढते.
Reinforcement learning दोन टप्प्यात विभागलेले आहे: प्रथम, RLHF वापरून मानवी सवयी align करणे, टेकओव्हर डेटा ॲनालाइज करणे आणि सुरक्षा आणि आराम सुनिश्चित करणे; दुसरे, pure reinforcement learning वापरून ऑप्टिमाइज करणे, G-value (आराम), collision आणि traffic rules feedback च्या आधारावर VLA "मानवापेक्षा चांगले ड्राइव्ह करते." ली शियांग यांनी नमूद केले की हा टप्पा वर्ल्ड मॉडेलमध्ये पूर्ण केला जातो, वास्तविक traffic परिस्थितींचे simulation केले जाते आणि efficiency पारंपरिक व्हेरिफिकेशनपेक्षा खूप चांगली आहे.
ही ट्रेनिंग मेथड केवळ टेक्निकल ॲडव्हान्समेंटची हमी देत नाही, तर practical ॲप्लिकेशन्समध्ये VLA ला पुरेसे विश्वसनीय बनवते.
ली शियांग यांनी मान्य केले की VLA चे यश industry benchmarks च्या प्रेरणाशिवाय शक्य नाही. DeepSeek च्या MoE आर्किटेक्चरने केवळ ट्रेनिंग efficiency सुधारली नाही, तर Li Auto ला मौल्यवान अनुभव दिला. त्यांनी खेद व्यक्त केला: "आम्ही दिग्गजांच्या खांद्यावर उभे आहोत आणि VLA च्या R&D ला गती देत आहोत." या खुल्या शिक्षण दृष्टिकोनमुळे Li Auto no-man’s land मध्ये आणखी पुढे जाऊ शकते.
"इन्फॉर्मेशन टूल्स" पासून "प्रोडक्शन टूल्स" पर्यंत
सध्या, AI industry मध्ये "information tools" पासून "production tools" पर्यंत एक मोठा बदल होत आहे. large model technology च्या परिपक्वतेमुळे, AI केवळ डेटा process करण्यापुरते आणि सूचना देण्यापुरते मर्यादित नाही, तर स्वतंत्र निर्णय घेण्याची आणि कार्ये करण्याची क्षमता त्यात येत आहे.
ली शियांग यांनी AI Talk च्या दुसऱ्या season मध्ये सांगितले की, AI ला माहिती साधने (जसे की search), सहाय्यक साधने (जसे की voice navigation) आणि उत्पादन साधने यामध्ये विभागले जाऊ शकते. त्यांनी जोर दिला: "कृत्रिम बुद्धिमत्ता हे उत्पादन साधन बनणे म्हणजे खऱ्या उद्रेकाचा क्षण आहे." large model technology च्या परिपक्वतेमुळे, AI केवळ डेटा process करण्यापुरते मर्यादित नाही, तर स्वतंत्र निर्णय घेण्याची आणि कार्ये करण्याची क्षमता त्यात येत आहे.
हा ट्रेंड "embodied intelligence" च्या संकल्पनेत विशेषतः दिसून येतो - AI सिस्टीम्सना भौतिक अस्तित्व दिले जाते, जे वातावरण जाणण्यास, समजून घेण्यास आणि संवाद साधण्यास सक्षम असतात.
Li Auto चे VLA मॉडेल या ट्रेंडचा एक स्पष्ट सराव आहे. व्हिजन, लँग्वेज आणि ॲक्शन इंटेलिजन्स एकत्रित करून, ते कारला एक इंटेलिजेंट एजंटमध्ये रूपांतरित करते, जे autonomous ड्राइव्ह करू शकते आणि users शी नैसर्गिकरित्या संवाद साधू शकते,"embodied intelligence" च्या core concept चा योग्य अर्थ लावते.
जोपर्यंत मानव व्यावसायिक ड्रायव्हर्सना कामावर ठेवतात, तोपर्यंत कृत्रिम बुद्धिमत्ता हे उत्पादन साधन बनू शकते. जेव्हा AI हे उत्पादन साधन बनते, तेव्हा कृत्रिम बुद्धिमत्तेचा खऱ्या अर्थाने विकास होईल.
ली शियांग यांच्या बोलण्याने VLA चे core value स्पष्ट केले - ते आता केवळ एक साधे सहाय्यक साधन नाही, तर एक "ड्रायव्हर एजंट" आहे, जे स्वतंत्रपणे कार्ये करू शकते आणि जबाबदाऱ्या घेऊ शकते. या बदलामुळे केवळ कारचे practical value सुधारत नाही, तर AI च्या इतर क्षेत्रांतील ॲप्लिकेशनसाठी कल्पनाशक्तीचा विस्तार होतो.
AI वरील ली शियांग यांचे विचार नेहमीच चौकटीबाहेरचे असतात. त्यांनी हे देखील नमूद केले: "VLA ही अचानक होणारी process नाही, तर उत्क्रांतीची process आहे." हे वाक्य Li Auto च्या टेक्निकल मार्गाचा अचूक सारांश आहे -
सुरुवातीच्या rule-driven पासून, end-to-end breakthroughs पर्यंत, आजच्या VLA च्या "human intelligence" level पर्यंत. या उत्क्रांतीवादी विचारांमुळे VLA तांत्रिकदृष्ट्या अधिक शक्य आहे, तसेच industry साठी एक संदर्भ paradigm देखील उपलब्ध आहे. काही प्रयत्नांच्या तुलनेत, जे अंधपणे उलथापालथ करण्याचा प्रयत्न करतात, Li Auto चा pragmatic मार्ग complex Chinese market साठी अधिक योग्य असू शकतो.
तंत्रज्ञानापासून विश्वासापर्यंत, Li Auto चा AI शोध सोपा नाही. ली शियांग यांनी मान्य केले: "आम्ही AI क्षेत्रात अनेक आव्हानांचा अनुभव घेतला आहे, जसे की पहाटेपूर्वीचा अंधार, परंतु आम्हाला विश्वास आहे की जर आम्ही चिकाटी ठेवल्यास, आम्हाला नक्कीच प्रकाश दिसेल." VLA च्या R&D मध्ये computing power bottlenecks आणि data ethics सारख्या समस्या आहेत, परंतु Li Auto ने self-developed base models आणि world models द्वारे हळूहळू त्यांचे तांत्रिक dawn आणले आहे.
ली शियांग यांनी मुलाखतीत हे देखील सांगितले की VLA चे यश Chinese AI च्या वाढीमुळे शक्य झाले आहे.
ते म्हणाले की DeepSeek आणि Tongyi Qianwen सारख्या मॉडेल्सच्या उदयामुळे चीनची AI level अमेरिकेच्या जवळपास पोहोचली आहे. त्यापैकी, DeepSeek ने जपलेला ओपन सोर्स दृष्टिकोन विशेषतः उत्साहवर्धक आहे, ज्यामुळे Li Auto ला Xinghuan OS ओपन सोर्स करण्यास प्रवृत्त केले. ली शियांग म्हणाले: "हे कंपनीच्या strategic विचारातून नाही. DeepSeek ने आम्हाला खूप मदत केली आहे, त्यामुळे आम्ही समाजात काहीतरी योगदान दिले पाहिजे."
तांत्रिक breakthroughs चा पाठपुरावा करताना, Li Auto ने AI तंत्रज्ञानाच्या सुरक्षा आणि नैतिक समस्यांकडे दुर्लक्ष केलेले नाही. VLA ने introduce केलेल्या "super alignment" तंत्रज्ञानामुळे Reinforcement Learning from Human Feedback (RLHF) द्वारे मॉडेलचे वर्तन मानवी सवयींच्या जवळ येते. डेटा दर्शवितो की VLA च्या ॲप्लिकेशनने high-speed MPI (सरासरी हस्तक्षेप मैलेज) 240km वरून 300km पर्यंत वाढवले आहे.
याहून महत्त्वाचे म्हणजे, Li Auto "मानवी मूल्यांसह AI" तयार करण्यावर जोर देते आणि नैतिकता आणि विश्वासाला तांत्रिक विकासाचा आधार मानते. अधिक macro दृष्टिकोनातून, VLA चे महत्त्व हे आहे की ते कार कंपन्यांची भूमिका पुन्हा परिभाषित करते.
भूतकाळात, कार्स ही औद्योगिक युगातील वाहतुकीची साधने होती; आज, ती कृत्रिम बुद्धिमत्ता युगात "spatial robots" मध्ये विकसित होत आहेत. ली शियांग यांनी AI Talk मध्ये नमूद केले: "Li Auto पूर्वी कार्सच्या no-man’s land मध्ये चालत असे आणि भविष्यात कृत्रिम बुद्धिमत्तेच्या no-man’s land मध्ये चालेल." Li Auto चे हे परिवर्तन ऑटोमोटिव्ह industry च्या बिझनेस मॉडेलमध्ये नवीन कल्पनाशक्ती आणते.
अर्थात, VLA चा विकास आव्हानांशिवाय नाही. computing power, data ethics आणि autonomous driving मध्ये ग्राहकांचा विश्वास निर्माण करणे हे Li Auto ला सामोरे जावे लागणारे मुद्दे आहेत. याव्यतिरिक्त, AI industry मधील स्पर्धा अधिकाधिक तीव्र होत आहे. Tesla, Waymo आणि OpenAI सारखे देशांतर्गत आणि परदेशी दिग्गज मल्टी-मॉडल मॉडेल्सच्या लेआउटला गती देत आहेत. Li Auto ला तंत्रज्ञान iteration आणि मार्केट प्रमोशनमध्ये आपले आघाडीचे स्थान टिकवून ठेवण्याची आवश्यकता आहे. ली शियांग म्हणाले, "आमच्याकडे शॉर्टकट नाही, आम्ही फक्त सखोल अभ्यास करू शकतो."
निःसंशयपणे, VLA चे लॉंचिंग एक महत्त्वाचा टप्पा असेल.
Li Auto ने जुलै 2025 मध्ये pure electric SUV Li Auto i8 सोबत VLA एकाच वेळी रिलीज करण्याची आणि 2026 मध्ये मोठ्या प्रमाणावर उत्पादन साध्य करण्याची योजना आखली आहे. हे केवळ तंत्रज्ञानाची व्यापक चाचणी नाही, तर मार्केटसाठी एक महत्त्वाचा touchstone देखील आहे.