เส้นทาง AI จีน: เน้นบูรณาการใช้จริงเหนือพลังดิบ

บทสนทนาระดับโลกเกี่ยวกับปัญญาประดิษฐ์ (AI) มักจะมุ่งเน้นไปที่การแข่งขันด้านอาวุธอย่างไม่หยุดยั้ง – ใครสามารถสร้างแบบจำลองภาษาขนาดใหญ่ (Large Language Model - LLM) ที่ใหญ่ที่สุดและทรงพลังที่สุดได้? ความก้าวหน้าล่าสุด เช่น ความสามารถอันน่าทึ่งที่แสดงโดยแบบจำลองอย่าง DeepSeek ในประเทศจีน ยิ่งตอกย้ำเรื่องเล่านี้ ท่ามกลางภูมิทัศน์ทางเศรษฐกิจที่ท้าทาย ทั้งในระดับโลกและในประเทศ การก้าวกระโดดทางเทคโนโลยีดังกล่าวนำเสนอภาพที่น่าจับตามองของศักยภาพในอนาคต และอาจเป็นตัวเร่งการเติบโตที่จำเป็นอย่างยิ่ง อย่างไรก็ตาม การมุ่งเน้นไปที่ LLM ที่พาดหัวข่าวเหล่านี้เพียงอย่างเดียวก็เหมือนกับการมองไม่เห็นภาพรวม ปัญญาประดิษฐ์ ในรูปแบบที่ไม่โอ้อวดแต่ส่งผลกระทบอย่างลึกซึ้ง ได้ถูกถักทอเข้ากับโครงสร้างชีวิตดิจิทัลของเรามานานหลายปีแล้ว

ลองพิจารณาแพลตฟอร์มที่แพร่หลายซึ่งครอบงำปฏิสัมพันธ์และการค้าออนไลน์ TikTok หรือ Douyin ซึ่งเป็นคู่แข่งในจีน จะสามารถเข้าถึงทั่วโลกได้อย่างน่าทึ่งเช่นนี้หรือไม่หากไม่มีอัลกอริทึมการแนะนำที่ซับซ้อนซึ่งปรับแต่งฟีดเนื้อหาอย่างต่อเนื่อง? ในทำนองเดียวกัน ความสำเร็จของยักษ์ใหญ่ด้านอีคอมเมิร์ซ ไม่ว่าจะเป็นผู้เล่นระดับนานาชาติอย่าง Amazon, Shein และ Temu หรือผู้ทรงอิทธิพลในประเทศอย่าง Taobao และ JD.com ก็สร้างขึ้นจากสิ่งอื่นนอกเหนือจากการจัดหาและโลจิสติกส์ที่มีประสิทธิภาพ AI ทำหน้าที่เป็นมือที่มองไม่เห็น ชี้นำทางเลือกของเราอย่างละเอียดอ่อน ตั้งแต่หนังสือที่เราพิจารณาซื้อไปจนถึงเทรนด์แฟชั่นที่เรานำมาใช้ พฤติกรรมการบริโภคของเราถูกกำหนดโดยระบบที่วิเคราะห์การซื้อในอดีต ประวัติการเข้าชม และรูปแบบการคลิกของเรามากขึ้นเรื่อยๆ นานก่อนที่ AI เชิงสนทนาจะสามารถแต่งบทกวีที่ไพเราะตามความต้องการได้ บริษัทอย่าง Amazon และ Google ก็เป็นผู้บุกเบิกการใช้ AI เพื่อทำความเข้าใจและคาดการณ์พฤติกรรมผู้บริโภค ซึ่งเปลี่ยนแปลงตลาดไปโดยพื้นฐาน AI รูปแบบที่เงียบกว่าและแพร่หลายมากขึ้นนี้ได้ปรับเปลี่ยนการค้าและการบริโภคสื่อมานานหลายทศวรรษ โดยมักจะทำงานอยู่ภายใต้เกณฑ์ของการรับรู้ที่รู้ตัว

ดาบสองคมของแบบจำลองภาษาขนาดใหญ่ (Large Language Models)

การเกิดขึ้นของ LLM ที่ทรงพลังเช่น DeepSeek ถือเป็นก้าวสำคัญทางเทคโนโลยีอย่างปฏิเสธไม่ได้ ความสามารถในการสร้างข้อความที่เหมือนมนุษย์ แปลภาษา และแม้กระทั่งเขียนเนื้อหาเชิงสร้างสรรค์ เช่น บทกวี นั้นน่าทึ่งมาก เครื่องมือเหล่านี้มีแนวโน้มที่ดีอย่างยิ่งในฐานะผู้ช่วยส่วนตัว เครื่องมือช่วยวิจัย และพันธมิตรเชิงสร้างสรรค์ ลองจินตนาการถึงการใช้ประโยชน์จากแบบจำลองดังกล่าวเพื่อร่างอีเมล สรุปเอกสารขนาดยาว หรือระดมความคิด – ศักยภาพในการเพิ่มผลิตภาพส่วนบุคคลนั้นชัดเจน

อย่างไรก็ตาม พลังนี้มาพร้อมกับข้อควรระวังที่สำคัญ ซึ่งมีรากฐานมาจากธรรมชาติของการทำงานของแบบจำลองเหล่านี้ LLM สร้างขึ้นจากวิธีการทางสถิติที่ซับซ้อนและโครงข่ายประสาทเทียมขนาดใหญ่ที่ฝึกฝนบนชุดข้อมูลขนาดมหึมา พวกมันเก่งในการระบุรูปแบบและคาดการณ์ลำดับคำที่น่าจะเป็นไปได้มากที่สุด แต่พวกมันไม่ได้มีความเข้าใจหรือสติสัมปชัญญะที่แท้จริง รากฐานทางสถิตินี้นำไปสู่ช่องโหว่ที่สำคัญ: ภาพหลอน (hallucinations) เมื่อต้องเผชิญกับหัวข้อที่อยู่นอกเหนือข้อมูลการฝึกอบรมหรือคำถามที่ต้องใช้วิจารณญาณที่ละเอียดอ่อน LLM สามารถสร้างข้อมูลที่ฟังดูน่าเชื่อถือแต่ไม่ถูกต้องหรือทำให้เข้าใจผิดได้อย่างมั่นใจ

ลองนึกถึง LLM ไม่ใช่ในฐานะเทพพยากรณ์ที่ไม่ผิดพลาด แต่อาจเป็นผู้เชี่ยวชาญที่อ่านมาอย่างดี พูดจาฉะฉาน แต่บางครั้งก็กุเรื่องขึ้นมา ในขณะที่ DeepSeek อาจแต่งบทกวีโซเน็ตที่เร้าใจ การพึ่งพามันสำหรับการตีความทางกฎหมายที่สำคัญ การวินิจฉัยทางการแพทย์ที่แม่นยำ หรือคำแนะนำทางการเงินที่มีเดิมพันสูงนั้นเป็นสิ่งที่ไม่รอบคอบอย่างยิ่ง กลไกความน่าจะเป็นทางสถิติที่ช่วยให้สามารถสร้างข้อความที่คล่องแคล่วได้นั้นยังทำให้มีแนวโน้มที่จะสร้าง ‘ข้อเท็จจริง’ ขึ้นมาเมื่อขาดความรู้ที่ชัดเจน แม้ว่าสถาปัตยกรรมและแบบจำลองการให้เหตุผลที่ใหม่กว่า (เช่น R1 ของ DeepSeek หรือ o1/o3 ที่มีข่าวลือของ OpenAI) มีเป้าหมายเพื่อบรรเทาปัญหานี้ แต่ก็ยังไม่ได้กำจัดมันออกไป LLM ที่ป้องกันความผิดพลาดได้อย่างสมบูรณ์ ซึ่งรับประกันว่าจะแม่นยำในทุกกรณี ยังคงเป็นสิ่งที่เข้าใจยาก ดังนั้น ในขณะที่ LLM สามารถเป็นเครื่องมือที่มีศักยภาพสำหรับบุคคล การใช้งานจะต้องควบคู่ไปกับการประเมินเชิงวิพากษ์ โดยเฉพาะอย่างยิ่งเมื่อการตัดสินใจตามผลลัพธ์ของมันมีน้ำหนักอย่างมีนัยสำคัญ พวกมันช่วยเสริมความสามารถของมนุษย์ ไม่ได้มาแทนที่วิจารณญาณของมนุษย์ในขอบเขตที่สำคัญ

การนำ AI ไปใช้ในองค์กรและภาครัฐ

แม้จะมีข้อจำกัดโดยธรรมชาติสำหรับคำถามปลายเปิดที่มีเดิมพันสูง LLM ก็ยังคงนำเสนอคุณค่าที่สำคัญสำหรับองค์กรและหน่วยงานภาครัฐ โดยเฉพาะอย่างยิ่งในสภาพแวดล้อมที่มีการควบคุม จุดแข็งของพวกมันไม่ได้อยู่ที่การแทนที่การตัดสินใจที่ชัดเจน แต่อยู่ที่การปรับปรุงกระบวนการให้มีประสิทธิภาพและการดึงข้อมูลเชิงลึก การใช้งานที่สำคัญ ได้แก่:

  • กระบวนการอัตโนมัติ (Process Automation): การจัดการงานประจำ เช่น การป้อนข้อมูล การคัดกรองเบื้องต้นในการบริการลูกค้า การสรุปเอกสาร และการสร้างรายงาน
  • การเพิ่มประสิทธิภาพเวิร์กโฟลว์ (Workflow Optimisation): การระบุคอขวด การเสนอการปรับปรุงประสิทธิภาพ และการจัดการไทม์ไลน์โครงการที่ซับซ้อนโดยอิงจากการวิเคราะห์ข้อมูล
  • การวิเคราะห์ข้อมูล (Data Analytics): การประมวลผลชุดข้อมูลขนาดใหญ่เพื่อเปิดเผยแนวโน้ม ความสัมพันธ์ และความผิดปกติที่อาจหลุดรอดจากการตรวจจับของมนุษย์ ช่วยในการวางแผนเชิงกลยุทธ์และการจัดสรรทรัพยากร

แง่มุมที่สำคัญสำหรับการใช้งานภาครัฐและองค์กรคือความปลอดภัยของข้อมูลและการรักษาความลับ ความพร้อมใช้งานของแบบจำลองโอเพนซอร์สเช่น DeepSeek ถือเป็นข้อได้เปรียบในที่นี้ แบบจำลองเหล่านี้สามารถโฮสต์ภายในโครงสร้างพื้นฐานดิจิทัลของรัฐบาลหรือองค์กรที่ปลอดภัยและเฉพาะเจาะจงได้ แนวทาง ‘on-premises’ หรือ ‘private cloud’ นี้ช่วยให้ข้อมูลที่ละเอียดอ่อนหรือเป็นความลับสามารถประมวลผลได้โดยไม่ต้องเปิดเผยต่อเซิร์ฟเวอร์ภายนอกหรือผู้ให้บริการบุคคลที่สาม ซึ่งช่วยลดความเสี่ยงด้านความเป็นส่วนตัวและความปลอดภัยที่สำคัญ

อย่างไรก็ตาม การคำนวณจะเปลี่ยนไปอย่างมากเมื่อพิจารณาแอปพลิเคชันภาครัฐที่ต้องเผชิญหน้ากับสาธารณะ ซึ่งข้อมูลที่ให้ต้องมีความน่าเชื่อถือและถูกต้องอย่างไม่มีข้อกังขา ลองจินตนาการถึงพลเมืองที่สอบถามพอร์ทัลของรัฐบาลที่ขับเคลื่อนด้วย LLM เกี่ยวกับสิทธิ์ในการรับสวัสดิการสังคม กฎระเบียบด้านภาษี หรือขั้นตอนฉุกเฉิน แม้ว่า AI จะสร้างคำตอบที่ถูกต้องสมบูรณ์แบบ 99% ของเวลาทั้งหมด แต่ 1% ที่เหลือของคำตอบที่ทำให้เข้าใจผิดหรือไม่ถูกต้องอาจส่งผลกระทบร้ายแรง บั่นทอนความไว้วางใจของสาธารณชน ก่อให้เกิดความเดือดร้อนทางการเงิน หรือแม้กระทั่งเป็นอันตรายต่อความปลอดภัย

สิ่งนี้จำเป็นต้องมีการนำมาตรการป้องกัน (safeguards) ที่แข็งแกร่งมาใช้ แนวทางแก้ไขที่เป็นไปได้ ได้แก่:

  • การกรองคำถาม (Query Filtering): การออกแบบระบบเพื่อระบุคำถามที่อยู่นอกขอบเขตที่กำหนดไว้ของคำตอบที่ปลอดภัยและตรวจสอบได้
  • การกำกับดูแลโดยมนุษย์ (Human Oversight): การตั้งค่าสถานะคำถามที่ซับซ้อน คลุมเครือ หรือมีความเสี่ยงสูงเพื่อให้ผู้เชี่ยวชาญที่เป็นมนุษย์ตรวจสอบและตอบกลับ
  • การให้คะแนนความเชื่อมั่น (Confidence Scoring): การเขียนโปรแกรมให้ AI ระบุระดับความมั่นใจเกี่ยวกับคำตอบ กระตุ้นให้ผู้ใช้ตรวจสอบยืนยันสำหรับคำตอบที่มีความเชื่อมั่นต่ำ
  • การตรวจสอบความถูกต้องของคำตอบ (Answer Validation): การอ้างอิงคำตอบที่สร้างโดย AI กับฐานข้อมูลที่รวบรวมข้อมูลที่ถูกต้องและเป็นที่รู้จักก่อนที่จะนำเสนอต่อสาธารณะ

มาตรการเหล่านี้เน้นย้ำถึงความตึงเครียดพื้นฐานที่มีอยู่ในเทคโนโลยี LLM ในปัจจุบัน: การแลกเปลี่ยนระหว่างพลังการสร้างที่น่าประทับใจกับความต้องการความแม่นยำและความน่าเชื่อถืออย่างสมบูรณ์ในบริบทที่สำคัญ การจัดการความตึงเครียดนี้เป็นกุญแจสำคัญในการปรับใช้ AI อย่างมีความรับผิดชอบในภาครัฐ

สู่ AI ที่น่าเชื่อถือ: แนวทางกราฟความรู้ (Knowledge Graph)

แนวทางของจีนดูเหมือนจะมุ่งเน้นไปที่การจัดการกับความตึงเครียดนี้มากขึ้นเรื่อยๆ โดยการบูรณาการ AI เข้ากับแอปพลิเคชันเฉพาะที่มีการควบคุม ในขณะเดียวกันก็แสวงหาวิธีเพิ่มความน่าเชื่อถืออย่างแข็งขัน ตัวอย่างที่น่าสนใจคือโครงการริเริ่มเมืองอัจฉริยะ (smart city) ที่กำลังดำเนินอยู่ในเมืองจูไห่ (Zhuhai) ซึ่งเป็นเมืองในเขตเศรษฐกิจพิเศษ Greater Bay Area เมื่อเร็วๆ นี้ รัฐบาลเทศบาลได้ทำการลงทุนเชิงกลยุทธ์ที่สำคัญ (ประมาณ 500 ล้านหยวน หรือ 69 ล้านดอลลาร์สหรัฐ) ใน Zhipu AI ซึ่งเป็นการส่งสัญญาณถึงความมุ่งมั่นในการฝัง AI ขั้นสูงเข้ากับโครงสร้างพื้นฐานของเมือง

ความทะเยอทะยานของจูไห่ขยายไปไกลกว่าระบบอัตโนมัติธรรมดา เป้าหมายคือการนำ AI มาใช้อย่างครอบคลุมและเป็นชั้นๆ โดยมุ่งเป้าไปที่การปรับปรุงบริการสาธารณะที่เป็นรูปธรรม ซึ่งรวมถึงการเพิ่มประสิทธิภาพการไหลเวียนของการจราจรผ่านการวิเคราะห์ข้อมูลแบบเรียลไทม์ การรวมกระแสข้อมูลที่แตกต่างกันจากหน่วยงานภาครัฐต่างๆ เพื่อการตัดสินใจแบบองค์รวมมากขึ้น และท้ายที่สุดคือการสร้างสภาพแวดล้อมในเมืองที่มีประสิทธิภาพและตอบสนองต่อพลเมืองได้ดียิ่งขึ้น

หัวใจสำคัญของความพยายามนี้คือแบบจำลองภาษาทั่วไป GLM-4 ของ Zhipu AI แม้ว่าจะมีความเชี่ยวชาญในการจัดการงานทั้งภาษาจีนและภาษาอังกฤษ และมีความสามารถหลายรูปแบบ (ประมวลผลข้อมูลนอกเหนือจากข้อความ) แต่ความแตกต่างที่สำคัญอยู่ที่สถาปัตยกรรม Zhipu AI ซึ่งเป็นบริษัทที่แยกตัวออกมาจาก Knowledge Engineering Group ที่มีชื่อเสียงของมหาวิทยาลัย Tsinghua ได้รวมชุดข้อมูลที่มีโครงสร้างและกราฟความรู้ (knowledge graphs) เข้ากับกระบวนการเรียนรู้ ซึ่งแตกต่างจาก LLM ทั่วไปที่เรียนรู้จากข้อความที่ไม่มีโครงสร้างจำนวนมหาศาลเป็นหลัก (เช่น เว็บไซต์และหนังสือ) Zhipu AI ใช้ประโยชน์จากกราฟความรู้ที่มีความแม่นยำสูงที่ได้รับการดูแลจัดการอย่างชัดเจน ซึ่งเป็นการแสดงโครงสร้างของข้อเท็จจริง เอนทิตี และความสัมพันธ์ระหว่างกัน

บริษัทอ้างว่าแนวทางนี้ช่วยลดอัตราการเกิดภาพหลอนของแบบจำลองได้อย่างมีนัยสำคัญ โดยมีรายงานว่ามีอัตราต่ำที่สุดในการเปรียบเทียบระดับโลกครั้งล่าสุด ด้วยการวางรากฐานการอนุมานทางสถิติของ AI ในกรอบของความรู้ที่มีโครงสร้างและผ่านการตรวจสอบแล้ว (ตามที่บอกเป็นนัยโดยที่มา ‘Knowledge Engineering’) Zhipu AI มีเป้าหมายที่จะสร้างกลไกการรับรู้ที่น่าเชื่อถือมากขึ้น นี่แสดงถึงก้าวที่เป็นรูปธรรมจากการพึ่งพาแบบจำลองทางสถิติล้วนๆ ไปสู่ระบบที่รวมการวางรากฐานตามข้อเท็จจริง ซึ่งช่วยเพิ่มความน่าเชื่อถือสำหรับแอปพลิเคชันเฉพาะ เช่น แอปพลิเคชันที่คาดการณ์ไว้ในโครงการเมืองอัจฉริยะของจูไห่

การแสวงหาการบูรณาการเชิงประสาท-สัญลักษณ์ (Neuro-Symbolic Integration)

ตัวอย่างของ Zhipu AI ชี้ให้เห็นถึงการเปลี่ยนแปลงที่กว้างขึ้นและเป็นพื้นฐานมากขึ้นที่คาดว่าจะเกิดขึ้นในวิวัฒนาการของปัญญาประดิษฐ์: การบูรณาการโครงข่ายประสาทเทียมเชิงสถิติเข้ากับการให้เหตุผลเชิงตรรกะเชิงสัญลักษณ์ ในขณะที่ LLM ในปัจจุบันส่วนใหญ่แสดงถึงชัยชนะของโครงข่ายประสาทเทียม – ยอดเยี่ยมในการจดจำรูปแบบ การประมวลผลข้อมูลทางประสาทสัมผัส และการสร้างผลลัพธ์ที่น่าจะเป็นไปได้ทางสถิติ – ขั้นตอนต่อไปน่าจะเกี่ยวข้องกับการรวมความสามารถ ‘เชิงสัญชาตญาณ’ นี้เข้ากับการให้เหตุผลตามกฎที่มีโครงสร้างซึ่งเป็นลักษณะของ AI เชิงสัญลักษณ์แบบดั้งเดิม

การบูรณาการเชิงประสาท-สัญลักษณ์ (neuro-symbolic integration) นี้มักถูกอธิบายว่าเป็น ‘จอกศักดิ์สิทธิ์’ ในการวิจัย AI อย่างแม่นยำเพราะมันให้คำมั่นสัญญาถึงสิ่งที่ดีที่สุดของทั้งสองโลก: ความสามารถในการเรียนรู้และการปรับตัวของโครงข่ายประสาทเทียม ควบคู่ไปกับความโปร่งใส การตรวจสอบได้ และการให้เหตุผลที่ชัดเจนของระบบสัญลักษณ์ ลองจินตนาการถึง AI ที่ไม่เพียงแต่จดจำรูปแบบในข้อมูล แต่ยังสามารถอธิบายเหตุผลตามกฎหมาย กฎเกณฑ์ หรือหลักการทางตรรกะที่กำหนดไว้ได้

การบรรลุการบูรณาการที่ราบรื่นนำเสนอความท้าทายที่ซับซ้อนมากมาย ซึ่งครอบคลุมกรอบทฤษฎี ประสิทธิภาพในการคำนวณ และการนำไปปฏิบัติจริง อย่างไรก็ตาม การสร้างกราฟความรู้ (knowledge graphs) ที่แข็งแกร่งถือเป็นจุดเริ่มต้นที่เป็นรูปธรรม ฐานข้อมูลข้อเท็จจริงและความสัมพันธ์ที่มีโครงสร้างเหล่านี้ให้พื้นฐานเชิงสัญลักษณ์ที่จำเป็นในการยึดเหนี่ยวการอนุมานของโครงข่ายประสาทเทียม

เราอาจจินตนาการถึงความพยายามขนาดใหญ่ที่ได้รับการสนับสนุนจากรัฐในประเทศจีน ซึ่งอาจสะท้อนถึงภารกิจอันยิ่งใหญ่ในการรวบรวมสารานุกรม Yongle Dadian ในสมัยราชวงศ์หมิง ด้วยการประมวลผลข้อมูลที่ตรวจสอบแล้วจำนวนมหาศาลในรูปแบบดิจิทัลในขอบเขตที่สำคัญซึ่งความแม่นยำเป็นสิ่งที่ไม่สามารถต่อรองได้ – เช่น การแพทย์ กฎหมาย วิศวกรรม และวัสดุศาสตร์ – จีนสามารถสร้างโครงสร้างความรู้พื้นฐานได้ การยึดแบบจำลอง AI ในอนาคตไว้ในฐานความรู้ที่มีโครงสร้างและประมวลผลเหล่านี้จะเป็นก้าวสำคัญในการทำให้พวกมันน่าเชื่อถือมากขึ้น มีแนวโน้มที่จะเกิดภาพหลอนน้อยลง และท้ายที่สุด มีความน่าเชื่อถือมากขึ้นสำหรับแอปพลิเคชันที่สำคัญ ซึ่งอาจเป็นการพัฒนาขอบเขตของสาขาเหล่านี้ในกระบวนการ

การขับขี่อัตโนมัติ: ความได้เปรียบด้านระบบนิเวศของจีน

บางทีเวทีที่น่าสนใจที่สุดที่จีนดูเหมือนจะพร้อมที่จะใช้ประโยชน์จากการมุ่งเน้นไปที่ AI ที่บูรณาการและเชื่อถือได้คือการขับขี่อัตโนมัติ (autonomous driving) แอปพลิเคชันนี้แตกต่างจากแบบจำลองภาษาเอนกประสงค์เนื่องจากความปลอดภัยไม่ใช่แค่สิ่งที่พึงปรารถนา แต่เป็นสิ่งสำคัญยิ่ง การควบคุมยานพาหนะในสภาพแวดล้อมจริงที่ซับซ้อนและคาดเดาไม่ได้ต้องการมากกว่าแค่การจดจำรูปแบบ มันต้องการการตัดสินใจในเสี้ยววินาทีโดยอิงตามกฎจราจร ข้อจำกัดทางกายภาพ ข้อพิจารณาทางจริยธรรม และการให้เหตุผลเชิงคาดการณ์เกี่ยวกับพฤติกรรมของผู้ใช้ถนนรายอื่น

ดังนั้น ระบบการขับขี่อัตโนมัติจึงจำเป็นต้องมีสถาปัตยกรรมเชิงประสาท-สัญลักษณ์ (neuro-symbolic architecture) ที่แท้จริง

  • โครงข่ายประสาทเทียม (Neural networks) มีความจำเป็นสำหรับการประมวลผลข้อมูลทางประสาทสัมผัสจำนวนมหาศาลจากกล้อง lidar และเรดาร์ การระบุวัตถุ เช่น คนเดินเท้า นักปั่นจักรยาน และยานพาหนะอื่นๆ และการทำความเข้าใจสภาพแวดล้อมในทันที
  • ตรรกะเชิงสัญลักษณ์ (Symbolic logic) มีความสำคัญอย่างยิ่งสำหรับการบังคับใช้กฎจราจร (การหยุดที่ไฟแดง การให้ทาง) การปฏิบัติตามข้อจำกัดทางกายภาพ (ระยะเบรก รัศมีวงเลี้ยว) การตัดสินใจที่โปร่งใสและตรวจสอบได้ในสถานการณ์ที่ซับซ้อน และอาจรวมถึงการนำทางในภาวะที่กลืนไม่เข้าคายไม่ออกทางจริยธรรม (เช่น ทางเลือกในอุบัติเหตุที่หลีกเลี่ยงไม่ได้ แม้ว่านี่จะยังคงเป็นประเด็นที่ซับซ้อนอย่างยิ่ง)

ยานยนต์อัตโนมัติต้องผสมผสาน ‘สัญชาตญาณ’ ที่ขับเคลื่อนด้วยข้อมูลเข้ากับการให้เหตุผลตามกฎได้อย่างมีประสิทธิภาพ โดยดำเนินการอย่างสม่ำเสมอและคาดการณ์ได้เพื่อรับประกันความปลอดภัยที่ปรับเปลี่ยนได้ในสถานการณ์ที่ไม่หยุดนิ่ง มันไม่สามารถที่จะมี ‘ภาพหลอน’ หรือข้อผิดพลาดเชิงความน่าจะเป็นที่ยอมรับได้ในแอปพลิเคชัน AI ที่มีความสำคัญน้อยกว่า

ในที่นี้ จีนมีการบรรจบกันของปัจจัยที่เป็นเอกลักษณ์ซึ่งสร้างระบบนิเวศที่อุดมสมบูรณ์สำหรับการพัฒนาและการปรับใช้การขับขี่อัตโนมัติ ซึ่งอาจเหนือกว่ามหาอำนาจระดับโลกอื่นๆ:

  1. ห่วงโซ่อุปทาน EV ชั้นนำของโลก: จีนครองตลาดการผลิตรถยนต์ไฟฟ้าและส่วนประกอบ โดยเฉพาะแบตเตอรี่ ซึ่งเป็นฐานอุตสาหกรรมที่แข็งแกร่ง
  2. โครงสร้างพื้นฐานการชาร์จที่กว้างขวาง: เครือข่ายสถานีชาร์จที่ขยายตัวอย่างรวดเร็วช่วยลดความกังวลเรื่องระยะทางและสนับสนุนการนำ EV มาใช้อย่างแพร่หลาย
  3. เครือข่าย 5G ขั้นสูง: การสื่อสารแบนด์วิดท์สูงและความหน่วงต่ำมีความสำคัญอย่างยิ่งสำหรับการสื่อสารระหว่างยานพาหนะกับทุกสิ่ง (V2X) ซึ่งช่วยให้เกิดการประสานงานระหว่างยานพาหนะและโครงสร้างพื้นฐาน
  4. การบูรณาการเมืองอัจฉริยะ: โครงการริเริ่มต่างๆ เช่น ของจูไห่ แสดงให้เห็นถึงความเต็มใจที่จะรวมระบบการขนส่งเข้ากับเครือข่ายข้อมูลเมืองที่กว้างขึ้น เพิ่มประสิทธิภาพการไหลเวียนของการจราจรและเปิดใช้งานคุณสมบัติ AV ขั้นสูง
  5. การใช้บริการเรียกรถอย่างแพร่หลาย: การยอมรับแอปเรียกรถของผู้บริโภคในระดับสูงสร้างตลาดที่พร้อมสำหรับบริการ robotaxi ซึ่งเป็นเส้นทางที่ชัดเจนสำหรับการทำให้ยานยนต์อัตโนมัติเป็นเชิงพาณิชย์
  6. อัตราการยอมรับ EV สูง: ผู้บริโภคชาวจีนยอมรับรถยนต์ไฟฟ้าได้เร็วกว่าในหลายประเทศตะวันตก ทำให้เกิดตลาดในประเทศขนาดใหญ่
  7. สภาพแวดล้อมด้านกฎระเบียบที่สนับสนุน: ในขณะที่ความปลอดภัยยังคงเป็นกุญแจสำคัญ ดูเหมือนว่าจะมีการสนับสนุนจากรัฐบาลสำหรับการทดสอบและการปรับใช้เทคโนโลยีอัตโนมัติ ซึ่งเห็นได้จากการดำเนินการ robotaxi ที่กำลังดำเนินการอยู่ในเมืองต่างๆ เช่น อู่ฮั่น (Wuhan)

เปรียบเทียบสิ่งนี้กับภูมิภาคอื่น สหรัฐอเมริกา แม้จะมีความพยายามบุกเบิกของ Tesla แต่ก็ยังตามหลังอย่างมีนัยสำคัญในการยอมรับ EV โดยรวมในกลุ่มประเทศที่พัฒนาแล้ว ซึ่งเป็นแนวโน้มที่อาจรุนแรงขึ้นจากการเปลี่ยนแปลงนโยบาย ยุโรปมีการยอมรับ EV ที่แข็งแกร่ง แต่ขาดการรวมศูนย์ของผู้ผลิต EV ในประเทศที่โดดเด่นหรือยักษ์ใหญ่ AI ชั้นนำระดับโลกที่มุ่งเน้นไปที่การบูรณาการนี้

ดังนั้น ความได้เปรียบเชิงกลยุทธ์ของจีนจึงดูเหมือนจะน้อยกว่าการมี LLM ที่ทรงพลังที่สุดเพียงตัวเดียว และมากกว่าการจัดระเบียบระบบนิเวศที่ซับซ้อนนี้ ชิ้นส่วนต่างๆ กำลังเข้าที่เข้าทาง – ตั้งแต่ความสามารถในการผลิตไปจนถึงโครงสร้างพื้นฐานดิจิทัลและการยอมรับของผู้บริโภค – ซึ่งอาจช่วยให้ยานยนต์อัตโนมัติเปลี่ยนจากการทดสอบเฉพาะกลุ่มไปสู่การยอมรับในกระแสหลักภายในทศวรรษนี้ บางทีอาจเห็นการเติบโตอย่างมีนัยสำคัญในปีนี้ พลังการเปลี่ยนแปลงเต็มรูปแบบจะถูกปลดล็อกเมื่อยานพาหนะเหล่านี้รวมเข้ากับโครงสร้างพื้นฐานเมืองอัจฉริยะที่กำลังพัฒนาได้อย่างราบรื่น

การเปลี่ยนจุดสนใจ: จากพลังการคำนวณสู่ระบบนิเวศแบบบูรณาการ

ในขณะที่สหรัฐอเมริกาและผู้เล่นอื่นๆ มักจะดูเหมือนติดอยู่กับ ‘การแข่งขันด้านการคำนวณ’ โดยมุ่งเน้นไปที่ความเป็นเจ้าแห่งชิป โครงสร้างพื้นฐานเซิร์ฟเวอร์ขนาดใหญ่ และการบรรลุความเป็นผู้นำด้านเกณฑ์มาตรฐานด้วย LLM ที่ใหญ่ขึ้นเรื่อยๆ จีนดูเหมือนจะดำเนินกลยุทธ์เสริม ซึ่งอาจส่งผลกระทบมากกว่าในท้ายที่สุด กลยุทธ์นี้เน้นการบูรณาการ AI เข้ากับแอปพลิเคชันที่จับต้องได้และเปลี่ยนแปลงสังคมได้ โดยให้ความสำคัญกับความน่าเชื่อถือและการทำงานร่วมกันของระบบนิเวศ โดยเฉพาะอย่างยิ่งในขอบเขตต่างๆ เช่น การขับขี่อัตโนมัติและเมืองอัจฉริยะ

สิ่งนี้เกี่ยวข้องกับการเคลื่อนไหวอย่างจงใจไปสู่แนวทางเชิงประสาท-สัญลักษณ์ โดยกำหนดเป้าหมายไปยังขอบเขตที่มีมูลค่าสูงและมีความสำคัญต่อความปลอดภัยโดยเฉพาะ ซึ่งแบบจำลองทางสถิติล้วนๆ ยังทำได้ไม่ดีพอ ความได้เปรียบทางการแข่งขันที่แท้จริงอาจไม่ได้อยู่ภายในอัลกอริทึมหรือแบบจำลองใดๆ เพียงอย่างเดียว โดยไม่คำนึงถึงพลังหรือความคุ้มค่า แต่在于ความสามารถในการถักทอ AI เข้ากับภูมิทัศน์ทางกายภาพและเศรษฐกิจผ่านระบบนิเวศที่ครอบคลุมและบูรณาการ จีนกำลังก้าวหน้าอย่างเงียบๆ ไปสู่การบูรณาการเชิงประสาท-สัญลักษณ์ที่ใช้งานได้จริงและเฉพาะทาง โดยมองข้ามความหลงใหลในปัจจุบันที่มีต่อ LLM ไปสู่แอปพลิเคชันที่สามารถปรับเปลี่ยนชีวิตในเมืองและการขนส่งได้อย่างสิ้นเชิง อนาคตของผลกระทบในโลกแห่งความเป็นจริงของ AI อาจไม่ได้อยู่ที่ความสามารถในการพูดคุยของแชทบอทมากนัก แต่อยู่ที่การทำงานที่น่าเชื่อถือของระบบที่ซับซ้อนและฝัง AI เหล่านี้