การแสวงหาอธิปไตย AI: การตอบสนองของไต้หวันต่อ DeepSeek

ในขณะที่ความก้าวหน้าล่าสุดของจีนในด้านปัญญาประดิษฐ์ โดยเฉพาะอย่างยิ่งกับการเปิดตัว DeepSeek-R1 ได้ดึงดูดความสนใจไปทั่วโลก ไต้หวันกำลังวางเส้นทางที่แตกต่างออกไป ซึ่งให้ความสำคัญกับการพัฒนาโมเดลภาษาที่สะท้อนถึงเอกลักษณ์ทางวัฒนธรรมและค่านิยมประชาธิปไตยที่เป็นเอกลักษณ์ของตน ความพยายามนี้มีจุดมุ่งหมายเพื่อสร้างความสมดุลให้กับระบบ AI ที่ได้รับอิทธิพลจากระบอบเผด็จการ

ความท้าทายของ DeepSeek

การเปิดตัว DeepSeek-R1 ในเดือนมกราคมได้จุดประกายความสนใจอย่างมากในชุมชนเทคโนโลยี โมเดลภาษาจีนก่อนหน้านี้ เช่น Ernie ของ Baidu และ Doubao ของ ByteDance แสดงให้เห็นถึงความหวังในการใช้งานภาษาจีน คณิตศาสตร์ และการเขียนโค้ด แต่ถูกจำกัดด้วยความสามารถทางภาษาอังกฤษที่อ่อนแอกว่าและการเข้าถึงที่จำกัด อย่างไรก็ตาม DeepSeek-R1 ถือเป็นเหตุการณ์สำคัญเนื่องจากเป็น LLM ภาษาจีนตัวแรกที่ได้รับการยอมรับในระดับสากล

หนึ่งในแง่มุมที่โดดเด่นที่สุดของ DeepSeek-R1 คือต้นทุนการพัฒนาที่ต่ำอย่างเห็นได้ชัด เมื่อเทียบกับ GPT-4o ของ OpenAI ซึ่งมีค่าใช้จ่ายในการฝึกอบรมสูงถึง 100 ล้านดอลลาร์สหรัฐ นักวิจัยของ DeepSeek อ้างว่าแชทบอทของพวกเขาได้รับการพัฒนาในราคาเพียง 5.6 ล้านดอลลาร์สหรัฐ ยิ่งไปกว่านั้น เพื่อส่งเสริมเรื่องราวของประสิทธิภาพ วิศวกรของ DeepSeek ได้ฝึกอบรมโมเดล R1 โดยใช้ CPU ระดับกลาง เช่น Nvidia H800 แทนที่จะใช้ชิปชั้นนำที่ใช้ในโมเดลเช่น GPT-4o หรือ Claude ของ Anthropic แม้ว่าสหรัฐฯ จะจำกัดการส่งออกชิปประสิทธิภาพสูงไปยังจีน แต่ DeepSeek-R1 ก็สามารถเอาชนะบอทชั้นนำอื่นๆ ได้โดยใช้โปรเซสเซอร์เพียง 2,048 ตัว กระจายอยู่ทั่ว 256 เซิร์ฟเวอร์

ประสิทธิภาพที่น่าทึ่งและต้นทุนการพัฒนาที่ต่ำกว่านี้ส่วนใหญ่เป็นผลมาจากเทคนิคการเขียนโปรแกรมที่ซับซ้อน รวมถึง PTX ซึ่งเป็นภาษาที่คล้ายกับการประกอบ ซึ่งช่วยให้นักพัฒนาสามารถปรับแต่งประสิทธิภาพและเพิ่มการใช้งานฮาร์ดแวร์ให้สูงสุดได้

หลังจากเปิดตัวได้ไม่นาน แอป DeepSeek-R1 ก็พุ่งขึ้นสู่อันดับต้น ๆ ของการจัดอันดับการดาวน์โหลดฟรีของ Apple App Store ในสหรัฐอเมริกา แซงหน้า ChatGPT, TikTok และแพลตฟอร์มโซเชียลมีเดียของ Meta Nasdaq ประสบภาวะขาลง และหุ้นของ Nvidia ร่วงลงหลังจากการเปิดตัว DeepSeek-R1

ตั้งคำถามกับการอ้างสิทธิ์ของ DeepSeek

แม้จะมีความกระตือรือร้นในตอนแรก แต่ผู้สังเกตการณ์หลายคนได้ตั้งคำถามเกี่ยวกับความถูกต้องของการอ้างสิทธิ์ของ DeepSeek เกี่ยวกับ LLM ของตน นักวิเคราะห์ได้แนะนำว่าตัวเลขที่ระบุไว้น่าจะคิดเฉพาะต้นทุนด้านการคำนวณเท่านั้น ในขณะที่ละเว้นหรือประเมินค่าโครงสร้างพื้นฐาน ฮาร์ดแวร์ และค่าใช้จ่ายด้านทรัพยากรบุคคลต่ำเกินไป

Wesley Kuo ผู้ก่อตั้งและซีอีโอของ Ubitus ซึ่งเป็นผู้ให้บริการเกม AI และคลาวด์แบบสร้างสรรค์ในไทเป ได้สะท้อนถึงข้อกังวลเหล่านี้ โดยระบุว่าต้นทุนที่แท้จริงน่าจะสูงกว่าที่รายงานไว้มาก Ubitus ซึ่งได้รับการสนับสนุนจาก Nvidia ได้สนับสนุน Project TAME ซึ่งเป็น LLM ที่แปลเป็นภาษาท้องถิ่นโดยใช้ตัวอักษรจีนดั้งเดิม พวกเขาจัดหา H100 CPU และข้อมูลเกม Ubitus ยังได้ร่วมมือกับ Foxlink และ Shinfox Energy เพื่อจัดตั้ง Ubilink.AI ซึ่งสร้างศูนย์บริการซูเปอร์คอมพิวเตอร์ AI ที่ขับเคลื่อนด้วยพลังงานสีเขียวที่ใหญ่ที่สุดของไต้หวัน โดยความร่วมมือกับ Asus

Kuo เน้นย้ำถึงการมีส่วนร่วมของบริษัทในการพัฒนาแอปพลิเคชันและโมเดล LLM สำหรับรัฐบาล รวมถึงรัฐบาลญี่ปุ่น ในภาคส่วนต่างๆ เช่น เกม การท่องเที่ยว และการค้าปลีก โดยเน้นย้ำถึงศักยภาพของ AI ในการแก้ไขปัญหาการขาดแคลนแรงงานและประชากรสูงอายุ

ข้อกังวลด้านความสมบูรณ์ของข้อมูล

Kuo สอดคล้องกับ OpenAI และ Microsoft ในการแนะนำว่า DeepSeek อาจได้รับข้อมูลผ่านการกลั่นแบบจำลอง กระบวนการนี้เกี่ยวข้องกับการฝึกอบรมแบบจำลองภาษาขนาดเล็กกว่าเพื่อให้เลียนแบบผลลัพธ์ของแบบจำลองขนาดใหญ่กว่า OpenAI และ Microsoft อ้างว่า DeepSeek ใช้ Application Programming Interface ของ OpenAI เพื่ออำนวยความสะดวกในการพัฒนา

Kuo ยืนยันว่า DeepSeek ได้รับข้อมูลจาก OpenAI และมีความเข้าใจผิดเกี่ยวกับการอ้างสิทธิ์ของบริษัทเกี่ยวกับประสิทธิภาพ เขาชี้ให้เห็นว่า DeepSeek-R1 ซึ่งมีพารามิเตอร์ 670 พันล้านพารามิเตอร์ มีขนาดใหญ่กว่า Llama 3.1 405B ของ Meta AI อย่างมาก พารามิเตอร์คือค่าตัวเลขภายในที่โมเดลเรียนรู้ระหว่างการฝึกอบรมเพื่อทำการคาดการณ์ Kuo ยังแนะนำว่าโมเดลของ DeepSeek อาจถูกกลั่นจาก Llama 3.1

นอกเหนือจากการหักล้างเหล่านี้แล้ว ยังมีข้อกังวลเกี่ยวกับความสามารถของ DeepSeek-R1 ผู้เชี่ยวชาญแนะนำว่า เช่นเดียวกับรุ่นก่อนๆ R1 เก่งในฟังก์ชันเฉพาะทางเฉพาะงาน แต่ล้าหลังกว่า GPT-4o ในด้านประสิทธิภาพทั่วไป

ข้อจำกัดที่สำคัญของโมเดลของ DeepSeek คือข้อจำกัดในการเข้าถึงข้อมูลฟรี ผู้ใช้พบว่าการสอบถามเกี่ยวกับหัวข้อทางการเมืองที่ละเอียดอ่อนได้รับการตอบสนองด้วยการตอบสนองที่หลีกเลี่ยง ในหัวข้อต่างๆ เช่น สถานะของชนกลุ่มน้อยอุยกูร์ในซินเจียงและไต้หวัน การตอบสนองของ DeepSeek สะท้อนถึงจุดยืนอย่างเป็นทางการของพรรคคอมมิวนิสต์จีน การวิจัยชี้ให้เห็นว่าเอาต์พุตส่วนใหญ่ของ DeepSeek ถูกเซ็นเซอร์เพื่อระงับข้อมูลที่เกี่ยวข้องกับประชาธิปไตย สิทธิมนุษยชน และการอ้างสิทธิ์อธิปไตยที่โต้แย้งของจีน

ทางเลือกของไต้หวัน: TAIDE และอื่นๆ

เพื่อตอบสนองต่อ LLM ที่พัฒนาโดยไต้หวัน เช่น TAME ได้กลายเป็นทางเลือกอื่นสำหรับ DeepSeek ภายใน Sinosphere Trustworthy AI Dialogue Engine (TAIDE) เปิดตัวในเดือนมิถุนายน 2023 โดย National Institute of Applied Research มีจุดมุ่งหมายเพื่อพัฒนาโมเดลที่สอดคล้องกับบรรทัดฐานทางสังคม วัฒนธรรม และภาษาของไต้หวัน

ในขณะที่งานเกี่ยวกับ TAIDE ดูเหมือนจะหยุดชะงัก แต่ก็ทำหน้าที่เป็นเกณฑ์มาตรฐานที่สำคัญสำหรับ Project TAME TAME ซึ่งพัฒนาโดย Machine Intelligence and Understanding Laboratory (MiuLab) ที่ National Taiwan University โดยได้รับทุนสนับสนุนจากองค์กรต่างๆ ได้รับการฝึกอบรมเกี่ยวกับโทเค็น 500 พันล้านโทเค็น มันเหนือกว่าคู่แข่ง รวมถึง GPT-4o ในการประเมิน 39 รายการ ทำคะแนนได้สูงกว่าในการสอบเข้ามหาวิทยาลัย บาร์ และการแพทย์แผนจีน

หนึ่งในวัตถุประสงค์ของ TAME คือการส่งเสริมวัฒนธรรมท้องถิ่น การปลดล็อกความสามารถทางภาษาในท้องถิ่นเป็นก้าวสำคัญ Kuo กล่าวถึงการพัฒนา Taiwanese Voice LLM ที่ใช้ Whisper ซึ่งประสบความสำเร็จในเชิงบวกในการทำความเข้าใจภาษาไต้หวัน Efforts กำลังดำเนินการเพื่อพัฒนาการจดจำภาษา Hakka

ความพยายามเหล่านี้ได้รับการตอบรับอย่างดีจากสถาบันในภูมิภาคที่ภาษาเหล่านี้แพร่หลาย นอกจากนี้ยังมีความพยายามในการฝึกอบรมแบบจำลองในการจดจำภาษาพื้นเมือง แต่ข้อมูลที่จำกัดยังคงเป็นอุปสรรค การฝึกอบรม AI ให้เรียนรู้ภาษาใหม่ต้องใช้การบันทึกเสียงจำนวนมากที่จับคู่กับข้อความ

การเข้าถึงข้อมูลในอดีตในเอกสารสำคัญของรัฐบาลนำเสนอโอกาสอีกอย่างหนึ่ง อย่างไรก็ตาม ข้อมูลบางอย่างได้รับการคุ้มครองโดยลิขสิทธิ์ การเกิดขึ้นของปัญญาประดิษฐ์ทั่วไปมีศักยภาพที่จะช่วยในการฟื้นฟูภาษาที่ใกล้สูญพันธุ์และสูญพันธุ์ไปแล้ว

การแสวงหาอธิปไตย AI

จุดตัดของภาษาและวัฒนธรรมเน้นย้ำถึงความสำคัญของอธิปไตย AI ในฐานะวิธีการเสริมสร้างเอกลักษณ์ของไต้หวัน สื่อสารเรื่องราวของไต้หวัน และปกป้องสภาพแวดล้อมข้อมูลของตน

Julian Chu ที่ปรึกษาอุตสาหกรรมและผู้อำนวยการที่ Market Intelligence & Consulting Institute (MIC) เน้นย้ำถึงศักยภาพของอคติในโมเดล LLM และข้อมูลการฝึกอบรม เขาตั้งข้อสังเกตว่าแม้ในขณะที่ใช้ตัวอักษรดั้งเดิม เอาต์พุต LLM สามารถสะท้อนถึงรูปแบบของสาธารณรัฐประชาชนจีนและไม่สามารถจับวัฒนธรรมของไต้หวันได้ เป้าหมายคือให้บริษัทไต้หวันใช้ภาษาหรือข้อมูลของไต้หวันเพื่อฝึกอบรม LLM และสร้างอธิปไตย AI

Chu กล่าวถึง Formosa Foundation Model (FFM-Llama2) ว่าเป็นอีกหนึ่ง LLM ที่มีแนวโน้มของไต้หวัน เปิดตัวในเดือนกันยายน 2023 โดย Taiwan Web Service มีจุดมุ่งหมายเพื่อทำให้ AI เป็นประชาธิปไตย Foxconn ยังได้เปิดตัว LLM, FoxBrain ในเดือนมีนาคม อย่างไรก็ตาม ผู้แสดงความคิดเห็นบางคนยังคงสงสัยเกี่ยวกับความพยายามขององค์กรขนาดใหญ่ในการ LLM

Lin Yen-ting สมาชิกของทีม MiuLab ที่พัฒนา TAME เน้นย้ำถึงความจำเป็นในการแก้ไขช่องว่างในสภาพแวดล้อมข้อมูลเกี่ยวกับไต้หวัน เขาตั้งข้อสังเกตว่า DeepSeek-R1 และ LLM ของจีนอื่น ๆ นำเสนอมุมมองที่บิดเบือนของไต้หวัน โมเดลที่พัฒนาโดยสหรัฐฯ บางครั้งอาจแสดงข้อมูลที่ไม่ถูกต้องเกี่ยวกับไต้หวัน โมเดลโอเพนซอร์สอาจไม่ให้ความสำคัญกับไต้หวัน และข้อมูลการฝึกอบรมถูกครอบงำโดยจีน

ดังนั้นจึงเป็นสิ่งสำคัญที่จะต้องรวมเนื้อหาของไต้หวันอย่างคัดเลือกและฝึกอบรมใหม่ในแบบจำลอง แนวทางเชิงรุกนี้ช่วยให้มั่นใจได้ว่าภูมิทัศน์ทางวัฒนธรรมและภาษาที่เป็นเอกลักษณ์ของไต้หวันจะถูกนำเสนออย่างถูกต้องในขอบเขตดิจิทัล ส่งเสริมความรู้สึกของเอกลักษณ์ประจำชาติและรักษาไว้ซึ่งมรดกที่แตกต่างของตนในการเผชิญหน้ากับการพัฒนา AI ทั่วโลก การอุทิศตนเพื่อรักษาสถานะของชาวไต้หวันทำให้มั่นใจได้ว่าวัฒนธรรมและค่านิยมที่เป็นเอกลักษณ์ของชาติเกาะจะไม่ถูกบดบังด้วยเรื่องเล่าที่โดดเด่น

ความท้าทายที่มีอยู่ในความพยายามนี้มีนัยสำคัญ การสร้างแบบจำลอง AI ที่เป็นตัวแทนอย่างแท้จริงต้องใช้การลงทุนด้านทรัพยากรอย่างมีนัยสำคัญ รวมถึงการเข้าถึงชุดข้อมูลจำนวนมากของเนื้อหาที่เป็นภาษาท้องถิ่นและความเชี่ยวชาญในการประมวลผลภาษาธรรมชาติ นอกจากนี้ ความจำเป็นอย่างต่อเนื่องในการต่อต้านข้อมูลที่ผิดพลาดและข้อมูลที่เป็นอคติยังต้องการกระบวนการปรับแต่งและปรับตัวอย่างต่อเนื่อง

แม้จะมีความท้าทายเหล่านี้ แต่ความมุ่งมั่นของไต้หวันต่ออธิปไตย AI ยังคงแน่วแน่ การพัฒนา TAME และ LLM ที่แปลเป็นภาษาท้องถิ่นอื่นๆ แสดงถึงขั้นตอนสำคัญในการสร้างความมั่นใจว่าอนาคตของปัญญาประดิษฐ์สะท้อนถึงเอกลักษณ์ทางวัฒนธรรมที่เป็นเอกลักษณ์ของเกาะ ค่านิยมประชาธิปไตย และความมุ่งมั่นอย่างแน่วแน่ในการรักษาสถานที่ที่โดดเด่นในโลก โดยการจัดลำดับความสำคัญของอธิปไตย AI ไต้หวันไม่เพียงแต่ปกป้องมรดกทางวัฒนธรรมของตนเท่านั้น แต่ยังวางตำแหน่งตนเองเป็นผู้เล่นหลักในภูมิทัศน์ AI ทั่วโลก โดยแสดงให้เห็นว่าความก้าวหน้าทางเทคโนโลยีสามารถสอดคล้องกับการรักษาสถานะทางวัฒนธรรมและหลักการประชาธิปไตย

สานต่อการเดินทาง

การเดินทางสู่อธิปไตย AI ที่สมบูรณ์ยังคงดำเนินต่อไป การวิจัย การพัฒนา และความร่วมมือเพิ่มเติมเป็นสิ่งสำคัญในการเอาชนะความท้าทายและรับประกันความสำเร็จในระยะยาวของโครงการริเริ่มเหล่านี้ โดยการจัดลำดับความสำคัญของอธิปไตย AI อย่างต่อเนื่อง ไต้หวันสามารถสร้างภูมิทัศน์ดิจิทัลที่สะท้อนถึงเอกลักษณ์ทางวัฒนธรรมและค่านิยมประชาธิปไตยที่เป็นเอกลักษณ์ของตนอย่างแท้จริง ซึ่งเป็นตัวอย่างสำหรับประเทศอื่นๆ ที่พยายามรักษาสถานที่ที่โดดเด่นของตนในโลกที่มีการเชื่อมต่อถึงกันมากขึ้นเรื่อยๆ