Meta ขยายขุมพลัง AI ด้วย Llama "มัลติโมดัล"

Meta ได้เปิดตัวโมเดลปัญญาประดิษฐ์ (AI) Llama รุ่นล่าสุด ซึ่งเป็นก้าวสำคัญในการมุ่งมั่นสร้างสรรค์นวัตกรรม AI อย่างต่อเนื่องของบริษัท ในบรรดาข้อเสนอใหม่ ได้แก่ Llama 4 Scout และ Llama 4 Maverick ซึ่ง Meta ขนานนามว่า “โมเดลแบบมัลติโมดัล” ซึ่งเน้นย้ำถึงความสามารถในการประมวลผลและโต้ตอบกับสื่อต่างๆ นอกเหนือจากข้อความธรรมดา

นอกจากนี้ Meta ยังได้เปิดตัว Llama 4 Behemoth ซึ่งวางตัวเป็น LLM ที่ชาญฉลาดที่สุดแห่งหนึ่งของโลก และมีวัตถุประสงค์เพื่อทำหน้าที่เป็นครูสำหรับโมเดลที่เพิ่งเปิดตัว

การประกาศนี้เน้นย้ำถึงการลงทุนจำนวนมากของ Meta ใน AI ในช่วงสองปีที่ผ่านมา CEO Mark Zuckerberg ได้กล่าวต่อสาธารณชนถึงความตั้งใจที่จะจัดสรรเงินสูงถึง 65 พันล้านดอลลาร์ในปี 2025 เพื่อเพิ่มขีดความสามารถด้าน AI ของบริษัทให้มากยิ่งขึ้น ความทะเยอทะยานของ Meta ขยายออกไปนอกเหนือจากพื้นที่โซเชียลมีเดีย โดยสำรวจความเป็นไปได้ในการสมัครสมาชิกแบบพรีเมียมสำหรับผู้ช่วย AI อย่าง Meta AI เพื่อจัดการงานต่างๆ เช่น การจอง และการสร้างวิดีโอ

ความพยายามแบบโอเพนซอร์สของ OpenAI

ในการพัฒนาควบคู่กันไป มีรายงานว่า OpenAI กำลังพิจารณาที่จะเปิดตัว LLM เวอร์ชันโอเพนซอร์ส ซึ่งเป็นการเปลี่ยนแปลงจากแนวปฏิบัติล่าสุด การเคลื่อนไหวนี้จะให้อิสระแก่ผู้ใช้ในการใช้งาน แก้ไข และเผยแพร่โมเดลโดยไม่ต้องเสียค่าธรรมเนียมใบอนุญาต OpenAI แสวงหาข้อมูลป้อนเข้าจากชุมชนนักพัฒนา นักวิจัย และประชาชนทั่วไป เพื่อเพิ่มประสิทธิภาพการใช้งานโมเดล

โมเดลโอเพนซอร์สคาดว่าจะเปิดตัวภายในไม่กี่เดือน ครั้งสุดท้ายที่ OpenAI ยอมรับหลักการโอเพนซอร์สคือในปี 2019 ด้วย GPT-2 LLM LLM ล่าสุดคือ GPT-4.5 OpenAI เปลี่ยนไปใช้โมเดลที่เป็นกรรมสิทธิ์หลังจากได้รับการลงทุนหนึ่งพันล้านดอลลาร์จาก Microsoft ซึ่งเป็นการสร้างพันธมิตรที่ใกล้ชิดเพื่อพัฒนาโมเดล AI ตั้งแต่นั้นมา Microsoft ได้ลงทุนมากกว่า 13 พันล้านดอลลาร์ใน OpenAI โดยโมเดลของ OpenAI เป็นเอกสิทธิ์เฉพาะสำหรับลูกค้าบริการคลาวด์ Azure ของ Microsoft

Llama ของ Meta, LLM ของ Mistral และ DeepSeek เป็นโมเดลโอเพนซอร์สบางส่วนที่ได้รับความนิยมเมื่อเร็วๆ นี้ Zuckerberg กล่าวใน Threads ว่า Llama ถูกดาวน์โหลดไปแล้ว 1 พันล้านครั้ง Llama เปิดตัวในปี 2023

โมเดล AI “Behemoth” ของ Meta เผชิญกับความล่าช้า

อย่างไรก็ตาม มีรายงานว่า Meta กำลังชะลอการเปิดตัว “Behemoth” ซึ่งเดิมมีกำหนดเปิดตัวในช่วงฤดูร้อน โดยมีการคาดการณ์ว่าจะเปิดตัวเร็วที่สุดในฤดูใบไม้ร่วง แหล่งข่าวแนะนำว่าความคืบหน้าของโมเดลยัง “ไม่สำคัญ” พอที่จะแสดงให้เห็นถึงการเปิดตัวในเดือนมิถุนายน และแสดงถึงความล่าช้าตั้งแต่การประชุมนักพัฒนาของ Meta

ความล่าช้าดังกล่าวทำให้เกิดความกังวลเกี่ยวกับการเปิดตัวกลุ่มผลิตภัณฑ์ large language models เรือธงของ Llama ของ Meta The Wall Street Journal กล่าวว่าพวกเขาได้รับการยกย่องในด้านความเร็วในการเปิดตัว Llama มีส่วนช่วยในการเพิ่มขีดความสามารถให้กับนักพัฒนาภายในบริษัทขนาดเล็ก องค์กรไม่แสวงหาผลกำไร และสถาบันการศึกษา มันเป็นทางเลือกสำหรับโมเดลที่เป็นกรรมสิทธิ์แบบปิดที่นำเสนอโดยบริษัทต่างๆ เช่น OpenAI, Google และ Amazon

ผลกระทบของความล่าช้าของ Behemoth ต่อบริษัทขนาดใหญ่จะเด่นชัดน้อยกว่า เนื่องจากพวกเขามักจะพึ่งพากับโมเดลที่เป็นกรรมสิทธิ์บนคลาวด์ แม้ว่าบริษัทขนาดเล็กจะสามารถปรับแต่งโมเดล Llama แบบโอเพนซอร์สได้ แต่พวกเขาก็ต้องการบริการปรับใช้เพิ่มเติมที่ Meta ไม่ได้นำเสนอ การใช้ Llama ของ Meta มีเป้าหมายเพื่อปรับปรุงเครื่องมือโซเชียลมีเดียของตนเอง ทำให้ Zuckerberg สามารถควบคุมวิถี AI ได้

ปัจจัยสำคัญที่อยู่เบื้องหลังความล่าช้าอยู่ที่ว่าโมเดลแสดงให้เห็นถึงการปรับปรุงที่สำคัญเพียงพอที่จะรับประกันการเปิดตัวสู่สาธารณะหรือไม่

ความจำเป็นในการสร้างสรรค์นวัตกรรม

ในโลกที่เปลี่ยนแปลงไปอย่างรวดเร็วของอุตสาหกรรมเทคโนโลยี การเปิดตัวใหม่ๆ จะต้องแสดงให้เห็นถึงความก้าวหน้าที่จับต้องได้เพื่อแสดงให้เห็นถึงการเปิดตัว ในงาน LlamaCon, Meta ได้แสดงโมเดล Llama 4 ที่เล็กลงสองตัว ซึ่งแต่ละตัวมีความสามารถที่น่าประทับใจ:

  • Maverick มีพารามิเตอร์ทั้งหมด 400 พันล้านตัว โดยมีหน้าต่างบริบทโทเค็น 1 ล้านโทเค็น (750,000 คำ)
  • Scout มีพารามิเตอร์ 109 พันล้านตัว และหน้าต่างบริบทโทเค็น 10 ล้านโทเค็น (7.5 ล้านคำ)

Behemoth เดิมมีกำหนดเปิดตัวพร้อมกัน โดยมีพารามิเตอร์ 2 ล้านล้านตัว

จากข้อมูลของ Wall Street Journal, Meta กำลังหมดความอดทนกับทีม Llama 4 เนื่องจากมีการลงทุนด้าน AI อย่างต่อเนื่อง ในปี 2024 บริษัทได้จัดสรรค่าใช้จ่ายด้านทุนสูงถึง 72 พันล้านดอลลาร์ ซึ่งส่วนใหญ่ส่งตรงไปยังการพัฒนา AI

ความกังวลที่เพิ่มขึ้น

Zuckerberg และผู้บริหารระดับสูงคนอื่นๆ ยังไม่ได้ประกาศวันที่เปิดตัวที่แน่นอนสำหรับ Behemoth คนวงในเกรงว่าประสิทธิภาพอาจไม่เป็นไปตามความคาดหมายที่กำหนดโดยแถลงการณ์ต่อสาธารณชนของ Meta

แหล่งข่าวบ่งชี้ถึงความไม่พอใจที่เพิ่มขึ้นในหมู่ผู้นำ Meta เกี่ยวกับความคืบหน้าที่ทำโดยทีมที่พัฒน โมเดล Llama 4 สิ่งนี้ได้นำไปสู่การอภิปรายเกี่ยวกับการเปลี่ยนแปลงความเป็นผู้นำที่เป็นไปได้ภายในกลุ่มผลิตภัณฑ์ AI

Meta ได้โฆษณา Behemoth ว่าเป็นระบบที่มีความสามารถสูง ซึ่งมีประสิทธิภาพเหนือกว่าคู่แข่งเช่น OpenAI, Google และ Anthropic ในเกณฑ์มาตรฐานเฉพาะ ความท้าทายภายในได้ขัดขวางประสิทธิภาพ ตามที่อ้างโดยผู้ที่คุ้นเคยกับการพัฒนา

OpenAI ก็ประสบปัญหาความล่าช้าเช่นกัน โมเดลหลักถัดไปของพวกเขา GPT-5 เดิมมีกำหนดเปิดตัวในช่วงกลางปี 2024 The Wall Street Journal รายงานในเดือนธันวาคมว่าการพัฒนาล่าช้ากว่ากำหนด

ในเดือนกุมภาพันธ์ Sam Altman CEO ของ OpenAI กล่าวว่าโมเดลระหว่างกาลจะเป็น GPT-4.5 ในขณะที่ GPT-5 ยังคงอีกหลายเดือน

สาเหตุที่เป็นไปได้สำหรับความคืบหน้าที่หยุดชะงัก

มีหลายปัจจัยที่อาจมีส่วนทำให้การพัฒนาโมเดล AI ช้าลง รวมถึง:

ข้อมูลคุณภาพสูงที่ลดลง

Large language models ต้องการข้อมูลจำนวนมากสำหรับการฝึกอบรม ซึ่งสะท้อนถึงพื้นที่กว้างใหญ่ของอินเทอร์เน็ต พวกเขาอาจกำลังใช้แหล่งข้อมูลสาธารณะที่มีอยู่จนหมด ในขณะที่เผชิญกับความรับผิดทางกฎหมายที่เกี่ยวข้องกับลิขสิทธิ์

สิ่งนี้นำไปสู่ OpenAI, Google และ Microsoft เพื่อสนับสนุนการรักษาสิทธิ์ในการฝึกอบรมในเนื้อหาที่มีลิขสิทธิ์

OpenAI กล่าวว่ารัฐบาลสามารถรักษาอิสรภาพของชาวอเมริกันในการเรียนรู้จาก AI และหลีกเลี่ยงการริเริ่ม AI ไปยัง PRC [สาธารณรัฐประชาชนจีน] โดยการรักษ ความสามารถของโมเดล AI ของอเมริกาในการเรียนรู้จากเนื้อหาที่มีลิขสิทธิ์

อุปสรรคเชิงอัลกอริทึม

ความเชื่อที่ว่าการเพิ่มขนาดโมเดล การใช้การคำนวณมากขึ้น และการฝึกอบรมเกี่ยวกับข้อมูลมากขึ้นจะสร้างความก้าวหน้าที่โดดเด่น ได้รับการพิสูจน์แล้วว่าผิด Bloomberg กล่าวว่ามีผลตอบแทนที่ลดลง ทำให้บางคนบอกว่ากฎหมายการปรับขยายกำลังชะลอตัวลง