ความผิดหวังและเปลี่ยนความคาดหวังที่ LlamaCon
ที่ LlamaCon การประชุมเปิดตัวของ Meta ที่อุทิศให้กับ LLM โอเพนซอร์สนั้น บรรยากาศเต็มไปด้วยความคาดหวังที่ไม่เป็นไปตามที่คาดหวัง นักพัฒนาที่เข้าร่วมหลายคนกล่าวว่าพวกเขารอคอยการเปิดตัวโมเดลให้เหตุผลที่ซับซ้อน หรืออย่างน้อยโมเดลแบบดั้งเดิมที่สามารถเอาชนะคู่แข่งเช่น V3 ของ DeepSeek และ Qwen ซึ่งเป็นชุดโมเดลที่พัฒนาโดยแผนกคลาวด์คอมพิวติ้งของ Alibaba
การไม่มีการประกาศดังกล่าวทำให้เกิดความกังวลว่า Llama กำลังสูญเสียพื้นที่ในการแข่งขันเพื่อความเป็นเจ้าแห่ง AI เพียงหนึ่งเดือนก่อนการประชุม Meta ได้เปิดตัว Llama รุ่นที่สี่ ซึ่งรวมถึงโมเดลโอเพนเวท Llama 4 Scout และ Llama 4 Maverick Scout ถูกออกแบบมาเพื่อประสิทธิภาพที่ประหยัดบน GPU เดียว ในขณะที่ Maverick ได้รับการออกแบบให้เป็นโมเดลที่ใหญ่กว่าเพื่อท้าทายโมเดลพื้นฐานอื่นๆ
นอกจาก Scout และ Maverick แล้ว Meta ยังได้แอบดู Llama 4 Behemoth ซึ่งเป็น “โมเดลครู” ที่ใหญ่กว่ามากซึ่งยังอยู่ระหว่างการฝึกอบรม วัตถุประสงค์ของ Behemoth คือเพื่ออำนวยความสะดวกในการกลั่น ซึ่งเป็นเทคนิคในการสร้างโมเดลขนาดเล็กที่เชี่ยวชาญจากโมเดลที่ใหญ่กว่า ซึ่งเป็นโมเดลทั่วไปมากกว่า
อย่างไรก็ตาม รายงานต่างๆ ระบุถึงความล่าช้าในการเปิดตัว Behemoth และความท้าทายในการบรรลุประสิทธิภาพที่สามารถแข่งขันได้กับชุด Llama 4 แม้ว่า Meta จะอ้างถึงความสามารถที่ทันสมัย แต่การรับรู้ในหมู่นักพัฒนาซอฟต์แวร์บางรายก็คือ Llama ไม่ได้เป็นผู้นำอีกต่อไป
การเกิดขึ้นของคู่แข่ง: Qwen และ DeepSeek
ความผิดหวังเกี่ยวกับ LlamaCon และโมเดล Llama 4 สะท้อนให้เห็นถึงความรู้สึกที่กว้างขึ้นว่า LLM โอเพนซอร์สของ Meta กำลังสูญเสียโมเมนตัมทั้งในด้านประสิทธิภาพทางเทคนิคและในด้านความกระตือรือร้นของนักพัฒนาซอฟต์แวร์ ในขณะที่ Meta เน้นย้ำถึงความมุ่งมั่นในหลักการโอเพนซอร์ส การสร้างระบบนิเวศ และนวัตกรรม คู่แข่งเช่น DeepSeek, Qwen และ OpenAI กำลังก้าวหน้าอย่างรวดเร็วในด้านที่สำคัญ เช่น การให้เหตุผล การใช้เครื่องมือ และการใช้งานในโลกแห่งความเป็นจริง
นักพัฒนาซอฟต์แวร์คนหนึ่ง Vineeth Sai Varikuntla แสดงความผิดหวังว่าเขาหวังว่า Llama จะเหนือกว่า Qwen และ DeepSeek ในกรณีการใช้งานทั่วไปและการให้เหตุผล แต่พบว่า Qwen ล้ำหน้าไปมาก
ความรู้สึกนี้เน้นย้ำถึงความท้าทายที่ Meta เผชิญในการรักษาสถานะของ Llama ในฐานะ LLM โอเพนซอร์สชั้นนำ ในขณะที่การเปิดตัว Llama ครั้งแรกได้รับความสนใจและคำชมอย่างมาก การเกิดขึ้นของทางเลือกที่สามารถทำได้มากขึ้นเรื่อยๆ ได้ทำให้การแข่งขันรุนแรงขึ้น
จุดเริ่มต้นที่มีแนวโน้ม: ผลกระทบของ Llama 2
เพื่อให้เข้าใจถึงเรื่องราวปัจจุบันเกี่ยวกับ Llama อย่างเต็มที่ สิ่งสำคัญคือต้องจำที่มาและความตื่นเต้นเริ่มต้นที่มันสร้างขึ้นได้ ในปี 2023 Jensen Huang CEO ของ Nvidia ยกย่องการเปิดตัว Llama 2 ว่า “อาจเป็นเหตุการณ์ที่ใหญ่ที่สุดใน AI” ของปีนั้น ภายในเดือนกรกฎาคม 2024 การเปิดตัว Llama 3 ถือเป็นความก้าวหน้า ซึ่งเป็นตัวแทนของ LLM แบบเปิดตัวแรกที่สามารถท้าทายความเป็นเจ้าของ OpenAI ได้
การมาถึงของ Llama 3 ทำให้เกิดความต้องการพลังการคำนวณเพิ่มขึ้นทันที ซึ่งนำไปสู่ราคาเช่า GPU ที่เพิ่มขึ้น ตามที่ Dylan Patel หัวหน้านักวิเคราะห์ของ SemiAnalysis การค้นหาของ Google สำหรับ “Meta” และ “Llama” ก็แตะระดับสูงสุดในช่วงเวลานี้ ซึ่งบ่งชี้ถึงความสนใจอย่างกว้างขวางในโมเดลใหม่
Llama 3 ได้รับการยกย่องว่าเป็น LLM ที่ผลิตในอเมริกา เปิด และเป็นอันดับต้นๆ แม้ว่าจะไม่ได้ติดอันดับมาตรฐานอุตสาหกรรมอย่างสม่ำเสมอ แต่ก็มีอิทธิพลและความเกี่ยวข้องอย่างมากภายในชุมชน AI อย่างไรก็ตาม พลวัตนี้ค่อยๆ เปลี่ยนไป
การเปลี่ยนแปลงทางสถาปัตยกรรมและคำวิจารณ์
โมเดล Llama 4 ได้เปิดตัวสถาปัตยกรรม "mixture of experts" ซึ่งเป็นการออกแบบที่ได้รับความนิยมจาก DeepSeek สถาปัตยกรรมนี้ช่วยให้โมเดลเปิดใช้งานเฉพาะความเชี่ยวชาญที่เกี่ยวข้องมากที่สุดสำหรับงานเฉพาะ ซึ่งจะช่วยปรับปรุงประสิทธิภาพ
อย่างไรก็ตาม การเปิดตัว Llama 4 ได้รับการวิพากษ์วิจารณ์เมื่อนักพัฒนาซอฟต์แวร์ค้นพบว่าเวอร์ชันที่ใช้สำหรับการวัดประสิทธิภาพสาธารณะนั้นแตกต่างจากเวอร์ชันที่พร้อมสำหรับการดาวน์โหลดและการใช้งาน ความคลาดเคลื่อนนี้นำไปสู่ข้อกล่าวหาว่า "เล่นเกมกระดานผู้นำ" ซึ่ง Meta ปฏิเสธ โดยระบุว่าตัวแปรที่เป็นปัญหาเป็นการทดลอง และการประเมินโมเดลหลายเวอร์ชันเป็นแนวทางปฏิบัติมาตรฐาน
แม้จะมีการอธิบายของ Meta แต่ข้อขัดแย้งดังกล่าวก็มีส่วนทำให้เกิดการรับรู้ว่า Llama กำลังดิ้นรนเพื่อรักษาความได้เปรียบทางการแข่งขัน เมื่อโมเดลคู่แข่งยังคงก้าวหน้าต่อไป Meta ก็ดูเหมือนจะขาดทิศทางที่ชัดเจน
การวัดการยอมรับของนักพัฒนาซอฟต์แวร์: งานที่ซับซ้อน
การพิจารณาว่ากลุ่ม LLM ใดเป็นที่นิยมมากที่สุดในหมู่นักพัฒนาซอฟต์แวร์เป็นงานที่ท้าทาย อย่างไรก็ตาม ข้อมูลที่มีอยู่บ่งชี้ว่าโมเดลล่าสุดของ Llama ไม่ได้อยู่ในกลุ่มผู้นำ
โดยเฉพาะอย่างยิ่ง Qwen ติดอันดับสูงอย่างสม่ำเสมอบนกระดานผู้นำต่างๆ ทั่วอินเทอร์เน็ต ตามที่ Artificial Analysis ซึ่งเป็นไซต์ที่จัดอันดับโมเดลตามประสิทธิภาพ Llama 4 Maverick และ Scout อยู่เหนือโมเดล GPT-4 ของ OpenAI (เปิดตัวเมื่อปลายปีที่แล้ว) และต่ำกว่า Grok ของ xAI และ Claude ของ Anthropic ในแง่ของสติปัญญา
OpenRouter ซึ่งเป็นแพลตฟอร์มที่ช่วยให้นักพัฒนาซอฟต์แวร์เข้าถึงโมเดลต่างๆ และเผยแพร่กระดานผู้นำตามการใช้งาน API แสดงให้เห็นว่า Llama 3.3 อยู่ใน 20 อันดับแรกของโมเดล ณ ต้นเดือนพฤษภาคม แต่ไม่ใช่ Llama 4
จุดข้อมูลเหล่านี้ แม้ว่าจะไม่ชัดเจน แนะนำว่าการทำซ้ำล่าสุดของ Llama ไม่ได้สอดคล้องกับนักพัฒนาซอฟต์แวร์อย่างแข็งขันเท่ากับรุ่นก่อนๆ
เหนือกว่าเกณฑ์มาตรฐาน: การใช้เครื่องมือและการให้เหตุผล
แม้ว่าการประเมินมาตรฐานของ Llama 4 อาจไม่น่าประทับใจ แต่ผู้เชี่ยวชาญแย้งว่าความกระตือรือร้นที่เงียบงันนั้นมาจากปัจจัยที่เหนือกว่าเมตริกประสิทธิภาพดิบ
AJ Kourabi นักวิเคราะห์จาก SemiAnalysis เน้นย้ำถึงความสำคัญของแนวคิด “tool calling” และความสามารถของโมเดลในการขยายไปไกลกว่าฟังก์ชันแชทบอทง่ายๆ การเรียกเครื่องมือหมายถึงความสามารถของโมเดลในการเข้าถึงและสั่งแอปพลิเคชันอื่นๆ ทางอินเทอร์เน็ตหรือบนอุปกรณ์ของผู้ใช้ ซึ่งเป็นคุณสมบัติที่สำคัญสำหรับ Agentic AI ซึ่งสัญญาว่าจะทำให้งานต่างๆ เป็นไปโดยอัตโนมัติ เช่น การจองการเดินทางและการจัดการค่าใช้จ่าย
Meta ได้ระบุว่าโมเดล Llama รองรับการเรียกเครื่องมือผ่าน API Theo Browne นักพัฒนาซอฟต์แวร์และ YouTuber โต้แย้งว่าการเรียกเครื่องมือได้กลายเป็นสิ่งจำเป็นสำหรับความเกี่ยวข้องที่ทันสมัยเนื่องจากเครื่องมือ Agentic ได้รับความโดดเด่น
Anthropic ได้กลายเป็นผู้นำในช่วงต้นของการใช้เครื่องมือ และโมเดลที่เป็นกรรมสิทธิ์เช่น OpenAI ก็กำลังไล่ตามอย่างรวดเร็ว ความสามารถในการเรียกเครื่องมือที่ถูกต้องอย่างน่าเชื่อถือเพื่อสร้างการตอบสนองที่ถูกต้องนั้นมีค่าอย่างมาก และ OpenAI ได้เปลี่ยนจุดสนใจไปที่การจัดลำดับความสำคัญของความสามารถนี้
Kourabi แย้งว่าการไม่มีโมเดลการให้เหตุผลที่แข็งแกร่งเป็นตัวบ่งชี้ที่สำคัญว่า Meta ล้มเหลว การให้เหตุผลถือเป็นองค์ประกอบพื้นฐานในสมการ Agentic AI ซึ่งช่วยให้โมเดลวิเคราะห์งานและกำหนดแนวทางปฏิบัติที่เหมาะสม
ช่องทางของ Llama: การใช้งานจริงและการยอมรับขององค์กร
แม้จะมีความกังวลเกี่ยวกับตำแหน่งของ Llama ที่แถวหน้าของการวิจัย AI แต่ Llama ยังคงเป็นเครื่องมือที่มีค่าสำหรับนักพัฒนาและองค์กรจำนวนมาก
Nate Jones หัวหน้าฝ่ายผลิตภัณฑ์ของ RockerBox แนะนำให้นักพัฒนาซอฟต์แวร์รวม Llama ไว้ในประวัติย่อของพวกเขา เนื่องจากความคุ้นเคยกับโมเดลนั้นน่าจะเป็นที่ต้องการในอนาคต
Paul Baier CEO และนักวิเคราะห์หลักของ GAI Insights เชื่อว่า Llama จะยังคงเป็นองค์ประกอบสำคัญของกลยุทธ์ AI สำหรับหลายบริษัท โดยเฉพาะอย่างยิ่งบริษัทนอกอุตสาหกรรมเทคโนโลยี
องค์กรต่างๆ ตระหนักถึงความสำคัญของโมเดลโอเพนซอร์ส โดย Llama เป็นตัวอย่างที่โดดเด่นสำหรับการจัดการงานที่ไม่ซับซ้อนและการควบคุมต้นทุน องค์กรจำนวนมากชอบการผสมผสานระหว่างโมเดลแบบปิดและแบบเปิดเพื่อให้ตรงกับความต้องการที่หลากหลาย
Baris Gultekin หัวหน้าฝ่าย AI ของ Snowflake กล่าวว่าลูกค้ามักจะประเมินโมเดลตามกรณีการใช้งานเฉพาะของพวกเขามากกว่าที่จะพึ่งพาเกณฑ์มาตรฐานเพียงอย่างเดียว เมื่อพิจารณาถึงต้นทุนที่ต่ำ Llama มักจะเพียงพอสำหรับการใช้งานหลายอย่าง
ที่ Snowflake Llama ใช้สำหรับงานต่างๆ เช่น การสรุปบทสนทนาการขายและการดึงข้อมูลที่มีโครงสร้างจากบทวิจารณ์ของลูกค้า ที่ Dremio Llama สร้างโค้ด SQL และเขียนอีเมลทางการตลาด
Tomer Shiran ผู้ร่วมก่อตั้งและประธานเจ้าหน้าที่ฝ่ายผลิตภัณฑ์ของ Dremio ชี้ให้เห็นว่าโมเดลเฉพาะอาจไม่สำคัญสำหรับ 80% ของแอปพลิเคชัน เนื่องจากโมเดลส่วนใหญ่ “ดีพอ” ที่จะตอบสนองความต้องการขั้นพื้นฐาน
ภูมิทัศน์ที่หลากหลาย: บทบาทที่มั่นคงของ Llama
แม้ว่า Llama อาจกำลังเปลี่ยนจากการแข่งขันโดยตรงกับโมเดลที่เป็นกรรมสิทธิ์ในบางพื้นที่ แต่ภูมิทัศน์ AI โดยรวมกำลังมีความหลากหลายมากขึ้น และบทบาทของ Llama กำลังแข็งแกร่งขึ้นภายในช่องที่เฉพาะเจาะจง
Shiran เน้นย้ำว่าเกณฑ์มาตรฐานไม่ได้เป็นตัวขับเคลื่อนหลักของการเลือกโมเดล เนื่องจากผู้ใช้ให้ความสำคัญกับการทดสอบโมเดลในกรณีการใช้งานของตนเอง ประสิทธิภาพของโมเดลบนข้อมูลของลูกค้านั้นสำคัญที่สุด และประสิทธิภาพนี้อาจแตกต่างกันไปเมื่อเวลาผ่านไป
Gultekin กล่าวเสริมว่าการเลือกโมเดลมักจะเป็นการตัดสินใจเฉพาะกรณีการใช้งานมากกว่าเหตุการณ์ครั้งเดียว
Llama อาจสูญเสียนักพัฒนาที่กำลังมองหาความก้าวหน้าล่าสุดอยู่ตลอดเวลา แต่ยังคงได้รับการสนับสนุนจากนักพัฒนาจำนวนมากที่มุ่งเน้นไปที่การสร้างเครื่องมือที่ขับเคลื่อนด้วย AI ที่ใช้งานได้จริง
พลวัตนี้สอดคล้องกับกลยุทธ์โอเพนซอร์สที่กว้างขึ้นของ Meta ซึ่งเป็นตัวอย่างโดยการเปิดตัว React ในปี 2013 และการสร้าง PyTorch ในปี 2016 ด้วยการส่งเสริมระบบนิเวศที่ประสบความสำเร็จ Meta จะได้รับประโยชน์จากผลงานของชุมชนโอเพนซอร์ส
ดังที่ Nate Jones สังเกต Zuckerberg ได้รับแรงผลักดันอย่างมากจากความคิดริเริ่มโอเพนซอร์สของ Meta