Ernie 4.5: ขุมพลัง Multimodal
Baidu ยักษ์ใหญ่ด้านเทคโนโลยีของจีน ได้เปิดตัวแบบจำลองปัญญาประดิษฐ์ (AI) ใหม่สองแบบ บริษัทฯ ยืนยันอย่างกล้าหาญว่าข้อเสนอใหม่เหล่านี้เหนือกว่าคู่แข่งอย่าง DeepSeek และ OpenAI ในการประเมิน benchmark เฉพาะ การพัฒนานี้ทำให้การแข่งขันที่กำลังดำเนินอยู่ในสาขา large language models (LLMs) ที่มีการพัฒนาอย่างรวดเร็วเข้มข้นยิ่งขึ้น เมื่อวันอาทิตย์ที่ผ่านมา Baidu ได้เปิดตัว Ernie 4.5 ซึ่งเป็นแบบจำลองพื้นฐาน multimodal ล่าสุด และ Ernie X1 ซึ่งเป็นแบบจำลองการให้เหตุผล multimodal ตัวแรก ทำให้สามารถเข้าถึงได้บนเว็บไซต์
Ernie 4.5 ซึ่งมีความสามารถ multimodal ที่ครอบคลุมทั้งรูปภาพ เสียง และวิดีโอ ได้แสดงให้เห็นถึงประสิทธิภาพที่เหนือกว่า GPT-4o ของ OpenAI ความเหนือกว่านี้สังเกตได้จากแพลตฟอร์ม benchmark หลายแห่ง รวมถึง CCBench และ OCRBench ที่โดดเด่น ตามรายละเอียดในแถลงการณ์ของ Baidu บนแพลตฟอร์ม WeChat นอกจากนี้ บริษัทยังอ้างว่าความสามารถในการจัดการข้อความของแบบจำลองพื้นฐาน Ernie 4.5 ไม่เพียงแต่เกินกว่า DeepSeek V3 เท่านั้น แต่ยังบรรลุระดับประสิทธิภาพที่เทียบเท่ากับ GPT-4.5 ของ OpenAI โดยประมาณ จากการประเมิน benchmark หลายชุด
บทบาทผู้บุกเบิกของ Baidu และการเพิ่มขึ้นของการแข่งขัน
Baidu ถือเป็นบริษัทเทคโนโลยีรายใหญ่แห่งแรกของจีนที่เปิดตัว LLM ในประเทศจีน การเคลื่อนไหวครั้งบุกเบิกนี้เกิดขึ้นในเดือนมีนาคม 2023 ซึ่งเป็นช่วงเวลาเดียวกับความตื่นเต้นที่เกิดจากการเปิดตัว ChatGPT ของ OpenAI อย่างไรก็ตาม ความได้เปรียบเริ่มต้นของ Baidu ถูกท้าทายมากขึ้นเรื่อยๆ โดยผู้เล่น AI หน้าใหม่รายอื่นๆ ในจีนในช่วงสองปีที่ผ่านมา กลยุทธ์ล่าสุดของยักษ์ใหญ่ด้านการค้นหาเพื่อเสริมสร้างสถานะในตลาด AI ของจีนเกิดขึ้นในขณะที่ DeepSeek ได้จุดประกายกระแสโอเพนซอร์ส ในขณะเดียวกัน ยักษ์ใหญ่ในอุตสาหกรรมอย่าง Alibaba, Tencent และ ByteDance กำลังไล่ตามผู้ใช้ทั้งธุรกิจและผู้บริโภคสำหรับ AI models ของตนอย่างจริงจัง
Ernie X1: ประสิทธิภาพและราคา
แม้ว่า Baidu จะไม่ได้เปิดเผยผล benchmark เฉพาะสำหรับ Ernie X1 ซึ่งเป็นแบบจำลองการให้เหตุผลที่เพิ่งเปิดตัวใหม่ แต่บริษัทฯ ระบุว่า “ให้ประสิทธิภาพเทียบเท่ากับ DeepSeek R1 ในราคาเพียงครึ่งเดียว” ข้อความนี้ชี้ให้เห็นถึงความได้เปรียบในการแข่งขันที่สำคัญในแง่ของความคุ้มค่า
สำหรับธุรกิจที่ต้องการผสานรวมความสามารถของ Ernie X1 ราคาสำหรับการเข้าถึง application programming interface (API) มีโครงสร้างดังนี้: 2 หยวน (ประมาณ 0.28 ดอลลาร์สหรัฐ) ต่อล้านโทเค็นอินพุต และ 8 หยวนต่อล้านโทเค็นเอาต์พุต ในทางตรงกันข้าม ปัจจุบัน DeepSeek เรียกเก็บเงิน 0.55 ดอลลาร์สหรัฐต่อล้านโทเค็นอินพุต และ 2.19 ดอลลาร์สหรัฐต่อล้านโทเค็นเอาต์พุตสำหรับ DeepSeek-reasoner ซึ่งขับเคลื่อนโดยแบบจำลองการให้เหตุผล R1 เป็นที่น่าสังเกตว่า DeepSeek ซึ่งเป็นสตาร์ทอัพในหางโจว เพิ่งขึ้นราคา API เพื่อตอบสนองต่อความต้องการที่เพิ่มขึ้นอย่างมาก
การเปลี่ยนแปลงของ Baidu สู่โอเพนซอร์ส
Robin Li Yanhong ผู้ก่อตั้ง ประธาน และ CEO ของ Baidu ได้ประกาศที่โดดเด่นเมื่อเดือนที่แล้วเกี่ยวกับอนาคตของ Ernie 4.5 เขาเปิดเผยว่าแบบจำลองดังกล่าวจะเปิดเป็นโอเพนซอร์สตั้งแต่วันที่ 30 มิถุนายน การตัดสินใจนี้แสดงถึงการเปลี่ยนแปลงครั้งสำคัญจากการสนับสนุนอย่างแข็งขันก่อนหน้านี้สำหรับการพัฒนา AI แบบปิด ซึ่งเป็นการพลิกผัน 180 องศาในแนวทางของเขา
Li อธิบายเพิ่มเติมเกี่ยวกับการเปลี่ยนแปลงเชิงกลยุทธ์นี้ในระหว่างการประชุมทางโทรศัพท์กับนักวิเคราะห์ในเดือนกุมภาพันธ์ โดยกล่าวว่า “สิ่งหนึ่งที่เราได้เรียนรู้จาก DeepSeek คือการเปิดโอเพนซอร์สแบบจำลองที่ดีที่สุดสามารถช่วยในการนำไปใช้ได้อย่างมาก” เขาอธิบายเพิ่มเติมว่า “เมื่อแบบจำลองเป็นโอเพนซอร์ส ผู้คนก็อยากจะลองใช้งานด้วยความอยากรู้อยากเห็น ซึ่งช่วยขับเคลื่อนการนำไปใช้ในวงกว้าง” การยอมรับถึงประโยชน์ของการพัฒนาโอเพนซอร์สนี้เน้นย้ำถึงกลยุทธ์ที่กำลังพัฒนาของ Baidu ในการแข่งขันด้าน AI
ผลการดำเนินงานทางธุรกิจของ Baidu ท่ามกลางความก้าวหน้าของ AI
แม้ว่า Baidu จะมีความก้าวหน้าอย่างมากในด้านปัญญาประดิษฐ์ แต่ธุรกิจโดยรวมของบริษัทฯ กำลังเผชิญกับอุปสรรคเนื่องจากรายได้จากการโฆษณาที่อ่อนแอลง รายงานทางการเงินล่าสุดระบุว่ารายได้รวมของ Baidu ในไตรมาสที่สี่ลดลง 2% เมื่อเทียบเป็นรายปี นอกจากนี้ รายได้ทั้งปียังลดลง 1% ตัวเลขเหล่านี้เน้นย้ำถึงความท้าทายที่ Baidu เผชิญในการสร้างสมดุลระหว่างการลงทุนในเทคโนโลยี AI ที่ล้ำสมัยกับความจำเป็นในการรักษาผลการดำเนินงานทางการเงินที่แข็งแกร่ง
ขยายความในประเด็นสำคัญ
เพื่อให้เข้าใจอย่างครอบคลุมยิ่งขึ้น เราจะเจาะลึกประเด็นสำคัญบางประการของการประกาศของ Baidu และบริบทที่กว้างขึ้นของภูมิทัศน์ AI ในประเทศจีน
ความสำคัญของ Multimodality:
การเน้นที่ความสามารถ “multimodal” ทั้งใน Ernie 4.5 และ Ernie X1 เป็นสิ่งสำคัญ LLMs แบบดั้งเดิมเน้นที่การประมวลผลข้อความเป็นหลัก อย่างไรก็ตาม ความสามารถในการประมวลผลและทำความเข้าใจข้อมูลจากรูปแบบต่างๆ – รูปภาพ เสียง และวิดีโอ – เปิดโอกาสใหม่ๆ มากมาย ซึ่งรวมถึง:
- การจดจำภาพที่ได้รับการปรับปรุง: AI models ในขณะนี้ไม่เพียงแต่สามารถระบุวัตถุในภาพได้เท่านั้น แต่ยังเข้าใจบริบทและความสัมพันธ์ระหว่างวัตถุเหล่านั้นได้อีกด้วย
- การถอดเสียงและการวิเคราะห์เสียงที่ได้รับการปรับปรุง: การถอดเสียงภาษาพูดด้วยความแม่นยำที่มากขึ้น และแม้กระทั่งการตรวจจับความแตกต่างเล็กน้อย เช่น อารมณ์และความตั้งใจในการบันทึกเสียง
- ความเข้าใจวิดีโอ: การวิเคราะห์เนื้อหาวิดีโอเพื่อระบุฉาก การกระทำ และแม้กระทั่งการคาดการณ์เหตุการณ์ในอนาคต
การถกเถียงเรื่องโอเพนซอร์ส:
การตัดสินใจของ Robin Li ที่จะเปิดโอเพนซอร์ส Ernie 4.5 เป็นการพัฒนาที่สำคัญในการถกเถียงอย่างต่อเนื่องระหว่างการพัฒนา AI แบบปิดและแบบโอเพนซอร์ส
- Closed-Source (แบบปิด): ผู้เสนอแนวทางนี้โต้แย้งว่าช่วยให้สามารถควบคุมเทคโนโลยีได้ดีขึ้น ทำให้มั่นใจได้ถึงการใช้งานอย่างมีความรับผิดชอบและป้องกันการใช้งานในทางที่ผิด นอกจากนี้ยังช่วยให้บริษัทต่างๆ สามารถปกป้องทรัพย์สินทางปัญญาและรักษาความได้เปรียบในการแข่งขัน
- Open-Source (แบบเปิด): ผู้สนับสนุนการพัฒนาโอเพนซอร์สเชื่อว่าจะส่งเสริมการทำงานร่วมกัน เร่งนวัตกรรม และส่งเสริมความโปร่งใส ช่วยให้นักวิจัยและนักพัฒนาทั่วโลกมีส่วนร่วมในการพัฒนาเทคโนโลยี AI
การเปลี่ยนแปลงของ Baidu ไปสู่การเปิดโอเพนซอร์ส อย่างน้อยก็สำหรับ Ernie 4.5 ชี้ให้เห็นถึงการยอมรับถึงแรงผลักดันที่เพิ่มขึ้นของการเคลื่อนไหวโอเพนซอร์สและประโยชน์ที่อาจเกิดขึ้น
ภูมิทัศน์การแข่งขัน:
การแข่งขัน AI ในจีนนั้นเข้มข้น โดยมีบริษัทจำนวนมากแย่งชิงความเป็นใหญ่
- Alibaba: Tongyi Qianwen LLM ของ Alibaba เป็นคู่แข่งรายใหญ่ และบริษัทฯ กำลังรวม AI เข้ากับหน่วยธุรกิจต่างๆ อย่างแข็งขัน รวมถึงอีคอมเมิร์ซ คลาวด์คอมพิวติ้ง และโลจิสติกส์
- Tencent: Hunyuan LLM ของ Tencent เป็นอีกหนึ่งผู้เล่นที่สำคัญ และบริษัทฯ กำลังใช้ประโยชน์จาก AI เพื่อปรับปรุงแพลตฟอร์มโซเชียลมีเดีย ข้อเสนอเกม และบริการคลาวด์
- ByteDance: บริษัทแม่ของ TikTok, ByteDance กำลังลงทุนอย่างมากใน AI โดยใช้เพื่อขับเคลื่อนอัลกอริธึมคำแนะนำและพัฒนาผลิตภัณฑ์ใหม่
- DeepSeek: DeepSeek เป็นคู่แข่งที่น่าเกรงขามในพื้นที่ LLM
ผลกระทบของราคา:
กลยุทธ์การกำหนดราคาเชิงรุกของ Baidu สำหรับ Ernie X1 ซึ่งลดราคาของ DeepSeek ลงครึ่งหนึ่ง เป็นการบ่งชี้ที่ชัดเจนถึงความตั้งใจที่จะได้รับส่วนแบ่งการตลาด สงครามราคานี้อาจเป็นประโยชน์ต่อธุรกิจและผู้บริโภคโดยการทำให้เทคโนโลยี AI เข้าถึงได้ง่ายและราคาไม่แพง
ผลกระทบในวงกว้าง:
ความก้าวหน้าของ Baidu ในด้าน AI พร้อมกับการแข่งขันที่รุนแรงในตลาดจีน มีผลกระทบในวงกว้าง:
- ความก้าวหน้าทางเทคโนโลยี: ความก้าวหน้าอย่างรวดเร็วของนวัตกรรมกำลังขับเคลื่อนการพัฒนา AI models ที่มีความซับซ้อนมากขึ้นพร้อมความสามารถที่กว้างขึ้น
- ผลกระทบทางเศรษฐกิจ: AI พร้อมที่จะเปลี่ยนแปลงอุตสาหกรรมต่างๆ เพิ่มผลผลิต สร้างงานใหม่ และอาจปรับเปลี่ยนภูมิทัศน์เศรษฐกิจโลก
- ผลกระทบทางสังคม: การนำ AI มาใช้อย่างแพร่หลายทำให้เกิดคำถามทางจริยธรรมและสังคมที่สำคัญที่ต้องได้รับการแก้ไข รวมถึงประเด็นที่เกี่ยวข้องกับอคติ ความเป็นส่วนตัว และการว่างงาน
การขยายความเพิ่มเติมเกี่ยวกับกลยุทธ์ของ Baidu
กลยุทธ์ของ Baidu ดูเหมือนจะมีหลายแง่มุม ครอบคลุมทั้งนวัตกรรมทางเทคโนโลยีและการวางตำแหน่งทางการตลาด
1. ความกล้าหาญทางเทคโนโลยี:
- มุ่งเน้นไปที่ Multimodality: Baidu ให้ความสำคัญกับการพัฒนา AI models แบบ multimodal อย่างชัดเจน โดยตระหนักถึงศักยภาพของเทคโนโลยีนี้ในการปลดล็อกแอปพลิเคชันและความสามารถใหม่ๆ
- การปรับปรุงอย่างต่อเนื่อง: การเปิดตัว Ernie 4.5 และ Ernie X1 แสดงให้เห็นถึงความมุ่งมั่นของ Baidu ในการวิจัยและพัฒนาอย่างต่อเนื่อง ผลักดันขอบเขตของประสิทธิภาพ AI อย่างต่อเนื่อง
- การเปิดรับโอเพนซอร์ส: การตัดสินใจเปิดโอเพนซอร์ส Ernie 4.5 ส่งสัญญาณถึงความเต็มใจที่จะมีส่วนร่วมกับชุมชน AI ในวงกว้างและมีส่วนร่วมในการพัฒนาโดยรวมของสาขานี้
2. การวางตำแหน่งทางการตลาด:
- ราคาที่แข่งขันได้: การกำหนดราคาเชิงรุกของ Ernie X1 เป็นการเคลื่อนไหวเชิงกลยุทธ์เพื่อดึงดูดผู้ใช้และได้รับส่วนแบ่งการตลาดในภูมิทัศน์ LLM ที่มีการแข่งขันสูง
- การกำหนดเป้าหมายธุรกิจ: การมุ่งเน้นไปที่การเข้าถึง API ชี้ให้เห็นว่า Baidu กำลังกำหนดเป้าหมายธุรกิจที่ต้องการรวม AI เข้ากับการดำเนินงานของตนอย่างแข็งขัน
- การจัดการกับจุดอ่อน: บริษัทฯ กำลังยอมรับและจัดการกับความท้าทาย เช่น รายได้จากการโฆษณาที่ลดลง โดยใช้ประโยชน์จากความก้าวหน้าของ AI เพื่อกระจายข้อเสนอและสำรวจแหล่งรายได้ใหม่
3. วิสัยทัศน์ระยะยาว:
- ความเป็นผู้นำด้าน AI: การกระทำของ Baidu ชี้ให้เห็นถึงความทะเยอทะยานที่ชัดเจนในการเป็นผู้นำในภูมิทัศน์ AI ระดับโลก ไม่ใช่แค่ในประเทศจีนเท่านั้น
- เทคโนโลยีการเปลี่ยนแปลง: บริษัทฯ ดูเหมือนจะมองว่า AI เป็นเทคโนโลยีการเปลี่ยนแปลงที่มีศักยภาพในการปรับเปลี่ยนธุรกิจและมีส่วนร่วมในความก้าวหน้าทางสังคมในวงกว้าง
- ความสามารถในการปรับตัว: ความเต็มใจของ Baidu ในการปรับกลยุทธ์ ดังที่เห็นได้จากการเปลี่ยนแปลงไปสู่การพัฒนาโอเพนซอร์ส แสดงให้เห็นถึงความคล่องตัวและการตอบสนองต่อพลวัตที่เปลี่ยนแปลงไปของอุตสาหกรรม AI
โดยพื้นฐานแล้ว Baidu กำลังวางตำแหน่งตัวเองเป็นกำลังสำคัญในการปฏิวัติ AI โดยผสมผสานนวัตกรรมทางเทคโนโลยีเข้ากับการหลบหลีกทางการตลาดเชิงกลยุทธ์เพื่อให้บรรลุเป้าหมายที่ทะเยอทะยาน ความก้าวหน้าของบริษัทฯ และการแข่งขันที่ดำเนินอยู่ในตลาด AI ของจีนจะถูกจับตามองอย่างใกล้ชิด เนื่องจากมีผลกระทบอย่างมากต่ออนาคตของ AI ทั่วโลก