สมองไหลที่ Meta: ทีม Llama AI สูญเสียคนเก่งให้คู่แข่ง

สมองไหลที่ Llama: เจาะลึก

โมเดล Llama แบบโอเพนซอร์สของ Meta มีบทบาทสำคัญในการกำหนดกลยุทธ์ AI ของบริษัท โมเดลเหล่านี้ได้รับการออกแบบมาเพื่อให้เข้าถึงและทำงานร่วมกันได้ และได้รับความสนใจอย่างรวดเร็วในชุมชน AI อย่างไรก็ตาม นักวิจัยผู้บุกเบิก Llama รุ่นแรกส่วนใหญ่ได้จากไปเพื่อแสวงหาโอกาสและความท้าทายใหม่ ๆ ที่อื่น

จากบุคคล 14 คนที่ได้รับการยกย่องว่าเป็นผู้เขียนในเอกสารสำคัญปี 2023 ที่เปิดตัว Llama สู่โลก มีเพียงสามคนที่ยังคงอยู่ที่ Meta ได้แก่ Hugo Touvron นักวิทยาศาสตร์การวิจัย, Xavier Martinet วิศวกรการวิจัย และ Faisal Azhar ผู้นำโครงการด้านเทคนิค การจากไปของผู้เขียนที่เหลืออีก 11 คน ถือเป็นการสูญเสียความเชี่ยวชาญและความรู้ของสถาบันอย่างมากสำหรับแผนก AI ของ Meta นักวิจัย Meta อดีตจำนวนมากเหล่านี้ได้เข้าร่วมกับคู่แข่งรายใหม่ ซึ่งยิ่งทำให้การแข่งขันรุนแรงขึ้น

Mistral: แม่เหล็กดึงดูดความสามารถด้าน AI ของ Meta

ผลกระทบของการไหลออกของสมองของ Meta นั้นเห็นได้ชัดเจนเป็นพิเศษที่ Mistral ซึ่งเป็นสตาร์ทอัพ AI ในปารีสที่ก่อตั้งโดย Guillaume Lample และ Timothée Lacroix อดีตนักวิจัยของ Meta ซึ่งเป็นสถาปนิกหลักของโมเดล Llama Mistral ได้ดึงดูดศิษย์เก่า Meta จำนวนมาก ซึ่งขณะนี้กำลังทำงานเพื่อพัฒนาโมเดลโอเพนซอร์สที่ทรงพลังซึ่งท้าทายความคิดริเริ่ม AI ที่เป็นเรือธงของ Meta โดยตรง

การรวมตัวของอดีตผู้มีความสามารถของ Meta ที่ Mistral บ่งชี้ว่า สตาร์ทอัพอาจได้สร้างสภาพแวดล้อมที่น่าดึงดูดเป็นพิเศษสำหรับนักวิจัยที่แสวงหาความเป็นอิสระที่มากขึ้น นวัตกรรมที่รวดเร็วขึ้น หรือวัฒนธรรมองค์กรที่แตกต่างกัน ความสามารถในการดึงดูดและรักษาผู้มีความสามารถด้าน AI ระดับสูงเป็นสิ่งสำคัญสำหรับบริษัทใด ๆ ที่ต้องการเป็นผู้นำในสาขาที่มีการแข่งขันสูงนี้

ผลกระทบต่อความทะเยอทะยานด้าน AI ของ Meta

การจากไปของนักวิจัยหลักจำนวนมากทำให้เกิดคำถามเกี่ยวกับความสามารถของ Meta ในการรักษาสถานะเป็นผู้นำด้านการวิจัยและพัฒนา AI บริษัทกำลังเผชิญกับแรงกดดันจากภายนอกและภายในที่เพิ่มขึ้น รวมถึงความล่าช้าในการเปิดตัวโมเดล AI ที่ใหญ่ที่สุดเท่าที่เคยมีมาของบริษัท นั่นคือ Behemoth เนื่องมาจากความกังวลเกี่ยวกับประสิทธิภาพและความเป็นผู้นำ นอกจากนี้ Llama 4 ซึ่งเป็นรุ่นล่าสุดของ Meta ได้รับการตอบรับที่ไม่ดีจากนักพัฒนา ซึ่งหันไปใช้ทางเลือกโอเพนซอร์สที่เคลื่อนไหวเร็วกว่า เช่น DeepSeek และ Qwen เพื่อความสามารถที่ล้ำสมัยมากขึ้น

ภายในองค์กร ทีมวิจัยของ Meta ยังมีการเปลี่ยนแปลงครั้งสำคัญอีกด้วย Joelle Pineau ซึ่งเป็นผู้นำกลุ่ม Fundamental AI Research (FAIR) ของบริษัทมาเป็นเวลาแปดปี ได้ลาออกจากตำแหน่งของเธอ เธอถูกแทนที่โดย Robert Fergus ซึ่งร่วมก่อตั้ง FAIR ในปี 2014 และต่อมาใช้เวลาห้าปีที่ DeepMind ของ Google ก่อนที่จะกลับมาที่ Meta

การเปลี่ยนแปลงความเป็นผู้นำเหล่านี้และการสูญเสียนักวิจัยหลักอย่างต่อเนื่อง ทำให้เกิดความไม่แน่นอนเกี่ยวกับทิศทางในอนาคตของความพยายามด้าน AI ของ Meta บริษัทต้องจัดการกับปัจจัยพื้นฐานที่ขับเคลื่อนผู้มีความสามารถออกไป และสร้างสภาพแวดล้อมที่น่าดึงดูดและคุ้มค่ามากขึ้นสำหรับนักวิจัยที่เหลืออยู่

ภูมิทัศน์ที่เปลี่ยนแปลงไปของโอเพนซอร์ส AI

การจากไปของนักวิจัยเบื้องหลังความสำเร็จเริ่มต้นของ Llama นั้นน่ากังวลเป็นพิเศษ โดยพิจารณาจากกลยุทธ์ของ Meta ในการวางตำแหน่งกลุ่มโมเดลให้เป็นศูนย์กลางของความทะเยอทะยานด้าน AI ด้วยสถาปนิกดั้งเดิมจำนวนมากที่ทำงานให้กับคู่แข่ง Meta เผชิญกับความท้าทายอย่างมากในการปกป้องความเป็นผู้นำในช่วงต้นโดยไม่มีทีมที่สร้างมันขึ้นมา

เอกสาร Llama ปี 2023 เป็นช่วงเวลาสำคัญในการพัฒนาโอเพนซอร์ส AI มันช่วยให้โมเดลภาษาขนาดใหญ่แบบเปิดน้ำหนักมีความชอบธรรม ซึ่งให้โค้ดและพารามิเตอร์พื้นฐานที่เปิดให้ผู้อื่นใช้งาน แก้ไข และสร้างขึ้นได้ฟรี โมเดลเหล่านี้เสนอทางเลือกที่ใช้งานได้จริงสำหรับระบบที่เป็นกรรมสิทธิ์ในขณะนั้น เช่น GPT-3 ของ OpenAI และ PaLM ของ Google

Meta ฝึกอบรมโมเดลโดยใช้ข้อมูลที่เปิดเผยต่อสาธารณะเท่านั้น และปรับให้เหมาะสมเพื่อประสิทธิภาพ ทำให้ นักวิจัยและนักพัฒนาสามารถรันระบบที่ล้ำสมัยบนชิป GPU เดียวได้ แนวทางนี้ทำให้ Meta อยู่ในตำแหน่งที่เป็นผู้นำที่มีศักยภาพในการเคลื่อนไหวโอเพนซอร์ส AI

อย่างไรก็ตาม สองปีต่อมา ความเป็นผู้นำของ Meta ก็ลดลง และบริษัทไม่ได้กำหนด Pace ในนวัตกรรมโอเพนซอร์ส AI อีกต่อไป คู่แข่งอย่าง Mistral, DeepSeek และ Qwen ได้กลายเป็นคู่แข่งที่น่าเกรงขาม ซึ่งนำเสนอโมเดลที่ล้ำหน้ากว่าและวงจรการพัฒนาที่เร็วกว่า

ความจำเป็นสำหรับโมเดลการให้เหตุผล

แม้จะมีการลงทุนอย่างมากใน AI แต่ Meta ยังขาดโมเดล “การให้เหตุผล” โดยเฉพาะ ซึ่งได้รับการออกแบบมาโดยเฉพาะเพื่อจัดการกับงานที่ต้องใช้การคิดหลายขั้นตอน การแก้ปัญหา หรือการเรียกใช้เครื่องมือภายนอกเพื่อทำคำสั่งที่ซับซ้อนให้เสร็จสมบูรณ์ ช่องว่างในความสามารถนี้เริ่มสังเกตเห็นได้ชัดเจนมากขึ้น เนื่องจากบริษัทอื่น ๆ เช่น Google และ OpenAI ให้ความสำคัญกับคุณสมบัติเหล่านี้ในโมเดลล่าสุดของตน

การไม่มีโมเดลการให้เหตุผลที่แข็งแกร่งทำให้ Meta เสียเปรียบในแอปพลิเคชัน AI ที่เพิ่มขึ้น รวมถึงผู้ช่วยเสมือน การบริการลูกค้าอัตโนมัติ และการวิเคราะห์ข้อมูลที่ซับซ้อน Meta ต้องจัดการกับข้อบกพร่องนี้หากหวังว่าจะสามารถแข่งขันได้อย่างมีประสิทธิภาพในอนาคต

การดำรงตำแหน่งที่ยาวนานของนักวิจัยที่จากไป

การดำรงตำแหน่งเฉลี่ยของผู้เขียนที่จากไป 11 คนที่ Meta เกินห้าปี ซึ่งบ่งชี้ว่าพวกเขาไม่ใช่ผู้ที่ได้รับการว่าจ้างในระยะสั้น แต่เป็นนักวิจัยที่ฝังแน่นอยู่ในความพยายามด้าน AI ของ Meta นักวิจัยเหล่านี้มีความเข้าใจอย่างลึกซึ้งเกี่ยวกับโครงสร้างพื้นฐานข้อมูลและระเบียบวิธีวิจัย AI ของ Meta

นักวิจัยบางคนเหล่านี้ลาออกตั้งแต่เดือนมกราคม 2023 ในขณะที่คนอื่น ๆ ยังคงอยู่ตลอดวงจร Llama 3 และบางคนเพิ่งลาออกในปีนี้ การจากไปโดยรวมของพวกเขาสื่อถึงการรื้อถอนทีมที่ช่วยให้ Meta สร้างชื่อเสียงด้าน AI บนโมเดลแบบเปิด

มาดูกันว่าพวกเขาไปที่ไหน

จุดต่อไปนี้ให้รายละเอียดเกี่ยวกับบทบาทก่อนหน้า บทบาทปัจจุบัน เวลาที่ และวันที่ออกจาก Meta จากนักวิจัยแต่ละคนที่อ้างถึงในบทความ:

  • Naman Goyal

    • บทบาทก่อนหน้าที่ Meta: ไม่มี
    • บทบาทปัจจุบัน: สมาชิกของเจ้าหน้าที่ด้านเทคนิคที่ Thinking Machines Lab
    • ออกจาก Meta: กุมภาพันธ์ 2025
    • เวลาที่ Meta: 6 ปี 7 เดือน
  • Baptiste Rozière

    • บทบาทก่อนหน้าที่ Meta: ไม่มี
    • บทบาทปัจจุบัน: นักวิทยาศาสตร์ AI ที่ Mistral
    • ออกจาก Meta: สิงหาคม 2024
    • เวลาที่ Meta: 5 ปี 1 เดือน
  • Aurélien Rodriguez

    • บทบาทก่อนหน้าที่ Meta: ไม่มี
    • บทบาทปัจจุบัน: ผู้อำนวยการ, Foundation Model Training ที่ Cohere
    • ออกจาก Meta: กรกฎาคม 2024
    • เวลาที่ Meta: 2 ปี 7 เดือน
  • Eric Hambro

    • บทบาทก่อนหน้าที่ Meta: ไม่มี
    • บทบาทปัจจุบัน: สมาชิกของเจ้าหน้าที่ด้านเทคนิคที่ Anthropic
    • ออกจาก Meta: พฤศจิกายน 2023
    • เวลาที่ Meta: 3 ปี 3 เดือน
  • Timothée Lacroix

    • บทบาทก่อนหน้าที่ Meta: ไม่มี
    • บทบาทปัจจุบัน: ผู้ร่วมก่อตั้งและ CTO ที่ Mistral
    • ออกจาก Meta: มิถุนายน 2023
    • เวลาที่ Meta: 8 ปี 5 เดือน
  • Marie-Anne Lachaux

    • บทบาทก่อนหน้าที่ Meta: ไม่มี
    • บทบาทปัจจุบัน: สมาชิกผู้ก่อตั้งและวิศวกรวิจัย AI ที่ Mistral
    • ออกจาก Meta: มิถุนายน 2023
    • เวลาที่ Meta: 5 ปี
  • Thibaut Lavril

    • บทบาทก่อนหน้าที่ Meta: ไม่มี
    • บทบาทปัจจุบัน: วิศวกรวิจัย AI ที่ Mistral
    • ออกจาก Meta: มิถุนายน 2023
    • เวลาที่ Meta: 4 ปี 5 เดือน
  • Armand Joulin

    • บทบาทก่อนหน้าที่ Meta: ไม่มี
    • บทบาทปัจจุบัน: นักวิทยาศาสตร์ผู้มีชื่อเสียงที่ Google DeepMind
    • ออกจาก Meta: พฤษภาคม 2023
    • เวลาที่ Meta: 8 ปี 8 เดือน
  • Gautier Izacard

    • บทบาทก่อนหน้าที่ Meta: ไม่มี
    • บทบาทปัจจุบัน: เจ้าหน้าที่ด้านเทคนิคที่ Microsoft AI
    • ออกจาก Meta: มีนาคม 2023
    • เวลาที่ Meta: 3 ปี 2 เดือน
  • Edouard Grave

    • บทบาทก่อนหน้าที่ Meta: ไม่มี
    • บทบาทปัจจุบัน: นักวิทยาศาสตร์การวิจัยที่ Kyutai
    • ออกจาก Meta: กุมภาพันธ์ 2023
    • เวลาที่ Meta: 7 ปี 2 เดือน
  • Guillaume Lample

    • บทบาทก่อนหน้าที่ Meta: ไม่มี
    • บทบาทปัจจุบัน: ผู้ร่วมก่อตั้งและหัวหน้านักวิทยาศาสตร์ที่ Mistral
    • ออกจาก Meta: ต้นปี 2023
    • เวลาที่ Meta: 7 ปี

อนาคตของกลยุทธ์ AI ของ Meta

Meta เผชิญกับความท้าทายที่สำคัญในการรักษาสถานะเป็นผู้นำด้านการวิจัยและพัฒนา AI บริษัทต้องจัดการกับปัญหาที่ขับเคลื่อน ผู้มีความสามารถออกไป ลงทุนในการพัฒนาโมเดล AI ที่ล้ำหน้ากว่า และปรับตัวให้เข้ากับภูมิทัศน์ที่เปลี่ยนแปลงไปอย่างรวดเร็วของโอเพนซอร์ส AI กุญแจสู่ความสำเร็จในอนาคตของ Meta อยู่ที่ความสามารถในการดึงดูด รักษา และเพิ่มขีดความสามารถให้กับนักวิจัยและวิศวกร AI ของบริษัท หากไม่มีทีมที่แข็งแกร่งและทุ่มเท Meta จะพยายามแข่งขันอย่างมีประสิทธิภาพในอีกไม่กี่ปีข้างหน้า บริษัทต้องให้ความสำคัญกับการพัฒนาโมเดลการให้เหตุผลและความสามารถ AI ขั้นสูงอื่น ๆ เพื่อตอบสนองความต้องการที่เปลี่ยนแปลงไปของผู้ใช้และลูกค้า