ความท้าทายที่แท้จริง สร้างแอปพลิเคชัน AI ระดับองค์กร

ภาพลวงตาของการปรับแต่งอย่างละเอียด (Fine-Tuning)

การปรับแต่งอย่างละเอียด (Fine-tuning) และ Retrieval Augmented Generation (RAG) โดยทั่วไปถือว่าเป็นวิธีการที่เป็นที่ยอมรับในการเพิ่มพูนความรู้และความสามารถของแบบจำลอง AI ที่ได้รับการฝึกอบรมล่วงหน้า อย่างไรก็ตาม Jonas Andrulis ซีอีโอของ Aleph Alpha ชี้ให้เห็นว่าความเป็นจริงนั้นซับซ้อนกว่า

“เมื่อปีที่แล้ว มีความเชื่ออย่างกว้างขวางว่าการปรับแต่งอย่างละเอียดเป็นวิธีแก้ปัญหาที่มหัศจรรย์ หากระบบ AI ทำงานได้ไม่ตรงตามที่ต้องการ คำตอบก็คือการปรับแต่งอย่างละเอียด มันไม่ง่ายอย่างนั้น” เขาอธิบาย

แม้ว่าการปรับแต่งอย่างละเอียดสามารถปรับเปลี่ยนรูปแบบหรือพฤติกรรมของแบบจำลองได้ แต่ก็ไม่ใช่วิธีที่มีประสิทธิภาพที่สุดในการสอนข้อมูลใหม่ ความคาดหวังว่าการปรับแต่งอย่างละเอียดเพียงอย่างเดียวสามารถแก้ปัญหาแอปพลิเคชัน AI ทั้งหมดได้นั้นเป็นความเข้าใจผิด

RAG: แนวทางทางเลือก

RAG นำเสนอทางเลือกโดยทำงานเหมือนบรรณารักษ์ที่ดึงข้อมูลจากคลังข้อมูลภายนอก แนวทางนี้ช่วยให้สามารถอัปเดตและเปลี่ยนแปลงข้อมูลภายในฐานข้อมูลได้โดยไม่ต้องฝึกอบรมใหม่หรือปรับแต่งแบบจำลอง นอกจากนี้ ผลลัพธ์ที่สร้างขึ้นสามารถอ้างอิงและตรวจสอบความถูกต้องได้

“ความรู้เฉพาะควรได้รับการบันทึกไว้เสมอและไม่ควรเก็บไว้ในพารามิเตอร์ของ LLM” Andrulis เน้นย้ำ

แม้ว่า RAG จะให้ประโยชน์มากมาย แต่ความสำเร็จของมันขึ้นอยู่กับการจัดทำเอกสารที่เหมาะสมของกระบวนการ ขั้นตอน และความรู้ของสถาบันที่สำคัญในรูปแบบที่แบบจำลองสามารถเข้าใจได้ แต่น่าเสียดายที่มักจะไม่เป็นเช่นนั้น

แม้ว่าจะมีเอกสารอยู่แล้ว องค์กรอาจพบปัญหาหากเอกสารหรือกระบวนการนั้นขึ้นอยู่กับข้อมูลนอกการแจกแจง (out-of-distribution data) ซึ่งเป็นข้อมูลที่แตกต่างอย่างมากจากข้อมูลที่ใช้ในการฝึกอบรมแบบจำลองพื้นฐาน ตัวอย่างเช่น แบบจำลองที่ได้รับการฝึกอบรมเฉพาะชุดข้อมูลภาษาอังกฤษจะประสบปัญหากับเอกสารภาษาเยอรมัน โดยเฉพาะอย่างยิ่งหากมีสูตรทางวิทยาศาสตร์ ในหลายกรณี แบบจำลองอาจไม่สามารถตีความข้อมูลได้เลย

ดังนั้น Andrulis แนะนำว่าการรวมกันของการปรับแต่งอย่างละเอียดและ RAG มักจะจำเป็นเพื่อให้ได้ผลลัพธ์ที่มีความหมาย แนวทางแบบไฮบริดนี้ใช้ประโยชน์จากจุดแข็งของทั้งสองวิธีเพื่อเอาชนะข้อจำกัดของแต่ละวิธี

การเชื่อมช่องว่าง

Aleph Alpha มุ่งหวังที่จะสร้างความแตกต่างในฐานะ DeepMind ของยุโรป โดยการจัดการกับความท้าทายที่ขัดขวางไม่ให้องค์กรและประเทศต่างๆ พัฒนา AI อธิปไตยของตนเอง

Sovereign AI หมายถึงแบบจำลองที่ได้รับการฝึกอบรมหรือปรับแต่งอย่างละเอียดโดยใช้ชุดข้อมูลภายในของประเทศบนฮาร์ดแวร์ที่สร้างขึ้นหรือปรับใช้ภายในขอบเขตของประเทศ แนวทางนี้รับประกันความเป็นส่วนตัว ความปลอดภัย และการควบคุมข้อมูล ซึ่งมีความสำคัญต่อองค์กรและรัฐบาลจำนวนมาก

“เรามุ่งมั่นที่จะเป็นระบบปฏิบัติการ ซึ่งเป็นรากฐานสำหรับองค์กรและรัฐบาลในการสร้างกลยุทธ์ AI อธิปไตยของตนเอง” Andrulis กล่าว “เรามุ่งหวังที่จะสร้างสรรค์สิ่งใหม่ๆ ในกรณีที่จำเป็น ในขณะเดียวกันก็ใช้ประโยชน์จากโอเพ่นซอร์สและเทคโนโลยีที่ล้ำสมัยในกรณีที่เป็นไปได้”

แม้ว่าบางครั้งจะเกี่ยวข้องกับการฝึกอบรมแบบจำลอง เช่น Pharia-1-LLM ของ Aleph แต่ Andrulis เน้นย้ำว่าพวกเขาไม่ได้พยายามที่จะทำซ้ำแบบจำลองที่มีอยู่ เช่น Llama หรือ DeepSeek จุดเน้นของพวกเขาคือการสร้างโซลูชันที่ไม่เหมือนใครซึ่งจัดการกับความท้าทายเฉพาะ

“ผมสั่งให้งานวิจัยของเรามุ่งเน้นไปที่สิ่งที่แตกต่างอย่างมีความหมายเสมอ ไม่ใช่แค่การคัดลอกสิ่งที่คนอื่นทำ เพราะสิ่งนั้นมีอยู่แล้ว” Andrulis กล่าว “เราไม่จำเป็นต้องสร้าง Llama หรือ DeepSeek อีกตัว เพราะมันมีอยู่แล้ว”

แต่ Aleph Alpha มุ่งเน้นไปที่การสร้างเฟรมเวิร์กที่ทำให้การนำเทคโนโลยีเหล่านี้ไปใช้ง่ายขึ้นและคล่องตัวขึ้น ตัวอย่างล่าสุดคือสถาปัตยกรรมการฝึกอบรมแบบไม่มีตัวสร้างโทเค็น (tokenizer-free) หรือ “T-Free” ใหม่ ซึ่งมีจุดมุ่งหมายเพื่อปรับแต่งแบบจำลองที่สามารถเข้าใจข้อมูลนอกการแจกแจงได้อย่างมีประสิทธิภาพมากขึ้น

แนวทางแบบใช้ตัวสร้างโทเค็น (tokenizer-based) แบบดั้งเดิมมักต้องการข้อมูลนอกการแจกแจงจำนวนมากเพื่อปรับแต่งแบบจำลองอย่างมีประสิทธิภาพ นี่เป็นค่าใช้จ่ายในการคำนวณที่สูงและถือว่ามีข้อมูลเพียงพอ

สถาปัตยกรรม T-Free ของ Aleph Alpha หลีกเลี่ยงปัญหานี้โดยการกำจัดตัวสร้างโทเค็น การทดสอบเบื้องต้นกับ Pharia LLM ในภาษาฟินแลนด์แสดงให้เห็นว่าต้นทุนการฝึกอบรมและรอยเท้าคาร์บอนลดลง 70 เปอร์เซ็นต์เมื่อเทียบกับแนวทางแบบใช้ตัวสร้างโทเค็น แนวทางที่เป็นนวัตกรรมนี้ทำให้การปรับแต่งอย่างละเอียดเข้าถึงได้ง่ายขึ้นและยั่งยืนมากขึ้น

Aleph Alpha ยังได้พัฒนาเครื่องมือเพื่อจัดการกับช่องว่างในความรู้ที่เป็นเอกสาร ซึ่งอาจนำไปสู่ข้อสรุปที่ไม่ถูกต้องหรือไม่เป็นประโยชน์

ตัวอย่างเช่น หากสัญญา 2 ฉบับที่เกี่ยวข้องกับคำถามด้านการปฏิบัติตามกฎระเบียบขัดแย้งกัน “ระบบสามารถเข้าหาบุคคลและพูดว่า ‘ฉันพบความคลาดเคลื่อน… คุณช่วยให้ข้อเสนอแนะได้ไหมว่านี่เป็นข้อขัดแย้งจริงหรือไม่’” Andrulis อธิบาย

ข้อมูลที่รวบรวมผ่านเฟรมเวิร์กนี้ ซึ่งเรียกว่า Pharia Catch สามารถป้อนกลับไปยังฐานความรู้ของแอปพลิเคชันหรือใช้เพื่อปรับแต่งแบบจำลองที่มีประสิทธิภาพมากขึ้น วงจรป้อนกลับนี้ช่วยปรับปรุงความถูกต้องและความน่าเชื่อถือของระบบ AI เมื่อเวลาผ่านไป

ตามที่ Andrulis กล่าว เครื่องมือเหล่านี้ได้ดึงดูดพันธมิตร เช่น PwC, Deloitte, Capgemini และ Supra ซึ่งทำงานร่วมกับลูกค้าปลายทางเพื่อนำเทคโนโลยีของ Aleph Alpha ไปใช้ การเป็นพันธมิตรเหล่านี้แสดงให้เห็นถึงคุณค่าและการใช้งานจริงของโซลูชันของ Aleph Alpha ในแอปพลิเคชันในโลกแห่งความเป็นจริง

ปัจจัยด้านฮาร์ดแวร์

ซอฟต์แวร์และข้อมูลไม่ใช่ความท้าทายเพียงอย่างเดียวที่ผู้ใช้ Sovereign AI ต้องเผชิญ ฮาร์ดแวร์เป็นอีกหนึ่งข้อพิจารณาที่สำคัญ

องค์กรและประเทศต่างๆ อาจมีข้อกำหนดเฉพาะในการทำงานบนฮาร์ดแวร์ที่พัฒนาขึ้นในประเทศ หรืออาจกำหนดตำแหน่งที่ปริมาณงานสามารถทำงานได้ ข้อจำกัดเหล่านี้อาจส่งผลกระทบอย่างมากต่อการเลือกฮาร์ดแวร์และโครงสร้างพื้นฐาน

ซึ่งหมายความว่า Andrulis และทีมของเขาต้องสนับสนุนตัวเลือกฮาร์ดแวร์ที่หลากหลาย Aleph Alpha ได้ดึงดูดกลุ่มพันธมิตรฮาร์ดแวร์ที่หลากหลาย รวมถึง AMD, Graphcore และ Cerebras

เมื่อเดือนที่แล้ว Aleph Alpha ได้ประกาศความร่วมมือกับ AMD เพื่อใช้ตัวเร่งความเร็ว MI300-series การทำงานร่วมกันนี้จะใช้ประโยชน์จากฮาร์ดแวร์ขั้นสูงของ AMD เพื่อเร่งการฝึกอบรมและการอนุมาน AI

Andrulis ยังเน้นย้ำถึงความร่วมมือกับ Graphcore ซึ่ง Softbank เข้าซื้อกิจการ และ Cerebras ซึ่งตัวเร่งความเร็วระดับเวเฟอร์ CS-3 ใช้ในการฝึกอบรมแบบจำลอง AI สำหรับกองทัพเยอรมัน การเป็นพันธมิตรเหล่านี้แสดงให้เห็นถึงความมุ่งมั่นของ Aleph Alpha ในการทำงานร่วมกับผู้ให้บริการฮาร์ดแวร์ที่หลากหลายเพื่อตอบสนองความต้องการเฉพาะของลูกค้า

แม้จะมีความร่วมมือเหล่านี้ Andrulis ยืนยันว่าเป้าหมายของ Aleph Alpha ไม่ใช่การเป็นผู้ให้บริการที่มีการจัดการหรือผู้ให้บริการคลาวด์ “เราจะไม่มีวันเป็นผู้ให้บริการคลาวด์” เขากล่าว “ผมต้องการให้ลูกค้าของผมมีอิสระและไม่ถูกผูกมัด” ความมุ่งมั่นต่ออิสระและความยืดหยุ่นของลูกค้านี้ทำให้ Aleph Alpha แตกต่างจากบริษัท AI อื่นๆ

หนทางข้างหน้า: ความซับซ้อนที่เพิ่มขึ้น

เมื่อมองไปข้างหน้า Andrulis คาดการณ์ว่าการสร้างแอปพลิเคชัน AI จะมีความซับซ้อนมากขึ้นเมื่ออุตสาหกรรมเปลี่ยนจากแชทบอทไปสู่ระบบ AI แบบตัวแทน (agentic AI) ที่มีความสามารถในการแก้ปัญหาที่ซับซ้อนมากขึ้น

Agentic AI ได้รับความสนใจอย่างมากในช่วงปีที่ผ่านมา โดยผู้สร้างแบบจำลอง นักพัฒนาซอฟต์แวร์ และผู้จำหน่ายฮาร์ดแวร์ต่างให้คำมั่นสัญญาถึงระบบที่สามารถทำกระบวนการหลายขั้นตอนแบบอะซิงโครนัสได้ ตัวอย่างแรกๆ ได้แก่ Operator ของ OpenAI และ computer use API ของ Anthropic ระบบ AI แบบตัวแทนเหล่านี้แสดงถึงความก้าวหน้าครั้งสำคัญในความสามารถของ AI

“ปีที่แล้ว เรามุ่งเน้นไปที่งานง่ายๆ เป็นหลัก เช่น การสรุปเอกสารหรือการช่วยเหลือในการเขียน” เขากล่าว “ตอนนี้ มันน่าตื่นเต้นมากขึ้นกับสิ่งที่ดูเหมือนจะไม่ใช่ปัญหา genAI ในแวบแรก ซึ่งประสบการณ์ของผู้ใช้ไม่ใช่แชทบอท” การเปลี่ยนแปลงไปสู่แอปพลิเคชัน AI ที่ซับซ้อนและบูรณาการมากขึ้นนี้นำเสนอความท้าทายและโอกาสใหม่ๆ สำหรับอุตสาหกรรม

ความท้าทายหลักในการสร้างแอปพลิเคชัน AI ระดับองค์กร:

  • การเชื่อมช่องว่างระหว่างการฝึกอบรมแบบจำลองและการรวมแอปพลิเคชัน: การแปลความสามารถของ LLMs ไปสู่แอปพลิเคชันที่ใช้งานได้จริงยังคงเป็นอุปสรรคสำคัญ
  • การเอาชนะข้อจำกัดของการปรับแต่งอย่างละเอียด: การปรับแต่งอย่างละเอียดเพียงอย่างเดียวมักไม่เพียงพอสำหรับการสอนข้อมูลใหม่ให้กับแบบจำลอง AI หรือปรับให้เข้ากับงานเฉพาะ
  • การรับรองคุณภาพและการเข้าถึงข้อมูล: RAG อาศัยข้อมูลที่มีการจัดทำเอกสารอย่างดีและเข้าถึงได้ง่าย ซึ่งมักขาดในหลายองค์กร
  • การจัดการข้อมูลนอกการแจกแจง: แบบจำลอง AI ต้องสามารถจัดการข้อมูลที่แตกต่างจากข้อมูลที่ได้รับการฝึกอบรม ซึ่งต้องใช้เทคนิคพิเศษ
  • การจัดการข้อจำกัดด้านฮาร์ดแวร์: องค์กรและประเทศต่างๆ มีข้อกำหนดด้านฮาร์ดแวร์ที่แตกต่างกันซึ่งต้องนำมาพิจารณา
  • การรักษาความเป็นส่วนตัวและความปลอดภัยของข้อมูล: Sovereign AI กำหนดให้ต้องแน่ใจว่าข้อมูลได้รับการประมวลผลและจัดเก็บอย่างปลอดภัยภายในขอบเขตของประเทศ
  • การพัฒนาระบบ AI แบบตัวแทน: การสร้างแอปพลิเคชัน AI ที่สามารถทำกระบวนการหลายขั้นตอนที่ซับซ้อนแบบอะซิงโครนัสเป็นพื้นที่การวิจัยที่ท้าทายแต่มีแนวโน้ม

โอกาสสำคัญในการสร้างแอปพลิเคชัน AI ระดับองค์กร:

  • การพัฒนาโซลูชัน AI ที่เป็นนวัตกรรม: ความท้าทายในการสร้างแอปพลิเคชัน AI ระดับองค์กรสร้างโอกาสในการพัฒนาโซลูชันที่เป็นนวัตกรรมที่ตอบสนองความต้องการเฉพาะ
  • การใช้ประโยชน์จากเทคโนโลยีโอเพ่นซอร์ส: เทคโนโลยีโอเพ่นซอร์สสามารถช่วยลดต้นทุนและเร่งการพัฒนาแอปพลิเคชัน AI
  • การทำงานร่วมกับพันธมิตรฮาร์ดแวร์: การทำงานร่วมกับพันธมิตรฮาร์ดแวร์สามารถช่วยให้มั่นใจได้ว่าแอปพลิเคชัน AI ได้รับการปรับให้เหมาะสมสำหรับแพลตฟอร์มฮาร์ดแวร์เฉพาะ
  • การสร้างความสามารถ AI อธิปไตย: Sovereign AI สามารถให้ประเทศและองค์กรต่างๆ ควบคุมข้อมูลและโครงสร้างพื้นฐาน AI ได้มากขึ้น
  • การเปลี่ยนแปลงอุตสาหกรรมด้วย AI: AI มีศักยภาพในการเปลี่ยนแปลงอุตสาหกรรมโดยการทำงานอัตโนมัติ การปรับปรุงการตัดสินใจ และการสร้างผลิตภัณฑ์และบริการใหม่ๆ

อนาคตของแอปพลิเคชัน AI ระดับองค์กร:

อนาคตของแอปพลิเคชัน AI ระดับองค์กรมีแนวโน้มที่จะมีลักษณะดังนี้:

  • ความซับซ้อนที่เพิ่มขึ้น: แอปพลิเคชัน AI จะมีความซับซ้อนและบูรณาการมากขึ้น ซึ่งต้องใช้ความเชี่ยวชาญและเครื่องมือพิเศษ
  • การให้ความสำคัญกับคุณภาพข้อมูลมากขึ้น: คุณภาพข้อมูลจะมีความสำคัญมากขึ้นเรื่อยๆ เนื่องจากแอปพลิเคชัน AI อาศัยข้อมูลที่ถูกต้องและเชื่อถือได้
  • การให้ความสำคัญกับความปลอดภัยและความเป็นส่วนตัวมากขึ้น: ความปลอดภัยและความเป็นส่วนตัวจะมีความสำคัญสูงสุดเนื่องจากแอปพลิเคชัน AI จัดการข้อมูลที่ละเอียดอ่อน
  • การนำ Agentic AI ไปใช้อย่างกว้างขวางมากขึ้น: ระบบ Agentic AI จะแพร่หลายมากขึ้นเมื่อองค์กรต่างๆ พยายามทำงานที่ซับซ้อนโดยอัตโนมัติ
  • นวัตกรรมอย่างต่อเนื่อง: สาขา AI จะยังคงพัฒนาอย่างรวดเร็ว นำไปสู่ความก้าวหน้าและโอกาสใหม่ๆ

โดยการจัดการกับความท้าทายและเปิดรับโอกาส องค์กรต่างๆ สามารถควบคุมพลังของ AI เพื่อเปลี่ยนแปลงธุรกิจของตนและสร้างอนาคตที่ดีกว่า