ภูมิทัศน์ของปัญญาประดิษฐ์กำลังเกิดการเปลี่ยนแปลงครั้งสำคัญ เป็นเวลาหลายปีที่ความต้องการด้านการประมวลผลมหาศาลของโมเดล AI ที่ซับซ้อน โดยเฉพาะอย่างยิ่ง large language models (LLMs) ทำให้การทำงานของพวกมันถูกจำกัดอยู่กับเซิร์ฟเวอร์ที่ทรงพลังและใช้พลังงานสูงซึ่งซ่อนอยู่ในศูนย์ข้อมูลขนาดใหญ่ การเข้าถึงโดยทั่วไปเกี่ยวข้องกับการส่งคำค้นหาผ่านอินเทอร์เน็ตและรอการตอบสนองที่ประมวลผลจากระยะไกล อย่างไรก็ตาม การเปลี่ยนแปลงที่น่าสนใจไปสู่การประมวลผลแบบ localized กำลังได้รับแรงผลักดัน โดยได้แรงหนุนจากความก้าวหน้าทางเทคโนโลยีโปรเซสเซอร์และความกังวลที่เพิ่มขึ้นเกี่ยวกับความเป็นส่วนตัวของข้อมูลและ latency Advanced Micro Devices (AMD) ซึ่งเป็นผู้เล่นที่น่าเกรงขามในวงการเซมิคอนดักเตอร์ กำลังเปิดรับแนวโน้มนี้อย่างแข็งขัน โดยพยายามเพิ่มขีดความสามารถให้ผู้ใช้สามารถควบคุมความสามารถของ generative AI ได้โดยตรงบนคอมพิวเตอร์ส่วนบุคคลของตน โครงการริเริ่มล่าสุดของบริษัทในด้านนี้คือโครงการโอเพนซอร์สที่ตั้งชื่ออย่างน่าสนใจว่า GAIA ซึ่งเป็นตัวย่อของ ‘Generative AI Is Awesome’
นำเข้าสู่ยุคของการประมวลผล AI แบบ Localized
เสน่ห์ของการรันโมเดล generative AI แบบ localized นั้นมีหลายแง่มุม ประการแรก มันช่วยแก้ปัญหาความกังวลเรื่องความเป็นส่วนตัวที่เพิ่มสูงขึ้น เมื่อข้อมูลถูกประมวลผลบนอุปกรณ์ของผู้ใช้เอง ความจำเป็นในการส่งข้อมูลที่อาจละเอียดอ่อนไปยังเซิร์ฟเวอร์ของบุคคลที่สามก็หมดไป ทำให้เกิดกระบวนทัศน์การทำงานที่ปลอดภัยยิ่งขึ้นโดยเนื้อแท้ ประการที่สอง การดำเนินการแบบ local สามารถลด latency ได้อย่างมาก ความล่าช้าระหว่างอินพุตและเอาต์พุตจะลดลงเหลือน้อยที่สุดเมื่อการประมวลผลหนักๆ เกิดขึ้นห่างจากส่วนต่อประสานผู้ใช้เพียงไม่กี่มิลลิเมตร แทนที่จะต้องเดินทางข้ามทวีป ประการที่สาม มันทำให้การเข้าถึงเป็นประชาธิปไตย ในขณะที่ AI บนคลาวด์มักเกี่ยวข้องกับค่าธรรมเนียมการสมัครสมาชิกหรือขีดจำกัดการใช้งาน การประมวลผลบนอุปกรณ์ใช้ประโยชน์จากฮาร์ดแวร์ที่ผู้ใช้เป็นเจ้าของอยู่แล้ว ซึ่งอาจลดอุปสรรคในการเข้าถึงสำหรับการทดลองและใช้งานเครื่องมือ AI
ด้วยการตระหนักถึงศักยภาพนี้ AMD ได้ทำการรวมคอร์ประมวลผลเฉพาะทางที่ออกแบบมาอย่างชัดเจนสำหรับเวิร์กโหลด AI เข้ากับสถาปัตยกรรมโปรเซสเซอร์ของตนอย่างมีกลยุทธ์ จุดสูงสุดของความพยายามเหล่านี้เห็นได้ชัดในโปรเซสเซอร์ Ryzen AI 300 series ล่าสุด ซึ่งมี Neural Processing Units (NPUs) ที่ได้รับการปรับปรุง NPUs เหล่านี้ได้รับการออกแบบมาเพื่อจัดการกับการดำเนินการทางคณิตศาสตร์ประเภทเฉพาะที่แพร่หลายในงาน machine learning โดยทำได้อย่างมีประสิทธิภาพมากขึ้นอย่างมีนัยสำคัญ ทั้งในแง่ของความเร็วและการใช้พลังงาน เมื่อเทียบกับคอร์ CPU แบบดั้งเดิม ฮาร์ดแวร์เฉพาะทางนี้เองที่ AMD ตั้งเป้าที่จะปลดล็อกสำหรับผู้ใช้ทั่วไปผ่านโครงการ GAIA ของตน Victoria Godsoe, AI Developer Enablement Manager ของ AMD เน้นย้ำถึงเป้าหมายนี้ โดยระบุว่า GAIA ‘ใช้ประโยชน์จากพลังของ Ryzen AI Neural Processing Unit (NPU) เพื่อรัน large language models (LLMs) แบบส่วนตัวและ local’ เธอยังเน้นย้ำถึงประโยชน์ต่างๆ เพิ่มเติม: ‘การผสานรวมนี้ช่วยให้การประมวลผลเร็วขึ้นและมีประสิทธิภาพมากขึ้น เช่น ใช้พลังงานน้อยลง ในขณะที่รักษาข้อมูลของคุณให้เป็น local และปลอดภัย’
ขอแนะนำ GAIA: ทำให้การปรับใช้ LLM บนอุปกรณ์ง่ายขึ้น
GAIA ปรากฏตัวขึ้นเพื่อเป็นคำตอบของ AMD สำหรับคำถามที่ว่า: ผู้ใช้จะสามารถเข้าถึงความสามารถ NPU ของเครื่องที่ขับเคลื่อนด้วย Ryzen AI ใหม่ของตนเพื่อรันโมเดล AI ที่ซับซ้อนได้อย่างง่ายดายได้อย่างไร GAIA นำเสนอในรูปแบบแอปพลิเคชันโอเพนซอร์ส โดยมีอินเทอร์เฟซที่ปรับปรุงให้ใช้งานง่าย ซึ่งปรับแต่งมาโดยเฉพาะสำหรับการปรับใช้และโต้ตอบกับ LLMs ขนาดเล็กโดยตรงบน Windows PCs ที่ติดตั้งฮาร์ดแวร์ AMD ล่าสุด โครงการนี้สร้างขึ้นบนเฟรมเวิร์กโอเพนซอร์สที่มีอยู่ โดยอ้างถึง Lemonade เป็นรากฐานอย่างชัดเจน แสดงให้เห็นถึงจิตวิญญาณแห่งความร่วมมือภายในชุมชนนักพัฒนาที่กว้างขึ้น
หน้าที่หลักของ GAIA คือการขจัดความซับซ้อนส่วนใหญ่ที่มักเกี่ยวข้องกับการตั้งค่าและรัน LLMs ผู้ใช้จะได้รับสภาพแวดล้อมที่เข้าถึงได้ง่ายขึ้น ซึ่งปรับให้เหมาะสมตั้งแต่ต้นสำหรับสถาปัตยกรรม Ryzen AI ของ AMD การปรับให้เหมาะสมนี้มีความสำคัญอย่างยิ่ง มันทำให้มั่นใจได้ว่าซอฟต์แวร์ใช้ NPU ได้อย่างมีประสิทธิภาพ เพิ่มประสิทธิภาพสูงสุดและลดการใช้พลังงานให้น้อยที่สุด ในขณะที่เป้าหมายหลักคือ Ryzen AI 300 series ที่มี NPU อันทรงพลัง AMD ก็ไม่ได้กีดกันผู้ใช้ฮาร์ดแวร์รุ่นเก่าหรือการกำหนดค่าที่แตกต่างกันโดยสิ้นเชิง
โครงการนี้รองรับตระกูล LLM ที่ได้รับความนิยมและค่อนข้างกะทัดรัด รวมถึงโมเดลที่ใช้สถาปัตยกรรม Llama และ Phi ที่เข้าถึงได้อย่างกว้างขวาง โมเดลเหล่านี้ แม้ว่าอาจจะไม่มีขนาดใหญ่เท่ากับยักษ์ใหญ่อย่าง GPT-4 แต่ก็มีความสามารถอย่างน่าทึ่งสำหรับงานบนอุปกรณ์ที่หลากหลาย AMD แนะนำกรณีการใช้งานที่เป็นไปได้ตั้งแต่ chatbots แบบโต้ตอบที่สามารถสนทนาได้อย่างเป็นธรรมชาติไปจนถึงงานการให้เหตุผลที่ซับซ้อนมากขึ้น แสดงให้เห็นถึงความเก่งกาจที่คาดการณ์ไว้สำหรับ AI แบบ local ที่ขับเคลื่อนโดย GAIA
สำรวจความสามารถของ GAIA: Agents และ Hybrid Power
เพื่อแสดงให้เห็นถึงการใช้งานจริงและทำให้เทคโนโลยีมีประโยชน์ในทันที GAIA มาพร้อมกับ ‘agents’ ที่กำหนดไว้ล่วงหน้าจำนวนหนึ่ง ซึ่งแต่ละตัวปรับแต่งมาสำหรับฟังก์ชันเฉพาะ:
- Chaty: ตามชื่อที่แนะนำ agent นี้มอบประสบการณ์ AI เชิงสนทนา ทำหน้าที่เป็น chatbot สำหรับการโต้ตอบและบทสนทนาทั่วไป มันใช้ประโยชน์จากความสามารถของ LLM พื้นฐานในการสร้างการตอบสนองข้อความที่เหมือนมนุษย์
- Clip: agent นี้เน้นไปที่งานตอบคำถาม ที่น่าสังเกตคือ มันรวมความสามารถ Retrieval-Augmented Generation (RAG) เข้าไว้ด้วย ทำให้สามารถดึงข้อมูลจากแหล่งภายนอก เช่น transcript ของ YouTube เพื่อให้คำตอบที่มีข้อมูลมากขึ้นหรือเกี่ยวข้องกับบริบทมากขึ้น ฟังก์ชัน RAG นี้ช่วยเพิ่มฐานความรู้ของ agent ได้อย่างมาก นอกเหนือจากข้อมูลการฝึกอบรมเริ่มต้นของ LLM
- Joker: agent ที่ใช้ RAG อีกตัว Joker ได้รับการออกแบบมาโดยเฉพาะสำหรับอารมณ์ขัน โดยได้รับมอบหมายให้สร้างเรื่องตลก สิ่งนี้แสดงให้เห็นถึงศักยภาพสำหรับการใช้งาน LLMs แบบ local ที่มีความเชี่ยวชาญและสร้างสรรค์
- Simple Prompt Completion: สิ่งนี้เสนอช่องทางที่ตรงกว่าไปยัง LLM พื้นฐาน ทำให้ผู้ใช้สามารถป้อน prompts และรับ completions ที่ตรงไปตรงมาโดยไม่มีชั้นเชิงสนทนาหรือเฉพาะงานของ agents อื่นๆ มันทำหน้าที่เป็นอินเทอร์เฟซพื้นฐานสำหรับการโต้ตอบกับโมเดลโดยตรง
การดำเนินการของ agents เหล่านี้ โดยเฉพาะอย่างยิ่งกระบวนการ inference ที่โมเดลสร้างการตอบสนอง ส่วนใหญ่จะจัดการโดย NPU บนชิป Ryzen AI 300 series ที่เข้ากันได้ สิ่งนี้ทำให้มั่นใจได้ถึงการทำงานที่มีประสิทธิภาพและใช้พลังงานต่ำ อย่างไรก็ตาม AMD ยังได้รวมโหมด ‘hybrid’ ที่ล้ำหน้ายิ่งขึ้นสำหรับโมเดลที่รองรับบางรุ่น แนวทางที่เป็นนวัตกรรมใหม่นี้จะดึงหน่วยประมวลผลกราฟิกในตัว (iGPU) ของโปรเซสเซอร์มาทำงานร่วมกับ NPU แบบไดนามิก ด้วยการใช้ประโยชน์จากพลังการประมวลผลแบบขนานของ iGPU โหมด hybrid นี้สามารถเพิ่มประสิทธิภาพได้อย่างมีนัยสำคัญสำหรับงาน AI ที่ต้องการพลังประมวลผลสูง ทำให้ผู้ใช้มีวิธีเร่งความเร็ว inference เกินกว่าที่ NPU เพียงอย่างเดียวจะทำได้
ด้วยการตระหนักถึงภูมิทัศน์ฮาร์ดแวร์ที่หลากหลาย AMD ยังมีตัวเลือกสำรองอีกด้วย GAIA รุ่นหนึ่งที่มีอยู่ซึ่งอาศัยคอร์ CPU เพียงอย่างเดียวในการคำนวณ แม้ว่าจะช้ากว่าและประหยัดพลังงานน้อยกว่าโหมด NPU หรือ hybrid อย่างมาก แต่เวอร์ชันที่ใช้ CPU เท่านั้นนี้ช่วยให้มั่นใจได้ถึงการเข้าถึงที่กว้างขึ้น ทำให้ผู้ใช้ที่ไม่มีฮาร์ดแวร์ Ryzen AI ล่าสุดสามารถทดลองใช้ GAIA ได้ แม้ว่าจะมีข้อเสียด้านประสิทธิภาพก็ตาม
การวางตำแหน่งเชิงกลยุทธ์และข้อได้เปรียบของโอเพนซอร์ส
การเปิดตัว GAIA สามารถมองได้ในบริบทที่กว้างขึ้นของตลาดเซมิคอนดักเตอร์ที่มีการแข่งขันสูง โดยเฉพาะอย่างยิ่งในส่วนที่เกี่ยวกับการเร่งความเร็ว AI เป็นระยะเวลาพอสมควรที่ NVIDIA ครองตำแหน่งที่โดดเด่นในพื้นที่ AI ส่วนใหญ่เนื่องมาจาก GPUs อันทรงพลังและระบบนิเวศซอฟต์แวร์ CUDA (Compute Unified Device Architecture) ที่เติบโตเต็มที่ ซึ่งกลายเป็นมาตรฐานโดยพฤตินัยสำหรับการเรียนรู้ของเครื่องที่มีประสิทธิภาพสูง การรันโมเดลขนาดใหญ่ได้อย่างมีประสิทธิภาพบนฮาร์ดแวร์สำหรับผู้บริโภคมักจะนำนักพัฒนาและผู้ที่ชื่นชอบไปสู่ข้อเสนอของ NVIDIA
โครงการริเริ่ม GAIA ของ AMD ควบคู่ไปกับฮาร์ดแวร์ NPU เฉพาะในชิป Ryzen AI แสดงถึงการเคลื่อนไหวเชิงกลยุทธ์เพื่อท้าทายการครอบงำนี้ โดยเฉพาะอย่างยิ่งในตลาดที่กำลังเติบโตสำหรับ AI บนอุปกรณ์บนแล็ปท็อปและเดสก์ท็อป ด้วยการจัดหาเครื่องมือที่ใช้งานง่าย ปรับให้เหมาะสม และเป็นโอเพนซอร์ส AMD ตั้งเป้าที่จะสร้างระบบนิเวศรอบๆ ความสามารถด้านฮาร์ดแวร์ AI ของตนเอง ทำให้แพลตฟอร์ม Ryzen AI น่าสนใจยิ่งขึ้นสำหรับนักพัฒนาและผู้ใช้ปลายทางที่สนใจในการดำเนินการ AI แบบ local การมุ่งเน้นที่การปรับให้เหมาะสมกับ NPU อย่างชัดเจนทำให้แตกต่างจากแนวทางที่เน้น GPU เป็นศูนย์กลาง และเน้นย้ำถึงประโยชน์ด้านประสิทธิภาพพลังงานที่มีอยู่ในโปรเซสเซอร์ neural เฉพาะสำหรับงาน AI ที่เฉพาะเจาะจง
การตัดสินใจเปิดตัว GAIA ภายใต้ใบอนุญาตโอเพนซอร์ส MIT ที่อนุญาตก็มีความสำคัญเชิงกลยุทธ์เช่นกัน มันเชิญชวนให้เกิดความร่วมมือและการมีส่วนร่วมจากชุมชนนักพัฒนาทั่วโลก แนวทางนี้สามารถเร่งการพัฒนาโครงการ นำไปสู่การรวมคุณสมบัติและโมเดลใหม่ๆ และส่งเสริมชุมชนที่ลงทุนในแพลตฟอร์ม AI ของ AMD AMD ยินดีรับ pull requests สำหรับการแก้ไขข้อบกพร่องและการปรับปรุงคุณสมบัติอย่างชัดเจน ส่งสัญญาณถึงความมุ่งมั่นในการพัฒนา GAIA ผ่านความพยายามร่วมกัน การเปิดเป็นโอเพนซอร์สช่วยลดอุปสรรคสำหรับนักพัฒนาในการทดลอง ผสานรวม และอาจสร้างแอปพลิเคชันเชิงพาณิชย์บนเฟรมเวิร์ก GAIA ซึ่งเป็นการกระตุ้นระบบนิเวศรอบๆ Ryzen AI ต่อไป
ในขณะที่เวอร์ชันปัจจุบันมุ่งเน้นไปที่ LLMs ขนาดเล็กที่เหมาะสำหรับการดำเนินการบนอุปกรณ์ รากฐานที่วางไว้โดย GAIA สามารถปูทางไปสู่การรองรับโมเดลและแอปพลิเคชันที่ซับซ้อนมากขึ้นเมื่อเทคโนโลยี NPU ก้าวหน้าต่อไป มันแสดงถึงคำแถลงเจตนารมณ์ที่ชัดเจนจาก AMD: ที่จะเป็นพลังสำคัญในยุคของปัญญาประดิษฐ์ส่วนบุคคลแบบ localized โดยจัดหาฮาร์ดแวร์และเครื่องมือซอฟต์แวร์ที่เข้าถึงได้ซึ่งจำเป็นต่อการนำความสามารถของ AI มาสู่มือของผู้ใช้โดยตรง อย่างปลอดภัยและมีประสิทธิภาพ ชื่อเล่น ‘Generative AI Is Awesome’ แม้ว่าอาจจะไม่เป็นทางการ แต่ก็เน้นย้ำถึงความกระตือรือร้นและความทะเยอทะยานของบริษัทในพรมแดนทางเทคโนโลยีที่พัฒนาอย่างรวดเร็วนี้