IBM มุ่งเป้าเพิ่มประสิทธิภาพองค์กรด้วย AI ที่ฉลาดและเล็กลง

ภูมิทัศน์ของปัญญาประดิษฐ์ (AI) ส่วนใหญ่ถูกกำหนดโดยการแข่งขันเพื่อขยายขนาด โดยบริษัทจำนวนมากต่างแข่งขันกันเพื่อสร้างแบบจำลองที่ใหญ่ที่สุดเท่าที่จะเป็นไปได้ ในขณะที่บางบริษัทดึงดูดความสนใจด้วยแบบจำลองที่ใช้พลังการประมวลผลมหาศาล แต่ธุรกิจจำนวนมากกำลังมองหาโซลูชันที่ใช้งานได้จริงซึ่งเหมาะสมกับความต้องการและข้อจำกัดด้านทรัพยากรของตน

IBM กำลังวางตำแหน่งตัวเองในเชิงกลยุทธ์เพื่อตอบสนองความต้องการที่เพิ่มขึ้นนี้ ยักษ์ใหญ่ด้านเทคโนโลยีและการให้คำปรึกษาระดับโลกเพิ่งเปิดตัว Granite large language model (LLM) รุ่นต่อไป โดยเน้นที่ระบบขนาดกะทัดรัดและมีประสิทธิภาพซึ่งปรับให้เหมาะกับการใช้งานทางธุรกิจในโลกแห่งความเป็นจริง

การปรับแต่ง Granite Series: ความสามารถที่เน้น, ลดขนาด

โมเดล Granite 3.2 ของ IBM แสดงถึงความต่อเนื่องของกลยุทธ์ของบริษัทในการพัฒนาโมเดลขนาดเล็ก โมเดลเหล่านี้ได้รับการออกแบบมาเพื่อมอบความสามารถเฉพาะโดยไม่ต้องการทรัพยากรการประมวลผลมากเกินไป แนวทางนี้สอดคล้องกับความต้องการเชิงปฏิบัติของธุรกิจจำนวนมากที่ต้องการโซลูชัน AI ที่มีประสิทธิภาพและคุ้มค่า

โมเดลเหล่านี้เปิดให้ใช้งานได้อย่างอิสระภายใต้ใบอนุญาต Apache 2.0 บน Hugging Face บางเวอร์ชันสามารถเข้าถึงได้ผ่านแพลตฟอร์ม watsonx.ai ของ IBM เอง รวมถึง Ollama, Replicate และ LM Studio การเข้าถึงที่กว้างขวางนี้ได้รับการปรับปรุงเพิ่มเติมโดยแผนการที่จะรวมโมเดลเหล่านี้เข้ากับ Red Hat Enterprise Linux AI 1.5 ในอีกไม่กี่เดือนข้างหน้า ซึ่งตอกย้ำความมุ่งมั่นของ IBM ต่อ AI แบบโอเพนซอร์ส

ปฏิวัติการประมวลผลเอกสาร: The Granite Vision Model

คุณสมบัติที่โดดเด่นของรุ่นนี้คือแบบจำลองภาษาภาพแบบใหม่ที่ออกแบบมาโดยเฉพาะสำหรับงานทำความเข้าใจเอกสาร แบบจำลองนี้แสดงถึงความก้าวหน้าครั้งสำคัญในวิธีที่ธุรกิจสามารถโต้ตอบและดึงข้อมูลจากเอกสารได้ ตามการทดสอบเกณฑ์มาตรฐานภายในของ IBM โมเดลใหม่นี้ทำงานได้เทียบเท่าหรือเหนือกว่าโมเดลคู่แข่งที่มีขนาดใหญ่กว่ามากในการทดสอบที่ออกแบบมาโดยเฉพาะเพื่อสะท้อนปริมาณงานระดับองค์กร

การพัฒนาความสามารถนี้เกี่ยวข้องกับการใช้ประโยชน์จากชุดเครื่องมือ Docling แบบโอเพนซอร์สของ IBM ชุดเครื่องมือนี้ใช้ในการประมวลผลเอกสาร PDF จำนวน 85 ล้านฉบับ สร้างคู่คำถาม-คำตอบสังเคราะห์ 26 ล้านคู่ การเตรียมการที่ครอบคลุมนี้ทำให้มั่นใจได้ว่าแบบจำลองมีความพร้อมในการจัดการเวิร์กโฟลว์ที่เน้นเอกสารซึ่งเป็นลักษณะของสภาพแวดล้อมขององค์กรจำนวนมาก รวมถึงบริการทางการเงิน การดูแลสุขภาพ และกฎหมาย

สถิติสำคัญเน้นย้ำถึงขนาดและประสิทธิภาพ:

  • 85 ล้าน: จำนวนเอกสาร PDF ที่ประมวลผลโดยใช้ชุดเครื่องมือ Docling ของ IBM เพื่อฝึกอบรมโมเดลการมองเห็นใหม่ ชุดข้อมูลขนาดใหญ่นี้เน้นย้ำถึงความพร้อมของแบบจำลองสำหรับความท้าทายในการประมวลผลเอกสารในโลกแห่งความเป็นจริง
  • 30%: การลดขนาดที่ทำได้ในโมเดลความปลอดภัยของ Granite Guardian ในขณะที่ยังคงรักษาระดับประสิทธิภาพไว้ได้ สิ่งนี้แสดงให้เห็นถึงความมุ่งมั่นของ IBM ในการเพิ่มประสิทธิภาพโดยไม่สูญเสียความปลอดภัย
  • 2 ปี: ช่วงการคาดการณ์สูงสุดของโมเดล TinyTimeMixers ของ IBM แม้ว่าจะมีพารามิเตอร์น้อยกว่า 10 ล้านพารามิเตอร์ สิ่งนี้แสดงให้เห็นถึงความสามารถที่โดดเด่นของโมเดลพิเศษเหล่านี้สำหรับการคาดการณ์ระยะยาว

การให้เหตุผลขั้นสูง: Chain of Thought และ Inference Scaling

IBM ยังได้รวมการให้เหตุผล “chain of thought” ไว้ใน Granite 3.2 เวอร์ชันพารามิเตอร์ 2B และ 8B คุณลักษณะนี้ช่วยให้แบบจำลองสามารถเข้าถึงปัญหาได้อย่างมีโครงสร้างและเป็นระเบียบ โดยแบ่งปัญหาออกเป็นขั้นตอนที่สะท้อนกระบวนการให้เหตุผลของมนุษย์ สิ่งนี้ช่วยเพิ่มความสามารถของแบบจำลองในการจัดการกับงานที่ซับซ้อนซึ่งต้องใช้การอนุมานเชิงตรรกะ

ที่สำคัญ ผู้ใช้มีความยืดหยุ่นในการเปิดใช้งานหรือปิดใช้งานความสามารถนี้ขึ้นอยู่กับความซับซ้อนของงาน ความสามารถในการปรับตัวนี้เป็นตัวสร้างความแตกต่างที่สำคัญ ช่วยให้องค์กรสามารถเพิ่มประสิทธิภาพการใช้ทรัพยากรตามความต้องการเฉพาะของตน สำหรับงานที่ง่ายกว่า การให้เหตุผลแบบ chain of thought สามารถปิดใช้งานได้เพื่อประหยัดพลังการประมวลผล ในขณะที่สำหรับปัญหาที่ซับซ้อนกว่านั้น สามารถเปิดใช้งานได้เพื่อใช้ประโยชน์จากศักยภาพในการให้เหตุผลของแบบจำลองอย่างเต็มที่

การปรับปรุงเหล่านี้ทำให้ประสิทธิภาพของแบบจำลอง 8B ดีขึ้นอย่างมากในเกณฑ์มาตรฐานการปฏิบัติตามคำสั่ง ซึ่งเหนือกว่าเวอร์ชันก่อนหน้า ด้วยวิธีการ “inference scaling” ที่เป็นนวัตกรรมใหม่ IBM ได้แสดงให้เห็นว่าแม้แต่แบบจำลองที่ค่อนข้างเล็กนี้ก็สามารถแข่งขันกับระบบที่ใหญ่กว่ามากได้อย่างมีประสิทธิภาพในเกณฑ์มาตรฐานการให้เหตุผลทางคณิตศาสตร์ สิ่งนี้เน้นย้ำถึงศักยภาพของแบบจำลองขนาดเล็กที่ได้รับการปรับปรุงให้มีประสิทธิภาพที่น่าประทับใจในโดเมนเฉพาะ

ความปลอดภัยและความแตกต่าง: การอัปเดต Granite Guardian

โมเดลความปลอดภัยของ Granite Guardian ซึ่งออกแบบมาเพื่อตรวจสอบและลดความเสี่ยงที่อาจเกิดขึ้นจากเนื้อหาที่สร้างโดย AI ได้รับการอัปเดตที่สำคัญเช่นกัน โมเดลเหล่านี้มีขนาดลดลง 30% ในขณะที่ยังคงรักษาระดับประสิทธิภาพไว้ได้ การเพิ่มประสิทธิภาพนี้มีส่วนช่วยให้มีประสิทธิภาพมากขึ้นและลดการใช้ทรัพยากร

นอกจากนี้ โมเดลเหล่านี้ยังมีคุณสมบัติที่เรียกว่า “verbalized confidence” คุณลักษณะนี้ให้การประเมินความเสี่ยงที่ละเอียดยิ่งขึ้นโดยรับทราบระดับความไม่แน่นอนในการตรวจสอบความปลอดภัย แทนที่จะให้การจำแนกประเภทที่ปลอดภัย/ไม่ปลอดภัยแบบไบนารี โมเดลสามารถแสดงระดับความเชื่อมั่นที่แตกต่างกันในการประเมิน ให้ผู้ใช้ได้รับการประเมินที่ให้ข้อมูลและโปร่งใสมากขึ้น

TinyTimeMixers: การคาดการณ์ระยะยาวสำหรับการวางแผนเชิงกลยุทธ์

นอกเหนือจากการอัปเดต Granite แล้ว IBM ยังได้เปิดตัว TinyTimeMixers รุ่นต่อไปอีกด้วย โมเดลเหล่านี้มีขนาดเล็กอย่างน่าทึ่ง โดยมีพารามิเตอร์น้อยกว่า 10 ล้านพารามิเตอร์ ซึ่งเป็นเศษเสี้ยวของขนาดของโมเดลอื่นๆ ในอุตสาหกรรม แม้จะมีขนาดกะทัดรัด แต่โมเดลพิเศษเหล่านี้สามารถคาดการณ์ข้อมูลอนุกรมเวลาได้นานถึงสองปีในอนาคต

ความสามารถนี้มีประโยชน์อย่างยิ่งสำหรับการใช้งานทางธุรกิจที่หลากหลาย รวมถึง:

  • การวิเคราะห์แนวโน้มทางการเงิน: การคาดการณ์ความเคลื่อนไหวของตลาดและการระบุโอกาสในการลงทุน
  • การวางแผนห่วงโซ่อุปทาน: การเพิ่มประสิทธิภาพระดับสินค้าคงคลังและการคาดการณ์ความผันผวนของอุปสงค์
  • การจัดการสินค้าคงคลังค้าปลีก: การตรวจสอบให้แน่ใจว่ามีระดับสต็อกเพียงพอเพื่อตอบสนองความต้องการของลูกค้าในขณะที่ลดของเสีย

แอปพลิเคชันเหล่านี้ทั้งหมดอาศัยความสามารถในการตัดสินใจอย่างชาญฉลาดโดยอิงจากการคาดการณ์ระยะยาว ทำให้โมเดล TinyTimeMixers เป็นเครื่องมือที่มีประสิทธิภาพสำหรับการวางแผนธุรกิจเชิงกลยุทธ์

การจัดการกับข้อจำกัดทางธุรกิจในโลกแห่งความเป็นจริง

ความสามารถในการสลับความสามารถในการให้เหตุผลภายในโมเดล Granite เป็นการจัดการกับความท้าทายในทางปฏิบัติในการนำ AI ไปใช้โดยตรง แนวทางการให้เหตุผลทีละขั้นตอน แม้จะมีประสิทธิภาพ แต่ต้องใช้พลังการประมวลผลจำนวนมากซึ่งไม่จำเป็นเสมอไป ด้วยการทำให้คุณลักษณะนี้เป็นทางเลือก IBM ช่วยให้องค์กรสามารถลดต้นทุนการประมวลผลสำหรับงานที่ง่ายกว่า ในขณะที่ยังคงตัวเลือกในการให้เหตุผลขั้นสูงสำหรับปัญหาที่ซับซ้อนกว่า

แนวทางนี้สะท้อนให้เห็นถึงความเข้าใจอย่างลึกซึ้งเกี่ยวกับข้อจำกัดทางธุรกิจในโลกแห่งความเป็นจริง ซึ่งประสิทธิภาพและความคุ้มค่ามักมีความสำคัญพอๆ กับประสิทธิภาพดิบ การมุ่งเน้นของ IBM ในการนำเสนอโซลูชันที่ใช้งานได้จริงซึ่งสามารถปรับให้เข้ากับความต้องการทางธุรกิจเฉพาะได้นั้นเป็นตัวสร้างความแตกต่างที่สำคัญในตลาด AI ที่มีผู้คนหนาแน่นมากขึ้น

ได้รับแรงผลักดัน: หลักฐานของผลกระทบในทางปฏิบัติ

กลยุทธ์ของ IBM ในการพัฒนาแบบจำลองขนาดเล็กที่เชี่ยวชาญดูเหมือนจะสะท้อนกับตลาด โมเดล Granite 3.1 8B รุ่นก่อนหน้านี้เพิ่งประสบความสำเร็จอย่างมากใน Salesforce LLM Benchmark for Customer Relationship Management (CRM) เกณฑ์มาตรฐานนี้ได้รับการออกแบบมาโดยเฉพาะเพื่อประเมินประสิทธิภาพของ LLM ในงานที่เกี่ยวข้องกับ CRM เช่น การวิเคราะห์การโต้ตอบกับลูกค้าและการสร้างเนื้อหาส่วนบุคคล

ประสิทธิภาพที่แข็งแกร่งของโมเดล Granite 3.1 8B ในเกณฑ์มาตรฐานนี้ชี้ให้เห็นว่าแบบจำลองขนาดเล็กที่เชี่ยวชาญสามารถตอบสนองความต้องการทางธุรกิจเฉพาะได้อย่างมีประสิทธิภาพ สิ่งนี้เป็นหลักฐานเพิ่มเติมว่าแนวทางของ IBM ไม่เพียงแต่มีเหตุผลในทางทฤษฎีเท่านั้น แต่ยังสามารถนำไปใช้ได้จริงอีกด้วย

มุ่งเน้นที่ประสิทธิภาพ การผสานรวม และผลกระทบในโลกแห่งความเป็นจริง

Sriram Raghavan รองประธานฝ่ายวิจัย AI ของ IBM สรุปปรัชญาของบริษัทไว้อย่างกระชับว่า: “ยุคต่อไปของ AI เกี่ยวกับประสิทธิภาพ การผสานรวม และผลกระทบในโลกแห่งความเป็นจริง ซึ่งองค์กรต่างๆ สามารถบรรลุผลลัพธ์ที่ทรงพลังได้โดยไม่ต้องใช้จ่ายด้านการประมวลผลมากเกินไป การพัฒนา Granite ล่าสุดของ IBM มุ่งเน้นไปที่โซลูชันแบบเปิดแสดงให้เห็นถึงอีกก้าวหนึ่งในการทำให้ AI เข้าถึงได้ง่ายขึ้น คุ้มค่า และมีคุณค่าสำหรับองค์กรสมัยใหม่”

คำแถลงนี้สรุปความมุ่งมั่นของ IBM ในการพัฒนาโซลูชัน AI ที่ไม่เพียงแต่มีความก้าวหน้าทางเทคโนโลยีเท่านั้น แต่ยังใช้งานได้จริง เข้าถึงได้ และสอดคล้องกับความต้องการในโลกแห่งความเป็นจริงของธุรกิจ การมุ่งเน้นไปที่โซลูชันแบบเปิดยังตอกย้ำความทุ่มเทของ IBM ในการส่งเสริมความร่วมมือและนวัตกรรมภายในชุมชน AI การเปลี่ยนแปลงที่เน้นจากการสร้างแบบจำลองที่ใหญ่ที่สุดไปสู่การสร้างเครื่องมือ AI ที่ให้คุณค่าที่จับต้องได้และช่วยให้ธุรกิจบรรลุวัตถุประสงค์เชิงกลยุทธ์