Oracle Cloud Infrastructure (OCI) Generative AI ได้รับการอัปเกรดครั้งใหญ่ ซึ่งรวมถึงการเปิดตัวโมเดล Cohere Command A และ Rerank 3.5 รวมถึงการเปิดตัว Cohere Embed 3 ที่รองรับมัลติโมดอล โมเดลใหม่เหล่านี้มุ่งหวังที่จะมอบฟังก์ชัน AI ระดับองค์กรที่แข็งแกร่งยิ่งขึ้นแก่ลูกค้า OCI และเพิ่มขีดความสามารถในการใช้งาน AI ในสถานการณ์การใช้งานต่างๆ
Command A: จุดสุดยอดของประสิทธิภาพและประสิทธิผล
Cohere’s Command A 03-2025 เป็นโมเดล Command ที่ทรงพลังที่สุดในปัจจุบัน โดยมีปริมาณงานมากกว่าผลิตภัณฑ์รุ่นก่อนหน้าถึง 150% ในขณะที่ต้องการ GPU เพียงสองตัว ตามข้อมูลที่ Cohere ให้ไว้ โมเดลนี้มีประสิทธิภาพเทียบเท่าหรือเหนือกว่า OpenAI 4o และ DeepSeekv3 ในแง่ของงานระดับองค์กรที่ใช้เอเจนต์ และมีการปรับปรุงอย่างมีนัยสำคัญในแง่ของประสิทธิภาพการคำนวณ
ประสิทธิภาพที่โดดเด่นของ Command A มาจากการออกแบบสถาปัตยกรรมและวิธีการฝึกอบรมขั้นสูง ซึ่งทำให้สามารถทำงานได้ดีเยี่ยมในการใช้งาน AI ระดับองค์กรที่ซับซ้อนต่างๆ ไม่ว่าจะเป็นการประมวลผลข้อมูลจำนวนมหาศาล การดำเนินงานอนุมานที่ซับซ้อน หรือการประมวลผลภาษาธรรมชาติแบบเรียลไทม์ Command A สามารถมอบโซลูชันที่มีประสิทธิภาพและเชื่อถือได้
คุณสมบัติหลักของ Command A ได้แก่:
หน้าต่างบริบทที่ยาวเป็นพิเศษ: รองรับความยาวบริบทสูงสุด 256k โทเค็น ทำให้โมเดลสามารถประมวลผลลำดับข้อความที่ยาวขึ้น ทำให้เข้าใจข้อมูลบริบทได้ดีขึ้น และสร้างการตอบกลับที่แม่นยำและสอดคล้องกันมากขึ้น ซึ่งหมายความว่า Command A สามารถจัดการเอกสารที่ซับซ้อน การสนทนาที่ยาว และการโต้ตอบหลายรอบ โดยไม่สูญเสียข้อมูลสำคัญ
การสร้างเสริมการดึงข้อมูลขั้นสูง (RAG): ด้วยการรวมเทคโนโลยีการสร้างเสริมการดึงข้อมูล Command A สามารถดึงข้อมูลที่เกี่ยวข้องจากข้อมูลจำนวนมหาศาล และรวมเข้ากับเนื้อหาที่สร้างขึ้น จึงช่วยปรับปรุงคุณภาพและความแม่นยำของผลลัพธ์ที่สร้างขึ้น เทคโนโลยีนี้ไม่เพียงแต่ลดการพึ่งพาความรู้จากภายนอกของโมเดลเท่านั้น แต่ยังช่วยให้ปรับตัวเข้ากับสภาพแวดล้อมข้อมูลที่มีการเปลี่ยนแปลงตลอดเวลาได้ดียิ่งขึ้น
การใช้เครื่องมือเอเจนต์ดั้งเดิม: Command A มีความสามารถในการใช้เครื่องมือเอเจนต์ดั้งเดิม ซึ่งสามารถรวมเข้ากับเครื่องมือและบริการอื่นๆ เพื่อให้ได้ฟังก์ชันที่ซับซ้อนยิ่งขึ้น ตัวอย่างเช่น สามารถโต้ตอบกับเครื่องมือค้นหา ฐานข้อมูล API ฯลฯ เพื่อรับข้อมูลที่จำเป็นหรือดำเนินการเฉพาะเจาะจง ความสามารถนี้ทำให้ Command A สามารถทำงานที่ซับซ้อนต่างๆ ได้ เช่น ระบบอัตโนมัติในการบริการลูกค้า ผู้ช่วยอัจฉริยะ และการวิเคราะห์ข้อมูล
ความปลอดภัยและความเป็นส่วนตัวระดับองค์กร: Command A ได้พิจารณาถึงความปลอดภัยและความเป็นส่วนตัวระดับองค์กรอย่างเต็มที่ในการออกแบบ และใช้มาตรการรักษาความปลอดภัยต่างๆ เพื่อปกป้องข้อมูลของลูกค้า ตัวอย่างเช่น รองรับการเข้ารหัสข้อมูล การควบคุมการเข้าถึง และฟังก์ชันการตรวจสอบ เพื่อให้มั่นใจว่าข้อมูลของลูกค้าจะไม่ถูกเข้าถึงหรือรั่วไหลโดยไม่ได้รับอนุญาต
ความสามารถด้านภาษาที่แข็งแกร่ง: Command A ได้รับการฝึกฝนใน 23 ภาษา ได้แก่ อังกฤษ ฝรั่งเศส สเปน อิตาลี เยอรมัน โปรตุเกส ญี่ปุ่น เกาหลี อาหรับ จีน รัสเซีย โปแลนด์ ตุรกี เวียดนาม ดัตช์ เช็ก อินโดนีเซีย ยูเครน โรมาเนีย กรีก ฮินดี ฮิบรู และเปอร์เซีย ทำให้สามารถประมวลผลข้อความในภาษาต่างๆ และให้บริการแก่ผู้ใช้ทั่วโลก
การป้อนและเอาต์พุตข้อความ: ปัจจุบัน Command A รองรับเฉพาะการป้อนและเอาต์พุตข้อความ ซึ่งหมายความว่าส่วนใหญ่จะใช้สำหรับการประมวลผลงานที่เกี่ยวข้องกับข้อความ เช่น การสร้างข้อความ การสรุปข้อความ การแปลข้อความ และการจัดประเภทข้อความ
หมายเหตุ: ปัจจุบันโมเดล Command A ไม่รองรับการปรับแต่งอย่างละเอียด
Rerank 3.5: เพิ่มความแม่นยำในการค้นหาขององค์กร
Rerank 3.5 เป็นโมเดลพื้นฐานการค้นหา AI ล่าสุดของ Cohere ซึ่งออกแบบมาเพื่อปรับปรุงความแม่นยำของการค้นหาขององค์กรและระบบสร้างเสริมการดึงข้อมูล (RAG) โมเดลนี้มีความสามารถในการให้เหตุผลที่ได้รับการปรับปรุง สามารถเข้าใจคำถามของผู้ใช้ที่ซับซ้อน และเข้ากันได้กับประเภทข้อมูลต่างๆ (รวมถึงเอกสารยาว อีเมล ตาราง JSON และโค้ด) นอกจากนี้ Rerank 3.5 ยังรองรับมากกว่า 100 ภาษา เพื่อตอบสนองความต้องการในการค้นหาขององค์กรทั่วโลก
Rerank 3.5 ช่วยปรับปรุงประสิทธิภาพและความพึงพอใจในการค้นหาของผู้ใช้ โดยการจัดลำดับผลการค้นหาใหม่ เพื่อให้ผลลัพธ์ที่เกี่ยวข้องที่สุดอยู่ในอันดับต้นๆ ไม่เพียงแต่สามารถใช้กับการค้นหาข้อความแบบดั้งเดิมเท่านั้น แต่ยังสามารถใช้กับการค้นหาประเภทอื่นๆ ได้หลากหลาย เช่น การค้นหารูปภาพ การค้นหาวิดีโอ และการค้นหาเสียง
คุณสมบัติหลักของ Rerank 3.5 ได้แก่:
ความสามารถในการให้เหตุผลที่ได้รับการปรับปรุง: Rerank 3.5 มีความสามารถในการให้เหตุผลที่ได้รับการปรับปรุง สามารถเข้าใจคำถามของผู้ใช้ที่ซับซ้อนได้ดียิ่งขึ้น สามารถวิเคราะห์ความหมายและบริบทของคำถาม ระบุความตั้งใจของผู้ใช้อย่างแม่นยำ และส่งคืนผลลัพธ์ที่เกี่ยวข้องที่สุด
การรองรับข้อมูลที่หลากหลาย: Rerank 3.5 เข้ากันได้กับประเภทข้อมูลต่างๆ รวมถึงเอกสารยาว อีเมล ตาราง JSON และโค้ด ซึ่งหมายความว่าสามารถประมวลผลข้อมูลจากแหล่งต่างๆ และดึงข้อมูลที่เป็นประโยชน์ออกมาได้
การรองรับหลายภาษาที่ดีขึ้น: Rerank 3.5 รองรับมากกว่า 100 ภาษา รวมถึงภาษาธุรกิจหลัก เช่น อังกฤษ อาหรับ จีน ฝรั่งเศส เยอรมัน ฮินดี ญี่ปุ่น เกาหลี โปรตุเกส รัสเซีย และสเปน ทำให้สามารถให้บริการค้นหาที่มีคุณภาพสูงแก่ผู้ใช้ทั่วโลก
ความแม่นยำในการค้นหาที่สูงขึ้น: ในการทดสอบข้อมูลทางการเงิน Rerank 3.5 มีประสิทธิภาพดีกว่า Hybris Search 23.4% และดีกว่า BM25 30.8% BM25 เป็นฟังก์ชันการจัดลำดับที่ใช้กันทั่วไปในเครื่องมือค้นหาและระบบการเรียกคืนข้อมูล เพื่อกำหนดความเกี่ยวข้องของเอกสารกับคำถามในการค้นหาที่กำหนด
การรองรับภาษาที่ขยาย: Rerank 3.5 รองรับมากกว่า 100 ภาษาได้อย่างไร
ความสามารถด้านภาษาที่หลากหลายของ Rerank 3.5 ปรากฏให้เห็นในความสามารถในการทำความเข้าใจและประมวลผลคำถามจากมากกว่า 100 ภาษา ซึ่งหมายความว่าไม่เพียงแต่สามารถเข้าใจความหมายตามตัวอักษรของคำถามเท่านั้น แต่ยังสามารถเข้าใจภูมิหลังทางวัฒนธรรมและบริบทเบื้องหลังคำถามได้อีกด้วย ตัวอย่างเช่น หากผู้ใช้ค้นหาด้วยภาษาสเปนว่า “mejores restaurantes en Madrid” Rerank 3.5 สามารถเข้าใจความตั้งใจของผู้ใช้ว่าต้องการหาร้านอาหารที่ดีที่สุดในมาดริด และส่งคืนผลการค้นหาภาษาสเปนที่เกี่ยวข้อง
เพื่อให้บรรลุเป้าหมายนี้ Rerank 3.5 ได้นำเทคโนโลยีต่างๆ มาใช้ ซึ่งรวมถึง:
ข้อมูลการฝึกอบรมหลายภาษา: Rerank 3.5 ได้รับการฝึกฝนจากข้อมูลหลายภาษาจำนวนมาก ซึ่งรวมถึงข้อความประเภทต่างๆ เช่น บทความข่าว บทความในบล็อก โพสต์บนโซเชียลมีเดีย และบทวิจารณ์ผลิตภัณฑ์
การฝังข้ามภาษา: Rerank 3.5 ใช้เทคโนโลยีการฝังข้ามภาษา เพื่อแมปคำในภาษาต่างๆ เข้ากับพื้นที่เวกเตอร์เดียวกัน ซึ่งทำให้แบบจำลองสามารถเข้าใจความสัมพันธ์ทางความหมายระหว่างภาษาต่างๆ และส่งคืนผลการค้นหาข้ามภาษาที่เกี่ยวข้อง
การตรวจจับและการแปลภาษา: Rerank 3.5 สามารถตรวจจับภาษาของคำถามของผู้ใช้ได้โดยอัตโนมัติ และแปลเป็นภาษาอังกฤษหรือภาษาอื่นที่รองรับ ซึ่งทำให้แบบจำลองสามารถประมวลผลคำถามในภาษาต่างๆ และส่งคืนผลการค้นหาที่เกี่ยวข้อง
ด้วยการใช้เทคโนโลยีเหล่านี้ Rerank 3.5 สามารถให้บริการค้นหาที่มีคุณภาพสูงแก่ผู้ใช้ทั่วโลก ไม่ว่าพวกเขาจะใช้ภาษาใดในการค้นหา
ความสามารถในการให้เหตุผลที่ได้รับการปรับปรุง: Rerank 3.5 เข้าใจคำถามที่ซับซ้อนได้อย่างไร
ความสามารถในการให้เหตุผลของ Rerank 3.5 ปรากฏให้เห็นในความสามารถในการเข้าใจคำถามที่ซับซ้อน และดึงข้อมูลที่เป็นประโยชน์ออกมา ตัวอย่างเช่น หากผู้ใช้ค้นหา “หุ้นของบริษัทเทคโนโลยีใดบ้างที่มีประสิทธิภาพดีกว่าปีที่แล้ว” Rerank 3.5 สามารถเข้าใจความตั้งใจของผู้ใช้ว่าต้องการค้นหาบริษัทเทคโนโลยีที่มีหุ้นมีประสิทธิภาพดีกว่าปีที่แล้ว
เพื่อให้บรรลุเป้าหมายนี้ Rerank 3.5 ได้นำเทคโนโลยีต่างๆ มาใช้ ซึ่งรวมถึง:
การวิเคราะห์ความหมาย: Rerank 3.5 ใช้เทคโนโลยีการวิเคราะห์ความหมาย เพื่อวิเคราะห์โครงสร้างความหมายและบริบทของคำถาม ซึ่งทำให้แบบจำลองสามารถเข้าใจความหมายของคำถาม และระบุความตั้งใจของผู้ใช้
การระบุเอนทิตี: Rerank 3.5 ใช้เทคโนโลยีการระบุเอนทิตี เพื่อระบุเอนทิตีในคำถาม เช่น บริษัท สถานที่ และบุคคล ซึ่งทำให้แบบจำลองสามารถเชื่อมโยงคำถามกับเอนทิตีที่เกี่ยวข้อง และส่งคืนผลการค้นหาที่เกี่ยวข้อง
การดึงความสัมพันธ์: Rerank 3.5 ใช้เทคโนโลยีการดึงความสัมพันธ์ เพื่อดึงความสัมพันธ์ระหว่างเอนทิตีในคำถาม ซึ่งทำให้แบบจำลองสามารถเข้าใจความหมายของคำถาม และส่งคืนผลการค้นหาที่เกี่ยวข้อง
ด้วยการใช้เทคโนโลยีเหล่านี้ Rerank 3.5 สามารถเข้าใจคำถามที่ซับซ้อน และส่งคืนผลการค้นหาที่เกี่ยวข้อง ซึ่งจะช่วยปรับปรุงประสิทธิภาพและความพึงพอใจในการค้นหาของผู้ใช้
ลูกค้า OCI สามารถใช้ประโยชน์จากโมเดลเหล่านี้ได้อย่างไร:
ลูกค้า OCI สามารถใช้ประโยชน์จากโมเดล Cohere เหล่านี้ได้หลายวิธี ซึ่งรวมถึง:
การบูรณาการทันที: โมเดลเหล่านี้สามารถเข้าถึงได้อย่างราบรื่นผ่านอินเทอร์เฟซแชท API หรือจุดสิ้นสุดเฉพาะ โดยไม่ต้องกังวลเกี่ยวกับการจัดการโครงสร้างพื้นฐาน ซึ่งช่วยให้ลูกค้าสามารถรวมโมเดลเหล่านี้เข้ากับแอปพลิเคชันของตนเองได้อย่างง่ายดาย โดยไม่ต้องทำการกำหนดค่าและปรับใช้ที่ซับซ้อน
การทำให้การพัฒนา AI ง่ายขึ้น: บริการ OCI Generative AI มีชุดเครื่องมือและบริการที่สมบูรณ์ ซึ่งสามารถช่วยลูกค้าทำให้กระบวนการพัฒนา AI ง่ายขึ้น เครื่องมือและบริการเหล่านี้รวมถึง:
- การเตรียมข้อมูล: บริการ OCI Generative AI มีชุดเครื่องมือเตรียมข้อมูล ซึ่งสามารถช่วยลูกค้าทำความสะอาด แปลง และเตรียมข้อมูล เพื่อใช้สำหรับการฝึกอบรมและการอนุมานแบบจำลอง AI
- การฝึกอบรมแบบจำลอง: บริการ OCI Generative AI มีชุดเครื่องมือฝึกอบรมแบบจำลอง ซึ่งสามารถช่วยลูกค้าฝึกอบรมแบบจำลอง AI ของตนเอง เครื่องมือเหล่านี้รองรับประเภทและเฟรมเวิร์กแบบจำลองต่างๆ เช่น TensorFlow, PyTorch และ Scikit-learn
- การปรับใช้แบบจำลอง: บริการ OCI Generative AI มีชุดเครื่องมือการปรับใช้แบบจำลอง ซึ่งสามารถช่วยลูกค้าปรับใช้แบบจำลอง AI ที่ได้รับการฝึกอบรมในสภาพแวดล้อมการผลิต
- การตรวจสอบแบบจำลอง: บริการ OCI Generative AI มีชุดเครื่องมือตรวจสอบแบบจำลอง ซึ่งสามารถช่วยลูกค้าตรวจสอบประสิทธิภาพและความแม่นยำของแบบจำลอง AI
การทำให้กระบวนการทำงาน RAG ง่ายขึ้น: ใช้ Command A เพื่อสร้างเนื้อหา และใช้ Rerank 3.5 เพื่อเพิ่มประสิทธิภาพผลลัพธ์ที่ได้รับการปรับปรุง ทำให้กระบวนการ RAG ที่ซับซ้อนมีประสิทธิภาพและง่ายขึ้น
ความหลากหลายของสถานการณ์การใช้งาน:
โมเดลเหล่านี้สามารถใช้ในสถานการณ์การใช้งานขององค์กรต่างๆ ซึ่งรวมถึง:
- การบริการลูกค้า: Command A และ Rerank 3.5 สามารถใช้เพื่อสร้างแชทบอทบริการลูกค้าอัจฉริยะ ซึ่งสามารถตอบคำถามของลูกค้า แก้ไขข้อกังวลของลูกค้า และให้บริการส่วนบุคคล
- การสร้างเนื้อหา: Command A สามารถใช้เพื่อสร้างเนื้อหาข้อความประเภทต่างๆ เช่น บทความข่าว บทความในบล็อก คำอธิบายผลิตภัณฑ์ และโพสต์บนโซเชียลมีเดีย
- การค้นหา: Rerank 3.5 สามารถใช้เพื่อปรับปรุงความแม่นยำและประสิทธิภาพของการค้นหาขององค์กร ช่วยให้ผู้ใช้ค้นหาข้อมูลที่ต้องการได้อย่างรวดเร็ว
- การวิเคราะห์ข้อมูล: Command A และ Rerank 3.5 สามารถใช้เพื่อวิเคราะห์ข้อมูลประเภทต่างๆ ดึงข้อมูลที่เป็นประโยชน์ และช่วยเหลือองค์กรในการตัดสินใจที่ดีขึ้น
- การจัดการความรู้: สามารถสร้างฐานความรู้อัจฉริยะ ซึ่งพนักงานสามารถค้นหาข้อมูลที่ต้องการได้อย่างรวดเร็ว ปรับปรุงประสิทธิภาพการทำงาน
บริการ OCI Generative AI ช่วยให้องค์กรสร้างโซลูชัน AI ที่เป็นนวัตกรรมต่างๆ ด้วยการมอบโมเดล AI ที่มีประสิทธิภาพสูง อเนกประสงค์ และปรับขนาดได้ จึงช่วยเพิ่มความสามารถในการแข่งขันและมูลค่าทางธุรกิจ
สำหรับรายละเอียดการบูรณาการและข้อมูลราคา โปรดดูเอกสารประกอบบริการ Generative AI ของเรา หรือติดต่อตัวแทน Oracle ของคุณ