ความท้าทายในการจับภาพและการเข้าถึงความรู้จากกิจกรรม
วิธีการดั้งเดิมในการจับภาพความรู้จากกิจกรรมมักมีข้อบกพร่อง ซึ่งนำไปสู่ความท้าทายที่สำคัญในการเข้าถึงและใช้ประโยชน์จากข้อมูลเชิงลึกที่มีค่า ความท้าทายเหล่านี้รวมถึง:
- วิธีการจับภาพที่ไม่เพียงพอ: การจดบันทึกแบบดั้งเดิมมักจะไม่สมบูรณ์และเป็นอัตวิสัย ทำให้ข้อมูลที่สำคัญที่แบ่งปันระหว่างกิจกรรมสูญหายไป
- กระบวนการตรวจสอบที่ไม่มีประสิทธิภาพ: การตรวจสอบบันทึกที่ยาวเพื่อค้นหาข้อมูลเฉพาะต้องใช้เวลานานและไม่มีประสิทธิภาพ สร้างอุปสรรคต่อการเก็บรักษาและการแบ่งปันความรู้
- การเข้าถึงที่จำกัดสำหรับผู้เข้าร่วมทางไกล: บุคคลที่ไม่สามารถเข้าร่วมกิจกรรมต้องเผชิญกับอุปสรรคที่สำคัญในการเข้าถึงความรู้ที่แบ่งปัน ซึ่งส่งผลกระทบต่อภาคส่วนต่างๆ เช่น การศึกษา สื่อ และภาครัฐ ซึ่งการเรียกคืนข้อมูลเป็นสิ่งสำคัญ
เพื่อเอาชนะความท้าทายเหล่านี้ Infosys ได้ร่วมมือกับ AWS เพื่อพัฒนา Infosys Event AI ซึ่งเป็นโซลูชันที่ครอบคลุมซึ่งออกแบบมาเพื่อปลดล็อกข้อมูลเชิงลึกที่สร้างขึ้นระหว่างกิจกรรม แพลตฟอร์มนวัตกรรมนี้ใช้ประโยชน์จากพลังของบริการ AWS เพื่อปรับปรุงการได้มาซึ่งสตรีมสด การประมวลผลการถอดเสียงแบบเรียลไทม์ การจัดทำดัชนีฐานความรู้สำหรับการดึงข้อมูลที่มีประสิทธิภาพ การสร้างสรุปเซสชันอัตโนมัติ และการจัดหาผู้ช่วยแชทที่ขับเคลื่อนด้วย AI สำหรับ Q&A แบบโต้ตอบ
พลังของบริการ AWS
Infosys Event AI ใช้ประโยชน์จากพลังของบริการ AWS หลายรายการเพื่อส่งมอบฟังก์ชันหลัก รวมถึง:
- AWS Elemental MediaLive: บริการประมวลผลวิดีโอที่เข้ารหัสสตรีมวิดีโอสด ทำให้มั่นใจได้ถึงการส่งมอบวิดีโอคุณภาพสูง
- AWS Elemental MediaConnect: บริการขนส่งวิดีโอที่สร้างเวิร์กโฟลว์วิดีโอสด ช่วยให้การขนส่งสตรีมวิดีโอไปยังคลาวด์มีความปลอดภัยและเชื่อถือได้
- Amazon Bedrock: บริการที่มีการจัดการอย่างเต็มรูปแบบซึ่งมีตัวเลือกของโมเดลภาษาขนาดใหญ่ (LLM) ชั้นนำของอุตสาหกรรมเพื่อสร้างแอปพลิเคชัน AI เชิงกำเนิด ปรับปรุงความสามารถของแพลตฟอร์มในการวิเคราะห์และสรุปเนื้อหากิจกรรม
- Amazon Nova Pro: โมเดลหลายรูปแบบที่มีความสามารถสูง ซึ่งสร้างสมดุลระหว่างความแม่นยำ ความเร็ว และต้นทุน ทำให้สามารถแปลการถอดเสียงได้หลายภาษา และให้การเข้าถึงทั่วโลก
ฟังก์ชันหลักของ Infosys Event AI
Infosys Event AI นำเสนอช่วงของฟังก์ชันหลักที่ปรับปรุงการเข้าถึงและปรับปรุงการดึงความรู้ รวมถึง:
- การได้มาซึ่งสตรีมสดที่ราบรื่นจากแหล่งที่มาในองค์กร: แพลตฟอร์มช่วยให้สามารถจับภาพและขนส่งสตรีมวิดีโอสดจากแหล่งที่มาในองค์กรไปยังคลาวด์ได้อย่างราบรื่น ทำให้มั่นใจได้ถึงการส่งมอบวิดีโอคุณภาพสูง
- การประมวลผลการถอดเสียงแบบเรียลไทม์สำหรับการแปลงคำพูดเป็นข้อความ: ระบบใช้ประโยชน์จากการประมวลผลการถอดเสียงแบบเรียลไทม์เพื่อแปลงคำพูดเป็นข้อความ ทำให้ผู้เข้าร่วมสามารถเข้าถึงได้แบบเรียลไทม์
- การประมวลผลหลังกิจกรรมและการจัดทำดัชนีฐานความรู้สำหรับการดึงข้อมูลที่มีโครงสร้าง: แพลตฟอร์มทำการประมวลผลหลังกิจกรรมโดยอัตโนมัติ จัดทำดัชนีฐานความรู้เพื่อการดึงข้อมูลที่ราบรื่น และทำให้มั่นใจได้ว่าข้อมูลเชิงลึกที่มีค่าสามารถเข้าถึงได้ง่าย
- การสร้างบทสรุปเซสชันและข้อมูลเชิงลึกที่สำคัญโดยอัตโนมัติเพื่อปรับปรุงการเข้าถึง: ระบบสร้างบทสรุปเซสชันและข้อมูลเชิงลึกที่สำคัญโดยอัตโนมัติ ช่วยให้ผู้ใช้เข้าใจสาระสำคัญของกิจกรรมได้อย่างรวดเร็วโดยไม่ต้องตรวจสอบการถอดเสียงที่ยาว
- ผู้ช่วยที่ใช้แชทที่ขับเคลื่อนด้วย AI สำหรับ Q&A แบบโต้ตอบและการดึงความรู้อย่างมีประสิทธิภาพจากเซสชันกิจกรรม: แพลตฟอร์มมีผู้ช่วยแชทที่ขับเคลื่อนด้วย AI ที่ช่วยให้ Q&A แบบโต้ตอบและการดึงความรู้อย่างมีประสิทธิภาพจากเซสชันกิจกรรม ทำให้ผู้ใช้สามารถเข้าถึงข้อมูลที่ต้องการได้ทันที
การได้มาซึ่งสตรีมสดที่ราบรื่น: ภาพรวมโดยละเอียด
กระบวนการจับภาพและขนส่งสตรีมวิดีโอสดจากแหล่งที่มาในองค์กรไปยังคลาวด์เป็นขั้นตอนสำคัญในเวิร์กโฟลว์ Infosys Event AI กระบวนการนี้ช่วยให้มั่นใจได้ถึงการส่งมอบวิดีโอคุณภาพสูง และเปิดใช้งานการถอดเสียงและการวิเคราะห์แบบเรียลไทม์
ระบบใช้โปรโตคอล Secure Reliable Transport (SRT) เพื่อขนส่งสตรีมไปยังคลาวด์อย่างปลอดภัยและเชื่อถือได้ผ่าน MediaConnect จากนั้น MediaLive จะรับและประมวลผลสตรีมที่นำเข้า ซึ่งจะเข้ารหัสวิดีโอแบบเรียลไทม์และสร้างเอาต์พุตที่จำเป็น
เวิร์กโฟลว์เป็นไปตามขั้นตอนเหล่านี้:
- กล้องที่เปิดใช้งาน IP หรือตัวเข้ารหัสภาคพื้นดินแปลงสตรีมที่ไม่ใช่ IP เป็นสตรีม IP และส่งผ่านโปรโตคอล SRT ไปยัง MediaConnect เพื่อการนำเข้ากิจกรรมสด
- MediaConnect ส่งสตรีมไปยัง MediaLive อย่างปลอดภัยเพื่อการประมวลผล ทำให้มั่นใจได้ถึงการส่งมอบวิดีโอคุณภาพสูง
การประมวลผลการถอดเสียงแบบเรียลไทม์: ปลดล็อกการเข้าถึง
การประมวลผลการถอดเสียงแบบเรียลไทม์เป็นองค์ประกอบสำคัญของโซลูชัน Infosys Event AI ซึ่งช่วยให้ผู้เข้าร่วมสามารถเข้าถึงได้แบบเรียลไทม์ กระบวนการนี้แปลงคำพูดเป็นข้อความโดยมีความหน่วงน้อยที่สุด ทำให้ได้รับประสบการณ์ที่ราบรื่นและโต้ตอบได้
เพื่อให้สามารถเข้าถึงได้แบบเรียลไทม์ ระบบใช้ MediaLive เพื่อแยกเสียงออกจากสตรีมวิดีโอสด จากนั้นสตรีมเสียงเท่านั้นนี้จะถูกส่งต่อไปยังโมดูลถอดเสียงแบบเรียลไทม์ ซึ่งโฮสต์อยู่บนอินสแตนซ์ Amazon Elastic Compute Cloud (Amazon EC2) โมดูลถอดเสียงแบบเรียลไทม์ใช้ Amazon Transcribe stream API เพื่อสร้างการถอดเสียงโดยมีความหน่วงน้อยที่สุด จากนั้นการถอดเสียงแบบเรียลไทม์เหล่านี้จะถูกส่งไปยังเว็บไคลเอ็นต์ในองค์กรผ่านการเชื่อมต่อ WebSocket ที่ปลอดภัย
ขั้นตอนเวิร์กโฟลว์สำหรับส่วนนี้ของโซลูชันเป็นไปตามขั้นตอนเหล่านี้:
- MediaLive แยกเสียงออกจากสตรีมสดและสร้างสตรีมเสียงเท่านั้น ซึ่งจะส่งไปยังโมดูลถอดเสียงแบบเรียลไทม์ที่ทำงานบนอินสแตนซ์ EC2 MediaLive ยังแยกเอาต์พุตเสียงเท่านั้นและจัดเก็บไว้ในบัคเก็ต Amazon Simple Storage Service (Amazon S3) ซึ่งอำนวยความสะดวกให้กับเวิร์กโฟลว์การประมวลผลภายหลัง
- โมดูลถอดเสียงแบบเรียลไทม์รับสตรีมเสียงเท่านั้นและใช้ Amazon Transcribe stream API เพื่อสร้างการถอดเสียงแบบเรียลไทม์โดยมีความหน่วงต่ำ ทำให้มั่นใจได้ถึงการเข้าถึงแบบเรียลไทม์
- โมดูลถอดเสียงแบบเรียลไทม์ใช้ WebSocket ที่ปลอดภัยเพื่อส่งข้อความที่ถอดเสียง ทำให้มีการเชื่อมต่อที่ปลอดภัยและเชื่อถือได้
- เว็บไคลเอ็นต์ในองค์กรรรับข้อความที่ถอดเสียงผ่านการเชื่อมต่อ WebSocket ที่ปลอดภัยผ่าน Amazon CloudFront และแสดงบน UI ของเว็บไคลเอ็นต์ ทำให้ผู้ใช้สามารถเข้าถึงข้อความที่ถอดเสียงได้ทันที
การประมวลผลหลังกิจกรรมและการจัดทำดัชนีฐานความรู้: ปรับปรุงการดึงข้อมูล
หลังจากกิจกรรมสิ้นสุดลง สื่อและบันทึกการถอดเสียงจะถูกจัดเก็บอย่างปลอดภัยใน Amazon S3 เพื่อการวิเคราะห์เพิ่มเติม เวิร์กโฟลว์แบบไร้เซิร์ฟเวอร์ที่ขับเคลื่อนด้วยเหตุการณ์โดยใช้ Amazon EventBridge และ AWS Lambda จะทำการประมวลผลหลังกิจกรรมโดยอัตโนมัติ Amazon Transcribe ประมวลผลเนื้อหาที่บันทึกไว้เพื่อสร้างการถอดเสียงขั้นสุดท้าย ซึ่งจะถูกจัดทำดัชนีและจัดเก็บไว้ในฐานความรู้ Amazon Bedrock เพื่อการดึงข้อมูลที่ราบรื่น นอกจากนี้ Amazon Nova Pro ยังช่วยให้สามารถแปลการถอดเสียงได้หลายภาษา ทำให้สามารถเข้าถึงได้ทั่วโลกเมื่อจำเป็น ด้วยคุณภาพและความเร็ว Amazon Nova Pro จึงเหมาะอย่างยิ่งสำหรับกรณีการใช้งานทั่วโลกนี้
เวิร์กโฟลว์สำหรับส่วนนี้ของกระบวนการเป็นไปตามขั้นตอนเหล่านี้:
- หลังจากกิจกรรมสิ้นสุดลง MediaLive จะส่งการแจ้งเตือนไปยัง EventBridge ซึ่งจะทริกเกอร์เวิร์กโฟลว์การประมวลผลหลังกิจกรรม
- ฟังก์ชัน Lambda ที่สมัครรับข้อมูลเหตุการณ์ที่หยุดแชนเนล จะทริกเกอร์การถอดเสียงหลังกิจกรรมโดยใช้ Amazon Transcribe ทำให้มั่นใจได้ว่าเนื้อหาที่บันทึกทั้งหมดจะถูกถอดเสียง
- เนื้อหาที่ถอดเสียงจะถูกประมวลผลและจัดเก็บไว้ในบัคเก็ต S3 ซึ่งเป็นโซลูชันการจัดเก็บที่ปลอดภัยและเชื่อถือได้
- (ไม่บังคับ) Amazon Nova Pro แปลการถอดเสียงเป็นหลายภาษาเพื่อการเข้าถึงที่กว้างขึ้นโดยใช้ Amazon Bedrock ทำให้สามารถเข้าถึงความรู้จากกิจกรรมได้ทั่วโลก
- Amazon Transcribe สร้างเหตุการณ์ที่สมบูรณ์ในการถอดเสียงและส่งไปยัง EventBridge ซึ่งทริกเกอร์กระบวนการซิงโครไนซ์กับ Amazon Bedrock Knowledge Bases
- ฟังก์ชัน Lambda ที่สมัครรับข้อมูลเหตุการณ์ที่สมบูรณ์ในการถอดเสียง จะทริกเกอร์กระบวนการซิงโครไนซ์กับ Amazon Bedrock Knowledge Bases ทำให้มั่นใจได้ว่าฐานความรู้เป็นข้อมูลล่าสุด
- จากนั้นความรู้จะถูกจัดทำดัชนีและจัดเก็บไว้ในฐานความรู้ Amazon Bedrock เพื่อการดึงข้อมูลที่มีประสิทธิภาพ ทำให้ผู้ใช้สามารถเข้าถึงข้อมูลที่ต้องการได้อย่างราบรื่น
การสร้างบทสรุปเซสชันและข้อมูลเชิงลึกที่สำคัญโดยอัตโนมัติ: ปรับปรุงประสบการณ์ผู้ใช้
เพื่อปรับปรุงประสบการณ์ผู้ใช้ โซลูชันนี้ใช้ Amazon Bedrock เพื่อวิเคราะห์การถอดเสียงเพื่อสร้างบทสรุปเซสชันและข้อมูลเชิงลึกที่สำคัญ ข้อมูลเชิงลึกเหล่านี้ช่วยให้ผู้ใช้เข้าใจสาระสำคัญของกิจกรรมได้อย่างรวดเร็วโดยไม่ต้องอ่านการถอดเสียงที่ยาว
เวิร์กโฟลว์สำหรับส่วนนี้ของโซลูชันเป็นไปตามขั้นตอนเหล่านี้:
- ผู้ใช้ตรวจสอบสิทธิ์เข้าสู่พอร์ทัลเว็บไคลเอ็นต์โดยใช้ Amazon Cognito เมื่อตรวจสอบสิทธิ์แล้ว ผู้ใช้จะเลือกตัวเลือกใน UI พอร์ทัลเพื่อดูบทสรุปและข้อมูลเชิงลึกที่สำคัญ
- คำขอของผู้ใช้จะถูกมอบหมายให้กับโมดูลผู้ช่วย AI ซึ่งจะดึงการถอดเสียงที่สมบูรณ์จากบัคเก็ต S3
- การถอดเสียงจะได้รับการประมวลผลผ่าน Amazon Bedrock Pro ซึ่งได้รับการชี้นำโดย Amazon Bedrock Guardrails ทำให้มั่นใจได้ว่าบทสรุปและข้อมูลเชิงลึกที่สร้างขึ้นนั้นถูกต้องและเชื่อถือได้
ผู้ช่วยที่ใช้แชทที่ขับเคลื่อนด้วย AI: Q&A แบบโต้ตอบและการดึงความรู้
คุณสมบัติที่สำคัญของสถาปัตยกรรมนี้คือผู้ช่วยแชทที่ขับเคลื่อนด้วย AI ซึ่งใช้เพื่อสอบถามฐานความรู้ของกิจกรรมแบบโต้ตอบ ผู้ช่วยแชทขับเคลื่อนโดย Amazon Bedrock และดึงข้อมูลจากดัชนี Amazon OpenSearch Serverless ทำให้สามารถเข้าถึงข้อมูลเชิงลึกของเซสชันได้อย่างราบรื่น
เวิร์กโฟลว์สำหรับส่วนนี้ของโซลูชันเป็นไปตามขั้นตอนเหล่านี้:
- ผู้ใช้ที่ตรวจสอบสิทธิ์แล้วมีส่วนร่วมกับผู้ช่วยแชทโดยใช้ภาษาธรรมชาติเพื่อขอรายละเอียดข้อความกิจกรรมเฉพาะจากพอร์ทัลเว็บไคลเอ็นต์
- พรอมต์ของผู้ใช้ถูกนำไปยังโมดูลผู้ช่วย AI เพื่อการประมวลผล ทำให้มั่นใจได้ว่าคำขอทั้งหมดจะได้รับการจัดการอย่างมีประสิทธิภาพ
- โมดูลผู้ช่วย AI สอบถาม Amazon Bedrock Knowledge Bases เพื่อหาคำตอบที่เกี่ยวข้อง ให้ข้อมูลที่ถูกต้องและเชื่อถือได้แก่ผู้ใช้
- การถอดเสียงได้รับการประมวลผลโดย Amazon Nova Pro ซึ่งได้รับการชี้นำโดย Amazon Bedrock Guardrails ทำให้มั่นใจได้ว่าการตอบสนองที่สร้างขึ้นนั้นเหมาะสมและเกี่ยวข้อง
ด้วยการใช้ประโยชน์จากพลังของบริการ AWS, Infosys Event AI มอบโซลูชันที่ครอบคลุมสำหรับการจับภาพ ประมวลผล และเข้าถึงความรู้จากกิจกรรม แพลตฟอร์มนวัตกรรมนี้ช่วยปรับปรุงการเข้าถึง ปรับปรุงการดึงข้อมูล และช่วยให้องค์กรใช้ประโยชน์จากข้อมูลเชิงลึกที่สร้างขึ้นระหว่างกิจกรรมได้อย่างมีประสิทธิภาพ ด้วยการได้มาซึ่งสตรีมสดที่ราบรื่น การประมวลผลการถอดเสียงแบบเรียลไทม์ การประมวลผลหลังกิจกรรมโดยอัตโนมัติ และผู้ช่วยแชทที่ขับเคลื่อนด้วย AI, Infosys Event AI กำลังเปลี่ยนวิธีที่องค์กรจับภาพและใช้ประโยชน์จากความรู้จากกิจกรรม โซลูชันนี้ไม่เพียงแต่ปรับปรุงการเข้าถึงสำหรับผู้เข้าร่วมทั้งหมด แต่ยังช่วยให้มั่นใจได้ว่าข้อมูลเชิงลึกที่มีค่าจะไม่สูญหาย ส่งเสริมวัฒนธรรมการแบ่งปันความรู้และการเรียนรู้อย่างต่อเนื่อง
การผสมผสานระหว่าง AWS Elemental MediaLive และ MediaConnect ทำให้มั่นใจได้ถึงการส่งมอบวิดีโอคุณภาพสูงและเชื่อถือได้ ในขณะที่โมเดลภาษาขนาดใหญ่ของ Amazon Bedrock ปรับปรุงความสามารถของแพลตฟอร์มในการวิเคราะห์และสรุปเนื้อหากิจกรรม ความสามารถในการแปลหลายภาษาของ Amazon Nova Pro ขยายการเข้าถึงความรู้จากกิจกรรมให้กว้างขึ้น ทำให้ผู้ชมทั่วโลกสามารถเข้าถึงได้
ผู้ช่วยแชทที่ขับเคลื่อนด้วย AI ซึ่งเป็นคุณสมบัติที่โดดเด่นของโซลูชัน ช่วยให้ผู้ใช้สามารถเข้าถึงข้อมูลได้อย่างโต้ตอบและมีประสิทธิภาพ ด้วยการสอบถามฐานความรู้ของกิจกรรมโดยใช้ภาษาธรรมชาติ ผู้ใช้สามารถค้นหาคำตอบที่ต้องการได้อย่างรวดเร็วโดยไม่ต้องกรองการถอดเสียงหรือบันทึกที่ยาว คุณสมบัตินี้มีค่าอย่างยิ่งสำหรับผู้ที่พลาดกิจกรรมหรือต้องการตรวจสอบหัวข้อเฉพาะอย่างรวดเร็ว
Infosys Event AI เป็นข้อพิสูจน์ถึงพลังของการประมวลผลแบบคลาวด์และปัญญาประดิษฐ์ในการเปลี่ยนแปลงวิธีที่องค์กรจัดการและใช้ประโยชน์จากความรู้ ด้วยการใช้ประโยชน์จากบริการ AWS, Infosys ได้สร้างโซลูชันที่ไม่เพียงแต่ปรับขนาดได้และเชื่อถือได้ แต่ยังมีความเป็นนวัตกรรมสูงและใช้งานง่าย แพลตฟอร์มนี้มีศักยภาพในการปฏิวัติวิธีการจัดกิจกรรมและวิธีการแบ่งปันความรู้ ช่วยให้องค์กรสามารถตัดสินใจได้ดีขึ้นและบรรลุเป้าหมาย การมุ่งเน้นที่การถอดเสียงแบบเรียลไทม์และการประมวลผลหลังกิจกรรมทำให้มั่นใจได้ว่าจะไม่มีข้อมูลที่มีค่าสูญหายไป ในขณะที่ฟีเจอร์ที่ขับเคลื่อนด้วย AI ช่วยเพิ่มการมีส่วนร่วมของผู้ใช้และการเก็บรักษาความรู้ แนวทางแบบองค์รวมนี้ทำให้ Infosys Event AI เป็นทรัพย์สินที่มีค่าสำหรับองค์กรใดๆ ที่ต้องการเพิ่มผลกระทบของกิจกรรมและเวิร์กช็อปให้สูงสุด