ฝึก AI หรือไม่ฝึก; นั่นคือปัญหา

การเพิ่มขึ้นของข้อยกเว้นด้านลิขสิทธิ์สำหรับการฝึกอบรม AI

ในช่วงไม่กี่ปีที่ผ่านมา หลายประเทศได้กำหนดข้อยกเว้นในกฎหมายลิขสิทธิ์ของตน โดยเฉพาะอย่างยิ่งเพื่ออำนวยความสะดวกในการทำเหมืองข้อความและข้อมูล (text and data mining) โดยบริษัท AI ข้อยกเว้นเหล่านี้มีจุดมุ่งหมายเพื่อส่งเสริมนวัตกรรมในสาขาปัญญาประดิษฐ์ โดยอนุญาตให้ LLMs ได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลขนาดใหญ่ โดยไม่จำเป็นต้องได้รับอนุญาตอย่างชัดแจ้งจากผู้ถือลิขสิทธิ์ทุกราย

ตัวอย่างเช่น สิงคโปร์ได้แก้ไขกฎหมายลิขสิทธิ์ในปี 2021 เพื่อสร้างข้อยกเว้นดังกล่าว การเคลื่อนไหวนี้ปูทางสำหรับนักพัฒนา AI ในประเทศให้เข้าถึงและประมวลผลงานที่มีลิขสิทธิ์เพื่อวัตถุประสงค์ในการฝึกอบรมแบบจำลองของตน ขณะนี้ เขตอำนาจศาลอื่นๆ ในเอเชีย รวมถึงฮ่องกงและอินโดนีเซีย กำลังพิจารณาการเปลี่ยนแปลงกฎหมายที่คล้ายคลึงกัน

มุมมองของจีน: คดีละเมิดลิขสิทธิ์ครั้งสำคัญ

จีน ซึ่งเป็นผู้เล่นหลักในภูมิทัศน์ AI ระดับโลก ก็กำลังต่อสู้กับความซับซ้อนของลิขสิทธิ์ในยุคของ LLMs คดีสำคัญ iQiyi vs. MiniMax ได้นำประเด็นนี้มาสู่ความสนใจ

ในกรณีนี้ iQiyi แพลตฟอร์มสตรีมมิ่งวิดีโอที่มีชื่อเสียง ได้ฟ้องร้อง MiniMax บริษัท AI โดยกล่าวหาว่าใช้วัสดุวิดีโอที่มีลิขสิทธิ์ของตนเพื่อฝึกอบรมแบบจำลอง AI โดยไม่ได้รับอนุญาต การฟ้องร้องครั้งนี้ถือเป็นพัฒนาการที่สำคัญ เนื่องจากเป็นคดีละเมิดลิขสิทธิ์ LLM วิดีโอ AI ครั้งแรกของจีน ซึ่งเน้นย้ำถึงความกังวลที่เพิ่มขึ้นเกี่ยวกับการใช้เนื้อหาที่มีลิขสิทธิ์โดยไม่ได้รับอนุญาตในการพัฒนาเทคโนโลยี AI

อุตสาหกรรมการพิมพ์ของอินเดียท้าทายแนวทางการฝึกอบรม LLM

การอภิปรายขยายไปไกลกว่าเอเชีย ในอินเดีย สำนักพิมพ์หลายแห่งได้เริ่มดำเนินการทางกฎหมายกับนักพัฒนา LLM โดยกล่าวหาว่าแบบจำลองเหล่านี้ได้รับการฝึกอบรมเกี่ยวกับข้อมูลที่คัดลอกมา (scraped data) ซึ่งรวมถึงงานที่มีลิขสิทธิ์ของพวกเขา กรณีเหล่านี้เน้นย้ำถึงความตึงเครียดระหว่างความปรารถนาที่จะพัฒนาขีดความสามารถของ AI และความจำเป็นในการปกป้องสิทธิ์ในทรัพย์สินทางปัญญาของผู้สร้าง

นอกเหนือจากการนำเข้าข้อมูลอย่างง่าย: ความแตกต่างเล็กน้อยของการฝึกอบรม LLM

ความท้าทายที่เกิดจากการฝึกอบรม LLM นั้นซับซ้อนกว่าการนำเข้าและประมวลผลข้อมูลอย่างง่าย กรณีของอินเดียและบทบัญญัติที่กำหนดไว้อย่างแคบของกฎหมายสิงคโปร์ เน้นย้ำถึงลักษณะที่หลากหลายของปัญหานี้

เจ้าของทรัพย์สินทางปัญญาจำนวนมากจำกัดการเข้าถึงและการใช้งานผลงานที่มีลิขสิทธิ์ของตนอย่างชัดแจ้ง ในขณะที่คนอื่นๆ ไม่ยินยอมให้มีการเข้าถึงและทำซ้ำดังกล่าว ผู้สร้างจำนวนมากพึ่งพารูปแบบการให้สิทธิ์ใช้งาน (licensing models) เป็นส่วนหลักของธุรกิจของตน และการใช้ผลงานของพวกเขาโดยไม่ได้รับอนุญาตสำหรับการฝึกอบรม AI จะบ่อนทำลายรูปแบบเหล่านี้โดยตรง

นอกจากนี้ ความจริงที่ว่าการฝึกอบรมส่วนใหญ่สามารถเกิดขึ้นได้ในระบบคลาวด์ ทำให้เกิดคำถามด้านเขตอำนาจศาลที่ซับซ้อน การพิจารณาว่ากฎหมายใดมีผลบังคับใช้เมื่อมีการประมวลผลข้อมูลข้ามพรมแดนระหว่างประเทศ เพิ่มความซับซ้อนอีกชั้นหนึ่งให้กับภูมิทัศน์ทางกฎหมายที่ซับซ้อนอยู่แล้ว

ท้ายที่สุดแล้ว ประเด็นหลักอยู่ที่ว่า LLMs รักษาความปลอดภัยข้อมูลการฝึกอบรมของตนอย่างไร และควรชดเชยผู้ถือลิขสิทธิ์สำหรับการใช้งานหรือไม่ และอย่างไร

องค์กรลิขสิทธิ์ของสหรัฐฯ คัดค้านข้อยกเว้นตามกฎหมาย

การอภิปรายไม่ได้จำกัดอยู่แค่ในแต่ละประเทศเท่านั้น แต่ยังขยายไปสู่เวทีระหว่างประเทศอีกด้วย กลุ่มพันธมิตรของสมาคมการค้าและกลุ่มอุตสาหกรรมเกือบ 50 แห่งในสหรัฐอเมริกา หรือที่รู้จักกันในชื่อ Digital Creators Coalition ได้แสดงการคัดค้านอย่างรุนแรงต่อการสร้างข้อยกเว้นตามกฎหมายสำหรับการฝึกอบรม LLM ในกฎหมายลิขสิทธิ์ โดยไม่มีบทบัญญัติสำหรับการอนุญาตหรือค่าตอบแทน

องค์กรเหล่านี้ได้ยื่นความคิดเห็นต่อผู้แทนการค้าสหรัฐฯ (USTR) โดยเรียกร้องให้หน่วยงานแก้ไขปัญหานี้ในการทบทวน Special 301 ประจำปี ซึ่งตรวจสอบการคุ้มครองทรัพย์สินทางปัญญาและแนวทางปฏิบัติในการบังคับใช้ทั่วโลก กลุ่มพันธมิตรได้จัดทำรายชื่อประเทศที่ได้ดำเนินการหรือกำลังเสนอข้อยกเว้นดังกล่าว โดยเน้นย้ำถึงขอบเขตทั่วโลกของความกังวลนี้

การอภิปรายในสหรัฐฯ: จุดยืนของ OpenAI และความขัดแย้งภายใน

แม้แต่ภายในสหรัฐอเมริกา การอภิปรายก็ยังคงดำเนินต่อไป OpenAI บริษัทที่อยู่เบื้องหลัง ChatGPT ที่ได้รับความนิยม ได้เพิ่มเสียงของตนในการอภิปรายโดยส่งจดหมายเปิดผนึกไปยังสำนักงานวิทยาศาสตร์และเทคโนโลยีของทำเนียบขาว

ในจดหมายฉบับนี้ OpenAI สนับสนุนสิทธิ์ในการคัดลอกข้อมูลจากอินเทอร์เน็ตภายใต้หลักการใช้งานที่เป็นธรรม (fair use) โดยโต้แย้งอย่างมีประสิทธิภาพเพื่อการเข้าถึงเนื้อหาที่มีลิขสิทธิ์ในวงกว้างเพื่อวัตถุประสงค์ในการฝึกอบรม อย่างไรก็ตาม ในทางตรงกันข้าม OpenAI ยังแนะนำว่านักพัฒนา LLM ต่างชาติควรถูกจำกัดไม่ให้ทำเช่นเดียวกัน ซึ่งอาจเป็นไปได้ผ่านการใช้นโยบายการส่งออกของสหรัฐฯ จุดยืนนี้เผยให้เห็นความขัดแย้งภายใน โดยสนับสนุนการเข้าถึงแบบเปิดสำหรับตนเอง ในขณะที่พยายามจำกัดการเข้าถึงของผู้อื่น

เส้นทางข้างหน้า: การอภิปรายอย่างต่อเนื่อง

เมื่อใกล้ถึงปี 2025 การอภิปรายเกี่ยวกับลิขสิทธิ์และการฝึกอบรม AI จะทวีความรุนแรงขึ้นอย่างแน่นอน ด้วยการเกิดขึ้นอย่างต่อเนื่องของ LLMs ใหม่ทั่วโลก ความจำเป็นในการมีกรอบกฎหมายที่ชัดเจนและสมดุลจึงมีความเร่งด่วนมากขึ้น

ภูมิทัศน์ทางกฎหมายในปัจจุบันเป็นกฎหมายระดับชาติที่ปะปนกัน บางส่วนมีข้อยกเว้นที่ชัดเจนสำหรับการฝึกอบรม AI และบางส่วนไม่มีบทบัญญัติดังกล่าว ความไม่สอดคล้องกันนี้สร้างความไม่แน่นอนสำหรับทั้งนักพัฒนา AI และผู้ถือลิขสิทธิ์ ขัดขวางนวัตกรรม และอาจบ่อนทำลายสิทธิ์ของผู้สร้าง

ข้อควรพิจารณาที่สำคัญสำหรับกรอบการทำงานที่สมดุล:

  • ความโปร่งใสและความรับผิดชอบ: นักพัฒนา LLM ควรมีความโปร่งใสเกี่ยวกับแหล่งข้อมูลที่ใช้สำหรับการฝึกอบรมแบบจำลองของตน และรับผิดชอบต่อการใช้เนื้อหาที่มีลิขสิทธิ์โดยไม่ได้รับอนุญาต
  • ค่าตอบแทนที่เป็นธรรม: ควรมีการสำรวจกลไกในการชดเชยผู้ถือลิขสิทธิ์สำหรับการใช้งานผลงานของพวกเขาในการฝึกอบรม AI ซึ่งอาจเกี่ยวข้องกับข้อตกลงการอนุญาตให้ใช้สิทธิ์ การจัดการสิทธิ์โดยรวม หรือโซลูชันที่เป็นนวัตกรรมอื่นๆ
  • การประสานงานระหว่างประเทศ: ความพยายามในการประสานกฎหมายลิขสิทธิ์ที่เกี่ยวข้องกับการฝึกอบรม AI ในเขตอำนาจศาลต่างๆ จะช่วยลดความไม่แน่นอนทางกฎหมายและอำนวยความสะดวกในการทำงานร่วมกันข้ามพรมแดน
  • การสร้างสมดุลระหว่างนวัตกรรมและสิทธิ์ของผู้สร้าง: กรอบกฎหมายควรสร้างสมดุลระหว่างการส่งเสริมนวัตกรรมใน AI และการปกป้องสิทธิ์ของผู้สร้าง ซึ่งต้องพิจารณาอย่างรอบคอบถึงผลประโยชน์ต่างๆ ที่เกี่ยวข้อง
  • บทบาทของการใช้งานที่เป็นธรรม: ความสามารถในการใช้หลักการใช้งานที่เป็นธรรมกับการฝึกอบรม AI จำเป็นต้องได้รับการชี้แจง ซึ่งอาจเกี่ยวข้องกับการกำหนดเกณฑ์เฉพาะสำหรับการพิจารณาว่าการใช้เนื้อหาที่มีลิขสิทธิ์เพื่อวัตถุประสงค์ในการฝึกอบรมมีคุณสมบัติเป็นการใช้งานที่เป็นธรรมหรือไม่

การอภิปรายอย่างต่อเนื่องเกี่ยวกับลิขสิทธิ์และการฝึกอบรม AI เน้นย้ำถึงความท้าทายในการปรับกรอบกฎหมายที่มีอยู่ให้เข้ากับเทคโนโลยีที่พัฒนาอย่างรวดเร็ว การหาทางออกที่สร้างสมดุลระหว่างผลประโยชน์ของผู้มีส่วนได้ส่วนเสียทั้งหมดจะต้องมีการเจรจาอย่างต่อเนื่อง ความร่วมมือ และความเต็มใจที่จะปรับตัวให้เข้ากับภูมิทัศน์ที่เปลี่ยนแปลงไปของยุคดิจิทัล อนาคตของการพัฒนา AI และการคุ้มครองผลงานสร้างสรรค์ อาจขึ้นอยู่กับผลลัพธ์ของการอภิปรายที่สำคัญนี้ คำถามเรื่องการฝึกอบรมจะอยู่กับเราไปอีกนาน