GPAI 실천 강령 초안 3: 저작권 준수 변경

배경

유럽 AI Act (규정 (EU) 2024/1689, 또는 ‘AI Act’)는 범용 AI (‘GPAI’) 모델 제공자에게 특정한 의무를 부과합니다. GPT 제품군, Llama 및 Gemini를 포함한 이러한 모델은 포괄적인 문서화 및 EU 저작권법 준수를 보장하는 정책 수립과 같은 요구 사항을 준수해야 합니다.

이러한 규정 준수를 용이하게 하기 위해 AI Act는 GPAI 모델에 맞춘 실천 강령 개발을 예상합니다. AI Office의 초청에 따라 다양한 전문가와 이해 관계자가 초기 실천 강령 초안 작성을 위한 4개의 워킹 그룹을 구성했습니다. EU 집행위원회가 이 강령을 승인하면 EU 전역에서 ‘일반적인 유효성’을 갖게 됩니다. 승인된 GPAI 실천 강령을 채택하면 기업은 사전 예방적 규정 준수를 입증할 수 있는 수단을 제공하여 잠재적으로 규제 조사 및 관련 처벌을 완화할 수 있습니다.

AI Office는 최근 이러한 워킹 그룹에서 작성한 실천 강령의 세 번째 초안(‘3차 초안’)을 발표했습니다. 이 초안은 다음 몇 가지 주요 영역을 포함합니다.

약속
투명성
저작권
안전 및 보안

이 실천 강령의 최종 버전은 2025년 5월 2일에 발표될 예정입니다.

이 문서는 3차 초안의 저작권 섹션에 있는 중요한 세부 사항을 자세히 설명합니다. 두 번째 초안(‘2차 초안’)과의 주목할 만한 차이점은 3차 초안의 간소화되고 간결한 접근 방식입니다. 주요 변경 사항은 2차 초안과 달리 3차 초안은 일반적으로 규정 준수 노력이 제공자의 규모와 능력에 상응해야 한다고 규정한다는 것입니다.

누구에게 해당됩니까?

실천 강령은 주로 GPAI 모델 제공자를 대상으로 합니다. 이러한 모델은 상당한 일반성과 광범위하고 다양한 작업을 능숙하게 실행할 수 있는 능력이 특징입니다. 여기에는 GPT (OpenAI), Llama (Meta), Gemini (Google) 및 Mistral (Mistral AI)과 같은 잘 알려진 대규모 언어 모델 제공자가 포함됩니다. 그러나 소규모 모델 제공자도 모델이 다양한 작업에 활용될 수 있는 경우 그 범위에 포함될 수 있습니다. 또한 특정 애플리케이션을 위해 모델을 미세 조정하는 기업도 GPAI 모델 제공자로 분류될 수 있습니다.

‘다운스트림 제공자’, 즉 GPAI 모델을 AI 시스템에 통합하는 기업도 실천 강령을 숙지해야 합니다. 이 강령은 GPAI 모델에 대한 준표준이 될 준비가 되어 있으며 AI 시스템 개발자가 GPAI 모델 기능에 대해 기대하는 바를 정의합니다. 이러한 이해는 GPAI 모델 제공자와의 계약 협상 중에 중요할 수 있습니다.

저작권법에 대한 실천 강령의 주요 개념

GPAI 모델 제공자는 EU 저작권법 (AI Act 제53조 (1) (c))을 준수하는 정책을 수립해야 합니다. 이 요구 사항의 참신성을 감안할 때 이러한 정책의 구조와 내용에 대한 실질적인 지침이 부족했습니다. 실천 강령은 이러한 격차를 해소하는 것을 목표로 합니다.

실천 강령은 제공자가 다음 조치를 시행하도록 규정합니다.

저작권 정책

실천 강령에 서명한 제공자(‘서명자’)는 EU 저작권법에 부합하는 저작권 정책을 수립, 유지 및 시행해야 합니다. 이 요구 사항은 AI Act에서 직접 파생됩니다. 서명자는 또한 조직이 이 저작권 정책을 준수하는지 확인해야 합니다.

2차 초안과의 중요한 차이점은 3차 초안이 더 이상 저작권 정책의 게시를 의무화하지 않는다는 것입니다. 서명자는 그렇게 하도록 권장될 뿐입니다. 이 감소된 요구 사항은 AI Act 자체가 모델 제공자에게 저작권 정책을 게시하도록 강요하지 않기 때문에 논리적입니다.

저작권이 있는 콘텐츠의 웹 크롤링

서명자는 일반적으로 GPAI 모델의 훈련 데이터를 수집하기 위해 텍스트 및 데이터 마이닝 (‘TDM’) 목적으로 웹 크롤러를 사용할 수 있습니다. 그러나 이러한 크롤러가 유료 콘텐츠와 같이 저작권이 있는 자료에 대한 액세스를 제한하도록 설계된 기술을 존중하는지 확인해야 합니다.

또한 서명자는 주로 저작권 침해 자료 배포에 관여하는 온라인 소스인 ‘불법 복제 도메인’을 제외해야 합니다.

웹 크롤링 및 TDM 옵트아웃 식별 및 준수

서명자는 웹 크롤러가 권리자가 선언한 TDM 옵트아웃을 식별하고 존중하는지 확인해야 합니다. EU 저작권법은 일반적으로 TDM을 허용하지만 권리자는 옵트아웃할 권리를 보유합니다. 웹 콘텐츠의 경우 이 옵트아웃은 기계가 읽을 수 있어야 합니다. 3차 초안은 웹 크롤러에 대한 요구 사항을 자세히 설명하며, 널리 채택된 robots.txt 프로토콜을 식별하고 준수해야 한다고 명시합니다. 또한 웹 크롤러는 업계 표준으로 설정된 메타데이터 또는 권리자가 일반적으로 사용하는 솔루션과 같은 기타 관련 기계 판독 가능 TDM 옵트아웃을 준수해야 합니다.

서명자는 권리자에게 사용 중인 웹 크롤러와 이러한 크롤러가 robots.txt 지시문을 처리하는 방법에 대해 알리기 위해 합당한 조치를 취해야 합니다. 이 정보는 웹 피드와 같은 다양한 채널을 통해 배포할 수 있습니다. 특히 3차 초안에는 더 이상 이 정보를 게시할 의무가 포함되지 않습니다.

웹 크롤링되지 않은 콘텐츠에 대한 TDM 옵트아웃 식별 및 준수

GPAI 모델 제공자는 웹 크롤링을 직접 수행하는 대신 제3자로부터 데이터 세트를 획득할 수도 있습니다. 2차 초안은 제3자 데이터 세트에 대한 저작권 실사를 의무화했지만, 3차 초안은 정보를 수집하는 데 사용된 웹 크롤러가 robots.txt 프로토콜을 준수했는지 여부에 대한 정보를 얻기 위해 합당한 노력을 요구합니다.

저작권 침해 출력물 생성을 방지하기 위한 위험 완화

AI 사용과 관련된 중요한 위험은 AI가 저작권을 침해하는 출력물을 생성할 가능성입니다. 여기에는 저작권으로 보호되는 온라인에서 찾은 코드 또는 이미지를 복제하는 것이 포함될 수 있습니다.

서명자는 이 위험을 완화하기 위해 합당한 노력을 기울여야 합니다. 이는 ‘과적합’을 피하기 위한 조치를 규정한 2차 초안에 비해 더 관대한 접근 방식을 나타냅니다. 3차 초안은 합당한 노력에 중점을 둔 보다 기술 중립적인 입장을 취합니다.

또한 서명자는 다운스트림 AI 시스템 제공자를 위한 이용 약관 (또는 유사한 문서)에 GPAI 모델을 저작권을 침해하는 방식으로 사용하는 것을 금지하는 조항을 포함해야 합니다.

연락 담당자 지정

서명자는 권리자를 위한 연락 담당자를 제공해야 합니다. 또한 권리자가 저작권 침해에 대한 불만을 제기할 수 있는 메커니즘을 구축해야 합니다.

3차 초안에 따라 서명자는 근거가 없거나 과도하다고 판단되는 불만 처리를 거부할 수 있습니다.

심층 분석: 저작권 조항에 대한 보다 세분화된 검토

3차 초안은 겉보기에는 간소화되었지만 더 자세히 살펴볼 가치가 있는 뉘앙스와 강조점의 변화를 도입합니다. 각 섹션을 더 자세히 분석해 보겠습니다.

저작권 정책: 게시에서 권장으로의 전환

2차 초안에 있는 저작권 정책 게시 의무는 잠재적인 경쟁적 불이익과 민감한 정보 노출에 대한 우려를 제기했습니다. 3차 초안은 게시를 요구하는 대신 권장하는 방향으로 전환하여 이러한 우려를 인정합니다. 이러한 변경을 통해 제공자는 내부 규정 준수 전략에 대한 어느 정도의 기밀성을 유지하면서도 투명성을 증진할 수 있습니다. 그러나 ‘권장’ 측면은 여전히 제공자에게 정책에 대해 공개하도록 미묘한 압력을 가하여 시간이 지남에 따라 사실상 게시 표준으로 이어질 수 있습니다.

웹 크롤링에 대한 명시적인 허가와 유료 콘텐츠와 같은 액세스 제한을 존중해야 하는 요구 사항은 섬세한 균형을 반영합니다. AI Act는 AI 모델 훈련을 위한 데이터의 중요성을 인식하지만 콘텐츠 제작자의 권리를 존중해야 할 필요성도 강조합니다. ‘불법 복제 도메인’의 제외는 저작권 침해에 적극적으로 관여하는 출처를 명시적으로 대상으로 하는 중요한 추가 사항입니다. 이 조항은 AI 개발이 불법 행위를 기반으로 구축되어서는 안 된다는 원칙을 강화합니다.

TDM 옵트아웃: 규정 준수의 기술적 특수성

3차 초안에서 robots.txt 프로토콜 및 기타 기계 판독 가능 옵트아웃 메커니즘을 강조하는 것은 규정 준수의 기술적 측면을 강조합니다. 이러한 특수성은 GPAI 제공자와 권리자 모두에게 명확성을 제공합니다. 제공자의 경우 크롤러가 옵트아웃 요청을 존중하도록 하기 위해 취해야 할 구체적인 단계를 간략하게 설명합니다. 권리자의 경우 TDM과 관련하여 자신의 선호도를 효과적으로 알릴 수 있는 방법을 명확히 합니다. ‘업계 표준’ 메타데이터 및 ‘널리 채택된’ 솔루션을 포함하면 옵트아웃 메커니즘의 환경이 진화하고 있으며 유연성이 필요하다는 것을 인정합니다.

웹 크롤링되지 않은 콘텐츠: 책임 및 실사 변경

제3자 데이터 세트와 관련하여 ‘저작권 실사’에서 ‘정보를 얻기 위한 합당한 노력’으로의 변경은 책임의 미묘하지만 중요한 변화를 나타냅니다. 2차 초안은 GPAI 제공자가 데이터 세트의 저작권 상태를 적극적으로 조사해야 하는 더 큰 부담을 지웠지만, 3차 초안은 데이터 수집 프로세스 (제3자에 의한)가 robots.txt를 존중했는지 여부를 확인하는 데 중점을 둡니다. 이는 GPAI 제공자가 제3자의 데이터 획득 관행을 항상 직접 제어할 수는 없지만 여전히 규정 준수에 대해 문의할 책임이 있음을 암시적으로 인정합니다.

침해 출력물 완화: ‘과적합’에서 ‘합당한 노력’으로

‘과적합’이라는 용어에서 벗어나는 것은 환영할 만한 변화입니다. 머신 러닝의 기술 용어인 ‘과적합’은 훈련 데이터에서는 잘 수행되지만 새 데이터에서는 제대로 수행되지 않는 모델을 나타냅니다. 과적합은 저작권 침해에 기여할 수 있지만 (예: 저작권이 있는 자료를 암기하고 복제함으로써) 유일한 원인은 아닙니다. 3차 초안의 ‘위험을 완화하기 위한 합당한 노력’에 대한 광범위한 초점은 더 광범위한 잠재적 침해 시나리오를 포괄하고 구현에 더 많은 유연성을 허용합니다. 이러한 변화는 또한 저작권 침해를 완벽하게 방지하는 것이 불가능할 수 있으며 위험 기반 접근 방식이 더 실용적이라는 것을 인정합니다.

연락 담당자 및 불만 처리 메커니즘: 프로세스 간소화

연락 담당자 및 불만 처리 메커니즘에 대한 요구 사항은 권리자에게 잠재적인 저작권 침해를 해결할 수 있는 명확한 방법을 제공합니다. 서명자가 ‘근거가 없거나 과도한’ 불만을 거부할 수 있는 기능은 시스템이 경솔한 주장으로 인해 압도되는 것을 방지하는 실용적인 추가 기능입니다. 이 조항은 불만 처리 메커니즘이 합법적인 저작권 문제를 해결하기 위한 실행 가능하고 효율적인 도구로 유지되도록 하는 데 도움이 됩니다.

더 광범위한 의미 및 향후 고려 사항

‘합당한 노력’ 표준: ‘합당한 노력’이라는 문구가 반복적으로 사용되면 어느 정도 주관성이 도입됩니다. 무엇이 ‘합당한’ 것으로 간주되는지는 해석의 대상이 될 것이며 법적 문제 및 업계 모범 사례를 통해 시간이 지남에 따라 발전할 수 있습니다. 이러한 모호성은 제공자에게 불확실성을 초래할 수 있지만 다양한 상황에 대한 유연성과 적응을 허용하기도 합니다.
다운스트림 제공자의 역할: 강령은 주로 GPAI 제공자를 대상으로 하지만 다운스트림 제공자는 조항을 이해하는 데 기득권을 가지고 있습니다. 강령은 GPAI 모델의 품질 및 규정 준수에 대한 기대치를 설정하여 계약 협상 및 위험 평가에 정보를 제공할 수 있습니다. 다운스트림 제공자는 또한 GPAI 모델 사용이 강령의 원칙에 부합하도록 간접적인 압력을 받을 수 있습니다.
기술의 진화: AI 개발 속도가 빠르다는 것은 실천 강령이 살아있는 문서여야 함을 의미합니다. 데이터 획득, 모델 훈련 및 출력 생성에 대한 새로운 기술이 등장하여 강령 조항을 업데이트해야 할 수 있습니다. ‘업계 표준’ 메타데이터 및 ‘널리 채택된’ 솔루션에 대한 언급은 지속적인 적응의 필요성을 인정합니다.
혁신에 미치는 영향: 실천 강령은 AI 혁신 촉진과 저작권 보호 사이의 균형을 맞추는 것을 목표로 합니다. 그러나 이러한 규정이 AI 개발의 속도와 방향에 미치는 영향은 아직 밝혀지지 않았습니다. 일부에서는 지나치게 엄격한 규정이 혁신을 억누를 수 있다고 주장하는 반면, 다른 일부에서는 책임감 있는 AI 개발을 촉진하기 위해 명확한 규칙이 필요하다고 주장합니다.
집행 및 모니터링 준수 여부는 어떻게 확인됩니까? 코드의 효과는 시행 및 모니터링을 위해 마련된 메커니즘에 크게 좌우됩니다.

GPAI 실천 강령의 3차 초안은 광범위한 영향을 미치는 복잡하고 진화하는 문서입니다. AI 시대의 저작권 준수 문제를 해결하기 위한 중요한 노력을 나타내지만 진행 중인 작업이기도 합니다. GPAI 제공자, 권리자, 정책 입안자 및 더 광범위한 AI 커뮤니티를 포함한 이해 관계자 간의 지속적인 대화는 강령이 의도한 목표를 달성하고 급속한 기술 변화에 직면하여 관련성을 유지하도록 하는 데 필수적입니다.

업데이트됨 2025-03-15

# AIGC # OpenAI # GPT

배경