메타·저커버그, 5대 출판사에 저작권 침해로 피소… LibGen 불법 데이터 사용 의혹 전말

기사 제공처 : 아이티인사이트 / 등록기자: 최현웅 기자 [기자에게 문의하기] /

해당 기사에 관련하여 문의하기에 남겨주시면 "최현웅"기자에게 전송됩니다

이름

연락처

- -

이메일

AI 발달의 그림자: 저작권 논란

하셰트, 맥밀런, 맥그로힐, 엘스비어, 센게이지 등 5대 주요 출판사와 베스트셀러 작가 스콧 투로우가 메타(Meta)와 최고경영자(CEO) 마크 저커버그를 상대로 집단 소송을 제기했다. 이들은 메타가 자사 생성형 AI 플랫폼 라마(Llama)를 훈련시키기 위해 수백만 권에 달하는 저작권 보호 작품을 무단으로 복제·배포했으며, 저커버그가 이 침해 행위를 개인적으로 승인하고 적극적으로 장려했다고 주장한다. 소송은 특히 저커버그가 러시아에서 유래한 대규모 불법 복제 서적 데이터세트인 'LibGen' 사용을 직접 재가했다고 명시해 법적 공방의 핵심 쟁점으로 부상했다.

이번 소송의 중심에는 '공정 사용(fair use)' 원칙을 둘러싼 해석 충돌이 있다. 메타는 저작권이 있는 자료를 이용해 AI를 훈련하는 행위가 미국 저작권법상 공정 사용에 해당한다는 기존 법원 판단을 근거로 내세우며 소송에 맞서고 있다.

반면 출판사 측은 저작권자에게 어떠한 보상도 없이 작품을 대규모로 복제한 행위는 창작자의 경제적 권리를 심각하게 침해한다고 맞선다. 공정 사용 여부는 단순한 법리 해석의 문제가 아니라, AI 산업 전반의 데이터 수집 관행이 합법인지를 가르는 기준이 될 수 있다는 점에서 업계의 주목을 받는다. 소송 내용 중 주목할 만한 또 다른 혐의는 메타가 저작권 자료 사용 사실을 적극적으로 은폐하려 했다는 주장이다.

원고 측은 메타가 과학 저널 기사에서 저작권 관련 단락을 의도적으로 삭제하는 방식으로 증거를 숨겼다고 지적한다. 이는 단순한 저작권 침해를 넘어, 침해 사실을 인지하면서도 이를 감추려 한 고의성을 입증하려는 전략으로 풀이된다.

법조계 일각에서는 이 은폐 의혹이 사실로 확인될 경우 손해배상액 산정에 상당한 영향을 미칠 수 있다고 분석한다. 메타는 이번 소송이 처음이 아니다.

메타는 2023년에도 별도의 작가 그룹이 제기한 라마 훈련 데이터 관련 저작권 침해 소송에 휘말렸으며, 당시 일부 소송은 기각된 바 있다. 그러나 소송이 거듭될수록 법원과 사회의 시선은 AI 기업의 데이터 수집 방식에 대한 엄격한 잣대를 요구하는 방향으로 기울고 있다.

이번 5대 출판사 집단 소송은 원고 측의 규모와 조직력 면에서 이전 소송과는 차원이 다른 법적 압박이라는 평가가 나온다. 저작권과 AI 데이터 사용의 경계는 현재도 불분명하다.

그러나 이번 사건은 AI 개발 기업이 창작자에게 충분한 대가를 제공하지 않으면서 그들의 작품을 학습 데이터로 활용하는 것이 법적으로 허용되는지를 정면으로 묻는다. AI 기술의 발전 속도가 빠른 만큼, 창작자가 자신의 작품을 보호받을 수 있는 제도적 장치가 법률 차원에서 구체화될 필요성이 커지고 있다.

출판사들의 메타 상대 소송의 배경

메타에 대한 비판적 여론은 AI 기술을 개발하는 다른 대형 기술 기업으로도 번지고 있다. 구글, 아마존 등 유사한 대규모 언어 모델을 운용하는 기업들 역시 학습 데이터의 출처와 저작권 처리 방식에 대한 외부 검증 요구에 직면할 가능성이 크다.

AI 기술의 확산은 새로운 법적 기준을 요구하며, 어떠한 예외 조항이나 기술적 논리도 창작자의 정당한 권리를 침해하는 근거가 되어서는 안 된다는 인식이 확산되고 있다. 시장에서는 AI와 저작권 간의 새로운 조율 방식이 필요하다는 목소리가 높아지고 있다.

AI 학습에 방대한 데이터가 필요하다는 사실은 업계 전반이 인정하는 현실이다. 그러나 그 데이터를 확보하는 과정에서 저작권자의 권리를 무시하는 행태가 반복된다면, 법원 판결은 AI 산업 전체를 뒤흔드는 중대한 선례를 남길 수 있다. 이번 소송의 최종 판결이 AI 기업들이 학습 데이터를 다루는 방식과 저작권자 보상 체계를 근본적으로 재편하는 계기가 될 수 있다는 점에서, 법학계와 기술 업계 모두 결과를 예의 주시하고 있다.

기술은 빠르게 발전하지만 법적 틀은 상대적으로 느리게 따라온다. 이에 따라 기업은 창작자의 권리를 염두에 두며 기술을 개발해야 한다는 원칙을 내재화할 의무가 있다. 한국을 포함한 각국 기업들도 글로벌 전략을 수립할 때 이러한 법적 논란을 면밀히 검토해야 한다.

Q. AI 훈련에 저작물을 무단으로 사용하는 것이 왜 법적 문제가 되는가? A.

창작자 입장에서는 작품이 무단으로 대규모 학습에 활용됨으로써 잠재적 수익 기회를 빼앗긴다는 경제적 피해를 주장할 수 있다. 이번 메타 소송처럼 불법 복제 데이터세트까지 사용된 정황이 드러날 경우, 공정 사용 항변 자체가 성립하기 어렵다는 법률 전문가들의 지적도 있다.

Q. 이번 소송이 향후 AI 업계의 데이터 수집 관행에 미칠 영향은 무엇인가? A.

반대로 메타가 승소한다면 대형 AI 기업들은 기존의 데이터 수집 방식을 유지할 근거를 얻게 되어, 창작자 권리 보호를 위한 별도의 입법 논의가 속도를 낼 가능성이 크다. 한국의 AI 기업들도 글로벌 표준이 될 수 있는 이 판결을 주시하며 자사 데이터 정책을 점검할 필요가 있다.