책소개
AI 시대, 창작과 법의 경계를 묻다
생성형 AI가 만든 텍스트와 이미지, 그 법적 권리는 누구에게 있는가? 생성형 AI가 창작 과정에 깊숙이 개입하는 시대에, 저작권의 본질과 기준이 어떻게 변화해야 하는지를 정면으로 묻는다. 인간이 프롬프트를 입력해 AI가 만들어낸 결과물은 과연 창작인가? AI의 학습 데이터는 누구의 권리를 포함하는가?
이 책은 AI의 블랙박스적 한계를 짚고, 인간 중심의 가치와 법적 책임의 원칙에서 출발해 프롬프트 창작, 알고리즘 공개, 보호 기간 제한 등 쟁점들을 면밀히 분석한다. 10개의 장을 통해 생성형 AI의 기술적 구조, 저작권법의 적용 범위, 사회적 합의의 가능성까지 차분히 짚으며, 향후 법과 윤리가 어떻게 조화롭게 설계될 수 있을지를 제안한다. 예술가, 개발자, 법률가 모두에게 필요한 통찰을 담았다.
200자평
AI가 만든 콘텐츠의 저작권은 누구의 것인가? 프롬프트 입력부터 결과물의 권리까지, 새로운 창작 시대에 법과 윤리가 어떻게 대응해야 할지를 깊이 있게 탐구한다. 인공지능총서. aiseries.oopy.io에서 필요한 인공지능 지식을 찾을 수 있다.
지은이
김윤명
디지털정책연구소(DPI) 소장이다. 남도의 니르바나, 땅끝 해남에서 태어났다. 광주 인성고등학교와 전남대학교 문헌정보학과를 졸업하고, 경희대학교에서 지식 재산법을 전공해 박사 학위를 받았다. 현재는 세종사이버대학교에서 정보보호학을 공부하고 있다. 네이버에서 정책 수석으로 일했고, 소프트웨어정책연구소(SPRi)에서 소프트웨어와 인공지능 법제 연구를 맡았으며, 국회에서는 보좌관으로 입법과 정책을 다루었다. 이재명 경기도지사 캠프와 인수위인 새로운경기위원회에서, 그리고 이재명 대통령 후보(20대, 21대) 캠프에서 활동했다. 대통령 소속 국가지식재산위원회 AI-IP 특위에서 AI 시대에 변화하는 지식 재산의 지형을 함께 그렸다. 경희대학교 법무대학원에서 ‘인공지능법’을, 전남대학교 데이터사이언스대학원에서 ‘데이터사이언스 법과 윤리’를 강의하며 다음 세대를 준비하고 있다.
사유하고 질문하고 기록하는 일은 일상이다. 《블랙박스를 열기 위한 인공지능법》은 교육부 우수 학술 도서로, 《게임법》, 《게임 서비스와 법》, 《인터넷 서비스와 저작권법》은 문화체육관광부 세종도서(우수 학술 도서)로 선정되었다.
시를 짓고 사진을 찍는다. 두 아이들의 강하중학교에서 발간한 시집 《나에겐 비도 맛있다》에 몇 편의 시를 담았다. 아내와 아이들, 그리고 시고르자브종 리카와 밴, 동네 골목, 바람과 하늘, 꽃과 나무 등 세상의 모든 숨결이 그의 렌즈에 깃든다. 사람들의 짠하고도 아심찬한 풍경을 기록한다. 시집을 내고, 사진 갤러리를 여는 것이 꿈이기도 하다.
집 안에 ‘도서관N’을 세웠다. 정사서 1급 자격증을 가지고 있지만, 도서관장은 아내다. ‘N’은 네이버와 한게임의 합병법인 NHN(Next Human Network)에서 따온 ‘Next’를 의미한다. “도서관엔(N) 뭐가 있을까? 도서관엔(N) 길이 있지! 도서관 다음엔(N) 뭘 만들지?” 이런 장난스러운 물음 속에 세상을 향한 다음 걸음을 품는다. 언젠가 모두를 위한 더 큰 도서관N을 짓겠다는 꿈을 품고 있다.
그는 다시 길을 내려 하고 있다.
AI를 비롯한 디지털 법제와 정책을 연구하기 위해 양평에 ‘디지털정책연구소(Digital Policy Institute)’를 세웠다. 그와의 인연은 digitallaw@naver.com을 통해 이어질 것이다.
차례
왜, 생성형 AI와 저작권법인가?
01 생성형 AI
02 학습 데이터
03 기계 학습
04 프롬프트 창작: 창작적 기여
05 생성물의 법적 성질
06 생성형 AI 창작과 저작자
07 저작권 침해
08 저작권과 윤리: 워터마크와 표시
09 서비스 제공자 책임
10 시사점
책속으로
거대 언어 모델(large language model, LLM)인 파운데이션 모델(Foundation Model)은 대규모 데이터 세트를 기반으로 사전 학습된 AI 모델을 말한다. 최근 딥러닝 기술이 발전하면서 많은 데이터를 사용하여 사전 학습된 모델이 만들어졌는데, 이를 파운데이션 모델이라고 부른다. 파운데이션 모델은 다양한 분야에서 활용되며, 자연어 처리, 이미지 인식, 음성 인식 등 다양한 분야에서 뛰어난 성능을 보인다. 예를 들어, GPT-3는 자연어 생성 분야에서 세계적인 수준의 성능을 보이는 파운데이션 모델 중 하나다. 기본적으로 대규모의 데이터 세트를 사용하여 학습되기 때문에 다양한 데이터 분포와 패턴을 학습할 수 있다. 이를 통해 새로운 과업에 대해서도 일반화된 성능을 보이며, 파인 튜닝(fine-tuning) 과정을 통해 적은 데이터 세트로도 높은 성능을 보이는 경우가 많다. 최근에는 공개된 코드나 모델을 활용하여 간단하게 사용할 수 있어서 다양한 분야에서 활용될 수 있다.
-01_“생성형 AI” 중에서
기계 학습은 AI가 스스로 데이터를 분석하고 학습하는 방식이다. 학습에 사용되는 데이터는 AI가 자율적으로 선별할 수도 있고, 개발자 또는 서비스 제공자에 의해 지정될 수도 있다. 학습에 이용되는 데이터가 저작물일 경우 이는 곧 저작물을 이용하는 행위에 해당하게 된다. 이 과정에서 다양한 데이터가 시스템 메모리 등에 저장되며, 일시적 복제를 포함한 복제 행위가 발생한다. 일반적으로 일시적 복제는 일정 요건하에 면책이 가능하나, 원칙적으로는 복제권 침해 여부의 쟁점이 될 수 있다.
-03_“기계 학습” 중에서
저작물의 정의에 대해 대법원과 학설도 일관되게 ‘인간의’ 노력으로 한정하기 때문에 인간이 아닌 AI가 만들어 낸 결과물은 저작물성이 부인된다. 다만 ‘인간의’라는 의미를 인간이 직접적으로 제작한 것만이 아닌 인간과 직간접적으로 관련된 것으로 해석할 수 있다면, AI가 만들어 낸 결과물도 인간에 의해 창작되거나 제작된 AI에 의한 것이어서 인간의 사상과 감정이 표현됐다고 보지 못할 이유는 없다. 따라서 ‘인간의’에 대한 해석 여부에 따라 AI 생성물도 저작물성을 인정할 여지가 있다. 인간이 코딩한 소프트웨어이고 데이터 기반의 기계 학습도 인간에 의하여 이루어진 점 등 기술적으로 인간이 관여하여 만들어 낸 것이다. 또한 학습 데이터도 인간의 사상과 감정이 담긴 정보라는 점에서 인간의 사상과 감정의 표현이 아니라고 보기 어렵기 때문이다.
-06_“생성형 AI 창작과 저작자” 중에서
서비스 제공자를 CP로 인정하는 것은 지양될 필요가 있다. 프롬프트로 생성하는 행위는 이용자의 사실 행위로 봐야지 이를 서비스 제공자의 생성으로 볼 수 있는 것은 아니기 때문이다. 온라인 서비스 제공자로서의 측면에서 보면, 생성형 AI 서비스가 이용자가 제공한 데이터를 기반으로 새로운 콘텐츠를 생성하거나 제공하는 경우, 해당 서비스는 이용자가 업로드한 콘텐츠에 대한 호스팅 또는 중계 기능을 제공하는 온라인 서비스 제공자로 간주될 수 있다. 디지털 밀레니엄 저작권법은 온라인 서비스 제공자에 대한 책임을 제한하고 있으며, DMCA의 책임 제한 규정에 따라 온라인 서비스 제공자는 이용자가 업로드한 콘텐츠의 저작권 침해에 대한 책임에서 면책될 수 있다.
-09_“서비스 제공자 책임” 중에서