책소개
기술과 예술 사이, 창작을 다시 생각하다
AI가 예술을 창작할 수 있을까? 지능이란 무엇이며, 창작이란 어떤 과정을 말하는가? 인간만의 고유한 영역이라 여겨졌던 예술 창작은 생성형 AI의 등장으로 경계가 무너졌다. 챗GPT와 같은 초거대 언어 모델은 인간의 질문 의도를 파악하고 문맥에 맞는 결과물을 만들어 낸다. AI는 실제로 새로운 의미를 창출하고 기능을 부여할 수 있는 단계에 이르렀다. 특히 ‘기존에 없던 조합을 통해 새로운 것을 만들어 낸다’는 창작의 정의에 비추어 볼 때, AI는 예술 창작 주체가 될 충분한 자격을 갖추었다.
그러나 중요한 것은 기술 그 자체보다 인간의 태도다. 변화는 늘 낯설고 불편하지만, 그것을 거부하는 대신 적극적으로 받아들이고 협력하는 방식이 생존과 성장에 필수적이다. 이 책은 AI 창작 도구를 위협이 아니라 파트너로 받아들이는 새로운 예술의 방향성을 제시한다. AI가 할 수 있는 일, 인간만이 할 수 있는 일, 그 경계를 재정의하며 창작의 지평을 넓히려는 이들에게 이 책은 든든한 이정표가 되어 줄 것이다.
200자평
AI가 예술을 창작할 수 있을까? 이 책은 인간 지능과 창작의 본질을 짚으면서 생성형 AI가 예술의 주체가 될 가능성을 논의한다. 단순한 도구를 넘어 새로운 의미를 생성하는 존재로서 AI를 조명하고, 창작자에게 변화에 대응하는 태도를 제안한다.
지은이
정성훈
한성대학교 AI응용학과에서 재직 중이다. 1989년 KAIST 석사 과정부터 인공지능 연구를 수행해 왔다. 2009년 KAIST 바이오및뇌공학과에서 연구년을 보내며 바이오 영감공학과 시스템생물학 연구를 약 8년 정도 진행했다. 2016년 알파고 사태를 계기로 다시 인공지능 연구에 집중하고 있으며, 최근 챗GPT와 같은 대규모 언어 모델에 자극을 받아 석사 시절부터 꿈꿔 왔던 범용 인공지능 구현에 관심을 두고 있다. 음악을 좋아해 2014년부터 인공지능 자동 작곡 연구를 해 오고 있으며 최근에는 대규모 언어 모델을 이용한 시나리오 생성 연구를 시작했다. 저서로는 『Unix 및 인터넷 개론』(2000)이 있으며, 번역서로는 『어셈블리 언어』(2004), 『디지털공학(5판)』(2009) 등이 있다. 시스템 생물학 연구로 Science Signaling 표지 논문을 공동저자로 발표하는 등 20여 편의 SCI 논문과 160편 이상의 국내외 논문을 발표했다. 또한 국내 다양한 중소기업에 자문 교수로 활동하고 있다.
차례
AI가 예술을 창작할 수 있을까
01 AI와 예술의 만남
02 AI의 역사 및 방법
03 생성 AI의 등장
04 이미지 생성 AI와 예술 분야 응용
05 텍스트 생성 AI와 예술 분야 응용
06 오디오 생성 AI와 예술 분야 응용
07 멀티모달 생성 AI와 예술 분야 응용
08 AI와 예술 교육
09 AI와 윤리
10 AI와 예술의 미래
책속으로
2차 부흥기에 AI를 예술 창작에 활용한 대표적 응용 사례는 다음과 같다. 1981년 데이비드 코프(David Cope)가 전문가 시스템과 패턴 분석을 기반으로 EMI (Experiments in Music Intelligence) 시스템을 개발하기 시작했다. 이 시스템은 바흐, 모차르트, 쇼팽 등 유명 작곡가의 음악 스타일을 학습하고 새로운 곡을 작곡하는 데 사용되었다. 이 시스템이 생성한 음악은 인간 작곡가의 작품과 매우 유사해 AI가 인간의 창작 스타일을 모방할 수 있음을 입증했다. 그러나 이러한 모방이 단순한 패턴 재현인지 실제로 창의적인 작업인지를 둘러싸고 논쟁이 일어났다. 이러한 논쟁은 딥러닝을 사용한 최근의 생성 AI에서도 계속되고 있다.
-01_“AI와 예술의 만남” 중에서
이미지 생성 기술에는 생성적 적대 신경망 외에도 변분 오토인코더와 확산 모델이 있다. 변분 오토인코더는 디데릭 킹마(Diederik Kingma)와 맥스 웰링(Max Welling)이 오토인코더(autoencoder)를 확장해 제안한 확률 기반 생성 모델로, 잠재 공간을 학습해 새로운 데이터를 생성한다(Kingma & Welling, 2013). 변분 오토인코더는 데이터의 분포를 확률적으로 모델링해 이미지 생성뿐 아니라 음성 및 텍스트 생성 등에도 활용된다. 그러나 블러(blur) 현상이 발생해 생성적 적대 신경망에 비해 생성된 이미지의 품질이 상대적으로 낮다는 단점이 있다. 그렇지만 잠재 공간을 수학적으로 명확히 정의해 조작할 수 있어 최근에도 여러 분야에서 많이 사용되고 있다.
-03_“생성 AI의 등장” 중에서
멀티모달 AI는 예술 창작뿐 아니라 로봇 기술과 결합해 더욱 고도화된 응용이 가능하다. AI에 인간의 시각, 청각, 언어 능력을 학습시키고 이를 로봇 시스템에 적용하면 더욱 자연스러운 상호작용과 창작 활동을 수행할 수 있다. 로봇 아트 분야에서는 그림을 그리는 로봇이나 자동으로 음악을 연주하는 로봇 시스템이 연구되고 있다. 예를 들어 AI가 입력된 텍스트를 기반으로 그림을 생성하고, 로봇이 이를 실제 캔버스에 표현하는 프로젝트들이 진행 중이다. 또한 영상, 음악, 대화를 통해 인간과 상호작용하면서 창작을 지원하는 휴머노이드 로봇이 개발되고 있다. 이러한 로봇은 공연 예술, 교육, 인터랙티브 미디어 등의 분야에서 활용될 수 있다.
-07_“멀티모달 생성 AI와 예술 분야 응용” 중에서