책소개
AI가 세계를 생성할 때, 인간은 시선을 결정한다
이제 영화는 카메라로 찍는 예술이 아니라, 선택으로 완성되는 예술로 전환되고 있다. AI는 시나리오를 입력하면 장면을 생성하고, 빛과 구도, 배우의 표정까지 계산해 하나의 세계를 구현한다. 그러나 이 변화는 감독의 소멸이 아니라 오히려 본질로의 귀환이다. 제작의 복잡한 과정이 제거된 자리에서, 감독에게 남는 것은 오직 판단이다. 무엇을 선택하고 무엇을 버릴 것인가, 어떤 시선으로 세계를 구성할 것인가라는 질문이다. ‘Story-to-Video’ 시대라는 근본적 변화 속에서 영화 감독의 역할이 어떻게 재정의되는지를 탐구한다. 생성 이미지가 현실의 흔적이 아닌 ‘가능성의 결과’로 작동하는 시대에, 영화의 존재론과 미학이 어떻게 변화하는지를 철학적으로 조망한다. 동시에 창작, 노동, 윤리의 구조가 흔들리는 전환 속에서 인간의 역할을 다시 묻는다. AI는 감독을 대체하지 않는다. 다만 관점 없는 감독을 도태시킬 뿐이다. 기술을 넘어서, 미래의 감독이 어떤 시선과 태도를 가져야 하는지를 묻는 사유의 기록이다.
200자평
AI가 영화를 생성하는 시대, 감독의 역할은 사라지는 것이 아니라 더 순수해진다. 이 책은 ‘선택’과 ‘시선’으로 재정의되는 연출의 본질을 탐구한다. 기술을 넘어 인간의 관점이 무엇인지 묻는, 미래 영화 창작자를 위한 사유의 안내서다. AI문고. aiseries.oopy.io에서 필요한 인공지능 지식을 찾을 수 있다.
지은이
박인수
한국영상대학교 영상편집제작학과 부교수다. 미시간 주립대학교 커뮤니케이션 예술 및 과학 대학, 텔레커뮤니케이션학 석사학위를 받았다. 2024년부터 한국영상대학교 마이스터대학 영상편집전공석사 전공주임을 맡고 있다. 2024∼2029년까지 아세안 TVET 프로그램 인도네시아 교환학생 영상편집 및 색 보정 수업 영어 강좌를 진행하고 있다.
저서로는 《AI와 넥스트 미디어》(2025), 《AI 영상 편집 마스터》(2025)와 2023년 영상편집 이론 및 실습 서적 《편집의 신(Scene)》이 있다. 2019년부터 전 세계 100여 개 대학 영화영상대학의 학회인 CILECT(International Association of Cinema, Audiovisual and Media School) 위원으로 활동하고 있다. 2019년 우즈베키스탄 TUIT(Tashkent University of Information Technology 파견교수로 현지 영상전공 학부 수업을 진행했다. 2014년 전문 영상편집도구인 애플 파이널 컷 프로 10.1 공인교재 번역을 했다.
차례
Story-to-Video 시대의 개막
01 AI와 영화의 만남
02 프리 프로덕션의 혁신
03 Story-to-Video 파이프라인
04 프로덕션의 재구성
05 포스트 프로덕션의 자동화
06 제작 속도와 비용 구조 혁명
07 AI 장편 영화의 도전 과제
08 영상 산업 구조의 재편
09 초상권 문제와 영상 인증제
10 AI 감독 시대의 장편 영화
책속으로
AI는 더 이상 영화의 주변부에 머무는 기술이 아니다. 가까운 미래, 드라마와 영화 제작 전반에서 AI가 관여하지 않는 과정이 오히려 예외가 될 가능성이 높다. 새로운 기술과 오래된 장르가 만날 때, 기대와 불안은 언제나 동시에 등장한다. 초기의 AI는 프리 프로덕션 단계에서 시나리오를 보조하고, 콘티를 시각화하며, 시간과 비용이 많이 드는 작업을 도와주는 ‘가벼운 협력자’에 가까웠다. 하지만 지금, 이 관계는 분명히 다른 국면으로 들어섰다. AI는 단순히 명령을 수행하는 도구가 아니라, 선택지를 제안하고, 변주를 만들어 내며, 창작 과정 전반에 개입하는 하나의 창작 주체로 이동하고 있다. 이 변화는 기술의 업그레이드가 아니다. 영화를 바라보는 방식, 그리고 ‘창작이란 무엇인가’라는 질문 자체를 다시 던지게 만드는 사건이다. 그래서 질문은 이렇게 바뀐다. “AI를 어디까지 사용할 수 있는가?”가 아니라 “영화는 AI와 함께 만들어질 때 무엇으로 다시 정의되는가?” 그리고 “인간과 AI는 어떤 방식으로 창작을 나눌 수 있는가?”
-01_“AI와 영화의 만남” 중에서
전통적으로 시나리오는 의미의 구조물이었다. 문장은 상상을 자극했고, 그 상상은 콘티와 공간 구성, 촬영 계획으로 이어졌다. 시나리오는 해석을 전제로 하는 언어였고, 이미지는 그 해석의 결과였다. 그러나 S2V 파이프라인에서 텍스트는 더 이상 의미만을 담은 언어로 남지 않는다. 시나리오는 곧바로 데이터의 층위로 전환된다. 텍스트가 입력되는 순간, AI는 감정 톤, 시간과 공간의 밀도, 인물의 행동 패턴과 장면 전환 리듬을 분석한다. 그리고 그 결과를 바탕으로 수많은 이미지 가능성을 동시에 생성한다. 이 과정에서 서사는 더 이상 ‘원본’이 아니다. 이미지를 만들어 내기 위한 원료에 가깝다.
-03_“Story-to-Video 파이프라인” 중에서
영화 제작은 오랫동안 비용이 곧 규모를 의미하는 예술이었다. 자본의 크기가 상상력의 범위를 결정했고, “큰 영화는 큰돈이 있어야 한다”는 전제가 산업 전반을 지배해 왔다. 하지만 AI의 도입은 이 비용 질서를 근본에서 흔든다. 기획·제작·후반으로 나뉘어 있던 비용의 덩어리들이 연산과 자동화를 통해 압축되면서, 제작비는 단순히 줄어드는 것이 아니라 구조 자체가 재편된다.
-06_“제작 속도와 비용 구조 혁명” 중에서
AI 시대에 영상은 더 이상 그 자체로 진실일 수 없다. 화면에 “보인다”는 사실만으로는 생성과 촬영, 합성과 기록을 구분할 수 없고, 얼굴과 목소리는 얼마든지 복제·변형될 수 있다. 그래서 신뢰는 영상 내부의 인상에서 만들어지지 않는다. 신뢰는 점점 영상 바깥의 시스템으로 이동한다. 이 변화가 요구하는 것이 바로 영상 인증(Video Provenance)이다. 영상 인증제는 영상이 어떤 방식으로 생성되었는지, AI가 사용되었는지, 편집과 합성의 이력이 무엇인지, 얼굴 데이터의 출처와 동의가 어떻게 확보되었는지를 기술적으로 기록하고 추적한다. 이는 창작을 막는 규제가 아니라, 무너진 신뢰를 회복하기 위한 최소한의 기반이다.
-09_“초상권 문제와 영상 인증제” 중에서