책소개
영상 콘텐츠의 창의성을 자극하는 조화로운 협력자, AI
AI가 영상 콘텐츠 제작에서 어떻게 혁신을 이끌고 있는지 탐구한다. 특히 AI가 편집, 얼굴 인식, 배경 제거, 자막 생성 등 후반 작업에서 어떻게 효율성을 극대화하고 있는지를 설명한다. AI는 영상 제작의 자동화를 통해 시간과 비용을 절감하며, 복잡한 작업을 빠르게 처리한다. 또한, AI는 영상 편집뿐 아니라 창의성의 영역에서도 인간과 협력하는 도구로 자리 잡고 있다.
이 책은 AI와 영상의 조화로운 협업을 통해 창의성을 확장하고, 효율성을 높이는 방법을 제시한다. AI의 기술이 영상 제작의 접근성을 높이고, 전문 지식이 없는 사람들도 쉽게 고품질의 콘텐츠를 제작할 수 있도록 돕는다는 사실을 강조한다. AI가 인간의 창의력을 보완하며, 영상 산업에서 새로운 가능성을 열어가는 방안을 제시한다.
200자평
AI가 영상 콘텐츠 제작에서 혁신을 이끄는 방식을 탐구한다. AI는 편집 자동화, 얼굴 인식, 배경 제거 등에서 효율성을 높이며 시간과 비용을 절감한다. 창의성 확장을 위한 협력자로서 AI의 역할을 강조하며 전문가가 아닌 사람도 고품질 영상을 제작할 수 있도록 돕는다.
지은이
이호은
청운대학교 방송영화영상학과 정교수로 재직 중이다. 한국외국어대학교에서 커뮤니케이션학 박사학위를 취득했다. 한국정치커뮤니케이션학회장을 지냈고 한국방송학회 영상연구회장으로 활동했다. KBS 시청자위원, 중앙선거관리위원회 자문위원을 역임했다. 전 방송 프로듀서로서 다수의 다큐멘터리와 드라마를 연출했다. 저서로 『스트리밍 시대의 비디오 저널리스트』(2015), 『커뮤니케이션으로 정치하라』(2014), 『영상과 상호미디어성』(2013), 『영상 이론과 실제』(2012), 『다큐멘터리 또 하나의 영화』(2009), 『영상학서설』(2008)이 있다. “한류 영상 콘텐츠의 한국어 수용에 관한 연구”(2024), “대통령후보 TV토론회의 수용태도 연구”(2022), “인기드라마에 내재된 공통구조와 그 양상”(2011), “다큐멘터리의 드라마 구조 수용에 관한 연구”(2006), “박근혜 대표 피습 이후 이미지 변화 연구”(2006), “분할영상광고의 특성 및 수용태도 연구”(2005), “노무현 대통령의 재신임 수용태도에 관한 연구”(2004) 등 100편 이상의 논문을 KCI, SCI, SSCI, SCOPUS 등 등재학술지에 게재했다.
차례
창의성을 자극하는 조화로운 협력자 AI!
01 AI 자동 편집
02 AI 얼굴 인식
03 AI 객체 추적
04 AI 색상 보정
05 AI 배경 제거
06 AI 사운드 믹싱
07 AI 모션 그래픽
08 AI 편집
09 AI 자막 생성
10 AI 클라우드 기반 영상 편집
책속으로
AI 자동화 영상 편집 기술은 영화와 방송 산업을 넘어 광고, 교육, 엔터테인먼트, 헬스케어 등 다양한 분야에서 활용될 것이다. 이에 따라 기존 산업에 혁신적인 변화가 일어날 것이며, 새로운 비즈니스 모델과 서비스가 등장할 것으로 전망된다. 이러한 변화에 대비해 각 산업 분야에서는 AI 기술 도입을 위한 준비와 인프라 구축이 필요할 수도 있다.
-01_“AI 자동 편집” 중에서
딥러닝은 머신러닝의 하위 분야로, 인공신경망을 활용해 대량의 데이터로부터 특징을 스스로 학습하는 기술이다. 딥러닝은 기존 머신러닝 알고리즘보다 복잡한 패턴 인식과 예측을 가능하게 한다. 대표적인 딥러닝 모델로는 합성곱 신경망(CNN), 순환 신경망(RNN), 오토인코더 등이 있다. 이러한 기술들은 비디오 데이터를 분석해 객체를 성공적으로 탐지하고 추적하는 데 중요한 역할을 한다.
-03_“AI 객체 추적” 중에서
가드너에 따르면, 창의성은 단순히 새로운 것을 만들어 내는 것이 아니라 기존 아이디어를 조합하거나 다양한 관점에서 문제를 바라보는 능력이다. 작가는 문학적 지능을 사용해 사람의 감정을 표현하고, 과학자는 논리적 지능을 사용해 복잡한 문제를 해결하는 방식을 제시한다. 그는 교육 방식에도 깊은 영향을 미쳤는데 학생들이 자신에게 맞는 지능을 활용해 창의적으로 생각하고 문제를 해결할 수 있도록 돕는 교육이 필요하다는 메시지를 전달한다.
-06_“AI 사운드 믹싱” 중에서
AI 자막 생성 기술에 사용되는 다양한 알고리즘과 모델이 존재한다. 음성 인식 분야에서는 통상적으로 가우시안 혼합 모델(GMM)과 히든 마르코프 모델(HMM)이 사용되어 왔으나, 최근에는 딥러닝 모델인 합성곱 신경망(CNN), 순환 신경망(RNN), 트랜스포머(Transformer) 등의 신경망 모델이 더 많이 활용된다. 이러한 방법들은 음성 인식과 자연어 처리의 성능을 크게 향상시킨다.
-09_“AI 자막 생성” 중에서