책소개
AI가 만드는 소리는 감정을 가질 수 있는가
사운드는 인간의 감정과 기억을 가장 직접적으로 흔드는 감각의 언어다. 우리는 소리를 통해 공간을 인식하고, 음색 하나로 과거를 소환하며, 음악과 음성으로 서사를 이해해 왔다. 그러나 이제 사운드는 인간의 손을 떠나 알고리즘과 데이터의 언어로 다시 쓰이고 있다. 이 책은 이러한 전환의 지점에서 사운드의 본질을 다시 묻는다. AI는 소리를 얼마나 정교하게 만들 수 있는가가 아니라, 소리를 통해 감정을 어떻게 전달하는가가 핵심이라는 문제의식에서 출발한다. 음악, 음성, 효과음이라는 사운드의 세 축을 중심으로 생성형 AI가 창작 과정에 개입하는 방식을 분석하고, 감성 기반 사운드 모델, 공간형 오디오, 인터랙티브 사운드 등 최신 기술이 실제 창작 현장에서 어떻게 활용되는지를 살핀다. 동시에 사운드 디자인의 미학과 윤리, 창작 주체의 변화라는 철학적 질문도 함께 다룬다. 기술의 완성도보다 감각의 회복에 주목하며, AI를 도구가 아닌 창작 파트너로 인식하는 새로운 창작 철학을 제시한다. 기술과 감성이 교차하는 지점에서, 사운드의 미래와 인간의 청각적 경험이 어떻게 진화하는지를 사유하는 책이다.
200자평
생성형 AI가 사운드 창작을 어떻게 변화시키고 있는지를 감각과 철학의 관점에서 탐구한다. 음악·음성·효과음을 아우르며, 기술의 효율이 아니라 인간의 감정 경험에 주목한다. AI를 창작의 도구를 넘어 새로운 사운드 언어로 이해하려는 시도다. AI문고. aiseries.oopy.io에서 필요한 인공지능 지식을 찾을 수 있다.
지은이
박남예
사운드 디자인과 작곡을 기반으로, 기술·예술·교육을 아우르는 학제적 연구를 해 왔다. 추계예술대에서 작곡을 전공하고, 성신여대 교육대학원에서 음악교육 석사와 이화여대 실용음악대학원에서 음악공학 석사를 취득했다. 이후 동국대 영상대학원에서 사운드 디자인 박사과정을 수료하며 현장의 언어를 이론적 틀로 체계화하였고, 추계예술대 대학원에서 사운드 디자인 제작 과정을 주제로 예술경영 박사학위를 받으며 학문적 기반을 확장하였다.
장편영화 사운드 디자인 실무 경험을 바탕으로, “자전적 영화에서 내면 의식을 나타내는 사운드 디자인 기법 연구”(2021), “영화의 의식의 흐름 기법과 사운드 디자인의 양상”(2021), “사적(私的) 영화에 나타난 사운드 디자인의 특성 연구”(2019), “예술경영 측면의 영화 사운드 고찰”(2021) 등 다수의 연구를 통해 이론적 논의를 심화시켰다. 또한 “영화 사운드 디자인에서 가상악기 활용 사례 연구”(2019), “VR 공간의 사운드 디자인 발전 방향 탐색 연구”(2023), “AI 사운드 생성 기술의 감정 기반 모델 분석과 사운드 디자인 응용 연구”(2025) 등을 통해 기술적 도구와 예술적 맥락의 융합 가능성을 탐구하고 있다. 현재는 안양대학교 교양대학에 재직하며 교육 현장을 기반으로 연구를 이어가고 있다.
차례
AI 시대 사운드 환경의 재정의
01 AI 기술이 이끄는 사운드의 변화
02 심리 음향 모델링과 감성 컴퓨팅
03 생성형 사운드: 효과음과 폴리
04 AI 음악 작곡과 편곡
05 몰입형 공간 사운드
06 적응형 인터랙티브 오디오
07 사운드 브랜딩과 AI전략
08 AI 사운드의 미학과 예술성
09 AI 사운드의 윤리·법적 쟁점
10 포스트ᐨAI 시대의 사운드 디자인
책속으로
트랜스포머 등장 이후 음성 인식의 정확도는 급격히 향상되었고, 오늘날 구글 어시스턴트, 스포티파이 추천, 게임 속 실시간 대사 생성 등이 모두 이 기술 덕분이다. 트랜스포머는 이제 음향 처리 분야의 사실상 표준이 되었다. 이 모든 변화의 핵심은 기계가 단순히 신호를 처리하는 것을 넘어, 소리의 의미를 이해하기 시작했다는 점이다. 이는 다음 단계, 즉 기계가 소리를 직접 만들어 내는 생성의 시대로 가는 필수적인 토대가 되었다.
-01_“AI 기술이 이끄는 사운드의 변화” 중에서
이렇듯 상업 영화 현장에서는 음성 보정을 포함하여 다소 한정된 활용에 머물렀다면, 앞에서 살펴본 바와 같이 학계와 연구 단계에서는 AI 폴리가 꾸준히 성과를 보여 왔다. 또한 의외로 대중의 영역에서 AI 폴리와 오디오 자동화 기술이 확산되고 있다. (…) 이처럼 AI 사운드 기술은 영화 현장의 신중한 접근과 대중 영역의 빠른 확산이라는 이중적 양상을 보이고 있다. 이러한 경향은 음악 분야에서 더욱 뚜렷하게 나타나고 있는데, AI 음악 생성 기술은 사운드 효과보다 훨씬 폭넓은 창작적 가능성과 산업적 파급력을 보여 주고 있다.
-03_“생성형 사운드: 효과음과 폴리” 중에서
그렇다면 왜 이것이 중요한가? 같은 음악이라도 이어폰으로 들을 때, 거실 스피커로 들을 때, 공연장에서 들을 때 청각 경험은 전혀 다르게 다가오기 때문이다. AI는 여기서 한 단계 더 나아가, 청취자의 머리 움직임, 시선, 행동 패턴까지 실시간으로 분석하며 음향을 정밀하게 조율한다. 그 결과 청취자는 단순히 음악을 ‘듣는’ 것이 아니라, 실제로 그 공간 안에 들어와 있는 듯한 몰입을 경험한다. 이 기술은 다채널 스피커 환경을 기반으로 작동하며, 작은 거실에서부터 대형 공연장까지 규모에 맞게 확장될 수 있다. 따라서 객체 기반 오디오와 AI의 결합은 단순한 기술적 진보가 아니라, 사운드 경험의 패러다임 자체를 바꾸는 중요한 전환점이라 할 수 있다.
-06_“적응형 인터랙티브 오디오” 중에서
이러한 결과는 AI 음악이 광고, 마케팅, 정치 캠페인 등에서 무의식적 감정을 유도하거나 조작하는 수단으로 활용될 수 있다는 우려로 이어진다. 하지만 동시에, 감정을 움직이는 것은 본래 음악 일반의 속성이기도 하다. 인간 작곡가들 역시 광고 음악이나 영화 음악을 통해 청중의 정서를 유도해 왔으며, 음악과 소비자 연구에서는 긍정적인 음악이 소비자의 구매 의도를 높이고, 브랜드 기억을 강화한다는 사실을 제시한 바 있다. 따라서 AI가 감정을 ‘조작한다’는 표현은 자극적이거나 단정적으로 사용하기보다, 윤리적·법적 맥락 속에서 신중히 다뤄져야 한다.
-09_“AI 사운드의 윤리·법적 쟁점” 중에서