책소개
사진, 손에서 알고리즘으로
현대 사진 예술의 변화와 AI 기술과의 융합을 다룬 책이다. 인공지능 기술이 이미지 생성 방식을 어떻게 혁신했는지, 특히 GAN(적대적 생성 신경망)과 같은 기술이 예술과 사진의 경계를 어떻게 허물었는지를 설명한다. 사진의 역사를 통해 아날로그에서 디지털, 그리고 AI 생성 이미지로의 전환 과정을 탐구하며, 인간이 카메라로 작업하던 전통적인 방법에서 알고리즘이 주도하는 이미지 생산 방식으로의 변화를 분석한다. 인공지능 기술이 단순한 복제에서 벗어나 ‘새로운’ 이미지를 창조하는 과정을 설명하며, 사진의 본질과 존재론을 재조명한다.
기술의 발전으로 인해 예술가와 기계의 역할이 재정립되고 있다. AI가 창작의 주체로서 어떤 의미를 갖는지 논의해야 하는 이유다. 이 책은 인간이 AI로부터 자유로워지는 대신, 그 기계적 산출물의 소비자로 머무는 현상을 분석하며, 이와 관련된 철학적 문제도 탐구한다. AI를 활용한 이미지 생성 기술의 미래와 그것이 사진과 예술의 영역에서 어떤 변화를 가져올지에 대한 전망을 제시한다.
200자평
AI 기술이 사진 예술에 미친 변화를 다룬다. 인공지능은 손과 카메라를 넘어 이미지를 생성하며, GAN 같은 기술은 새로운 사진을 창조하는 데 기여한다. AI로 인해 변화된 사진의 존재론과 창작 주체에 대한 논의를 통해, 인간과 기계의 관계를 재조명하며 예술과 기술의 융합을 탐구한다.
지은이
박평종
중앙대학교 인문콘텐츠연구소 HK연구교수다. 중앙대학교 사진학과를 졸업하고 파리10대학에서 미학 박사학위를 받았다. <다큐멘터리 스타일>전(2014), <사진의 경계>전(2022), <미증유의 얼굴>전(2022), <생성사진 프로젝트>전(2024) 등 다수의 전시를 기획했다. 주요 저서로 『AI, 세상을 바꾸다』(2022), 『사진가의 우울한 전성시대』(2013),『한국 사진의 자생력』(2010) 등이 있다. “이미지 생성 인공지능의 가능성과 한계: 한국 초상화 기반 생성사진 제작 사례”(2023), “계산 착오 이미지: 알고리즘의 도전”(2022) 등 다수의 논문을 발표했다. 사진과 시각예술에 관한 연구를 진행해 왔으며, 인공지능 기술이 향후 인간의 시각 문화에 어떤 변화를 초래할지에 관심을 기울이고 있다.
차례
손, 장치, 알고리즘
01 프로그램
02 적대적생성신경망(GAN)
03 사진을 향하여
04 이미지 변환
05 스타일 합성
06 기타 생성 모델
07 가상 인간의 사진
08 생성 이미지는 사진일까?
09 인공지능과 창의성
10 생성 사진을 둘러싼 문제들
책속으로
사진 이후 인공지능을 활용한 이미지 생성에서도 프로그램의 논리는 똑같이 작동한다. 알고리즘의 생성 이미지 역시 장치 프로그램의 산물이기 때문이다. 예컨대 생성형 인공지능은 원하는 조건에 부합하는 이미지를 자동으로 산출하도록 ‘예정된’ 프로그램이다. 실상 프로그램의 목적은 정보를 산출하는 데 있으며, 그것은 결국 인간의 의도에서 출발했다. 따라서 장치 프로그램이 생산한 정보는 포괄적인 의미에서 예측할 수 있다. 그것이 프로그램의 본래 의미다. 즉 프로그램의 모든 가능성은 인간의 ‘기획’ 속에 이미 예정돼 있다.
-01_“프로그램” 중에서
ProGAN의 성능은 IS(Inception Score) 수치에서도 확인된다. 실상 ProGAN이 생성한 이미지는 원본 사진과 구분이 어려울 정도로 놀라운 유사성을 보인다. 그런데 유사성은 사람의 ‘주관적’ 판단에 따르므로 생성 모델의 ‘성능’을 평가하는 객관적 척도가 될 수 없다. IS는 GAN의 성능을 ‘수학적으로’ 측정하기 위해 고안된 지표로, FID(Frechet Inception Distance)와 더불어 생성 이미지의 성능을 수학적으로 계산하는 가장 보편적인 측정 방법으로 쓰인다. 생성 이미지의 데이터 분포를 계산해 원본 이미지에 대한 충실도(fidelity)와 다양성(variety)을 평가하는 것이다. ProGAN이 학습한 또 다른 데이터셋은 Cifar10인데, 이 데이터셋은 각종 물건이나 동식물, 건물, 풍경 등을 촬영한 32×32비트 컬러사진 6만 장으로 구성돼 있다.
-03_“사진을 향하여” 중에서
마이 헤리티지(My Heritage)에서 개발한 딥 노스탤지어(Deep Nostalgia)는 ‘살아 움직이는 인물사진’을 제공하는 인공지능 알고리즘이다. 마이 헤리티지는 세계 각지에 흩어져 있는 가족이나 친인척 등을 찾아 주는 이스라엘의 인터넷 플랫폼으로, 오래된 기념사진이 주요 자료로 활용되고 나아가 DNA 검사 키트도 동원된다. 사용자가 여기에 사진을 업로드하면 마치 비디오 영상처럼 10∼20초 정도 인물에 동작을 부여해 준다. ‘살아 있는 사진’이 탄생하는 셈이다. 딥 노스탤지어는 바로 이 낡은 기념사진의 ‘죽은’ 이미지에 움직임을 부여함으로써 고인의 살아생전 모습을 회상할 수 있게 해 준다. 물론 이 움직임은 비디오로 촬영한 것이 아니기에 실제 현실은 아니다. 말하자면 사진 속 인물의 동작은 허구다.
-06_“기타 생성 모델” 중에서
결국 진정한 창의성(역사적+심리적)의 구현은 요원하나, 보덴은 컴퓨터가 조합(combination)과 탐색(exploration), 변형(transformation)을 통해서 역사적 창의성을 구현할 수 있다고 주장한다. 우선 컴퓨터는 이미 저장된 데이터를 랜덤하게 조합해 새로운 정보를 산출할 수 있다. 시각예술에서 널리 활용되어 온 콜라주나 몽타주가 그 예다. 문제는 어떤 방법으로 조합을 해야 새롭고 가치 있는 생성인지 컴퓨터 스스로 판단할 수 없다는 점이다.
-09_“인공지능과 창의성” 중에서