책소개
AI가 읽어 낸 문학의 감정 지도
딥러닝과 대규모 언어 모델을 활용해 이상의 단편 소설 속 감정 구조를 정량적으로 분석한다. 기존 감성 분석이 긍·부정 이분법에 머물렀다면, 이 책은 KcELECTRA 모델과 코테(KOTE) 데이터세트를 기반으로 44개 감정 범주를 문장 단위로 측정해 감정의 분포와 흐름을 시각화했다.
특히 ‘에피파니’라 불리는 깨달음의 순간을 감정 패턴에서 포착하며, 불안·공포 이후 깨달음·감동이 도출되는 ‘정서적 선회’ 양상을 실증적으로 제시한다. 또한 정량 분석과 정성 독해를 병행해 문학적 맥락을 놓치지 않으려는 균형 잡힌 해석 방식을 취한다. 데이터, 코드, 시각화 결과를 OSF에 공개해 독자와 연구자가 직접 재현·확장할 수 있는 개방형 문학 연구의 가능성을 제시한다.
200자평
딥러닝 기반 감정 분석으로 이상의 단편 속 감정 흐름을 계량화했다. ‘에피파니’를 정서 패턴에서 포착하고, 비애적 내면 구조를 데이터로 확인했다. 분석 자료를 통해 개방형 문학 연구의 길을 연다. 인공지능총서. aiseries.oopy.io에서 필요한 인공지능 지식을 찾을 수 있다.
지은이
지해인
한국학중앙연구원 디지털인문학연구소 연구원. 한국학중앙연구원 한국학대학원 인문정보학 전공에서 “디지털 감각·감정 분석을 통한 이상 문학의 에피파니 연구”로 문학석사 학위를 받고, 동 대학원에서 박사과정을 밟고 있다. 한국전통문화대학교에서 강의하며, ‘전산 문학 연구(computational literary studies, CLS)’를 필두로 한 디지털 인문학의 제 분야에 관심을 갖고 연구하는 나날을 보내고 있다.
김바로
한국학중앙연구원 인문정보학 조교수. 북경대학교에서 역사학 학사 및 석사, 한국학중앙연구원에서 “제도와 인사의 관계성 데이터 아카이브 구축과 활용”으로 박사 학위를 받았다. 중앙대학교 HK+인공지능인문학사업단 HK연구교수를 지냈으며, 한국외대, 경희대 등에서 강의했다. 저서로는 《디지털 인문학 입문》(2016), 《AI가 내려온다》(2022) 등이 있다. “국문장편소설의 감정에 대한 정성적·정량적 연구 시론”(2024), “한국역사인물데이터베이스 설계 시론”(2023), “<공공데이터법>과 인문데이터”(2022) 등 다수의 논문을 게재했다. ‘知其不可而爲之’를 늘 새기며, 디지털인문학이라는 캔버스 위에 인문학의 깊이와 디지털 기술의 혁신을 담아내는 연구와 교육에 정진하고 있다.
차례
기계가 감정을 읽는다는 것
01 디지털 감정 분석, 문학을 새롭게 읽다
02 전통적인 디지털 감정 분석 방법
03 AI, 텍스트의 감정을 읽다
04 감정 지도 그리기
05 감정 분류 데이터 구축 가이드
06 AI가 예측하는 문장 속 감정
07 소설가 이상과 에피파니
08 AI로 본 이상의 단편 소설
09 AI로 본 이상의 〈날개〉
10 문학 감정 분석의 미래
책속으로
미국의 인지언어학자 레이코프(George Lakoff)는 추상 개념을 육체화된 경험에서 파생된 은유로 보고, 몸 담론에 대한 새로운 접근을 시도했다. 후설(Edmund Husserl)은 신체는 단순한 살덩어리가 아닌, 삶이라는 의식이 깃든 대상으로 보았다.
우리는 몸을 통해서만 공간적 대상을 지각할 수 있기에, 신체는 대상과 상호 작용을 하기 위한 구체적인 조건이 된다. 또한 지각이 펼쳐지는 나의 신체는 과거, 현재, 미래가 동시에 존재하는 ‘기억하는 몸’으로, 단순한 사물이 아닌 정신의 표현, 나아가 ‘심화(心化)된 몸’이 된다. 감각ᐨ감정ᐨ행위의 연쇄는 개인과 외부 세계가 교류하는 일반적인 도식(scheme)이라고 할 수 있다.
감정에 기반한 독해는 감정의 재실천이라는 측면에서 큰 의미를 갖는다. 영국의 사회학자 윌리엄스(Simon J. Williams)는 감정을 사회적 구성물로 바라보는 것을 넘어, 구조적인 동시에 구조화가 진행 중인 것, 즉 사회적 효과를 지니는 동적이고 능동적인 것으로 파악했다.
-01_“디지털 감정 분석, 문학을 새롭게 읽다” 중에서
버트는 방대한 코퍼스를 사전 학습한 모델인 만큼, 방대한 학습 데이터가 없이, 약간의 감정 분류 데이터만 추가로 학습(few-shot learning)해도 뛰어난 감정 분류기가 된다. 가령 SKT 브레인(SKT Brain)에서 한국어 위키백과와 뉴스 데이터를 기반으로 사전 학습한 코버트(KoBERT, Korean BERT)는 네이버 영화 리뷰 감성 코퍼스(NSMC)로 파인 튜닝했을 때, 다국어 버트(multilingual BERT)가 기록한 87.5%보다 높은 수치인 약 90%의 감성 분류 정확도를 기록해 한국어 특화 언어 모델의 효용성을 입증한 바 있다. 이후 이상(李箱) 소설 감정 분석 장에서 사용할 Kc엘렉트라(KcELECTRA) 모델에 코테(KOTE)를 파인 튜닝한 모델 역시 버트 계열의 엘렉트라(ELECTRA) 모델을 파인 튜닝한 모델이다.
-03_“AI, 텍스트의 감정을 읽다” 중에서
“나는 유쾌하오”라는 문장은 표면적으로는 긍정의 감정을 나타내며, 실제 감정 분석 결과 역시 ‘기쁨’, ‘행복’, ‘즐거움/신남’ 등의 감정에 높은 확률 값을 부여한 것을 확인할 수 있다.
그러나 ‘박제가 되어 버린 천재’는 텍스트의 전체적인 맥락 속에서 비극적 상황에 대한 반어적 표현에 가깝다. ‘천재’가 ‘박제’로 전락하고 말았다는 탄식의 함의를 이해한다면, 그리고 그 의미를 통찰할 수 있는 독자라면 해당 문장에서 ‘슬픔’ 그리고 ‘절망’ 정도의 감정을 포착함이 더 자연스러울 것이다.
-06_“AI가 예측하는 문장 속 감정” 중에서
다섯 번째 외출(〈날개〉, ID:582)을 감행한 ‘나’는 쓰디쓴 입맛을 달래기 위해 커피를 마시려 하나 자신이 무일푼 신세임(〈날개〉, ID:586)을, 몇 시간 후 자신이 미쓰꼬시 옥상에 있는 것(〈날개〉, ID:591)을 깨닫는다. 이곳에서 ‘나’는 “또 나 자신에게 물어보”(〈날개〉, ID:594)면서 스스로의 삶을 회고하기 시작한다.
이 시점부터 깨달음을 포함해 여타 감정 전반은 하향선을 그리다가 “나는 피로와 공복 때문에 무너져 들어가는 몸뚱이를 끌고 그 회탁의 거리 속으로 섞여 들어가지 않는 수도 없다 생각했다”(〈날개〉, ID:608)라는 대목에서 새롭게 깨달음의 감정이 고조되기 시작한다.
-09_“AI로 본 이상의 〈날개〉” 중에서