책소개
AI 번역, 한국어의 결을 읽을 수 있을까
번역 기술의 편리함 이면에서 언어와 문화가 어떻게 손실되는지를 탐구한다. 단순한 문장 변환을 넘어, 한국어의 ‘맛·색·소리·정서’ 같은 감각적 층위와 시·노랫말 속의 정서를 AI가 어떻게 단순화하거나 왜곡하는지 구체적 사례로 짚는다. 고자원 언어 중심 구조에서 비롯된 편향, 문화·젠더 편향 문제를 분석하며, AI 번역이 만들어 내는 문화적 둔감성의 양상도 드러낸다. 의료 번역처럼 생명과 직결된 고위험 영역에서는 AI 번역의 가능성과 동시에 치명적 한계를 경계해야 한다.
기술의 원리를 설명하는 매뉴얼이 아니라, AI 번역이 어디까지 언어를 이해할 수 있는지 묻는 성찰의 기록이다. 웃음을 자아내는 오역 사례에서 출발해, 언어를 단순한 정보가 아니라 감정과 역사, 삶의 결을 담은 그릇으로 바라보며, 슬기로운 번역기 사용을 위한 감별력을 길러 준다. 한국어라는 언어적 자산을 지키며 AI와 공존할 미래를 모색한다.
200자평
번역 기술이 한국어의 맛·색·정서 같은 감각을 어떻게 단순화하는지 분석한다. 문화·젠더 편향, 의료 번역의 한계까지 짚으며 AI와 언어의 공존을 성찰한다. 인공지능총서. aiseries.oopy.io에서 필요한 인공지능 지식을 찾을 수 있다.
지은이
남영자
맥길대학교에서 음성학 분야로 박사 학위를 받았다. 중앙대학교 인문콘텐츠연구소 HK연구교수 및 연구전담교수로 재직하며 다양한 인공지능과 인문학 융합 연구를 수행했으며, 대표적으로 한국어 음성 감정어 데이터베이스(Chung-Ang Auditory Database of Korean Emotional Speech: A Validated Set of Vocal Expressions With Different Intensities) 구축 프로젝트를 주도했다. 딥러닝을 활용한 음성 감정어 인식 연구를 포함해 KCI, SCI(E) 등재 학술지에 다수의 논문을 발표했다. 주요 저서로는 《더 나은 AI, 더 나은 삶》, 《인공지능 데이터해석학》이 있으며, 현재 한양대학교에서 강의하고 있다. 연구 분야는 음성학, 말소리 지각, 언어 습득, 음성 감정 인식 등이며, 최근에는 음성 인식 연구로 영역을 확장하고 있다.
차례
AI 번역과 언어의 경계
01 AI 번역, 고자원 언어 편향
02 문화적 편향
03 젠더 편향
04 K-맛 표현
05 K-색채어
06 K-의성어·의태어
07 K-시
08 K-대중가요 가사
09 K-정서
10 AI 의료 번역의 가능성과 경계
책속으로
언어의 소멸은 단순히 말의 사라짐을 의미하지 않는다. 언어는 그 언어를 사용하는 공동체의 역사, 지식, 가치관, 세계관을 담고 있는 문화적 자산이다. 많은 저자원 언어는 자연과 인간의 관계, 공동체 중심의 삶의 방식, 세대 간 전승되는 지혜를 고유한 언어 구조를 통해 전달한다. 그러나 AI 시스템이 이들 언어를 번역하거나 분석하지 못할 경우, 이러한 문화적 지식은 디지털 환경에서 기록되지 않고 사라지게 된다. 언어의 소멸은 곧 문화의 단절을 의미하며, 이는 인류 전체의 문화적 다양성과 지적 자산이 줄어드는 결과로 이어질 수 있다.
-01_“AI 번역, 고자원 언어 편향” 중에서
AI는 복잡한 문장을 단순화하려는 경향이 있다. 이때 젠더가 모호하면 학습된 확률에 따라 남성 대명사를 기본 값으로 선택하는 경우가 많다. 또한 문맥을 충분히 이해하기 어려운 구조는 번역 과정에서 젠더 판단 오류를 더욱 쉽게 일으킨다. 여기에 사용자의 수정이 반복되면 AI는 이를 다시 학습하며 편향을 재생산하고 강화하는 피드백 루프(feedback loop)가 형성된다. 피드백 루프는 AI 시스템이 이전의 결과를 다시 학습하여 그 학습을 바탕으로 점점 더 같은 결과를 만들어 내는 과정이다. 예를 들어 성별에 대한 편향이 포함된 사용자 수정이 계속 반복되면, AI는 이러한 수정 사항을 학습하여 성별 편향을 반복적으로 생성하는 악순환을 초래할 수 있다.
-03_“젠더 편향” 중에서
AI 번역기의 한국어 의성어·의태어 처리는 아직 뚜렷한 한계를 지닌다. 그럼에도 문맥을 고려하려는 시도, 소리의 질감이나 감정을 살피려는 움직임은 분명히 관찰된다. 그러나 한국어 화자인 필자에게는 여전히 번역 결과가 전달하지 못하는 심리적 거리감이 존재한다. 예를 들어 ‘간들간들’은 ‘soft breeze(부드러운 미풍)’나 ‘gently(부드럽게)’ 같은 표현만으로는 메워지지 않는 감각의 틈이 있다. 한국어에는 ‘간들간들’, ‘살랑살랑’, ‘하늘하늘’ 등 바람을 묘사하는 다양한 표현이 존재하며, 각 단어가 불러일으키는 이미지는 미묘하게 다르다. 이는 수치화하기 어렵지만, 한국어 사용자에게는 분명히 구분되는 감각이다.
-06_“K-의성어·의태어” 중에서
‘한 많은 이 세상’을 GPT는 ‘sorrow-filled world(슬픔으로 가득한 세상)’, 구글 번역은 ‘this world full of sorrows(슬픔으로 가득한 이 세상)’로 번역했다. 두 표현 모두 자연스럽지만 ‘sorrow(슬픔)’는 주로 비애나 슬픔에 집중되어 있어 ‘한’이 지닌 깊이와는 거리가 있다. ‘한’에는 삶의 고단함, 가슴 깊이 내려앉은 응어리, 회한과 체념, 말 못 할 원망 등이 복합적으로 얽혀 있다. 영어의 ‘sorrow’ 하나로는 이 복잡하고도 한국적인 정서를 온전히 담기 어렵다. 그런데 파파고는 이 부분을 아예 번역하지 않았다. 이는 아마도 해당 소절이 문법적으로 완결된 단위로 인식되지 못했기 때문일 수 있다.
-09_“K-정서” 중에서