책소개
인공지능이 만들어 가는 지구화
AI 기술이 한국학 연구 방법론과 지식 생산 방식에 미치는 영향을 탐구한다. 전통적으로 국학이나 지역학으로 한정되던 한국학이 AI와 데이터 과학을 통해 글로벌 연구로 확장될 가능성을 살펴본다. 챗지피티(ChatGPT) 등 생성형 AI는 인문학과 글쓰기에 변화를 가져오며, 연구의 효율성을 높이고 있다. AI 기반 데이터 분석과 프롬프트 엔지니어링은 한국학 연구를 체계화하는 데 기여하며, AI 민주화는 연구 접근성을 확대하고 있다. 하지만 AI 언어 모델은 한국 관련 정보가 부족한 한계를 지니며, 이를 개선하기 위한 검색 증강 생성(RAG)과 윤리적·사회적 민감도 향상이 필요하다. AI는 교육과 정책에도 영향을 미치며, 저출산·고령화 속에서 글로벌 한국학은 아프리카, 동남아 등과의 교류를 통해 지속 가능한 발전을 모색해야 한다. 이 책은 AI와 한국학의 융합을 통해 미래 연구 방향을 제시하며, 새로운 학문적 가능성을 탐색한다.
200자평
AI가 한국학 연구 방법과 지식 생산 방식에 미치는 영향을 탐구한다. 챗지피티 등 생성형 AI는 인문학 연구를 효율화하며, 데이터 분석과 프롬프트 엔지니어링을 통해 한국학을 체계화한다. 그러나 AI 언어 모델의 한국 관련 정보 부족 문제와 윤리적 민감도 향상이 필요하다. 저출산·고령화 속에서 글로벌 한국학은 새로운 교류와 연구 방향을 모색하며, AI와 융합된 학문의 가능성을 제시한다.
지은이
조은경
서강대학교 글로벌한국학과 전임 교수이며 컴퓨터공학과에 겸직으로 재직 중이다. 연세대학교 국어국문학과 학사, 언어정보학과 석사, 서강대학교 컴퓨터공학과 석사, 연세대학교 언어정보학과 박사 학위가 있다. 문화체육관광부 주관의 21세기 세종계획에 참여했고, 한국연구재단, 산업자원부, 정보통신기획평가원 주관의 다양한 한국어 정보 처리 연구 과제에 참여한 바 있다. 한국전자통신연구원 언어공학연구부에서 위촉 연구원으로, 다음커뮤니케이션(현 카카오) 검색포털본부에서 소프트웨어개발자로, 삼성전자 선행개발팀에서 시니어소프트웨어 개발자로 언어 정보 처리 업무를 담당했다. 주요 논저로 박사 학위 논문 “국어 공지시 해석 시스템에 관한 연구”(2007), “감성 분석 연구의 현황과 말뭉치에 기반한 사례 분석”(2012), “디지털 사회의 가치와 언어 연구 방법”(2016), “Improving educational dialog system for historical world affairs” (2021), 『한국어 텍스트 감성분석』(2017, 2022), 『한국학과 데이터과학』(2024) 등이 있다. 현재는 한국연구재단의 “대화분석에 근거한 인간과 기계와의 인터페이스 설계” 과제와 정보통신기획평가원의 “사회적, 윤리적 학습을 위한 데이터 특성 및 생성 AI 모델의 윤리성 향상” 과제를 수행하고 있다.
차례
인공지능이 만들어 가는 지구화
01 글로벌 한국학
02 인문학과 인공지능
03 한국학을 위한 인공지능
04 인공지능 언어 모델과 챗지피티
05 언어 데이터와 기계 학습
06 언어 모델과 한국에 관한 지식
07 언어 모델의 사회적·윤리적 민감도
08 언어 모델의 문화 민감도
09 언어 모델을 활용한 교육과 검색 증강 생성
10 언어 장벽 너머 글로벌 한국학
책속으로
데이터 과학적 한국학이 데이터 과학적이라는 수식어를 달았다고 해서 연구 대상이나 내용이 다른 것은 아니다. 이전에 전통적인 한국학이 연구했던 한국의 문학, 역사, 정치, 사회, 예술에 관한 주제를 연구하되 방법론이나 연구 자료 측면에서 디지털 데이터를 연구 재료로 하여 양적 분석 결과를 줄 수 있는 정보 처리/분석 방법론을 활용한다. 따라서 연구 자료는 디지털화된 역사 자료일 수도 있고 인터넷을 통해 수집된 것일 수도 있다. 연구 방법 측면에서는 데이터 과학이라는 분야가 주된 연구 방법으로 삼는 통계적 방법, 기계 학습, 더 최근에는 인공지능 기술 등이 모두 해당된다.
-01_“글로벌 한국학” 중에서
한국을 알리고 한국에 대해 연구하는 학문인 한국학이 전통적인 방식으로 연구된 성과를 보면 한국학은 한국학을 연구하는 지식인 엘리트의 전유물인가 싶을 정도로 질적 분석의 깊이가 깊고 때로는 자의적인 느낌이 들 정도로 그들만의 연구인가 싶을 때도 있다. 비교적 최근 글로벌라이제이션에 힘입어 Kᐨ팝이나 Kᐨ컬처 등 지구적 영향력을 갖는 대중문화에 관한 연구가 한국학을 조금 대중화시키기는 했다. 한강이 2024년에 노벨상을 받기까지는 2016년 맨부커상을 받은 그녀의 작품 『채식주의자』를 세계적인 시각에서 볼 수 있도록 그리고 서양인들의 감성에도 호소할 수 있도록 번역한 데보라 스미스(Deborah Smith)의 역할도 큰 것으로 알려져 있다. 한국학이나 한국적 무엇이 널리 알려지는 데에는 지구화와 대중적 영향력을 가진 그 무언가 지렛대가 필요하다.
-03_“한국학을 위한 인공지능” 중에서
한국어 데이터로 학습을 하면 한국어로 질문할 수 있는 질의응답 시스템이나 한국어로 요약해 달라는 요청을 할 수 있는 요약 시스템을 만들기가 더 쉬울 것이다. 기반 언어 모델(foundation language model)이 한국어가 대부분이므로 한국적 지식일 가능성이 더 크기 때문이다. 이 때문에 언어 모델에 한국어로 표현된 한국적 지식과 언어문화적 자산이 더 많이 학습되어야 하고 그 이전에 한국어로 작성된 지식 콘텐츠가 더 많이 만들어져야 하는 것은 당연성을 띤다. 그렇다고 하여 한국학적 지식이 반드시 한국어로만 표현되는 것은 아니므로 다른 언어 모델의 한국학적 지식에 대한 고려도 필요하다.
-06_“언어 모델과 한국에 관한 지식” 중에서
검색 증강 생성의 핵심은 사전 학습 언어 모델의 기반 학습 방식인 다음 단어 추정에 전적으로 의존하기보다 밀집 벡터(dense vector)라 불리는 학습에 쓰인 데이터의 문서 단위 검색 데이터에서 추출된 랭킹 순위가 높은 지식을 연계해 언어 텍스트를 생성하는 것이다. 그리하여 문서 단위 검색 데이터가 저장된 벡터 저장소로부터 참조 및 출처 정보를 가져와서 생성 결과로 제시할 수 있고 근거 있는 생성 결과를 줌으로써 비사실 정보를 줄일 수 있게 되는 것이다.
-09_“언어 모델을 활용한 교육과 검색 증강 생성” 중에서