책소개
감성은 ‘측정’될 수 있는가
텍스트 감성 분석의 대상은 디지털화된 언어 자원이며, 대중에 의해 실시간으로 생성된, 주관성을 담은 언어라는 점에서 기존의 언어 분석과 다른 접근을 요구한다. 감성 분석은 우리 주변에 편재하는 대량의 텍스트에서 특정 ‘대상’에 대한 ‘평가’를 표현한 주관적 언어를 어떻게 추출할 것인가, 또 이러한 ‘평가’나 ‘의견’, ‘태도’, 즉 ‘감성’의 언어 표현을 ‘개인’의 의견 차원을 넘어서 ‘집단’의 감성으로 해석하기 위해 어떻게 범주화, 정량화할 수 있는가의 문제로 요약된다. 텍스트 감성 분석은 의견, 감정, 평가, 신념 등 주관적 언어에 나타난 극성과 정도성을 분석한다는 점에서 공학과 언어학에서는 도전적 과제로 인식되어 왔다.
이 책은 감성 분석과 관련된 주제를 다루어 온 기존 연구 분야의 쟁점을 소개하고 한국어 감성 표현의 예를 활용함으로써 독자의 이해를 돕는다. 감성 분석과 관련한 주요 개론서와 국내외 최근 연구 동향과 성과도 소개했다. 특히 주제와 장르에 의존적인 감성 표현의 특수성을 고려하여, 특정 상품에 대한 실제 상품평이나 블로그 등의 텍스트 자료를 분석한 결과를 제시하기도 했다. 이러한 구체적 예를 통해 감성 언어 자원의 가치와 다양성, 극성 분석의 쟁점 등을 쉽게 살펴볼 수 있다. 최근 빅데이터 분석과 관련하여 활발히 논의되고 있는 ‘감성 분석’이라는 주제에 관심이 있는 일반인과 ‘언어’ 분야의 연구자들이 관심 가질 만하다.
200자평
텍스트 감성 분석은 전문가가 아닌 대중이 생산한 비정형 텍스트를 대상으로 한다. 의견, 감정, 평가, 신념 등 주관적 언어에 나타난 극성과 정도성을 분석한다는 점에서 공학과 언어학에서는 도전적 과제로 인식되어 왔다. 이 책은 감성 분석과 관련한 하위 주제와 쟁점을 포괄적으로 소개한다. 특히 한국어 텍스트를 예시로 함으로써 한국어 감성 분석에 대한 이해의 폭을 넓힌다.
지은이
남길임
경북대학교 국어국문학과 교수다. 연세대학교를 졸업하고 같은 대학에서 석사와 박사학위를 받았다. 『연세한국어사전』(1998), 『외국인을 위한 한국어학습사전』(2006), ‘21세기 세종계획’(1998∼2007), ‘빅데이터 기반 안전ㆍ안심도시 구현을 위한 소셜플랫폼 구축’(2014) 사업 등 사전을 비롯한 언어 자료의 구축과 활용 사업에 참여했으며, 언어 수행의 유창성과 경향성을 밝히는 말뭉치언어학에 관심이 있다. 현재는 ‘개방형 한국어 지식 대사전 신어 조사’(2012∼ ) 사업, ‘어패럴 산업의 Customizing Marketing을 위한 데이터 사이언스 활용의 MISP(Marketing Intelligence Service Platform) 개발’(2014∼2016) 사업에 참여하였다. 대표 논저로 『한국어 사전 편찬학 개론』(2008), 『현대 국어 ‘이다’ 구문 연구』(2004), “상풍평 텍스트에 나타난 감성 표현 연구: 감성 분석과 국어학 연구의 접점”(2016), “감정용언의 부정 구문에 대한 연구: 극성의 정도성과 의미 범주의 변화를 중심으로”(2015), “이론으로서의 말뭉치언어학에 대한 연구 현황과 쟁점”(2014) 등이 있다.
조은경
서강대학교 지식융합미디어대학 글로벌한국학과 부교수다. 연세대학교를 졸업하고 같은 대학에서 석사와 박사학위를 받았다. 문화체육관광부 주관의 21세기 세종계획(1998~2007)의 국가말뭉치 구축, 국어정보화 인력 양성, 전문용어 표준화 등의 과제에 참여했고, 산업자원부 주관의 실버메이트(Silver Mate)용 대화음성 인터페이스 기술 개발, 시소러스 기반 대화형 정보검색 및 질의응답시스템 개발에 관한 연구 등의 과제에 참여한 바 있다. 정부출연연구기관인 한국전자통신연구원 언어공학연구부에서 온톨로지 설계와 구축을 했고, 다음커뮤니케이션(현재는 카카오) 검색포털본부에서 한국어정보처리, 텍스트마이닝, 검색랭킹모델링 부문의 일을 담당했다. 삼성전자 선행개발팀에서 다국어 대화엔진 개발, 검색콘텐츠 개발, 해외연구소 관리 등의 일을 했다. 주요 논저로, “디지털 사회의 가치와 언어 연구 방법”(2016), “감성 분석에서 함수적 어휘와 대하여성 추출”(2015), “감성 분석 연구의 현황과 말뭉치에 기반한 사례 분석”(2012), 『국어 공지시 해석 시스템에 관한 연구』(2007) 등이 있다. 현재는 한국연구재단 신진연구자지원사업의 지원을 받아 ‘텍스트 분석과 의미 정보 처리에 기반한 문서 요약 방법 개발: 딥러닝을 활용하여’라는 과제를 수행하고 있다.
차례
감성 분석, ‘언어’의 문제로 바라보기
01 감성 분석의 목적과 대상
02 감성 분석의 단위
03 감성 분석의 절차와 쟁점
04 감성 분석의 수준
05 감성 표현 선정의 절차와 방법
06 감성 표현과 감성 분석 사전
07 주제별·장르별 감성 분석
08 어휘 극성과 문맥 극성
09 토론과 논평 분석
10 한국어와 감성 분석
책속으로
감성 분석은 대중의 의사소통에 존재하는, 특정 개체에 대한 감정, 정서, 평가 등을 분석하고 분류, 해석하는 작업이다. 감성 분석에는 대량의 언어 자원에 대한 자연언어 처리와 텍스트마이닝의 방법론이 도입된다는 점, 감성 분석의 궁극적 목적이 언어에 대한 진위 판별을 넘어 인간 의사소통의 핵심을 이루는 주관적 평가 행위에 대한 해석에 있다는 점에서, 감성 분석은 여러 학문 분야에서 관심을 받아 왔다.
_“01 감성 분석의 목적과 대상” 중에서
감성 분석은 객관적 텍스트가 아닌 주관적 텍스트를 주요 대상으로 한다는 점에서 사실 기반 텍스트 처리가 대부분이었던 이전의 자연언어 처리와 상당한 차이가 있다. 이와 관련하여 객관적 텍스트와 주관적 텍스트의 구분이 분명하지 않다는 점, 객관적 표현이 주관적 평가를 충분히 담을 수 있다는 점, 감성 표현이 주제 영역에 상당히 의존적이라는 점 등이 쟁점으로 논의되어 왔다.
_“03 감성 분석의 절차와 쟁점” 중에서
인간의 의사소통을 이루는 가장 주된 두 축은 객관적 정보의 교환과 주관적 정보의 공유라 할 수 있을 것이다. 감성 분석은 공유를 목적으로 작성된 평가나 의견 등과 같은 후자의 결과물을 분석 대상으로 한다. 과거에 자연어 처리의 주된 관심사가 사실 기반 문서의 객관적 정보였다면, 감성 분석은 의견 기반 문서에 나타난 주관적 의견을 다룬다는 점에서 이전 연구와 다른 방법론을 요구한다.
_“05 감성 표현 선정의 절차와 방법” 중에서
대개 주제별 특성에 따라 감성 분석을 위한 언어 정보 분석 방식과 자원은 음식, 의류, 영화 등의 주제 영역별로 각각의 자원을 구축하여 쓴다. 특히 양상 수준(aspect level) 분석에서 주제 분야가 ‘옷’이면, ‘사이즈, 디자인, 소재, 가격, 착용감’과 관련한 감성 표현이 주요 양상(aspect)이 되는 데 반해, ‘영화평’이면 ‘줄거리, 배우, 연출, 재미, 감동’ 등의 분류 체계에 속하는 감성 표현이 주가 될 것이다.
_“07 주제별·장르별 감성 분석” 중에서
이 중에서 가장 많은 의견 제시와 대립을 보이는 티핑 포인트는 ‘검찰 부패’, ‘권력 비리’다. 그리고 이러한 의견을 내는 이들은 서로의 의견에 각각의 댓글을 달면서 찬반 대립을 보이기도 한다. 동조하는 글은 어떤 감정적인 표현을 직접적으로 드러내기보다는 관련된 핵심어를 써서 자신의 의견을 표현한다. ‘검찰 개혁 없이 시녀 역할을 하는 한, 법치 국가는 요원하다’에서 ‘검찰 개혁’이나 ‘법치 국가’와 같은 핵심어를 써서 자신의 의견을 표현한다. 반면, 반대하는 글은 부정적인 평가 표현이나 감정적인 표현을 직접 드러낸다.
_“09 토론과 논평 분석” 중에서