책소개
컴퓨터, 이제 ‘진짜’ 대화로 소통한다
인공지능 시대, 사람들은 이제 컴퓨터와 ‘대화’한다. 명령어 입력이나 아이콘 클릭 대신, 우리는 자연어로 질문하고 응답을 얻는다. GUI에 익숙한 우리에게도 AI와의 대화형 상호작용은 이제 일상이 되었다.
이 책은 대화형 컴퓨팅의 역사를 텍스트 기반에서 시작해 대화형 사용자 인터페이스(CUI)로의 발전 과정을 따라가며 설명한다. 초기 챗봇에서 시작해, 대규모 언어 모델을 사용하는 오늘날의 챗GPT까지 인공지능의 급성장은 컴퓨터가 단순히 ‘도구’에서 ‘대화 상대’로 변모하게 만들었다. 대화형 컴퓨팅에서 AI는 사용자의 의도를 파악해 최적의 해결책을 제시하는 동반자가 되며, 이를 통해 미래의 컴퓨터는 단순히 조작의 대상이 아닌 개인 맞춤형 대화 파트너로 기능할 수 있다.
이 책은 AI 언어모델을 직접 개발하지 않더라도, 다양한 대화형 AI 서비스를 기획하고 이해할 수 있도록 돕는 안내서다. SK텔레콤, 삼성전자 등과 진행한 사례들을 통해 대화형 컴퓨팅 설계의 실제 적용 사례와 핵심 기술, 디자인 요소를 설명한다. SK텔레콤 티맵의 NUGU, 삼성 오븐의 음성조작, 1인 가구용 스피커, 일기 작성 보조 등의 사례가 포함되어 있다. “컴퓨터와의 대화는 실수를 유발하지 않을까?”, “대화형 인터페이스는 기존 방식보다 우월한가?” 등의 질문을 탐구하고 대화형 컴퓨팅의 진화가 가져올 미래를 예측한다. 앞으로 다양한 산업에 활용될 대화형 인터페이스를 설계하고자 하는 연구자, 기획자들에게 이 책은 유용한 통찰을 제공할 것이다.
200자평
대화형 컴퓨팅 시대, 사람들은 이제 컴퓨터와 자연어로 소통한다. 텍스트 기반 인터페이스에서 대화형 인터페이스(CUI)로 진화한 과정과 AI가 대화 상대가 된 배경을 설명하며, 다양한 대화형 AI 서비스 사례와 기획 원리를 제공한다.
지은이
이중식
사용자경험(User Experience) 연구를 한다. 서울대학교 융합과학기술대학원 교수이며, 현재 서울대학교 문화예술원 원장이다. 연세대학교와 미국 예일대학교에서 건축을 전공했고 예일대학교에서 가르쳤다. 2000년에 귀국하여 삼성오픈타이드에서 인터넷 컨설팅을 담당했다. 서울대 사용자경험 연구실을 운영 중이며 연구 주제로는 로그 기반의 사용자 모델링, 보이스 인터랙션, 그리고 1인 가구가 있다. 2022년에 서울대학교 교육상을 수상하였다. 저서로는 『창조성의 원천』, 『1인가구와 기술』이 있다.
차례
대화, 인공지능 시대의 상호 작용
01 대화형 이전의 인터페이스
02 일상의 컴퓨팅
03 대화형의 가능성과 한계
04 대화형 컴퓨팅: 챗봇
05 대화형 컴퓨팅: 버추얼 어시스턴트
06 대화 기술: 자연어 처리
07 대화 기술: 대형 언어 모델
08 대화형 서비스 만들기
09 기계와 대화 잘하기
10 대화형의 시대
책속으로
노인들이 음식점 키오스크 사용을 어려워하는 이유는 여러 가지가 있겠지만 그중 하나는 집집마다 다른 위계를 이해해야 한다는 점이다. 물론 식당들은 어느 정도 보편적인 위계를 사용하고 있지만 식당마다 메뉴가 다르고 프로모션도 다르기에 위계는 조금씩 다를 수밖에 없다. 그래서 하나의 정보 시스템에 익숙해진다는 것은 그 시스템의 정보 위계를 익힌다는 것과 같은 말이 된다. 위계는 잘 만들기도 어렵고 사용자에게 빨리 전달하기도 어렵다. 더구나 정보가 끊임없이 늘어 가는 상황에선 위계가 제 역할을 하기 어렵다.
-01_“대화형 이전의 인터페이스” 중에서
심리 상담 봇 또한 성공 케이스다. 인지 행동 치료 기술(CBT)를 활용한 상담 봇은 사용자의 부정적인 생각 패턴을 인식하고 수정하는 데 도움을 준다. 이는 우울증, 불안, 스트레스 등의 상태를 관리하는 데 효과적인 방법이다. 일기나 명상 등 자기 관리 도구형 챗봇도 발달하고 있다. 답답할 때 내 이야기를 들어 주는 것만으로도, 또는 복잡한 심경을 말로 풀기만 해도 심리적 효과가 있다고 한다.
-04_“대화형 컴퓨팅: 챗봇” 중에서
만약 사용자가 ‘생수 떨어졌어’라고 표현했을 때 에이전트는 바닥에 떨어진 생수를 줍는(pick up) 게 아니라 생수를 ‘주문(buy)’하는 걸로 이해해야 한다. 위의 두 표현이 같은 의도인지 아는 방법은 두 가지이다. 하나는 언어학적 방법, 즉 문법적 해석에 의한 것이고, 또 하나는 데이터의 훈련을 통해서다. 지금은 발화 데이터를 벡터라이즈해 유사한 그룹을 통해 인텐트를 파악하는 방법이 널리 쓰인다. 2010년대에 버추얼 어시스턴트가 일취월장한 배경에는 머신러닝 기술의 발전으로 자연어 이해가 발전했기 때문이다.
-06_“대화 기술: 자연어 처리” 중에서
추천을 통제하는 유일한 방법은 길들이기(taming)다. 유튜브의 추천 동영상을 내 입맛에 맞추는 방법은 특정 동영상을 선택한 뒤 오래 보고 반응하는 것이다. 혹은 불편한 동영상을 빨리 스킵하거나 비추천 버튼을 누르는 것이다. 암묵적이거나 명시적인 입력은 추천 엔진에 반영된다. 이런 길들이기는 영화, 음악, 식당, 쇼핑 등 다양한 추천 영역에 확산되어 있다. 추천을 통제하는 더 나은 방법들이 연구되고 있지만 길들이기는 추천과 인간이 배경적으로 상호 작용하는 좋은 방법이다.
-09_“기계와 대화 잘하기” 중에서