책소개
인간의 지적 능력은 언어지능에 달려 있다
언어지능 … 감각 지식 종합한 모든 지능의 기초
언어는 지능이며, 동시에 모든 지능의 기초가 된다. 인간의 지적 능력은 다중적인데, 여기에는 언어지능, 논리수학지능, 음악지능, 신체운동지능, 공간지능, 인간친화지능, 자기성찰지능, 자연친화지능, 실존지능 등이 있다. 감각과 연관된 데이터와 지식에는 시각, 청각, 촉각 등의 지식이 주요하게 작용하는데, 이를 종합하는 것이 언어지능이다.
인간의 지적 능력 중 대부분이 언어지능과 관련된다. 일상적 언어 데이터 분석은 매우 중요한 빅데이터 분석의 대상이다. 과거 경영 및 마케팅 조사 방법론에서 큰 부분을 차지하던 설문조사 대신, 인터넷 블로그나 SNS 등과 같은 텍스트 유형 데이터 분석이 주를 이루고 있다. 교육·법률·특허 등 전문 지식 상담 분야에도 언어지능이 필요하다. 언어를 적용하면 판단이 좀 더 편리해질 것이다. 또한 인공지능, 빅데이터 등 최첨단 정보처리 기술과 맞물려 언어를 이해하는 기술은 크게 인간ᐨ기계 인터페이스와 연관된 부문, 언어 데이터 및 여러 정보를 처리하는 부문, 인간의 교육과 연관된 부문, 인간의 지적 능력을 해결하는 부문 등으로 나뉜다.
이 책은 언어지능의 세부 내용을 설명하기 위해 음성처리, 정보검색, 온톨로지, 추론시스템 등 빅데이터 시대에 언어 데이터와 연관된 10가지 세부 분야를 논의한다. 언어지능은 언어에 대한 이해를 기본으로 하며, 언어는 인문학에 대한 기초를 제공한다. 이러한 의미에서 언어라는 인문학적 이해를 기본으로 인문학과 데이터사이언스의 융합을 도모하려 했다.
200자평
인간의 지적 능력 중 대부분이 언어와 연관된 언어지능과 관련되어 있다. 현재 일상적 언어 데이터 분석은 매우 중요한 빅데이터 분석의 대상이다. 과거 경영 및 마케팅 조사 방법론에서 큰 부분을 차지하던 설문조사 대신, 이제는 인터넷 블로그나 SNS 등과 같은 텍스트 유형의 데이터를 통한 분석이 주류를 이루고 있다. 이 책은 이러한 흐름에 발맞춰 현재 데이터사이언스와 직접적으로 연관된 지능 관련 주제를 다룬다.
지은이
김동성
한국외국어대학교 영어과를 졸업하고 뉴욕대학교에서 언어학(Linguistics)으로 석사학위를, 고려대학교 언어학과에서 전산언어학으로 박사학위를 받았다. 음성처리, 언어처리, 인공지능에 관심을 갖고 있으며, 여러 관련 기업에서 프로젝트 개발, 기획과 마케팅 등 다양한 일을 해 왔다. 현재 이화여자대학교 인문과학대학 인문융합기반 인문테크놀로지 특임교수로 근무하고 있다. 고려대학교 언어정보연구소 연구교수, 한국외국어대학교 ‘언어중립적온톨로지연구팀’ 연구원을 지냈다. 고려대학교, 한국외국어대학교, 연세대학교에 출강한 바 있다. 저서로 언어 연구를 위한 통계학(2010), 언어 처리를 위한 Perl(공저, 2008) 등이 있다.
차례
지능의 출발
01 언어 빅데이터 코퍼스
02 음성처리
03 정보검색
04 자동번역
05 문서자동요약
06 사전, 온톨로지
07 자동대화시스템
08 컴퓨터를 활용한 언어학습
09 기계학습과 언어습득
10 추론 시스템
책속으로
데이터 생태계는 원시 데이터 생성 부문, 이중나비넥타이 처리 부문, 메타데이터 활용 부문으로 구성된다. 데이터 생명 주기는 생태계 내에서 데이터가 생성, 정제, 해석, 개발, 메타화, 폐기되는 과정을 말한다. 생명주기 안에서 데이터가 만들어지는 과정을 추적해 보고, 데이터 생산에서 가장 먼저 고려할 요소인 협업 메커니즘에 대해 알아본다.
_“02 데이터 생산 메커니즘” 중에서
데이터 거래는 특수한 목적하에 문제 해결을 하려는 주체가 필요한 데이터를 보유하거나 생성하는 주체로부터 특정한 대가를 지불하고 매매하는 행위를 말한다. 여기서 주체는 개인, 기업, 정부 등을 말하며, 특정한 대가는 금전적 부분뿐만 아니라 공짜로 제공되는 서비스 등 다양한 형태로 존재한다. 데이터 거래의 배경, 데이터 거래 시장 형태, 데이터 거래 활성화를 위해 필요한 요건들을 살펴본다.
_“03 진화하는 데이터 거래 시장” 중에서
데이터로부터 가치 창출은 미래 사회를 변화시킬 주요 동력이 되며 사회 혁신, 경제적 성장, 공공서비스 지원 등 사회·경제·공공 사회 전 분야에 중요한 영향을 준다. 데이터가 새로운 가치로 변환되는 과정에서, 스타트업 기업부터 플랫폼서비스기업까지 새로운 가치사슬망이 형성되어 데이터 기반 산업 생태계가 만들어진다.
_“05 데이터 밸류 체인” 중에서
통신, 인프라, 응용 소프트웨어 등 인프라 중심이었던 ICT의 패러다임이 데이터 중심으로 변화하면서 데이터의 분석 및 관리가 중요한 이슈로 부각되고 있다. 모바일 기기와 센서를 부착한 사물들이 확산됨에 따라 수집되는 데이터도 폭발적으로 증가하고 있다. 이로 인해 데이터의 수집, 검색, 데이터 전처리 및 분석, 저장, 유통, 가공 등 데이터 기반의 기술들에 대한 관심이 집중 되고 있다. 빅데이터, 클라우드, 사물인터넷, 블록체인 기술이 데이터노믹스를 이끄는 사두마차로 기술 간 융합과 데이터 과학을 선도하고 있다.
_“08 데이터노믹스 기반 기술” 중에서