책소개
이 책은 1999년 이후 급변한 한국어 정보처리 연구 환경을 적극 반영하였다. 이론 중심의 접근 방식에서 벗어나 데이터를 중심으로 접근했다. 하위 분야에 흩어져 있던 연구결과를 한 데 묶었다. 이를 바탕으로 한국어를 문자 코드, 코퍼스, 워드넷의 개념으로 꼼꼼히 살펴본다. 형태소 분석, 구문 분석, 의미 분석으로 한국어를 고찰한다. 맞춤법, 음성 언어 처리법, 기계 번역, 정보 검색 시스템 등 디지털 기술로 우리말을 처리하는 방법도 제시한다.
최신 연구결과를 담은 한국어 정보처리 입문서!
이 책을 무엇보다도 쉽게 쓰려고 노력했다. 또 학습자와 교수자의 이해를 돕기 위해 각 장별로 연습문제를 만들었다. 이 책의 또다른 특징은 1999년 이후 급변한 한국어 정보 처리의 연구 결과를 반영하려고 노력했다는 것이다. 이론 중심의 연구 성과들에서 벗어나, 데이터 중심의 성과들을 제시했으며, 여러 하위 분야로 흩어져 있던 연구 결과들을 한데 묶어 놓았다. 주로 코퍼스와 형태소 분석의 단계에 머물러 있던 1999년 이전 연구물에 보태서 구문 분석과 의미 분석을 추가했으며, 최근의 21세기 세종 전자사전, 맞춤법 검사기, 문서요약기, 정보검색기, 그리고 워드넷(wordnet)과 같은 응용시스템도 포함시켰다.
200자평
1999년 이후 급변한 한국어 정보처리 연구 환경을 적극 반영하여, 데이터 중심으로 접근하고. 하위 분야에 흩어져 있던 연구결과를 한 데 묶은 책. 한국어를 문자 코드, 코퍼스, 워드넷. 형태소 분석, 구문 분석, 의미 분석으로 한국어를 고찰하고 있다.
지은이
한정한
단국대학교 교수, 고려대학교 국어국문학과를 졸업, 같은 대학 대학원에서 석사학위를 받고, 박사과정을 수료했다. 뉴욕주립대학교 버팔로캠퍼스에서 언어학으로 박사학위를 받았다. 한국어학회 총무이사를 역임했고, 제8차 세계언어학자대회 조직위원, 한국어 의미학회 편집이사로 활동하고 있다. 주요관심 분야는 통사론, 의미론, 전자사전학 등이다.
주요 논문과 저서
“‘-는 바람에’ 유형의 사전기술과 전산처리”, 2007
“‘에/를’ 교체구문의 연결 알고리즘”, 2005
“‘가/를’의 연결이론”, 2002
『다국어 기계번역을 위한 중간언어 모형과 방법론 연구(2)』(공저), 2005
『유로워드넷』(공역), 2004
남경완
고려대학교 연구교수. 고려대학교 국어국문학과를 졸업하고, 같은 대학 대학원에서 석사학위와 박사학위를 받았다. 고려대학교, 단국대학교, 경기대학교 등에 출강하고 있다.
주요 논문과 저서
“굳은 관형사형의 유형별 처리 방안 연구”, 2007
“국어 용언의 의미 분석 연구”, 2005
“한국어의 형태론적 중의 어절 사전 구축과 표제어 선정”(공저), 2006
『쉽게 풀이한 대한문전』(공저), 2002
유혜원
고려대학교 연구교수. 고려대학교 국어국문학과를 졸업하고, 같은 대학 대학원에서 석사학위와 박사학위를 받았다. 고려대학교, 서울교육대학교 등에 출강하고 있다.
주요 논문과 저서
“‘-게’에 대한 고찰”, 2007
“경계성 명사류의 명사 연쇄 구성 연구”, 2007
『한국어 정보 처리의 이론과 실제』, 2004
『논항구조란 무엇인가』, 2000
이동혁
포항공과대학교 인문사회학부 대우전임강사. 고려대학교 국어국문학과를 졸업하고, 같은 대학 대학원에서 석사학위와 박사학위를 취득하였다. 포항공과대학교, 서울여자대학교, 나사렛대학교 등에 출강하고 있다.
주요 논문과 저서
“한영 기계번역 시스템의 다의 정보 처리에 대하여”, 2006
“문법적 관용표현의 전산 처리”, 2005
『유로워드넷'(공역)』 2004
차례
머리말
1 한국어 정보 처리의 개념
기호로서의 언어
언어와 정보, 그리고 정보 처리
정보의 개념
정보사회
컴퓨터의 특징
정보 처리
한국어 정보 처리
한국어 정보 처리의 단계와 현황
정보의 생산, 전달과 한국어학의 과제
한국어 정보 처리의 핵심 분야
한국어 정보 처리의 응용 분야
연습문제
2 한국어 문자 코드
문자 코드(Character Code)란 무엇인가?
문자 코드의 개념
문자 코드의 중요성
문자 코드의 기초
ASCII 코드
문자 목록
한글 문자 코드
한글 코드의 역사
한글 코드의 탄생
한글 코드의 종류
완성형과 조합형
유니코드
유니코드 1.0
유니코드 2.0
연습문제
3 코퍼스의 구축과 가공
코퍼스의 구축
코퍼스란 무엇인가
쓸모 있는 코퍼스를 만들기 위한 조건
코퍼스의 종류
자료의 입수
코퍼스의 크기
용어 색인(용례)
코퍼스의 가공
원시 코퍼스와 주석 코퍼스
주석의 방법
품사 태깅
연습문제
4 코퍼스와 언어 분석
코퍼스 기반 언어 분석의 필요성
통계적 사실과 관련된 언어 연구로 밝혀 낼 수 있는 것들
언어 정보 기술 차원에서 밝혀 낼 수 있는 것들
용례 색인 방법
코퍼스 기반 언어 분석의 실제 예들
빈도 정보
공기 관계 정보에 대한 기술의 예
연어 정보
새로운 의미 정보의 획득
규범적 사실에 대해 검증 작업이 가능
유의어의 용법의 차이를 기술할 수 있음
곡용에 제약이 있는 명사
활용에 제약이 있는 용언
의존적으로 쓰이는 명사 용법
화용 정보를 기술해 낼 수 있음
연습문제
5 전자사전
전자사전이란?
사전 개발자 기준의 사전 분류
시스템 사전
전문어 사전
이용자 사전
사전 표제어의 종류와 범위
단어 수록의 범위
단어 수록의 단위
표제어의 이표기 문제
사전 등록 정보의 종류
언어 처리 내용에 따른 사전의 종류
형태소 분석용 사전
구문 분석용 사전
의미 분석용 사전
연습문제
6 형태소 분석(1):한국어의 형태론적 특성과 형태소 분석기의 구조
한국어 형태론의 기본적인 개념
한국어의 형태론적 특성
형태소 결합 순서
형태소 결합 제약
형태소의 융합
형태소의 변형
형태론적 중의성
형태소 분석기의 구조
형태소 분석의 개념
형태소 분석을 위한 장치
형태소 분석 프로그램의 소개
연습문제
7 형태소 분석(2):형태소 분석의 실제
형태소 분석의 원리
형태소 분석의 방법
형태소 분석의 구성
원형 복원
불규칙 용언의 활용
축약
생략
중의어의 분석
미등록어 분석
형태소 분석기의 평가
연습문제
8 구문 분석(1)
한국어 구문론
구문론의 문법 단위
문장 성분의 종류와 특성
한국어 문장의 종류
한국어 구문의 특성
구문 분석의 개관
구문 분석의 개념
구문 분석을 위한 문법 모형
구문 분석의 구조
연습문제
9 구문 분석(2)
구문 분석의 방법
구문 분석의 구성
문장 구조 분석 및 복문 분석
구 분석
문장 성분 분석
양태 분석
연습문제
10 의미 표상과 의미 분석
의미 표상
단어 의미의 표상
시소러스
워드넷
유로워드넷
의미 분석
중의성과 의미 분석
다의성의 개념과 단위
다의어의 의미 기술
다의성의 해소
다의성 해소의 실제
연습문제
11 음성 언어 처리
음성 자료의 수집과 가공
음성 언어와 문자 언어
한국어 음성 음운 정보
음성 코퍼스 구축
음성 공학
음성 인식
음성 합성
연습문제
12 기계번역
기계번역은 왜 어려울까
기계번역의 역사
기계번역의 방법론
합리주의적 방법론
경험주의적 방법론
기계번역의 실제
연습문제
13 한국어 정보 처리의 응용 시스템
맞춤법 검사
맞춤법 검사의 개념
맞춤법 오류의 유형
맞춤법 검사 방법론
맞춤법 검사기의 실제
문서 요약
문서 요약의 개념
문서 요약의 유형 및 방법론
문서 요약의 실제
정보 검색
정보 검색의 개념
정보 검색 시스템의 구성
정보 검색 시스템의 유형
색인
연습문제
14 어문 정책과 국어 정보화
국어 정보화 정책의 개념과 필요성
국어 정보화 정책의 역사
국어 정보화 정책의 실제
코퍼스 구축
전자 사전 개발
어문 규정 검색
남북한 언어 비교
기타
국어 정보화 정책의 영향 및 방향
연습문제
참고문헌