책소개
시맨틱 AI 아카이브: 데이터와 지식의 새로운 연결 방식
인공지능 시대, 데이터는 단순한 저장을 넘어 의미와 관계를 형성하며 새로운 가치를 창출해야 한다. 이 책은 기호학과 시맨틱 기술, AI의 결합을 통해 아카이브의 미래를 제시한다. ‘식별’과 ‘집중’이라는 두 가지 키워드를 중심으로, 데이터가 단순히 보관되는 것이 아니라 의미적 맥락 속에서 활용될 수 있도록 하는 방안을 탐구한다. 기호학적 접근을 기반으로 정보를 구조화하고, 검색 증강 생성(RAG) 기술과 온톨로지 기반 지식 그래프를 결합하여 AI가 보다 정교한 정보를 제공하는 방식을 설명한다.
기존 아카이브 시스템이 단순 저장에 머물러 있다면, 이 책은 레코드 컨티뉴엄(Record Continuum) 이론을 적용하여 데이터를 동적으로 활용하는 방법을 제안한다. 또한, Machine-Actionable Metadata(MAM)를 활용해 기계가 데이터를 이해하고 자동으로 처리할 수 있도록 하는 기술을 조명한다. 이를 통해 자율주행, 스마트 공장 등 다양한 분야에서의 혁신 가능성을 보여 준다. 책에서는 FAIR 원칙(Findable, Accessible, Interoperable, Reusable)에 기반한 데이터 조직 방식과 유럽의 ‘유로피아나(Europeana)’ 사례를 분석하며, 국내 아카이브 시스템이 나아갈 방향도 제안한다.
데이터가 단순한 저장에서 벗어나 의미적으로 연결되고 활용될 수 있도록 돕는 새로운 패러다임을 제시하는 이 책은 AI와 시맨틱 기술을 활용한 차세대 아카이브 시스템에 관심 있는 연구자, 개발자, 정보관리 전문가들에게 필독서가 될 것이다.
200자평
기호학과 시맨틱 기술, AI를 결합해 데이터가 단순한 저장을 넘어 의미적으로 연결되고 활용될 수 있는 방안을 제시한다. 검색 증강 생성(RAG), 온톨로지 기반 지식 그래프, Machine-Actionable Metadata(MAM) 등을 통해 AI가 보다 정교한 정보를 제공하는 방식을 탐구한다. FAIR 원칙과 유럽 ‘유로피아나’ 사례 분석을 통해 국내 아카이브의 발전 방향도 제안한다.
지은이
조명대
성균관대학교에서 박사 학위를 취득한 시맨틱 기술 및 융합 기술 연구 분야 전문가다. 국토개발연구원에서 연구원으로 경력을 시작한 후 미국 시러큐스대학교와 UCLA에서 컴퓨팅 어시스턴트(Computing Assistant)와 티칭 어시스턴트(Teaching Assistant)로 활동하며 학문적 기반을 다졌다. 이후 성균관대학교와 서울대학교 융합과학기술대학원 등 국내외 주요 대학에서 겸임교수와 연구자로 활동하며 학계와 연구 개발 분야에 기여했다. 특히 서울대학교 차세대융합기술연구원 ‘Linked Data 연구센터’ 센터장으로서 데이터를 활용한 융합 기술 연구를 선도하며, 융합과학기술과 데이터 관리 분야에서 중요한 성과를 거두었다. 한국외국어대학교 정보·기록학과 겸임교수로 재직 중이며, 데이터와 기록학 분야의 교육과 연구를 이어 가고 있다. 특히 시맨틱 기반 연계 탐색형 시스템 개발에 집중하고 있다.
차례
기호학, 시맨틱 기술 그리고 ontoRAG
01 시맨틱 기술과 기호학
02 시스템적 사고
03 시맨틱, 시맨틱 웹 그리고 시맨틱 기술
04 시맨틱 기술의 꽃: DIA
05 FAIR 데이터 원칙
06 전통적 검색과 시맨틱 기반 검색+탐색
07 온톨로지 학습과 인공지능
08 그래프 구조와 AI 질의응답 시스템
09 CPS와 논리적 접착제로서 시맨틱 기술
10 인공지능 시대의 아카이브: ontoRAG
책속으로
기호학과 온톨로지 기반 시맨틱 기술은 의미를 이해하려는 본질적인 목표를 공유한다. 기호학은 인간의 문화적, 사회적 맥락에서 의미의 다층성과 복잡성을 탐구하며, 의미의 유동성과 맥락 의존성을 강조한다. 반면 온톨로지 기반 시맨틱 기술은 기계가 처리할 수 있는 명확하고 구조화된 의미를 정의하고, 이를 통해 자동화된 추론과 처리를 가능하게 한다. 이러한 차이에도 시맨틱 기술은 기호학의 통찰을 활용하여 맥락화된 의미 처리 시스템을 구축할 수 있는 잠재력을 지니고 있다.
– 01_“시맨틱 기술과 기호학” 중에서
시맨틱 기술은 원시 데이터를 의미적으로 변환하여 정보로 바꾸고, 이를 바탕으로 행동을 도출하는 과정에서 중요한 역할을 한다. 이 과정은 마치 인간이 단백질 덩어리로 구성되어 있지만, 지적 활동을 통해 복잡한 결정을 내리는 방식과 유사하다. 프랑스 철학자 메를로퐁티의 몸철학을 통해, 시맨틱 기술이 어떻게 무의미한 데이터에서 의미를 창출하고 지적 활동을 가능하게 만드는지 설명할 수 있다.
– 04_“시맨틱 기술의 꽃: DIA” 중에서
메타데이터를 흔히 ‘데이터에 대한 데이터’라고 정의한다. 물론 틀린 말은 아니다. 하지만 이를 단순히 정보의 설명 수준에서 이해하는 것은 메타데이터의 핵심적인 잠재력을 간과하는 것이다. ‘aboutness(데이터를 설명하거나 분류하는 관점)’를 넘어, 메타데이터는 전술한 바와 같이 ‘things’에 대해 구체적 ‘action’을 수행할 수 있게 만드는 데이터로 정의할 수 있다. 여기서 중요한 것은 메타데이터가 단순히 데이터를 수동적으로 설명하는 것이 아니라, 실제 행동(행동을 유발하거나 가능하게 하는)을 일으킬 수 있는 실질적 역할을 한다는 점이다.
– 06_“전통적 검색과 시맨틱 기반 검색+탐색” 중에서