책소개
데이터가 연결되면 가치가 증가한다
링크드 데이터, 융합 데이터의 전제 조건
데이터가 연결되면 가치가 증가한다. 네트워크 효과를 발휘하는 플랫폼이 필요하다. 더 좋은 효과를 내게 하려면 데이터 품질 향상, 데이터 구조화, 의미 있는 연결이 필수다. 이러한 가치사슬은 의사판단 자료로 활용되기도 하고 생각을 계속 확장할 수 있게 도와 창의성 발현의 근간이 될 수도 있다. 새로운 기술이나 방법이 아니라 생각하는 방식의 변화, 즉 데이터 및 그 가치사슬을 기반으로 생각하고 문제에 접근하는 사고적 개념이 필요하다. 새로움이 가치와 연결되어 있을 때 비로소 우리는 혁신이라는 이름을 붙일 수 있기 때문이다. 링크드 데이터로 발행하는 것, 융합 데이터의 전제 조건이다.
의미 없는 텍스트의 바다를 의미가 있는 데이터로 바꿔 보자는 시도가 바로 링크드 데이터다. ‘혼란’한 것을 ‘링크드(구조화, 식별 및 연결)’시키니 의미 있는 데이터로 변한다는 것이다. 웹을 더 구조화시키고 의미가 살아 있는 공간으로 바꿔 보는 시도인 것이다.
이 책은 융합 데이터의 전제 조건인 링크드 데이터를 다루며 문화·과학·기술·예술 등을 아우르는 생각 연결 확장 플랫폼을 구현하는 데 필요한 간단한 개념 모델과 구체적인 방법론을 제시한다.
200자평
데이터가 계속 연결되면 그 가치가 증가한다. 네트워크 효과를 발휘할 수 있는 플랫폼이 필요하다. 이때 더 좋은 효과를 내게 하기 위해서는 데이터의 품질 향상, 데이터 구조화, 의미 있는 연결을 거쳐야 한다. 이런 일련의 가치사슬은 의사판단 자료로 활용되기도 하고 우리의 생각을 계속 확장할 수 있게 도와 창의성 발현의 근간이 될 수도 있다. 이 책은 융합 데이터의 전제 조건인 링크드 데이터를 다룬다.
지은이
조명대
서울대학교 융합과학기술대학원 겸임부교수다. 성균관대학교 문헌정보학과, 영국 러프버러대학교, 미국 시러큐스대학교 등을 거쳐 성균관대학교에서 박사학위를 받았다. 서울대학교 차세대융합기술연구원 링크드데이터연구센터장을 역임하기도 했다. 이론보다는 실제 시스템을 구현하는 데 관심이 많으며 실제 링크드 데이터를 웹에 발행하는 데 주력하고 있다. 지금은 링크드 데이터 기반 국가 학술정보 통합 검색 플랫폼을 위한 표준화 작업에 주력하고 있다. 기존의 표준식별자 및 기 발행된 RDF 어휘를 최대한 활용하면서 학술정보를 통합·검색할 수 있는 표준을 만들어 나가고 있다. RDF로 발행된 링크드 데이터에서의 데이터 단뿐 아니라 이용자를 위한 응용 시스템 개발에도 힘을 쏟고 있다. 링크드 데이터라는 기술이 실제 이용자에게 와 닿게 하는 게 목표다.
차례
데이터에 숨겨진 지식
01 융합 데이터
02 메타데이터
03 현상과 본질
04 그래프 구조와 표준
05 네트워크적 생각
06 기계가 스스로 판단하고 행동하는 메타데이터
07 온톨로지
08 링크드 데이터의 발행 원칙
09 링크드 데이터 애플리케이션
10 데이터 가치사슬과 정보 문해
책속으로
메타데이터에는 빅데이터를 ‘구조화’시키는 힘이 있다. 빅데이터에서는 정형 또는 비정형 데이터가 아주 빠르게, 아주 대량으로, 다양하게 쏟아지기 때문에 지금까지의 방법으로는 이를 다루는 것이 불가능하다. 그래서 다른 방법으로 다루어야 하는데, 패턴을 찾아내거나 분석 및 예측을 하는 작업을 한다. 그렇게 데이터에서 정보로 만들어 낸다. 시각화가 그 대표적 예 중 하나일 것이다.
_“01 융합 데이터” 중에서
시소러스와 온톨로지는 ‘간단’과 ‘복잡’이라는 차이를 두고 실세계를 모델링해 나간다. 링크드 데이터로 발행하기 이전의 아주 중요한 두 모델링 방법이다. 이렇게 데이터에 의미를 담아야 비로소 물리적 공간을 탈피하여 엄청난 효과를 창출해 낸다. 따라서 사이버공간의 효율적 활용이 필수다.
_“03 현상과 본질” 중에서
상상을 잘할 수 있는 연결 플랫폼 및 교육 시스템을 갖출 필요가 있다. 가능하다면 하나의 커다란 지능형 인터페이스를 만들 필요가 있다. ‘부분의 합이 전체’라는 환원주의를 뛰어넘는 ‘연결주의’에 의해 펼쳐지는 복잡계 이론이 좋은 본보기가 될 것이다.
_“05 네트워크적 생각” 중에서
링크드 데이터란 간단히 ‘문서’가 아니라 ‘데이터’를 웹에 발행하는 기술이다. 지금까지의 웹은 ‘문서’만 연결시키는 것이었다. 반면 링크드 데이터는 ‘의미 없는 텍스트가 아니라 의미 있는 데이터’를 만드는 기술이다. 의미를 갖게 하기 위해서는 구조화해서 데이터를 웹에 발행해야 한다. 여기서 구조화란 간단히 개체(집합으로 불리는 개체, 또는 클래스)를 관계(Relationship)로 표현한 것을 말한다.
_“08 링크드 데이터의 발행 원칙” 중에서