책소개
데이터 리터러시, 디지털 사회의 생존 문법
데이터가 모든 의사 결정과 경쟁력의 중심이 된 시대, 개인과 조직이 반드시 익혀야 할 역량을 종합적으로 다룬다. 데이터 리터러시는 단순히 숫자와 그래프를 읽는 기술이 아니라, 데이터를 수집·정제·분석해 의미를 도출하고, 이를 근거로 비판적이고 책임 있는 결정을 내리는 통합적 능력이다.
이 책은 데이터 윤리, 저작권, 계약, 거버넌스, 데이터 사일로 해소, 데이터 전략과 정책, 데이터 민주화 등 폭넓은 주제를 체계적으로 정리한다. 기업과 국가의 전략적 데이터 활용, 개인정보 보호, 공공성과 투명성을 담보할 제도적 장치까지 아우른다. AI의 학습 기반이자 사회적 자산인 데이터는 편향·불투명성·법적 책임이라는 문제를 동반한다. 이를 해소하지 못하면 데이터 활용은 위험으로 이어질 수 있다. 결국 데이터 리터러시는 단순한 기술이 아니라 디지털 사회에서 민주성과 지속가능성을 확보하는 시민적 교양이자 조직의 경쟁력이다.
200자평
데이터를 이해하고 활용하는 능력을 개인과 조직의 핵심 경쟁력으로 제시한다. 윤리, 저작권, 거버넌스, 민주화까지 아우르며, 단순 기술이 아닌 책임 있는 데이터 활용의 지침을 담았다. 인공지능총서. aiseries.oopy.io에서 필요한 인공지능 지식을 찾을 수 있다.
지은이
김윤명
작가 김윤명은 디지털정책연구소(DPI) 소장이다. 남도의 니르바나, 땅끝 해남에서 태어났다. 광주 인성고와 전남대 문헌정보학과를 졸업하고, 경희대에서 지식재산법을 전공하여 박사학위를 받았다. 현재는 세종사이버대에서 정보보호학을 공부하고 있다.
그는 네이버 정책수석을, 소프트웨어정책연구소(SPRi)에서 소프트웨어와 인공지능 법제 연구를, 국회에서는 보좌관으로 입법과 정책을 다루었다. 이재명 경기도지사 캠프와 인수위인 새로운경기위원회에서, 그리고 이재명 대통령후보(20대, 21대) 캠프에서 활동했다. 대통령소속 국가지식재산위원회 AI-IP 특위에서 AI 시대에 변화하는 지식재산의 지형을 함께 그렸다. 경희대학교 법무대학원에서 인공지능법을, 전남대학교 데이터사이언스대학원 데이터사이언스 법과 윤리를 강의하며 다음 세대를 준비하고 있다.
사유하고 질문하고 기록하는 일은 그의 일상이다. 《블랙박스를 열기 위한 인공지능법》은 교육부 우수학술도서로, 《게임법》, 《게임서비스와 법》, 《인터넷서비스와 저작권법》은 문화체육관광부 세종도서(우수학술도서)로 선정되었다. 2025년 7월에 나온 《모두의 AI》는 이재명 정부가 추구하는 ‘모두의 AI’와 이를 통해 실현하고자 하는 ‘AI 기본사회’의 가치와 이념이 담겨 있다.
그는 시를 짓고 사진을 찍는다. 두 아이들의 강하중학교에서 발간한 시집 《나에겐 비도 맛있다》에 몇 편의 시를 담았다. 아내와 아이들, 그리고 시고르자브종 리카와 밴, 동네 골목, 바람과 하늘, 꽃과 나무 등 세상의 모든 숨결이 그의 렌즈에 깃든다. 사람들의 짠하고도 아심찬한 풍경을 기록한다. 시집을 내고, 사진 갤러리를 여는 것이 꿈이기도 하다.
또한 집 안에 ‘도서관N’을 세웠다. 정사서 1급 자격증을 가지고 있지만, 도서관장은 아내이다. N은 네이버와 한게임의 합병법인 NHN(Next Human Network)에서 따온 Next를 의미한다. “도서관엔(N) 뭐가 있을까? 도서관엔(N) 길이 있지! 도서관 다음엔(N) 뭘 만들지?” 이런 장난스러운 물음 속에 세상을 향한 다음 걸음을 품는다. 언젠가 모두를 위한 더 큰 도서관N을 짓겠다는 꿈을 품고 있다.
그는 다시 길을 내려 하고 있다.
AI를 비롯한 디지털 법제와 정책을 연구하기 위해 디지털정책연구소(Digital Policy Institute)를 세웠다. 그와의 인연은 digitallaw@naver.com을 통해 이어질 것이다.
차례
왜 데이터 리터러시인가?
01 데이터 리터러시
02 데이터 윤리
03 데이터 저작권
04 데이터 계약
05 데이터 사일로와 문화
06 데이터 전략과 정책
07 데이터 거버넌스
08 데이터 사이언스와 CDO
09 데이터 민주화
10 시사점
책속으로
데이터 수집은 분석의 첫 번째 단계로, 적절한 출처에서 신뢰할 수 있는 데이터를 확보하는 것이 중요하다. 수집한 데이터가 정확하고 신뢰할 수 있음을 보장하려면, 데이터의 출처와 품질을 꼼꼼히 검토해야 한다. 수집된 데이터는 대부분 오류를 포함하고 있기 때문에, 이를 정제하는 과정이 필수적이다. 정제 과정에서는 결측값을 처리하고, 이상치를 제거하며, 중복된 데이터를 정리하는 등의 작업이 이뤄진다. 이러한 과정을 통해 분석에 적합한 고품질 데이터를 만들 수 있으며, 잘못된 데이터는 분석의 정확성을 떨어뜨리기 때문에 철저한 정제가 필요하다.
-01_“데이터 리터러시” 중에서
데이터 저작권과 개인정보 보호는 서로 밀접한 관계에 있지만, 때로는 충돌할 수 있다. 개인정보가 포함된 데이터의 경우, 데이터 저작권을 주장할 수 있는지에 대한 법적 논란이 존재한다. 예를 들어, 개인정보를 익명화하거나 비식별화하는 경우, 해당 데이터에 대한 저작권을 주장할 수 있을지에 대한 문제가 발생할 수 있다. 「개인정보보호법」은 데이터를 보호하고, 데이터 활용 시 개인정보가 침해되지 않도록 해야 한다. 따라서 데이터 저작권은 개인정보 보호와 조화를 이뤄야 하며, 이를 위한 법적 규제를 준수하면서도 데이터의 소유권을 적절히 보호하는 것이 중요하다.
-03_“데이터 저작권” 중에서
국가와 기업의 데이터 전략 및 정책은 각각의 목표에 따라 우선순위를 두고 있으며, 서로 밀접한 영향을 주고받는다. 국가 차원에서는 데이터 주권과 사이버 안보를 최우선으로 고려하며, 이를 바탕으로 공공 데이터 개방과 산업 육성, AI 윤리 등의 정책을 추진한다. 반면, 기업은 데이터 자산화를 통한 수익 창출을 우선시하며, 동시에 규제 준수, 데이터 보안, 맞춤형 서비스 제공 등의 목표를 설정하고 있다.
국가와 기업의 데이터 전략은 서로 긴밀한 관계를 맺고 있다. 국가가 데이터 보호 및 규제 정책을 강화하면 기업은 이를 준수하기 위해 내부 데이터 정책을 조정해야 한다. 예를 들어, 「GDPR」이 시행된 이후 글로벌 기업들은 개인정보 보호 정책을 전면 개편하고, 데이터 처리 방식도 변화시켰다. 반대로, 국가가 공공 데이터를 개방하고, 데이터 경제 활성화를 지원하면 기업들은 이를 활용해 혁신적인 서비스를 개발하고 새로운 시장을 창출할 수 있다.
-06_“데이터 전략과 정책” 중에서
데이터의 활용은 기업 내 데이터 문화의 형성과도 깊은 연관이 있다. 데이터 문화는 단순히 데이터를 다루는 방식뿐만 아니라, 데이터를 활용해 더 나은 결과를 예측하고 신뢰성을 높일 방법을 포함한다. 개발자나 기획자가 데이터에 접근함으로써, 더 풍성하고 유의미한 결과를 이끌어 낼 수 있다. 이러한 데이터 민주화(data democratization)는 기업의 개발 문화와 밀접하게 연관되어 있으며, 결과적으로 데이터 기반의 의사 결정이 더 정확하고 효과적으로 이뤄지도록 돕는다. 데이터 민주화가 진정으로 이뤄졌을 때, 기업은 데이터를 통해 더 나은 미래를 예측하고, 창의적이고 혁신적인 결과를 도출할 수 있을 것이다.
-09_“데이터 민주화” 중에서