빅데이터와 언론
<신문의 날 특집> 저널리즘 생존 게임 4. 데이터 저널리즘은 왜 강한가?
신동희가 쓴 <<빅데이터와 언론>>
가디언을 만든 건 정부
한두 명의 기자나 문사로는 안 된다. 독자가 더 잘 알기 때문이다. <<가디언>>은 데이터 저널리즘의 선구자다. 기자와 독자가 함께 사실을 추적한다. 어떻게? 정부가 정보를 공개하기 때문이다.
저널리즘과 테크놀로지의 융합으로 생겨난 데이터 저널리즘은 위기에 빠진 국내 저널리즘에 새로운 돌파구가 될 수 있다.
<<빅데이터와 언론>>, vii쪽.
정말로 국내 저널리즘의 돌파구가 될 수 있나?
가장 가까운 가능성이다. 이미 성공 사례도 있다.
국내 성공 사례가 뭔가?
뉴스타파다. 한국형 프로퍼블리카를 표방하는 인터넷 독립 탐사 보도 매체다.
프로퍼블리카?
비영리 탐사 전문 온라인 매체인 프로퍼블리카는 억만장자 허버트 샌들러의 기부로 2007년 설립되었다. 매년 수백 억 원을 지원받는다.
뉴스타파도 기부금으로 운영되나?
일반 시민의 후원으로 운영된다. 2014년 4월 8일 기준으로 3만2117명이 뉴스타파를 후원한다.
뉴스타파의 성과는?
페이퍼컴퍼니를 설립해 비자금을 빼돌린 한국인 명단을 공개했다.
어떤 데이터를 사용했나?
국제탐사보도언론인협회와 함께 조세피난처 프로젝트를 진행했다.
플랫폼은 뭔가?
홈페이지, 유튜브, 팟캐스트, 포털사이트, RTV다.
약하지 않은가?
신문과 방송의 인용 보도로 뉴스는 급격히 확산된다. 조세피난처 뉴스는 단번에 세간의 화제가 되었다. 이 보도로 미디어공공성포럼 언론상을 받았다.
일회성 이벤트 아닌가?
역외 유령 회사 추적 시민 참여 프로젝트라는 명칭으로 뉴스타파 홈페이지에 게시되어 있다. 홈페이지 제보로 시민의 직접 참여도 가능하다.
성과는 이어지고 있는가?
국정원 대선 개입이 조직적이었는지를 밝히기 위해 트위터 데이터를 분석했다. 뉴스타파 데이터센터에 658개 트위터 계정과 23만여 건 트윗 글을 공개했다.
658개 계정으로 뭘 말할 수 있는가?
각 계정의 관계를 시각적으로 표현해 뉴스의 심층성과 분석력을 보여 주었다.
한국에서는 뉴스타파뿐인가?
국내 언론사는 데이터를 통한 보도에 큰 관심을 기울이지 않았다. 최근 <<연합뉴스>>, <<한겨레>>, <<해럴드경제>>가 데이터 저널리즘을 활용한다.
데이터를 활용하는 것과 데이터 저널리즘은 무엇이 다른가?
과거에는 저널리즘의 한 공정에 필요한 기술이었다. 데이터 저널리즘은 다양한 데이터를 분석하는 것에서 시작해 인터랙티브한 결과물을 사람들이 이용할 수 있게 하는 전반적 과정이다.
어떤 과정을 말하나?
데이터의 수집, 정리, 분석, 시각화, 스토리화의 과정을 통해 저널리즘을 실천한다.
기존 저널리즘과 무엇이 다른가?
많은 양의 데이터에 기반을 두고 자료를 수집 정리하여 의미 있는 정보를 만들어 낸다.
어떤 데이터를 사용하나?
공개 데이터를 저널리즘 활동에 적극 활용한다. 이제는 오픈 데이터 저널리즘의 시대다.
오픈 데이터의 시대란 뭘 의미하는가?
미디어는 더 이상 일방적으로 정보를 전달하지 않는다. 인터넷을 통해 누구든지 참여하고 자신의 의견을 표명할 수 있다.
누가 오픈 데이터 활용 보도에 앞서 있는가?
영국의 <<가디언>>과 비비시, 미국의 <<라스베이거스 선>>과 에이비시, <<파이낸셜타임스>>, 독일의 <<자이트>> 온라인이 데이터 저널리즘에 관심을 가지고 활용 방법을 모색하고 있다.
<<가디언>>의 방법은 뭔가?
시민들의 도움으로 수많은 문건을 검토했다. 의원들이 국회 의정비를 어떻게 남용했는지 밝혀냈다. 부패한 영국 정가의 모습을 정확히 보여 줄 수 있었다.
그들이 만든 < Wikileaks War Logs>는 뭔가?
위키리크스의 내용을 토대로 구축한 데이터베이스다. 앞으로 무궁무진한 기사를 만들 수 있는 정보의 보고다.
다른 언론사나 일반 대중도 사용할 수 있는가?
보도에 활용한 빅데이터 830여 세트를 웹사이트에 공개했다.
어떤 내용의 데이터인가?
성형수술 건수, 개인용 화기 보급, 낙태 건수 등 사회적으로 민감한 이슈, 세계 인구 추이, 노벨상 수상자 목록, 세계 항공 업계 관련 데이터 등 전 지구적 내용을 담은 데이터가 담겨 있다.
특종을 포기한 것인가?
투명성을 추구하는 것이다. 예전처럼 특종에 목을 매어 데이터를 기밀 사항으로 숨기지 않는다. 인터넷 시대에 어울리는 공유의 정신에 부합하는 것이다.
<<가디언>>이 데이터 저널리즘에서 두각을 나타내는 이유는 무엇인가?
영국 정부는 오픈 데이터에 일찍부터 투자했다. 데이터 저널리즘의 발전 환경을 조성한 것이다. 2012년 6월에 영국의 국무조정실은 ‘data.gov.uk’ 사이트를 열고 오픈 데이터 백서를 발표했다.
데이터 저널리즘은 새로운 저널리즘인가?
기존 저널리즘을 바꾸고 언론사의 본질을 바꾼다.
이 환경에서 언론사는 앞으로 무엇이 되는 것인가?
뉴스와 정보를 생산하는 곳이 아니라 뉴스와 정보를 상호작용적으로 처리하는 플랫폼이 된다.
플랫폼이 된다는 것은 무슨 뜻인가?
언론사는 전통적 비즈니스 모델에서 벗어나야 한다. 이제는 데이터를 통해 이익을 낼 수 있는 새로운 플랫폼을 만들어야 한다.
새로운 플랫폼의 이름은 뭔가?
신뢰할 만한 데이터를 구축하고 이를 분석해 이야기를 전달하는 매체, 곧 데이터 허브로 발전해야 한다.
이렇게 하면 신문이 살아나는가?
신문의 위기는 신뢰성, 경제성 두 가지에서 비롯됐다. 데이터 저널리즘은 저널리즘의 신뢰성을 회복하고 다양한 비즈니스 모델을 창출할 수 있다.
어떤 비즈니스 모델인가?
데이터 유료 부가 서비스와 재판매, 데이터 부대 사업, 광고 플랫폼, 데이터 활용 컨설팅을 생각할 수 있다. 모두가 부가 지식 산업이다.
지속 가능한 모델인가?
데이터 저널리즘 기반으로 수행된 취재 활동과 데이터 세트가 누적되면 특정 산업에 대한 통찰적 지식이 형성된다. 그 지식은 지식 기반 서비스업의 토대가 될 가능성이 크다. 그렇게 된다면 지속은 당연한 결과가 된다.
그런 비즈니스 모델 구축 사례가 있는가?
<<가디언>>, <<시엔엔>>, <<뉴욕타임스>>다. 다른 매체가 쉽게 따라잡을 수 없는 데이터 저널리즘 보도 자체가 광고주를 유인한다.
한국의 사정은 어떤가?
데이터 저널리즘은 시간과 노력이 많이 요구된다. 데이터 토대가 마련되어야 실행할 수 있기 때문이다. 생존 문제에 시달리는 국내 언론사들은 이런 투자를 사치라고 생각하는 듯하다.
한국 언론사가 살 길은 없는가?
공공 정보를 공개해야 한다. 공개 자료가 있지만 대통령 후보들의 선거 비용과 고위 공직자들의 재산과 같이 권력 감시에 중요하게 사용되는 자료들은 제한된 열람 기간과 불가능한 저장 및 출력, DB화하기 힘든 이미지 형식 때문에 데이터 저널리즘과 연결하기가 어렵다. 경제협력개발기구는 한국 정부의 공공 정보 비공개 범위가 넓고 청렴성이 미흡하다고 거듭 지적해 왔다.
당신은 누구인가?
신동희다. 성균관대학교 인터랙션사이언스학과 교수다.