빅데이터와 언론
2544호 | 2015년 4월 17일 발행
신동희의 저널리즘 혁신 제안
신동희가 쓴 ≪빅데이터와 언론≫
빅데이터와 크라우드 소싱 저널리즘
데이터는 이야기가 되고 이미지가 될 때 저널리즘이 된다.
대중과 함께할 때 언론은 진실을 전할 수 있다.
정보가 많아지면 격차도 커진다.
콘텐츠의 생산 유통 소비 재생산이 선순환이 필요한 때다.
“≪텍사스트리뷴≫은 텍사스 주 공무원들 임금 데이터를 보여 주며, 다른 직업군과 비교하거나 물가상승률과 전체 국민소득 추이를 반영해서 콘텍스트를 보여 주었다. 넘쳐나는 숫자들의 조합 속에서 의미를 짚고 콘텍스트를 읽어 내며, 데이터와 콘텍스트를 스토리로 묶어 전한 것이다.”
‘데이터 저널리즘의 성공 사례’, ≪빅데이터와 언론≫, 76쪽.
데이터를 스토리로 전하면 뭐가 달라지나?
더 많은 정보, 정보에 숨겨진 의미와 맥락, 사건의 배경, 문제의 핵심을 더 쉽게 이해하고 해석할 수 있다. 데이터 시각화도 같은 효과가 있다.
데이터 시각화는 그래프 또는 다이어그램과는 다른 개념인가?
데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달하는 과정이다. 통계그래픽, 인포그래픽을 주로 사용한다. 과거 몇 가지 항목만 제시한 그래프와는 다르다.
뭐가 다른가?
데이터 양이다. ≪가디언≫은 영국 정부 지출 현황을 인포그래픽으로 보여 주었다. 항목이 무려 19만 개에 달한다.
19만 개 항목을 어떻게 한 번에 보여 줄 수 있는가?
빅데이터 처리 기술이다. 규모가 크고 다양한 형태로 빠르게 처리되는 속성이 있다. 대량의 정형 데이터, 비정형 데이터를 수집, 저장, 관리하고 이들 데이터에서 결과를 분석해 가치를 창출한다.
어떤 가치가 창출되는가?
모바일 디바이스, 인터넷 홈페이지, GPS 센서, 트래픽, 결제모듈 등에서 수집한 데이터를 분석해 의미를 파악하고 연관 분석해 인간에게 편리하고 유익한 어떤 정보, 스토리, 지식을 추출한다. 수집, 분석, 가치 창출이 연속되는 구조를 통해 새로운 정보를 계속 제공할 수 있다. 빅데이터가 창출한 가치를 활용해 기사를 작성하는 것이 데이터 저널리즘이다.
≪가디언≫의 2011년 런던 폭동 보도 같은 것을 말하는가?
그렇다. 폭동에 참여한 270명과의 인터뷰, 폭동과 관련한 해시태그가 붙은 트위터 257만 건을 분석해 탄생한 기사가 “폭동 읽기”다. 또 트위터 분석 결과를 토대로 당시 유포된 폭동 관련 루머의 진위를 입증했다. 루머의 확산 경로를 추적해 양방향 그래픽으로 보여 줬다. 주장이나 편견이 아니라 데이터로 중요한 이야기를 들려준 것이다.
앞서 나가는 언론사는 어디인가?
영국의 BBC와 ≪가디언≫, ≪파이낸셜타임스≫와 미국의 ≪시카고트리뷴≫, ≪라스베이거스선≫, ≪로스앤젤레스타임스≫, 독일의 ≪차이트온라인≫, 일본의 ≪아사히신문≫을 들 수 있다. 이들은 데이터 저널리즘을 활용할 뿐만 아니라 또 다른 혁신을 꾀하고 있다. 이 흐름을 주목해야 한다.
또 다른 혁신이 뭔가?
크라우드소싱 저널리즘과의 융합이다. ‘대중(crowd)’과 ‘외부자원 활용(outsourcing)’의 합성어인 크라우드소싱은 대중의 정보와 지식을 바탕으로 한 참여를 뜻한다. 단순 제보가 아니라 시민이 참여하는 새로운 형태의 개방형 저널리즘이다.
대중과 외부자원 활용이 만나 성공한 사례가 있는가?
≪허핑턴포스트≫는 버락 오바마의 경기 부양책과 관련한 1400페이지의 예산안을 통째로 사이트에 올려놓고 문제가 될 만한 부분을 찾아 달라고 독자들에게 요청했다. 367명의 독자가 응답했고 그들의 의견이 기사가 되었다. ≪가디언≫은 국민이 낸 세금을 의원들이 어떻게 흥청망청 쓰는지 한눈에 알 수 있게 보여 줬는데, 이 작업에도 독자가 참여했다. 원본 문서를 공개하자 방문자의 56%가 80시간 만에 17만 건의 영수증을 분석했다.
한국의 사정은 어떤가?
≪한겨레≫는 2014년 ‘전두환 재산찾기 프로젝트’라는 크라우드소싱을 제안해 독자의 제보와 의견을 받았다. 뉴스타파도 ‘조세피난처 프로젝트’의 페이퍼컴퍼니 설립 명단을 홈페이지에 공개하며 크라우드소싱으로 취재 방식을 전환했다.
이렇게 되면 저널리즘은 어디로 가게 되는가?
대중과의 협업, 정보의 공개와 공유를 통한 가치 창출로 진화할 것을 암시한다. 언론사보다 독자, 대중과의 소통, 인터랙션 플랫폼이 저널리즘의 중심축이 될 것이다. 앞의 언론사들은 데이터 저널리즘과 크라우드소싱의 융합 형태를 잘 보여 줬다. 이 융합을 바탕으로 언론사가 탐사조사에 나서는 방향으로 나아갈 수도 있다.
트렌드로 끝날 가능성은 없는가?
온라인 저널리즘, 뉴저널리즘, 디지털 저널리즘이 그랬다. 저널리즘 혁신이 유야무야로 끝났다. 데이터 저널리즘도 하나의 트렌드로 지나갈 수 있다.
혁신에 성공하려면 무엇이 필요한가?
독자와 소통할 수 있는 플랫폼 채널을 만들고 독자가 콘텐츠 생산 전반에 적극 참여하도록 이끌어야 한다. 정보의 공유, 개방, 협업으로 콘텐츠를 생산하고, 생산-유통-소비-재생산하는 선순환 구조를 만들어야 한다. 그러면 콘텐츠의 질도 높아지고, 더 많은 사람이 정보의 의미와 맥락을 이해할 수 있게 될 것이다.
우리 사회가 얻는 것은?
정보 격차, 사회적 격차를 줄일 수 있다. 정보 과잉 시대에 정보의 의미를 제대로 해석하지 못하는 사람이 늘고 있다. 정보를 아는 것과 모르는 것이 사회적 격차를 벌린다. 데이터 저널리즘은 그들이 정보의 행간을 파악하고 해석할 수 있도록 돕는다.
이 책 ≪빅데이터와 언론≫은 무엇을 말하는가?
데이터 저널리즘의 기본 개념과 발생 배경을 정리했다. 국내외 데이터 저널리즘 현황을 분석하고 데이터 저널리즘과 크라우드소싱 저널리즘 성공 사례에서 저널리즘이 나아갈 방향을 모색했다. 언론사, 정부, 연구소의 빅데이터 활용 방안과 데이터 저널리즘 활성화 방안을 제시했다.
당신은 누구인가?
신동희다. 성균관대학교 인터랙션사이언스학과 교수이고 BK사업단장이다.