빅데이터
정용찬이 쓴 커뮤니케이션이해총서 <<빅데이터>>
가장 쉬운 빅데이터
통신회사 하나가 하루에 나르는 데이터가 소설책 40억 권 분량이다. 크고 다양한 빅데이터를 이해하는 가장 쉬운 방법이 나왔다. 저자에게 직접 듣는 오디오북이다.
<<빅데이터>> 오디오북 작업은 어떤 경험이었나?
오디오북 작업은 처음이다. 스튜디오 녹음은 새로운 경험이라 흥미로웠다.
무엇이 중요한가?
저자가 직접 낭독했다는 것이다.
저자가 직접 낭독한다는 것은 무엇을 뜻하나?
책을 직접 쓴 사람만큼 그 책을 잘 아는 사람이 있을까? 책이 전달하려는 의미를 더 명확하게 독자에게 전달할 수 있다.
오디오북은 어떻게 읽는가?
스마트폰 대중화 시대다. 필요할 때 수시로 들으면 책을 읽는 것과 또 다른 묘미를 느낄 수 있을 것이다.
이 책이 말하는 빅데이터는 무엇인가?
빠르고 다양한 대규모 데이터를 말한다.
얼마나 큰 게 빅데이터인가?
합의된 기준은 없지만 테라바이트 단위 이상은 되어야 하지 않을까. 소설책 한 권이 250킬로바이트 정도니 1테라바이트는 소설책 400만 권 정도 분량이라고 보면 된다. 요즘은 통신회사의 하루 데이터 전송량이 1페타바이트 정도라고 한다.
페타바이트라면 어느 정도의 양인가?
소설책 40억 권 정도다.
이 책에서 독자가 놓쳐서는 안 될 대목은 어디인가?
빅브라더와 빅데이터 기술을 다룬 부분이다.
왜 거기인가?
새로운 기술은 우리에게 안락과 걱정을 동시에 안긴다. 빅브라더는 우리에게 편리함을 주는 빅데이터의 어두운 면이다.
빅브라더는 현실인가?
현재 기술로 가능성은 충분하다. 막지 않으면 현실이 된다.
사례가 있는가?
최근 불거진 미 국가안보국(NSA)의 외국 지도자 도청을 보라. 이런 건 이제 고전이 된 수법이다. 수사 목적으로 이메일, 웹서핑 감청이 용인되고 있다. 거리 도처에 있는 CCTV도 남용 가능한 수단이다.
프리즘을 말하는가?
그렇다. NSA와 FBI는 자국 내 위치한 인터넷 회사 중앙 서버에 직접 접속해 영화, 오디오, 사진, 이메일, 문서 콘텐츠와 로그 데이터를 2007년부터 수집·분석해 왔다.
정보를 제공한 인터넷 기업은 어디인가?
구글을 포함해 수십억 명의 사용자들이 활용하는 마이크로소프트, 야후, 페이스북, 팔토크, 스카이프, AOL, 애플이다.
한국은 안전한가?
국가정보원도 패킷 감청을 사용한다. 패킷 감청은 이메일과 웹서핑, 게시물 읽기와 쓰기 등 인터넷상 모든 활동을 실시간으로 살펴볼 수 있다.
감청이 합법인가?
법원의 감청허가서가 있으면 된다. 특정 회선을 통한 웹서핑, 이메일 등을 한꺼번에 감청한다. 같은 회선을 이용하는 제3자의 개인정보까지 노출된다.
2011년에 패킷 감청이 위헌이라는 헌법소원이 제기되지 않았나?
민주사회를위한변호사모임이 정보수사기관의 포괄적 인터넷 회선 감청에 대해서 “인권침해적 감청기술이며 헌법이 보장하는 통신의 자유 및 사상과 양심의 자유, 통신 비밀의 자유 등을 침해한다”고 주장했다.
국가정보원의 대답은 무엇인가?
수사권이 미치지 않는 지메일 같은 외국계 이메일을 통해 사이버 망명을 시도하는 경우가 있어 인터넷 감청이 불가피하다고 주장했다.
빅브라더를 막을 방법이 있나?
벤자민 프랭클린은 “일시적인 안전을 위해 자유를 포기한다면 자유는 물론 안전도 누릴 수 없다”고 했다.
이런 위험 잠재력에도 불구하고 이 세계가 빅데이터에 열광하는 이유가 뭔가?
빅데이터는 미래 경쟁력의 우위를 좌우하는 중요한 자원이다. 맥킨지는 스마트혁명 시기에 빅데이터는 혁신과 경쟁력 강화, 생산성 향상의 원천이라고 했다. 가트너도 데이터를 21세기의 원유라고 했다.
고객관계관리와 빅데이터 분석의 차이는 뭔가?
적용 대상과 분석기법이 확장되었다. 데이터 규모 확대, 내부 고객 데이터에서 소셜 미디어를 통한 잠재 고객 데이터로 확장, 반복적 마케팅 활동 분석에서 시장 예측을 위한 트렌드 분석까지 포괄하는 점이 다르다.
빅데이터로 뭘 할 수 있는가?
기업의 마케팅 분야, 정부를 포함한 공공 부문의 혁신을 수반하는 대변화를 가져올 수도 있다. 재난 방재, 테러 감지, 전염병 확산 위험 예측이 가능하다.
공공 부문에서는 빅데이터를 어떻게 활용하는가?
구글이 검색어 빈도를 활용해 독감이 어느 지역에서 유행할지 예측한 사례가 유명하다. 기존 미국질병통제본부가 사용하는 방법보다 예측이 더 빠르다.
한국의 공공 부문은 빅데이터를 어떻게 사용하는가?
최근 서울시가 휴대전화 통화 데이터와 심야택시 운행정보를 결합해 심야버스노선을 개발한 사례가 대표적이다.
빅데이터 시대의 경쟁력 포인트는 어디 있는가?
대량의 데이터를 수집·분석할 수 있는 하드웨어가 구축돼야 한다. 수학·공학적인 능력과 경제학·통계학·심리학 등 다방면에 능통한 인재도 필요하다. 빅데이터 처리 인프라 개발 및 분석, 플랫폼 구축을 위한 시스템 엔지니어와 데이터 해석력을 갖춘 인재 양성을 위한 교육과정 개설이 시급하다.
이 책, <<빅데이터>>는 무엇을 말하나?
빅데이터의 정의부터 활용, 기술, 마이닝, 데이터 마이닝, 데이터 시각화, 클라우드 컴퓨팅, 데이터센터, 빅브라더 등 빅데이터의 모든 것을 담았다. 기업과 공공 부문에서 빅데이터에 대한 정확한 이해와 효과적 활용 전략을 배울 수 있다.
당신은 누구인가?
정용찬이다. 정보통신정책연구원 방송미디어연구실 연구위원이다.