책소개
더 이상 소셜 빅데이터 마이닝이 데이터를 다루는 연구자나 분석가에게 생소한 개념이어선 곤란하다. 현대 사회에서는 미디어 이용자들의 의견이 대량생산되고, 이용자마다 미디어를 이용하는 행태도 다양하다. 이에 따라 소셜 빅데이터 마이닝은 미디어 분석 연구자에게 더욱 중요해지고 있다. 이 책은 연구자뿐 아니라 소셜 빅데이터 마이닝의 공학적 분석 기술에 익숙하지 않은 이들에게도 유용한 관련 개념과 소셜 빅데이터를 분석할 때 고려해야 할 절차를 소개한다. 이를 통해 소셜 빅데이터 마이닝을 활용한 미디어 분석을 체계화하는 방법과 분석의 신뢰도와 타당성을 높이는 방법에 대한 논의가 활발해지기를 기대한다.
지은이
최홍규
한국교육방송공사(EBS) 연구위원이다. 서울과학기술대학교 전자IT미디어공학과(구 매체공학과)를 졸업하고, 고려대학교 일반대학원 언론학과에서 석사와 박사학위를 취득했다. 한국인터넷진흥원(KISA)의 선임연구원을 지냈다. 서울특별시 소위원회 홍보부문 위원, 중앙일보 모바일서비스기획 자문위원, 고려대학교 ≪커뮤니케이션과학≫ 편집위원, (사)국제슬로푸드한국협회 이사 등으로도 활동한 바 있다. 이외에 “빅데이터로서 뉴스 콘텐츠 활용 방안”, “국내 스타트업 정책사업 사례” 등 다양한 프로젝트 수행 경험이 있다. 주요 연구 분야는 방송 ․ 통신 정책, 빅데이터, 미디어 생태학 등이며, 특히 미디어와 빅데이터로 인한 사회 변화 양상에 관심이 많다. 박사학위논문은 『정보화 정책 이슈의 확산 과정에 관한 연구: 소셜 텍스트 빅데이터 분석을 중심으로』(2014)다. 학술 분야에서는 저서로 『빅데이터 시대의 커뮤니케이션 연구』(공저, 2015)와 『콘텐츠 큐레이션』(2015) 등 다수를 집필했고, “방송콘텐츠 영향력 도출을 위한 빅데이터 분석체계에 관한 연구”(2014), “IT ․ 정보화 정책의제 확산에 관한 연구: 소셜 텍스트 빅데이터 분석을 중심으로”(2014) 등을 발표했으며, “정보화 관련 ICT 정책 영역 중복에 관한 연구”(2013), “An Analysis of Media Researchers’ Perceptions of the Digitalization of Broadcasting in Korea”(2010) 등의 논문을 집필했다.
차례
01 소셜 빅데이터와 마이닝의 개념
02 소셜 빅데이터를 활용한 미디어 분석 유형
03 분석 절차 1: 주요 분석 내용 설정
04 분석 절차 2: 수집 데이터 설정
05 분석 절차 3: 데이터 수집
06 분석 절차 4: 자연어 처리와 코딩
07 분석 절차 5: 통계 분석과 결과 도출
08 분석 절차 6: 결과 해석과 시각화
09 분석 방법의 한계
10 분석 방법 개선 방안
책속으로
소셜 미디어 이용자에 대한 분석이 기존 미디어 분석과는 다르게 이용자들의 세부 정보 활동 양상을 분석하는 방법이다 보니, 방법론의 체계화는 더욱 중요해진다. 데이터 수집·분석 과정에서, 또한 결과물을 해석·활용히는 일련의 과정에서 합의된 방법론 체계를 통해 본질적인 데이터 분석 목적이 달성될 수 있기 때문이다. 방법론 체계가 견고하지 못할 경우 소셜 미디어 이용자 활동 데이터는 전체 사회를 읽는 데 무가치한 자료로 전락한다.
“소셜 빅데이터와 마이닝의 개념” 중에서
데이터 동질성(homogeneity)을 확보하기 위해 데이터 수집에 소요되는 총 기간은 최소화하는 것이 좋다. 소셜 빅데이터 분석에서는 대용량 데이터를 다루기 때문에 분석 시스템의 양적, 질적 수준에 따라 소요되는 데이터 수집 기간에 편차가 있을 수 있다. 그러므로 분석 주제, 분석 방법, 분석 범위와 수준 등을 설정하고 나면 첫 번째 데이터 수집 시점과 최종 수집 시점 간 간격을 최소화하도록 수집 시스템을 구조화해야 한다.
“분석 절차 4: 자연어 처리와 코딩” 중에서
아무리 논리적인 알고리즘을 통해 프로그래밍 작업을 한다고 해도 가비지 데이터를 완벽하게 차단할 수는 없다. 오히려 분석 과정에서 어느 정도 오류를 전제해 가비지 데이터를 수량화하는 과정이 필요할 수 있는 것이다. 이에 제안할 수 있는 것은 가비지 스케일(Garbage Scale)이다. 앞서 언급한 대로 연구자가 가비지 개념 설정 과정을 거친다면, 가비지 스케일은 이렇게 설정된 가비지 개념을 조작적으로 정의하고 측정해 보려는 시도인 것이다.
“분석 방법 개선 방안” 중에서