책소개 사회과학 연구자의 입장에서 R프로그래밍의 기초 문법을 정리했다. 기본적인 R프로그래밍 명령어를 소개하고, 실제 통계 분석 과정에서 이를 어떻게 활용해야 하는지 설명한다. 프로그래밍 명령어 텍스트와 함께 그 결과 화면을 그림으로 실어 이해도를 높혔다. 책의 예제를 차근차근 따라하다 보면 어느새 R프로그램의 기초를 탄탄하게 다질 수 있을 것이다.
※ 부록 – 샘플 데이터 파일을 받으려면 여기를 클릭하세요. ※ 부록 – R commands 파일을 받으려면 여기를 클릭하세요. ※ 부록 – Omnibus_Oct_2012_Political_Video_spss.sav 파일을 받으려면 여기를 클릭하세요. 200자평 R가 SPSS를 대체하는 통계 프로그램으로 떠오른 까닭은 뭔가? 다양한 연구 분야를 포괄하는 범용성 때문이다. 어느 분야에서 활용되나? 통계학, 전산학, 수학, 물리학, 생물학 등 거의 모든 학문 분과에서 사용된다. 사회과학 연구자가 R에 익숙해지려면? 인터넷에 공유된 오픈 소스를 따와 자신의 연구에 직접 적용해 보는 방법이 최선이다. R을 이용해 사회과학 연구를 진행해 온 저자가 R의 기본기를 정리했다. R 프로그램의 활용이 쉬워진다. 지은이 백영민 차례 머리말
1부 들어가면서 01 사회과학자는 왜 프로그래밍을 배워야 하는가?
2부 데이터 관리 07 데이터란
3부 데이터 사전처리 11 데이터 중 일부만 골라내기
4부 통계분석 13 R프로그래밍을 통한 확률분포 학습
5부 기초편을 넘어 16 기초가 가장 중요하다 책속으로 이 책은 R를 소개하는 기존의 책과 매우 다른 접근을 취했다. R에 관한 기존의 책들은 대부분 통계학 전공자들이나 컴퓨터 프로그래머와 같은 사람들이 저술하였다. 이러한 배경을 갖는 사람들이 보기에 이 책에서 소개된 R프로그래밍은 비효율적으로(inefficient) 보일 수 있다. 이를테면 이 책에서는 attach()와 detach()함수를 사용하지 않았는데, 이 같은 비효율성은 사실 의도된 것이다. 비효율성을 택한 대신 저자는 프로그래밍에 익숙하지 않은 사람들이 보아도 이해할 수 있는 반복적이지만 직관적인 프로그래밍을 강조하였다. 이 책의 독자들 중 반복적이라도 직관적인 R프로그래밍보다 효율적인 R프로그래밍을 원한다면, 다른 R 관련 책을 탐독하는 편이 나을 것이다. 하지만 대부분의 사회과학 데이터의 크기가 크지 않은 상황과 최근 컴퓨터의 자료처리 속도를 감안할 때, 비효율적이지만 직관적으로 이해가 가능한 프로그래밍이라도 자료를 처리하는 데는 많은 시간이 낭비되지 않는다는 점을 강조하고 싶다.
일반 상업용 프로그램에서의 프로그래밍과 R의 프로그래밍은 얼마나 다를까? 의심의 여지없이 일반 상업용 프로그램은 사용이 쉽다. 그러나 사용이 쉬운 대신, “뜻을 실어 펼” 표현법이 부족하다는 문제가 있다. 비유를 하자면 상업용 프로그램의 프로그래밍은 아이콘(icon)을 이용한 커뮤니케이션과 비슷하다. 아이콘을 이용한 커뮤니케이션은 그림을 통해 특정한 정보를 쉽게 커뮤니케이션할 수 있다는 장점이 있다. 하지만 아이콘을 이용해 커뮤니케이션되는 표현은 단순한 것에 그치기 쉽다. 이에 반해서 R프로그래밍은 추상적 언어에 보다 가깝다. 외국어를 배울 때 어려움을 겪듯, 프로그래밍을 접해 보지 않은 사회과학자의 입장에서 R프로그래밍은 쉽지 않은 것이 사실이다. 게다가 ‘R프로그래밍에 익숙해 봤자 사회과학적 지식 추구에 직접적으로 도움이 되지 않는 것’처럼 보이는 것도 사실이다. 그러나 확실한 것은 R프로그래밍은 매우 유연한 언어이기 때문에 기초적인 데이터 관리 및 분석에서 고급 분석 방법까지 커버가 가능하다는 점이다. 추천글 30여 년 전 대학원 공부를 시작했을 때 노먼 나이(Norman Nie)의 SPSS 매뉴얼을 끼고 다니면 뭔가 한 발 앞서 가는 학자인 거 같아 우쭐했던 기억이 난다. 네트워크 시대인 현재 오픈 소스를 바탕으로 한 R의 진가는 잘 알려져 있다. 기존의 패키지 프로그램과 비교해 보면, 수많은 통계 기법과 새로운 테크닉을 마음대로, 그것도 거저 사용할 수 있는 R의 진가가 금방 나타난다. 이 책은 이런 점에서 시의적절하다. 아울러 앞으로 사회과학도를 위한 통계 패키지 입문서로 나이의 SPSS 매뉴얼처럼 고전이 될 것이다.
자료 분석과 처리는 대부분 통계 프로그램의 도움을 받아야 한다. 문제는 학생들이 상용 통계 프로그램의 깔끔한 그래픽 환경과 편리한 메뉴 구성에 의존하는 나머지, 통계학적 전제와 조건에 대한 기본 검토도 없이 프로그램에 통계 처리를 내맡기는 나쁜 습관에 쉽게 물든다는 점이다. 저자가 강조하듯 R는 장점이 많은 통계 프로그램이다. 그러나 학습 과정에서 얼마간의 ‘수고스러움’도 요구한다. 통계 분석의 전제와 조건을 직접 확인해 가는 프로그래밍 작업을 감내 해야 하기 때문이다. 하지만 독자들은 이런 과정이 자신의 통계학적 기초를 튼튼하게 하고 수준 높은 응용력을 연마하는 길이라는 사실을 금방 알아차릴 것이다. 저자의 친절하고 성실한 설명이 장점인 이 책은 입문하기 어렵다고 알려진 R를 즐겁게 배울 수 있는 경험을 제공할 것이다.
자료 분석에도 도가 있고 품격이 있다. 홀로 깨우치거나 아무 책이나 놓고 배우더라도 결과만 얻으면 그만이라고 생각하는 이도 있겠지만, 실제로 분석은 그렇게 만만하지 않다. 누구로부터 어떻게 배우냐에 따라 학습의 효율성은 물론 분석의 도와 품격이 달라진다. 이 책은 R의 기본 원리에 대한 친절한 설명부터 자료 처리의 특성에 대한 소개까지 R의 초심자가 알아야 할 모든 내용을 친절하고도 요령 있게 전달한다. 이 책으로 R를 시작하면 중급을 넘어 고급 자료 분석을 할 때에도 놓쳐서는 안 되는 자료 분석의 도와 품격을 얻을 수 있다. |
회사소개   알리는말씀   이용약관 유료서비스이용약관   개인정보취급방침   회사약도 페이스북컴북스   페이스북지만지 |