컨텐츠상세보기

Do it! 쉽게 배우는 R 데이터 분석
Do it! 쉽게 배우는 R 데이터 분석
  • 저자김영우
  • 출판사이지스퍼블리싱
  • 출판일2017-07-20
  • 등록일2020-12-24
보유 2, 대출 0, 예약 0, 누적대출 17, 누적예약 4

책소개



통계, 프로그래밍을 1도 몰라도 데이터를 혼자서 다룰 수 있다!

데이터 분석 프로젝트 전 과정 수록!



데이터 분석을 처음 시작한 초보자도 어깨춤을 추며 데이터를 혼자 다룰 수 있게 한다는 강의가 책으로 출간되었다. 통계, 프로그래밍, 데이터 분석을 전혀 몰라도 「Do it! 쉽게 배우는 R 데이터 분석」을 통해 R로 최근 주목받고 있는 데이터 분석 기법들을 재미있게 배울 수 있다. 이 책은 데이터 정제, 가공, 분석부터 그래프 그리기까지 실제 현업에서 데이터 분석 프로젝트를 할 때와 같은 모든 과정을 직접 해볼 수 있다. 쉬운 예제부터 차근차근 실습을 하다 보면 어렵게 느껴졌던 R 코드에 익숙해지고, 끝에 가서는 자신만의 훌륭한 데이터 분석 프로젝트를 완수하게 된다!

저자소개



저자 : 김영우

저자 김영우는 데이터로 세상을 이해하는 일을 하는 데이터 분석가. 기업, 대학, 연구 기관, 시민 단체 등 다양한 조직의 데이터 분석 프로젝트를 진행하고 있다. 측정, 실험, 데이터를 좋아하고, 혈액형 성격론, 타로카드, 자기개발서를 싫어한다. 데이터에 기반을 둔 대화를 추구하기 때문에 지인들로부터 신뢰할 만하다는 평을 듣지만 친구는 별로 없다.

초보자도 어깨춤을 추며 데이터를 분석하게 되는 강의를 진행하고 있다. SKT, 넥슨네트웍스, 로엔엔터테인먼트, 교육과정평가원, 마소캠퍼스 등에서 강의했다. 데이터 저널리스트로 활동하고 있다. 데이터 저널(datajournal.kr)을 운영하며 오마이뉴스에 기고하고 있다. 현재 레어템을 좋아하는 여인에게 수집돼 함께 살고 있으며, 가장 효율적으로 아무것도 안 하는 고양이 두 마리를 모시고 있다.

목차

첫째마당 R이랑 친해지기



01 안녕, R?

01-1 R이 뭔가요? - R 이해하기 

01-2 R이 강력한 이유



02 R 데이터 분석 환경 만들기 

02-1 R과 R 스튜디오 설치하기 

02-2 R 스튜디오와 친숙해지기 

02-3 프로젝트 만들기

02-4 유용한 환경 설정 



03 데이터 분석을 위한 연장 챙기기 

03-1 변하는 수, ‘변수’ 이해하기 

03-2 마술 상자 같은 ‘함수’ 이해하기 

03-3 함수 꾸러미, ‘패키지’ 이해하기



둘째마당 본격 실습! 데이터 갖고 놀기



04 데이터 프레임의 세계로! 

04-1 데이터는 어떻게 생겼나? - 데이터 프레임 이해하기 

04-2 데이터 프레임 만들기 - 시험 성적 데이터를 만들어 보자! 

04-3 외부 데이터 이용하기 - 축적된 시험 성적 데이터를 불러오자! 

[정리하기] 



05 데이터 분석 기초! - 데이터 파악하기, 다루기 쉽게 수정하기 

05-1 데이터 파악하기 

05-2 변수명 바꾸기 

05-3 파생변수 만들기 

[정리하기] 

[분석 도전!] 



06 자유자재로 데이터 가공하기 

06-1 데이터 전처리 - 원하는 형태로 데이터 가공하기 

06-2 조건에 맞는 데이터만 추출하기

06-3 필요한 변수만 추출하기 

06-4 순서대로 정렬하기 

06-5 파생변수 추가하기 

06-6 집단별로 요약하기 

06-7 데이터 합치기 

[정리하기] 

[분석 도전!]



07 데이터 정제 - 빠진 데이터, 이상한 데이터 제거하기 

07-1 빠진 데이터를 찾아라! - 결측치 정제하기 

07-2 이상한 데이터를 찾아라! - 이상치 정제하기 

[정리하기] 



08 그래프 만들기 

08-1 R로 만들 수 있는 그래프 살펴보기 

08-2 산점도 - 변수 간 관계 표현하기 

08-3 막대 그래프 - 집단 간 차이 표현하기 

08-4 선 그래프 - 시간에 따라 달라지는 데이터 표현하기 

08-5 상자 그림 - 집단 간 분포 차이 표현하기 

[정리하기] 

[꿀팁 01] 초보자가 자주 하는 실수 

[꿀팁 02] 에러 메시지 이해하기 



셋째마당 실전! 데이터 분석 프로젝트



09 데이터 분석 프로젝트 - ‘한국인의 삶을 파악하라!’ 

09-1 ‘한국복지패널데이터’ 분석 준비하기 

09-2 성별에 따른 월급 차이 - “성별에 따라 월급이 다를까?” 

09-3 나이와 월급의 관계 - “몇 살 때 월급을 가장 많이 받을까?” 

09-4 연령대에 따른 월급 차이 - “어떤 연령대의 월급이 가장 많을까?” 

09-5 연령대 및 성별 월급 차이 - “성별 월급 차이는 연령대별로 다를까?” 

09-6 직업별 월급 차이 - “어떤 직업이 월급을 가장 많이 받을까?” 

09-7 성별 직업 빈도 - “성별로 어떤 직업이 가장 많을까?” 

09-8 종교 유무에 따른 이혼율 - “종교가 있는 사람들이 이혼을 덜 할까?” 

09-9 지역별 연령대 비율 - “노년층이 많은 지역은 어디일까?”



넷째마당 R로 하는 다양한 데이터 분석의 세계



10 텍스트 마이닝 

10-1 힙합 가사 텍스트 마이닝 

10-2 국정원 트윗 텍스트 마이닝 



11 지도 시각화 

11-1 미국 주별 강력 범죄율 단계 구분도 만들기 

11-2 대한민국 시도별 인구, 결핵 환자 수 단계 구분도 만들기 



12 인터랙티브 그래프 

12-1 plotly 패키지로 인터랙티브 그래프 만들기 

12-2 dygraphs 패키지로 인터랙티브 시계열 그래프 만들기 



13 통계 분석 기법을 이용한 가설 검정 

13-1 통계적 가설 검정이란? 

13-2 t 검정 - 두 집단의 평균 비교 

13-3 상관분석 - 두 변수의 관계성 분석 



14 R Markdown으로 데이터 분석 보고서 만들기 

14-1 신뢰할 수 있는 데이터 분석 보고서 만들기 

14-2 R 마크다운 문서 만들기 



15 R 내장 함수, 변수 타입과 데이터 구조 

15-1 R 내장 함수로 데이터 추출하기 

15-2 변수 타입 

15-3 데이터 구조 

[정리하기] 



16 데이터 분석 기술을 효율적으로 익히는 방법 

15-1 집중할 방향 정하기 

15-2 데이터 분석 기술을 효율적으로 익히는 방법 

15-3 오픈 소스 생태계와 어울리기 



정답 

찾아보기

한줄 서평