데이터 준비부터 분석을 통한 인사이트 도출까지
데이터를 인사이트로 바꾸는 SQL 활용법
데이터 분석 역량은 분야를 막론하고 경쟁력을 갖추는 데 필수가 되어가고 있다. 이 책은 SQL 데이터 분석이 익숙하지 않은 초급자와 더 나은 쿼리 및 분석 방법을 찾는 SQL 숙련자 모두를 위한 가이드다. 분석에 앞서 데이터를 준비하는 과정부터 실무에서 가장 활용도 높은 시계열, 코호트, 리텐션 분석 등 다양한 분석법을 알려준다. 실제 데이터셋을 사용해 흥미로운 예제를 실습해보며 실전에 가까운 분석 경험을 쌓아보자.
대상 독자
CHAPTER 1 SQL을 활용한 분석
1.1 데이터 분석이란
1.2 SQL을 사용하는 이유
1.3 데이터베이스 타입과 활용법
1.4 결론
CHAPTER 2 데이터 준비
2.1 데이터 타입
2.2 SQL 쿼리 구조
2.3 프로파일링: 데이터 분포
2.4 프로파일링: 데이터 품질
2.5 준비: 데이터 정제
2.6 준비: 데이터 셰이핑
2.7 결론
CHAPTER 3 시계열 분석
3.1 날짜 및 시간 데이터 조작
3.2 데이터셋: 소매업 매출
3.3 데이터 트렌드 분석
3.4 시간 윈도우 롤링
3.5 계절성 분석
3.6 결론
CHAPTER 4 코호트 분석
4.1 코호트
4.2 데이터셋: 미국 의회 입법가
4.3 리텐션
4.4 관련 코호트 분석
4.5 코호트를 활용한 크로스 섹션 분석
4.6 결론
CHAPTER 5 텍스트 분석
5.1 SQL을 활용한 텍스트 분석
5.2 데이터셋: UFO 목격 보고
5.3 텍스트 특징
5.4 텍스트 파싱
5.5 텍스트 변환
5.6 대규모 텍스트에서 문자열 찾기
5.7 텍스트 구성과 형태 변환
5.8 결론
CHAPTER 6 이상 탐지
6.1 SQL을 활용한 이상 탐지
6.2 데이터셋: 지진 발생 기록
6.3 아웃라이어 탐지
6.4 이상값의 형태
6.5 이상값 처리
6.6 결론
CHAPTER 7 실험 분석
7.1 SQL을 활용한 실험 분석
7.2 데이터셋: 모바일 게임 사용자
7.3 실험 유형
7.4 실험의 어려움과 문제 해결 방법
7.5 대체 분석 방법
7.6 결론
CHAPTER 8 복잡한 데이터셋 생성
8.1 SQL로 복잡한 데이터셋 생성하기
8.2 코드 구성
8.3 쿼리 실행 순서 구성
8.4 데이터셋 크기 및 프라이버시 관리
8.5 결론
CHAPTER 9 결론
9.1 퍼널 분석
9.2 이탈, 휴면의 정의
9.3 장바구니 분석
9.4 참고 자료
9.5 마치며
데이터로 소통하는 시대에 필살기가 되어줄 SQL 활용법
데이터로 말하고 데이터로 소통하는 시대에, 데이터 분석은 점점 선택이 아닌 필수가 되어가고 있습니다. 데이터를 다루는 사람이라면 기본으로 알아야 할 SQL은 이제 개발자나 데이터베이스 관리자뿐 아니라 다양한 비즈니스의 기획, 마케팅 등 여러 직무로 영역을 넓혀가고 있습니다. SQL을 다룰 줄 안다면 방대한 비즈니스 데이터에서 필요한 정보를 직접 추출할 수 있고, 한 단계 더 나아가 SQL이 지원하는 다양한 분석법을 활용할 줄 안다면 추출한 데이터에서 의미 있는 정보를 가려내 비즈니스에 도움이 되는 인사이트를 도출할 수 있습니다. SQL은 데이터 분석가가 필수로 갖춰야 할 역량이자, 비개발 직군이라면 업무에 깊이와 통찰을 더하고 시각을 넓혀줄 필살기가 되어줄 겁니다.
“신규 고객이 얼마나 유입됐는가?”, “판매 추이가 어떠한가?”, “왜 어떤 고객은 한번 서비스를 이용한 후 다시 돌아오지 않는 반면, 어떤 고객은 지속해서 서비스를 이용하는가?” 등 분석은 항상 질문을 던지는 데서 시작합니다. 답할 질문이 주어지고 나면 데이터가 어디에서 생성되고 어디에 저장되는지(데이터 탐색), 주어진 데이터를 어떻게 분석하고, 그 결과에서 어떻게 인사이트를 찾아낼지(데이터 분석) 생각합니다.
이 책은 데이터를 분석하는 ‘쿼리와 분석’ 단계에 초점을 맞춥니다. 다양한 사례마다 적절한 쿼리 작성법을 알려주면서도 분석 워크플로 내에서 데이터를 프로파일링 및 정제하는 준비 단계도 놓치지 않습니다. 웹사이트에서 공개한 실제 데이터셋으로 쿼리를 실행해보며 시계열 분석, 코호트 분석, 텍스트 분석 등을 실무에 가깝게 실습해봅니다. 예제마다 제시하는 다양한 문제에 대한 답을 찾아가며 유용한 분석법을 학습하다 보면, 여러분에게 놓인 업무 상황에 어떤 분석법을 적용할 수 있을지 그리고 그 결과를 어떻게 활용할지 길이 보일 겁니다.
주요 내용
옮긴이의 말
이 책은 다양한 분석 기법을 설명하는 데서 한발 더 나아가 왜 이러한 분석이 필요한지, 분석 결과가 무엇을 의미하는지, 결과를 새로운 전략에 어떻게 활용할지도 알려줍니다.
‘옮긴이의 말’ 중에서
추천사
데이터 분석을 시작할 때 이 책이 있었다면 많은 시간을 줄여줬을 것 같습니다. 쿼리 작성법뿐 아니라 필요한 기초 지식도 같이 알려준다는 점이 인상 깊습니다. SQL 입문자와 숙련자 모두에게 추천합니다.
_변성윤, 데이터 과학자 및 머신러닝 엔지니어
20여 년간 SQL로 분석을 해왔지만 이 책을 보며 몇 번이나 ‘아하’를 외쳤는지 모릅니다. 제 팀원들과 미래의 팀원 모두에게 권하려고 합니다.
_스튜어트 킴-브라운, PhD, B2C, SaaS 프로덕트 애널리틱스 리더
드디어 데이터 분석만을 위한 SQL 책이 나와 매우 기쁩니다. SQL을 활용한 다양한 데이터 분석 기법을 다루고 있어 모든 분석가와 데이터 과학자에게 도움이 될 겁니다.
_댄 부히스, 애널리틱스 디렉터, 질로우
자료명 | 등록일 | 다운로드 |
---|---|---|
예제소스 | 2022-10-21 | 다운로드 |