메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

데이터 드리븐 리포트

상사와 고객을 설득하는 데이터 기반의 의사결정 with 파이썬

한빛미디어

집필서

판매중

  • 저자 : 이상석
  • 출간 : 2023-10-31
  • 페이지 : 408 쪽
  • ISBN : 9791169211574
  • 물류코드 :11157
  • 초급 초중급 중급 중고급 고급
4.9점 (43명)
좋아요 : 2

무조건 안 된다는 상사, 데이터로 설득하라!

 

데이터를 근거로 의사소통해야 하는

모든 실무자를 위한 데이터 기반의 의사결정 가이드

 

경험 또는 직관만으로 의사결정자나 이해관계자를 설득할 확률은 0%에 가깝다. 상사나 고객을 설득하려면 데이터에 기반하여 소통해야 한다. 이 책은 데이터 분석을 실무적으로 다루며 방대한 데이터 속에서 핵심 인사이트를 찾아내 그 결과를 명확하게 전달하는 방법을 안내한다. 또한 데이터 분석 결과를 비즈니스에 성공적으로 적용한 여섯 가지 사례를 통해, 분석 목표 파악부터 데이터 유형에 따른 적절한 분석 기법 선택, 분석 결과를 바탕으로 의사결정자를 설득하는 실무 과정까지 익힐 수 있다. 데이터 기반의 의사결정 절차를 살펴보면서 데이터를 효율적으로 분석하고, 그 결과를 근거로 원활히 소통하는 전문 역량을 키워보자.

 

상세이미지(700)_데이터 드리븐 리포트.jpg

이상석 저자

이상석

어린 시절부터 사람에게 관심이 많던 저자는 자연스럽게 HR 분석가로 성장했다. 하지만 직관과 감, 경험으로 무장한 경영진을 설득하는 데 한계를 느꼈고 이 벽을 넘기 위해 미국 듀크 대학교 데이터 사이언스 석사 과정을 졸업했다. 그리고 데이터 과학자로서 공공기관에서는 최초로 HR 애널리틱스 분야에 뛰어들었다. 입사부터 퇴직까지의 HR 데이터를 데이터 레이크에 담아 채용, 승진, 이동, 평가 등을 종합적으로 분석하여 데이터 기반 HR 정책 효과성 측정 및 개선에 활용하고 있다. 또한 HR과 데이터 사이언스를 융합한 분야를 연구하며 기업의 HR 애널리틱스 도입 관련 자문 및 강사로도 활동 중이다. 감정 분류 모델, 인재 추천 시스템, HR 면접관 추천 시스템 등을 개발하여 특허를 출원했고 London Text Analytics, AI Summit Seoul, HR AI Forum 등의 콘퍼런스에서 발표하기도 했다. 그간 데이터에 기반한 의사소통과 보고를 하며 느낀 데이터의 힘을 나누고자 이 책을 썼다.

| 1장 |  데이터 드리븐 보고

 

1.1 일상의 보고 상황

 

1.2 데이터 드리븐 의사결정이란

_1.2.1 일상부터 비즈니스 의사결정까지

_1.2.2 데이터 드리븐 흐름

_1.2.3 데이터 드리븐 효과

 

1.3 데이터 드리븐 보고란

_1.3.1 데이터 드리븐 보고에 관한 오해들

_1.3.2 데이터 드리븐 보고의 여섯 가지 유형

_1.3.3 데이터 드리븐 보고가 나와 무슨 관계가 있을까?

 

1.4 데이터 드리븐 보고 5원칙

_1.4.1 설명 가능해야 한다

_1.4.2 데이터 드리븐 보고는 중립적이지 않다

_1.4.3 문제를 정의할 수 있어야 한다

_1.4.4 MVP부터 시작하라

_1.4.5 추론과 예측을 구분하라

 

| 2장 |  데이터 드리븐 보고 절차

 

2.1 데이터 드리븐 보고 전략

 

2.2 분석 전 알아야 하는 용어

_2.2.1 독립변수와 종속변수

_2.2.2 테이블, 행과 열

_2.2.3 데이터 분리

_2.2.4 모델링

 

2.3 분석 목표 설정

_2.3.1 분석 목표(가설)를 확실하게 정의하라

_2.3.2 의사결정자에게 최대한 많이 질문하라

 

2.4 계획서 작성

_2.4.1 분석 계획서의 필수 요소

 

2.5 데이터 선정

_2.5.1 데이터 수집

_2.5.2 EDA & 데이터 정제

 

2.6 분석 방법 결정 및 해석/검증

_2.6.1 기본 통계

_2.6.2 가설검정

_2.6.3 선형회귀분석

_2.6.4 분류예측모델

 

2.7 보고 대상자에 따른 보고 방식

_2.7.1 실무자용 보고

_2.7.2 의사결정자용 보고

 

| 3장 |  데이터 드리븐 보고 실전 사례 with 챗GPT

 

3.1 데이터와 친해지자: EDA & 기술통계

[사례] 행복에 영향을 미치는 변수와 국가별 행복지수 분석하기

_3.1.1 상황

_3.1.2 분석 목표 파악하기

_3.1.3 분석 계획 세우기

_3.1.4 데이터 선정하기

_3.1.5 EDA 수행하기

_3.1.6 해석하기

_3.1.7 보고하기

_3.1.8 챗GPT 활용하여 EDA 수행하기

 

3.2 데이터도 백문이 불여일견: 데이터 시각화

[사례] 회사의 중장기 인력구조 예측, 분석, 시각화하기

_3.2.1 상황

_3.2.2 분석 목표 파악하기

_3.2.3 분석 계획 세우기

_3.2.4 데이터 선정하기

_3.2.5 EDA 수행하기

_3.2.6 분석 및 예측 방법 결정하기

_3.2.7 시각화하기

_3.2.8 해석하기

_3.2.9 보고하기

_3.2.10 챗GPT 활용하여 시각화하기

 

3.3 당신의 질문에 데이터가 답한다: 가설검정

[사례] 마케팅 효과 분석 및 최적의 광고 플랫폼 찾기

_3.3.1 상황

_3.3.2 분석 목표 파악하기

_3.3.3 데이터 선정하기

_3.3.4 분석 방법 결정하기

_3.3.5 해석하기

_3.3.6 보고하기

_3.3.7 챗GPT 활용하여 가설검정하기

 

3.4 데이터에 맞는 직선을 찾아라: 선형회귀분석 

[사례] 유학 컨설팅을 위한 해외 대학 합격률 분석하기

_3.4.1 상황

_3.4.2 분석 목표 파악하기

_3.4.3 분석 계획서 작성하기

_3.4.4 데이터 선정하기

_3.4.5 EDA 수행하기

_3.4.6 분석하기

_3.4.7 해석하기

_3.4.8 컨설팅하기

_3.4.9 챗GPT 활용하여 회귀분석하기

 

3.5 합격이냐 불합격이냐: 분류예측

[사례] 당뇨병 예측모델 수립 및 사전 예방 솔루션 제공하기

_3.5.1 상황

_3.5.2 분석 목표 파악하기

_3.5.3 분석 계획서 작성하기

_3.5.4 데이터 확인하기

_3.5.5 EDA 수행하기

_3.5.6 분석하기

_3.5.7 해석하기 

_3.5.8 솔루션 제공하기

_3.5.9 챗GPT 활용하여 분류예측모델 만들기

 

3.6 대량의 텍스트 데이터를 이해하다: 토픽 모델링

[사례] 전 직원 대상 설문조사의 서술형 응답 분석하기

_3.6.1 상황

_3.6.2 결과물 미리 보기

_3.6.3 검증하기

_3.6.4 토픽 모델링 따라하기

_3.6.5 챗GPT 활용하여 워드 클라우드 만들기

 

| 4장 |  데이터 드리븐 커뮤니케이션

 

4.1 데이터 드리븐 커뮤니케이션의 필요성

_4.1.1 나의 연봉과 상사의 연봉이 다른 이유

_4.1.2 타이밍이 중요한 이유

 

4.2 데이터 드리븐 커뮤니케이션 구성 요소

_4.2.1 메시지

_4.2.2 시각화

_4.2.3 스토리

 

4.3 데이터 드리븐 커뮤니케이션 방법

_4.3.1 어떤 차트가 효과적인가

_4.3.2 어떤 도구를 써야 하는가

_4.3.3 어떤 전달 방식이 적합한가

 

4.4 스토리텔링

_4.4.1 스토리텔러의 핵심은 속임수?

_4.4.2 스토리 만들기

 

4.5 데이터 드리븐 커뮤니케이션 체크리스트

_4.5.1 내가 이해하는 만큼 상대방도 이해한다

_4.5.2 보고는 내가 하고 싶은 이야기를 전달하는 것이 아니다

_4.5.3 나보다 보고 주제를 더 잘 아는 사람은 없다

_4.5.4 보고의 성패를 가르는 사전 준비 질문

_4.5.5 보고가 끝났다고 모든 일이 끝난 것은 아니다

데이터 유형별 효과적인 분석 기법 선정부터

설득을 위한 커뮤니케이션까지


실무에 바로 써먹는 데이터 기반 보고의 모든 것

 

비즈니스 영역에서 데이터 분석의 궁극적인 목적은 이해관계자를 설득하여 효율적인 의사결정을 내리는 데 있다. 데이터를 분석하는 역량만으로는 모든 결과를 가치 있게 만들 수 없다. 복잡하고 화려한 분석 결과물을 얻더라도 의사결정자에게 설득력 있게 전달하지 못한다면 그 데이터는 의미가 없다. 

 

이 책은 문제 해결을 위한 올바른 문제 정의부터 데이터 수집, 정제, 분석 그리고 스토리텔링, 시각화까지의 과정을 통해 데이터로 이해관계자를 설득하는 데이터 드리븐(Data-Driven) 보고 능력을 키우는 방법을 상세하게 제시한다. 국가 공인 데이터분석전문가(ADP)이자 HR 데이터 과학자인 저자의 경험을 바탕으로 다양한 비즈니스 사례를 통해 상황별 가장 적합한 분석 기법을 어떻게 선택하는지 익힐 수 있다. 또한 방대한 양의 데이터에서 핵심 인사이트를 찾아내고 이를 설득력 있는 보고로 만들어내는 방법뿐만 아니라, 상대방이 가진 편향을 고려해 효과적으로 의사소통하는 방법까지 얻을 수 있다. 데이터 중심의 의사결정을 하고자 하는 데이터 분석가의 필독서로, 데이터 분석 사고의 폭을 넓히고 데이터를 기반으로 한 보고 방식에 대한 명쾌한 해답을 얻을 수 있을 것이다.

 

● 내용 구성

1장. 데이터 드리븐 보고

일상에서 데이터를 기반으로 의사결정하는 사례를 소개하고 데이터 드리븐 의사결정이 비즈니스에 어떻게 적용되는지 알아본다.

 

2장. 데이터 드리븐 보고 절차

성공적인 데이터 드리븐 보고를 위한 ON AIR 분석 절차를 단계별로 설명한다.

 

3장. 데이터 드리븐 보고 실전 사례 with 챗GPT

실제 비즈니스에 활용되는 데이터셋을 통해 데이터 형식과 보고 목적이 각각 다른 여섯 가지 사례를 실습한다.

- 행복에 영향을 미치는 변수와 국가별 행복지수 분석하기

- 회사의 중장기 인력구조 예측, 분석, 시각화하기

- 마케팅 효과 분석 및 최적의 광고 플랫폼 찾기

- 유학 컨설팅을 위한 해외 대학 합격률 분석하기

- 당뇨병 예측모델 수립 및 사전 예방 솔루션 제공하기

- 전 직원 대상 설문조사의 서술형 응답 분석하기

 

4장. 데이터 드리븐 커뮤니케이션

데이터를 기반으로 의사소통할 때 꼭 점검해야 할 체크리스트와 보고 대상자에 따른 맞춤형 커뮤니케이션 방법을 안내한다.

 

● 주요 내용

- 데이터에 기반한 보고 방법

- 보유한 데이터 특성에 따른 적절한 데이터 분석 기법 선정 방법

- 데이터 분석 결과물을 바탕으로 설득 대상에 따라 효과적으로 의사소통하는 방법

- 실제 분석 업무에 적용할 수 있는 단계별 실습 사례

- 구글 콜랩, 파이썬, 챗GPT를 실제 보고에 활용하는 방법

- 선형회귀분석을 통한 고객 설득 방법

- 수치형, 범주형 데이터에 적용하는 추론과 분류예측 방법

- 텍스트 데이터에 적용하는 워드 클라우드와 토픽 모델링 방법

 

● 대상 독자

- 파이썬 기초 문법을 알고 데이터 분석을 해본 적 있는 사람

- 데이터를 근거로 의사결정자 또는 이해관계자를 설득하고 싶은 사람

- 다양한 상황별로 적합하고 효율적인 분석 기법을 알고싶은 사람

- 분석 업무에 챗GPT를 활용하고 싶은 사람

- 데이터분석전문가(ADP), 빅데이터분석기사를 준비하는 사람

 

● 먼저 읽은 베타리더의 한 마디

- 비즈니스와 맞닿아 있는 신선한 사례들을 경험할 수 있고 실무에 적용하는 데 큰 도움을 준다. _김수현

- 데이터에 익숙하지 않은 주니어를 포함하여 이미 관련 경험이 있는 매니저급도 자신의 역량을 한 단계 끌어올릴 수 있을 것이다. _윤명식

- 데이터 분석, 시각화 코드 생성, 분석 결과를 보고서화하기 위한 챗GPT 프롬프트까지 알찬 내용만 담겨 있다. _윤세완

- 데이터 기반의 보고를 주저하는 직장인에게 자신감을 심어주고 끝내 보고할 수 있게 만든다. _정보영

- 편견과 인지 편향으로 가득한 상사를 설득하기 위한 체계적인 프레임워크를 제시한다. _조현석

- 데이터에 관심이 있고 분석을 할 줄 알아도, 이를 활용하는 방법 및 보고의 실체에 대해 감이 잡히지 않는다면 반드시 이 책을 읽어야 한다. _최철훈


 



회사 생활을 해보면 알겠지만, 대부분의 회사 생활은 실제 능력만큼 중요한 게 바로 '설득'능력이라고 할 수 있다. 능력이 압도적으로 뛰어나서 누군가에게 말을 할 필요도 없다면 모르겠지만, 사실 그런일은 없다시피하고 모든 일들이 설득을 배제하고는 돌아가지 않는다. 그렇다면 우리는 어떻게 '설득'을 해야할까? 관련한 해답을 책에서 찾을 수 있다.

이전의 데이터 관련 책들은 코딩만하거나, 아니면 챗GPT만 사용하는 경우들이 많았는데, '데이터 드리븐 리포트'의 경우는 그 두 개를 적절히 활용한다. 특히, 예시가 차지하는 부분이 굉장히 많은데 그 예시가 매우 알차게 되어 있다. 실제 있을 법한 상황을 가정하고 어떻게 분석을 이끌어나갈지 계획을 수립하고 데이터를 수집 및 분석한다. 그리고 개인적으로 이 책의 포인트라고 생각하는 부분인 '해석, 인사이트'를 통하여 '의사결정자용 보고'까지 어떻게 도출하는지 보여준다. 데이터에 기반한 보고가 처음인 사람들은 이런 레퍼런스를 통해 어떻게 보고를 해야 하는지 틀을 잡을 수 있어 매우 도움이 될 것이라는 생각이 들었다.

또한 마지막에 '보고는 내가 하고 싶은 이야기를 하는 것이 아니다'라는 섹션이 있다. 내가 말하고 싶은 것이 아니라 상대방이 궁금해하는 것을 이야기해주는 것, 가장 중요하고 기초지만 그래서 쉽게 잊게 되는 이야기인데 책의 마무리 부분에서 다시 한 번 짚어주어 좋았다. 단순히 분석을 어떻게 하는가?에 대한 책이 아닌, 우리가 분석을 어떻게 활용을 해야하는가에 대한 내용이라 정말 읽어볼만한 가치가 있는 책이라고 생각한다.

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

요즈음의 회사 업무는 챗 GPT가 일상이다. 작년부터 챗 GPT나 각종 Ai 툴들을 쓰고 있었고, 올해에는 챗 GPT의 유료 버전까지 따로 결제해서 업무에 활용하고 있는 중이다. 회사에서는 이번 달 들어서 업무에 Ai를 적극 활용해 보고자 업무 프로세스를 도입하려고 하고 있다. 아마 앞으로의 직장인은 Ai를 업무에 얼마나 잘 활용하는 지로 퍼포먼스가 나뉠 수 있을 것 같다. 그리고 그 챗 GPT와 파이썬을 활용하여 상사와 고객을 설득할 수 있는 책이 있어 소개하게 되었다. (사실 난 개발팀이라 고객은 관심 없고, 상사는 관심이 있지)

이상석 저자의 '데이터 드리븐 리포트'를 보게 된 건, 신규 아이템 제작 회의에서 개발이 드랍된 후였다. 나름 철저하게 자료를 준비했다고 생각했는데, 의사 결정권자가 보기에는 데이터가 부족하다고 했다. 여기에는 뭐 어느 정도 다른 이해관계도 포함되어 있긴 하지만, 사실 데이터가 충분하지 않았던 것은 인정하는 바다. 그렇다고 업무가 넘쳐 워라밸은커녕 숨 쉴 틈 찾기도 어려운 때에 데이터를 정리하겠다고 시간을 오래 들이기도 어려운 편이다.

"인생은 타이밍이다."라는 말을 아는가? 나도 가끔 하는 말이기는 한데, 이 책의 뒷부분에 나오는 내용이 뼈를 때렸다. '타이밍이 중요한 이유'. 상사의 기준에서 내 보고가 꼭 필요한 순간이 있고, 내 보고는 유효기간이 정해져 있는 우유와 같기 때문에 유효기간이 지난 순간 가치를 잃는다는 것. 정리해서 보고할 필요가 있었으나 솔직히 보고를 위한 보고라서 시간이 없어 미루다가 결국은 진행하지 않고 태스크 목록에만 남아 이제는 보고할 타이밍도 놓친 일들도 있다.

물론 시일을 다루는 보고는 그날 바로바로 써서 올리기는 한다면, 이번 신규 아이템 제작 회의도 미리 더 준비를 해서 타이밍에 맞춰 딱 내놓았다면 결과가 달라졌을지도 모른다. 명심하자. 기간 내 결과를 내야 하는 것도 직장인으로서의 중요한 역량이다.

누적된 기존 업무 성과들로 인해 어느 정도 결정권자(경영진)의 신뢰를 얻고 있다고 해도 새로운 것을 시작하려면 그것을 실행하기 전에 '근거'를 가지고 있어야 한다. 그리고 그 '근거'를 가지고 설득을 해야 하고.

"데이터가 없으면 당신은 단지 의견을 가진 평범한 사람에 불과하다."라는 에드워즈 데밍의 말처럼 회사에서 의사 결정을 하기 위해선, 그리고 비용 투자가 필요한 프로젝트를 진행하고 싶다면 근거가 되는 데이터를 준비해야 한다.

데이터 드리븐 의사결정은 개인의 경험이나 직관이 아닌 객관적인 데이터를 기반으로 하는 의사결정이며, 우리 삶에 필수적이다.(물론 경영진의 경험이나 직관 앞에 데이터가 무 쓸모 해지는 경우도 있으니 너무 상처받지는 말자)

책에서는 데이터 드리븐 보고의 여섯 가지 유형에 대해서 다룬다. 필수 역량인 '데이터 문해력'이라는 말이 등장한다. 실제로 책을 보면서 통계학과 수업 들을 때가 떠오를 정도였지만, 저자는 수학과 통계, 코딩이 아니라 데이터로 생각하는 습관과 내가 가진 데이터로 주어진 문제를 분석 및 시각화하는 방법을 아는 것이라고 말한다. 개인적인 생각으로는 사회 초년생이 보고 따라 할 수 있는 내용은 아니었지만, 2~3년 차 이상이라면 상사에게 본인의 의견을 피력할 때, 상사의 마음에 드는(상사가 상사의 상사에게 보고하기에 흡족한) 보고서를 작성하기에 꽤 도움이 될 내용들이다.

책은 보고 대상자가 실무자인지 의사결정자인지에 따라 보고 방식을 다르게 해야 한다고 하며, 보고 방법에 대해 알려준다. 회사는 학교나 학원이 아니기 때문에 이런 부분들은 사회 초년생에게도 도움이 될 내용들이라고 생각했다. 알잘딱깔센(알아서 잘 딱 깔끔하고 센스 있게) 사원이 되고 싶다면, 알아두면 좋을 내용들이다.

내게 유용했던 부분은 바로 여기. 챗 GPT와 함께 하는 실전 사례 부분이다. 이미 업무에 챗 GPT를 쓰고 있기 때문에, 좀 더 효율적으로 데이터 시각화 업무를 할 때 사용하고 싶었는데, 마침 이 책에서 이런 부분을 다루고 있어서 좋았다.

이 책은 전체적으로 이론 설명에 그치지 않고 실제 비즈니스 상황에서 어떻게 적용할 수 있는지를 구체적으로 다루고 있다. 예를 들어, 데이터 유형에 따른 분석 기법 선택이나, 보고 대상자에 따른 맞춤형 보고서 작성법 등을 상세히 설명한다.

데이터 분석의 복잡한 개념을 나름 쉽게 설명하고, 각 단계별로 필요한 사항들을 정리해 놓아 이해하기 쉬운 편이다. (모두에게 그런 것은 아니지만, 이 정도면 조금 어려워도 따라 할 수는 있다. 어차피 어려운 건 GPT가 다 해줌) 데이터 드리븐 보고의 5원칙 등은 펀쿨섹 보고서를 쓰기 위해 꼭 기억해 두어야 할 가이드라인이라고 생각한다.

다음은 개인적으로 내 업무에 활용하기 유용하다고 생각되는 챕터들이다.

게임 기획자라는 업무 특성상 데이터 시각화 부분은 잘 추려서 팀원들 교육에 활용해도 좋을 것 같다는 생각이 들었다.

분류 예측. 나는 지금 회사에서 중간 관리자라서 신입 채용이나 인사도 관여를 하고 있는데 신입 지원자들 지원서와 포트폴리오를 보는 데에 꽤 많은 시간을 뺏기는 편이다. 솔직히 말해서 너무 바쁠 때는 미안한 말이지만 훑어보고 눈에 띄는 부분이 없으면 걸러지기도 한다. (이래서 인생은 타이밍이다. 현실은 실무진이 꼼꼼하게 지원서와 포폴을 검토할 시간조차 주어지지 않는다.) 분류 예측을 보자마자 이거 잘 응용하면 지원서 검토에 쓸 수 있지 않을까라는 생각을 해보았다.

실제 업무에 활용하면 좋을 것 같은 토픽 모델링. 이 부분을 보자마자 이 책을 '신규 아이템 개발을 위한 시장 조사 보고서' 작성을 하고 있는 팀원에게 전달해 줘야겠다는 생각이 들었다. 토픽 모델링을 어떻게 하는지와 어떻게 효율적으로 하는지, 효용성에 대해서 다루고 있다. 제목만 보고 유용한 책일 거라고 생각해서 신청했는데 역시나 매우 유용한 책이었다. :)

한빛미디어의 데이터 드리븐 리포트는 데이터 분석을 통해 보다 효과적인 의사결정을 내리고 싶은 실무자들에게 매우 유용한 책이다. 데이터 기반의 보고서 작성법과 실제 사례를 통해 배운 내용을 실무에 바로 적용할 수 있는 실질적인 가이드를 제공하며 데이터 분석의 기본부터 고급 기술까지 폭넓게 다루고 있어, 데이터 분석에 대한 경험이 있는 경력자들뿐만 아니라 신입이나 초년생들에게도 추천할 만 하다. 예쁨 받는 보고서를 효율적으로 쓰기 위한 지름길을 가르쳐 주는 책이랄까. 물론 뭐든 처음은 어렵기 때문에 처음의 삽질은 감수해야겠지만, 일단 해두고 익혀두면 이후 업무의 질이 확연하게 달라질 것 같다.

이것은 여담. 4장 데이터 드리븐 커뮤니케이션에서 나의 연봉과 상사의 연봉이 다른 이유가 나온다. 아주 재미있고 유용하니 꼭 직접 읽어보시길 바란다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

#한빛미디어 #데이터드리븐리포트 #데이터기반보고서 #데이터시각화 #챗GPT로쓰는보고서 #데이터로상사설득하기

 

 

이번 책은 데이터 드리븐 리포트. 부제는 상사와 고객을 설득하는 데이터 기반의 의사결정 with 파이썬이다.

6년간 다닌 회사에서 개발자 어깨너머로 보기만 했던 파이썬을 책을 통해 이제 와서 이해하고 있는 상황이다. 내 위치를 이야기하자면 디자이너로 웹/앱에 이용되는 이미지를 담당자다. UI/UX를 공부하면서 데이터에 관심을 갖기 시작했다. 사용자 입장에서 조금 더 생각해 보려고 하다 보니 회사와 부딪히는 부분도 많았다. 다크 패턴을 활용해 사용자를 더 묶어두려던 회사를 설득하고 싶었던 적도 있고 다른 곳에서 인기 있는 UX를 마구잡이로 회사 앱에 매칭 시키려고도 하는 데 반박하고 싶었던 적이 많았다. 설득력이 약한 것도 있었고, 내 업의 위치에서 의견 반영은 병이나 정 정도되는 듯 부장 선에서 정리되기 일쑤라서 힘을 잃었다.

그래서 데이터를 기반으로 다루고 싶었지만 그 데이터는 개발자 선에서 좌지우지되니 다가가기도 어려웠다. 만약 그 권한이 나에게도 주어졌다면 누적되는 데이터 관리나 이를 정제해서 인사이트를 뽑아 사용성 개선하는 것도 데이터 드리븐 리포트로 상사를 설득할 수 있었으리라 뒤늦게 깨우쳐본다. 이런 상황에 데이터 드리븐에 대한 관심이 높다. 설득도 잘 해보고 싶고, 데이터를 기반으로 화면 구성을 기획하고 디자인해 나간다. 상사를 설득하고 사용성 개선에 적극적으로 필요한 것이 데이터니 앞으로 나의 관심사는 데이터를 기반으로 확장될 것이다. 그래서 이번에 읽은 책 덕분에 애널리틱스 정도까지만 알고 있던 나에게 통계까지 확장되는 계기가 되기도 했다.

데이터 드리븐 보고는 데이터로 생각하는 습관을 갖고 주어진 데이터로 문제를 분석하고 시각화하는 역량(p.37)이 주 포인트니 잘 익혀본다면 활용면에서 좋으리라 생각된다.

책에서 권하는 대상 독자로는

파이썬 기초 문법을 알고 데이터 분석을 해본 적이 있는 직장인 / 상사와 고객을 설득해야 하는 데이터 분석가 / 기존의 보고 방식을 뛰어넘어 예측 가능하고 선제적인 분석 기법을 알고 싶은 사람 / '해봤는데 안 돼', '예전에 검토해 봤어' 등의 이유로 상사에게 거절당한 경험이 있는 사람 / 분석 업무에 챗 GPT를 활용하고 싶은 사람 / 데이터 분석 자격증과 실무를 동시에 고민하고 있는 사람으로 제시하고 있다.

디자이너로 호기심에 선택된 이 책을 읽고 내가 느낀 바로는 파이썬은 기본 지식이 있어야 이해할 수 있겠지만 그것 빼고는 일반적인 방법론 책과 달리 실무자 입장에서 작성되었다는 것이 중요했다. 데이터 드리븐의 기본 목적을 전달하고 이를 제대로 실천하기 위해 데이터를 가지고 통계나 결괏값만 도출하는 것에서 끝나지 않고 상사를 설득하며 사업에 활용할 수 있도록 데이터로 인사이트 찾는 사례들이 자세하게 적혀 있었다. 데이터 문해력을 키울 수 있도록 사례 제시와 챗 GPT로 활용하는 방법까지 자세히 다루고 있다. 그리고 데이터 드리븐 보고 5가지 원칙은 꼭 데이터를 다루지 않아도 실제 보고하는 방법에도 적용해도 유용해 보였다.

2014년 아마존에서 신규 입사자의 이력서를 점수로 환산해 주는 알고리즘 개발하며 벌어진 일은 충격적이었다. AI를 마냥 믿지 못하는 것도 이런 문제 때문일 것이다. 데이터는 중립적이지 않으며, 어떻게 데이터를 편집하느냐에 따라 주관적으로 변한다. 지난 데이터를 취합하여 결괏값으로 추려진 알고리즘은 지난 10년간 테크 기업의 성비가 남성이 많았다는 것으로 데이터화되어 이력서에 '여대', '여성 체스 클럽 회장'이라는 단어가 나오면 자동으로 페널티를 받게 설계되어 버렸다. (p.49) 이후 알고리즘을 포기했으며, 이런 편협적인 사건으로 AI의 설명 가능성, 투명성이 중요해졌다.

"데이터 시각화 분야의 세계적인 권위자 알베르토 카이로는 [숫자는 거짓말을 한다(웅진지식하우스, 2020)] 에서 어떻게 읽는지에 따라 숫자도 글자만큼 주관적이라고 말한다. 즉 우리가 데이터 기반의 보고를 잘하기 위해서는 데이터로 정보를 제공하는 신문 기사나 기타 보고 자료를 보고 그대로 수용하는 것이 아니라 비판적으로 사고할 줄 알아야 한다는 뜻이다."

데이터 드리븐 리포트. p.51

데이터를 다룬다면 주의해야 할 사항이 나에게는 유익했다. 데이터 문해력이 약한 사람이라면 헷갈릴 수 있는 용어의 차이도 세세하게 설명을 해주니 개인적으로 추가 검색으로 설명을 보태 이해할 수 있었다. 한번 읽고 이해하기에는 어려운 파이썬과 데이터 드리븐 쌩 초보자지만 신세계를 연 것 같이 신선했다. 그래도 알아서 나쁠 것은 없다고 2-3번 더 읽어 활용해 볼 여지를 찾아보려 한다.

나에게는 새로웠던 구글 콜랩에 대한 방법도 부록으로 실려 있으니 데이터를 다루는 사람이라면 유용할 것이다. 깃허브에 올린 자료로 실제 참여해 볼 수 있으니 데이터를 분석하고 싶은 입문자라면 데이터 문해력과 실무에서 직접 활용할 수 있는 보고서 활용까지 유용하니 적극적으로 추천해 보고 싶다.

 

​한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공 받아 작성된 서평입니다.

데이터 분석에 대한 관심이 조금이라도 있는 사람이라면 '데이터 드리븐'이라는 용어를 많이 들어보았을 것이다. 몇 년 전부터 나오기 시작하는 많은 책들에도 '데이터 드리븐'이라는 용어가 나오고 있다. 하지만 '데이터 드리븐' 의사 결정을 할 때 어떤 방식으로 해야할지 정확히 아는 사람은 얼마나 될까?

 

데이터 드리븐 의사결정을 하고 싶은 사람 중 하나로서, 데이터 분석을 배워보기도 하고 다양한 BI 도구의 사용법도 배워보았지만 데이터 드리븐 의사결정을 하기 위한 방법을 명확히 알려주는 사람이나 도서는 적었던 것 같다.

 

그러나 최근 한빛미디어에서 나온 '데이터 드리븐 리포트'라는 책을 알게 되었다. 의사 결정자들이 데이터 드리븐 의사 결정을 하기 위해 도움을 줄 수 있는 실무자들의 데이터 드리븐 리포트를 작성할 수 있는 방법을 알려줄 것 같아 읽게 되었다. 

 

'데이터 드리븐 리포트'라는 책 제목에서 예추할 수 있던 것처럼 문제 정의부터 데이터 수집, 데이터 정제, 데이터 분석과 시각화, 분석 결과로부터의 해석과 의견/제안을 담은 보고서  작성까지 모두 다루는 좋은 책이었다. 목차부터 흥미로운 책이었고, 설명도 쉽게 되어 있어 데이터 분석에 조금이라도 관심이 있는 사람이라면 누구도 금세 읽을 수 있는 책이었다. 

 

특히 좋았던 것은 보통의 데이터 분석 책들처럼 분석과 시각화로 끝나는 것이 아니라 보고서 작성법과 예시를 많이 다루어 주고 있다는 점이었다. 분석의 결과를 어떻게 해석하는지, 그리고 어떻게 의사결정자들에게 효과적으로 보여주고 의사 소통해야 하는지를 다양한 예시를 통해 알려주어 실제 현업의 경험을 조금이나마 엿본 느낌이었다.     

 

또한 상세하고 반복적인 설명도 좋았다. 물론 어떤 사람들에게는 계속 반복한다는 지루함을 줄 수 있겠지만 옹어와 그 의미를 반복해서 설명하여 초보자들이 용어의 의미를 다시 되새기느라 책의 앞 부분을 뒤적이지 않아도 될 것 같다. 하지만 상세한 설명이 길어 어떤 사람에게는 실제 보고서 작성 방법이나 실제 업무 노하우가 조금 빈약하다는 느낌을 받을 수 있겠다는 생각이 들었다.  

 

조금 아쉬웠던 점은 데이터 수집에 대한 설명이 부족했던 것이다. 이 부분은 각자의 상황이나 데이터 수집 방법이 다를 수 있어서 그럴 수 있겠지만 데이터 수집을 위해 어떤 생각을 해야 하고, 어떤 부분을 고려해야 하는지에 대해 조금 더 자세한 설명이 있었으면 좋았을 것 같다는 생각을 했다. 

 

ChatGPT를 이용한 데이터 분석 방법이나 해석 방법은 코딩을 잘 모르는 사람들에게는 도움이 될 수 있겠지만 ChatGPT가 유행하니 한번 넣어본 것 같은 느낌을 받았다. 앞에서 설명한 분석 내용을 반복하는 것은 1번으로 족하고 나머지는 텍스트 마이닝 파트처럼 다른 분석을 시도해 보았으면 어땠을까 하는 생각이 든다. 

 

그래도 전체적으로 데이터 드리븐 리포트를 작성하는 방법과 의사 결정자들과의 커뮤니케이션 노하우가 잘 담겨 있고, 분석 과정에 대한 설명이 상세하고 쉽게 잘 되어 있어서 데이터 드리븐 의사결정을 하고 싶은 실무자들에게 추천하고 싶은 좋은 책이다. 

데이터 직무를 계속 하고 싶은 사람으로서 분석 결과를 갖고 팀원들, 다른 부서, 나아가 고객과도 잘 소통하기 위해서 이번 도서를 선정했습니다. 고백하자면 그동안 업무를 하면서 분석을 잘했을지언정 누구나 잘 이해하게 내용을 전달했나? 에 대한 대답은 잘 모르겠습니다. 스토리텔링이 중요하다는데 그런건 소설 쓰는 사람들이 알아야 하는 것 아니었나 의문을 가진 채로 어디서부터 시작해야 하나 막막해하며 다른 사람들이 써왔던 문서를 보면서 간접적으로 배웠던 것 같습니다. 도서 설명을 읽고 바로 이 책은 진짜로 실무에 바로 도움될 수 있겠다 싶어 신청했습니다.

이런 어려움은 저만 겪은 것이 아니었는지, “조사에 따르면 데이터로 향하는 변화의 흐름이 조직의 성장과 수익 창출에 긍정적인 영향을 끼친 것은 맞지만, (중략) 데이터 기술 분야에 엄청난 비용을 투자했음에도 결과가 좋지 않은 이유를 ‘데이터 드리븐 보고(리포트)’ 역량의 부재 때문이라고 생각”(10페이지)이라고 하는 내용도 있었습니다. 저자도 ”직관과 감, 경험으로 무장한 경영진을 설득하는 데 한계를 느꼈고 이 벽을 넘기 위해“(14페이지) 데이터 과학을 공부하셨다고 하네요. 저처럼 데이터를 활용한 보고에 어려움을 느낀 분들, 저자처럼 보고에 데이터를 더해 설득을 하고 싶은 분들에게 모두 도움될 만한 도서라고 생각합니다.

 

1장 데이터 드리븐 보고에서는 데이터 드리븐 보고를 위한 필수조건과 데이터를 기반으로 의사결정하는 사례를 소개합니다. 특히 데이터 드리븐 보고를 위한 5가지 원칙을 설명하면서 왜 중요한지, 어떻게 적용할 수 있는지, 실제 관련된 사례로 어떤 것들이 있는지 함께 알려준 것이 인상적이었습니다. 앞으로 보고가 있을 때마다 이 원칙들이 잘 적용되었는지 검토해야겠습니다.

 

2장 데이터 드리븐 보고 절차에서는 보고를 위한 절차를 단계별로 설명합니다. 목표를 설정하고 데이터를 수집하고 분석 방법을 결정, 실제 수행 후 해석과 보고를 하는 과정을 상세하게 알려줍니다. 빅데이터 분석기사를 비롯한 데이터 관련 자격증에서 개념적으로만 배웠던 내용들을 실제 사례, 코드와 함께 확인할 수 있었습니다. 분석에 필요한 기본 용어 설명부터 통계 방법론을 적용하는 코드까지 다뤄주고 있어 데이터 분석을 처음 접하는 분들도 어렵지 않게 적용할 수 있을 것 같습니다. 개인적으로는 분석 계획서의 필수 요소들과 보고 대상자에 따른 보고 방식 내용을 집중적으로 살펴봤습니다.

 

3장 데이터 드리븐 보고 실전 사례 with 챗GPT에서는 데이터 형식과 보고 목적이 다른 6가지 비즈니스 사례를 실습합니다. 데이터를 시각화하고 분석 방법을 정해 수행하는 과정까지 챗GPT의 도움을 받아 파이썬 코드를 작성합니다. 실무자용 보고와 의사 결정자용 보고를 다르게 제안해서, 어떻게 다르게 작성해야 하는지도 이해할 수 있습니다. 챗GPT 3.5 버전을 사용하고 있어 유료 결제를 하고 있지 않아도 사용할 수 있어 좋은 것 같습니다. 챗GPT의 답변을 그대로 따라했을 때 발생하는 오류에 대처하는 과정까지 있어서 파이썬, 챗GPT가 낯선 분들도 당황하지 않고 따라하실 수 있을 듯합니다.

 

4장 데이터 드리븐 커뮤니케이션에서는 데이터를 기반으로 의사소통할 때 어떻게 진행해야 좋은지 설명합니다. 성공적인 커뮤니케이션을 위해 메시지/시각화/스토리는 왜 중요한지, 어떤 차트/도구/전달 방식이 적합한지, 스토리는 어떻게 만들어야 하는지를 제안합니다. 특히 보고에서 점검해야 할 체크리스트를 제공하고 있어 실제로 업무를 수행하면서 적용하면 좋을 것 같습니다.

 

이 책도 깃허브를 통해 실습 자료를 제공하고 있습니다. 각 장에서 QR 코드를 함께 붙여줘서 바로 자료를 확인할 수 있어 좋습니다.

https://github.com/sangsucki/DataDrivenReport



여러 사례들과 각 상황에서의 사례를 설명해주어 더욱 이해가 쉬웠고 실무에 적용하기도 좋아 보입니다. 꼭 데이터 과학자가 아니더라도 데이터가 수반되는 모든 부서의 직장인들이 업무 역량을 기르는 데에 도움 받을 수 있을 것 같습니다. 이제 SQL이나 파이썬 같은 도구를 이용해 데이터를 분석할 수 있는지 보다는 해결하고 싶은 문제를 명확하게 정의하고 의사결정에 도움되는 통찰을 도출하는 것이 중요할 테니까요.

 

다소 불편했던 점은 구글 도서에서 목차를 제공해주지 않았다는 점, 책을 이미지로 제공해서 글씨 크기 조절은 불가능하다는 점입니다. 이미지가 많이 포함되어있고 많은 기술책들이 이북에서는 페이지 단위로 볼 수 있으니 후자는 이해할 수 있지만.. 제공되는 목차가 아래 내용이 전부였다는 점이 아쉬웠습니다. 구글 도서가 목차 페이지를 자동으로 탐지해서 텍스트로 변환해주면 좋을텐데 말이죠..

 

독서를 마친 후 드는 생각은 “이걸 사회 초년생에 알았다면 더 좋았을텐데..”였습니다. 지금에라도 좋은 내용을 익혀서 다행이라고 해야할까요.. 책을 읽으며 나의 보고 능력은 지금 어떤 수준인지를 돌아보고, 보고 능력이 이렇게나 중요하구나 깨닫는 계기가 되었습니다. 문제를 정의하고, 데이터를 수집하고 올바른 분석 방법론을 선택하고 자료를 작성해 커뮤니케이션하는 과정까지 정말 많은 기술과 노력이 필요하지만.. 저자가 언급한 것처럼 "지속 가능한 커리어 성장과 나를 차별화하기 위해"(47페이지) 반드시 필요한 역량이라고 생각합니다.

 

아래와 같은 분들에게 이 도서를 추천하고 싶습니다.
1. 분석은 잘하지만 어떤 방식으로 전달해야 좋을지 막막한 분
2. 이해관계자 설득을 위해 문제 정의부터 데이터 분석을 수행하는 과정 전체를 알고 싶으신 분
3. 챗GPT를 이용하여 분석 업무를 해보고 싶은 분

 

저자는 도입에서 “데이터 드리브 보고는 데이터 문해력과 스토리텔링의 조합으로 이뤄진 예술적인 행위”(16페이지)라고 하였습니다. 아마 5년 전쯤 언젠가 지도교수님께서 통계가 예술이라고 말씀하신 적이 있었는데요. 통계가 데이터를 읽고 쓰는 데이터 문해력을 적용하며 메시지를 전달하는 스토리텔링까지 하는 행위를 모두 포괄하기 때문에 그렇게 비유하신 것을 이제서야 명확하게 이해하였습니다.

 

올바른 문제 해결을 위한 문제 정의부터 데이터 수집, 분석을 거쳐 스토리텔링, 시각화를 수행하여 의미 있는 결론을 내고 결국 설득까지 해내는 과정을 위하여, 그리고 AI에 대체되지 않기 위해서..ㅎㅎ 이 책을 통해 배운 점들을 잘 적용해서 문서 작성할 수 있도록 해야겠습니다.

데이터 드리븐 리포터?

개인적으로 처음 들어보는 단어이다.

단어적 의미로만 보면 [데이터에 따라 처리를 하는]이라고 설명을 하고 있는데, 어떤 결정을 내릴 때 데이터를 활용한다는 의미로 추측된다. 처음 이 책의 제목만 봤을 때는 그리 관심이 없었는데, 표지에 추가로 담겨있는 [상사와 고객을 설득하는 데이터 기반의 의사결정 with 파이썬]이라는 문구에 눈이 쏠리게 되면서 읽어보게 된 책이다. 사업을 하거나 직장인이라면 아니 거의 대부분이 관심을 두지 않을까 여겨진다. 다만 꼬리에 달린 'with 파이썬'이라는 프로그래밍 언어가 등장해서 어려운 내용이 담겨있지는 않은지 조금 불안할 뿐이다.

설득.

시작은 상사에게 마케팅 전략에 대해 나름 설득력 있는 수십 페이지의 보고서를 작성하여 상사에게 보고를 하였지만 상사가 던진 질문에 대답을 하지 못하면서 설득에 실패하는 상황에 대한 일례로 시작한다. 그러면서 보고 과정에서 상사와 보고자 모두 감에 의한 보고와 의사결정을 하고 있다는 점을 주시하면서 설득의 과정이 무너진 점에 대한 분석을 대리며 이에 대한 방법으로 데이터를 기반으로 하는 보고가 설득에 유리하다는 점을 부각시키며 상사가 가진 특정 편향에 맞추어 테이터를 준비하고 활용한다면 설득의 성공가능성을 높힐 수 있다. 여기서 객관적인 테이터를 기반으로 의사결정을 하는 것을 '데이터 드리븐 의사결정'이라고 하며 이 방법은 일상에서 일어나는 일부터 비즈니스 상황에서 일어나는 일까지 유용하게 사용할 수 있으며 특히 비즈니스 환경에서는 '데이터 드리븐 보고'라는 절차와 켜뮤니케이션으로 활용되는 점을 안내하며 보고의 유형과 원칙에 대해 설명하는 것으로 1장을 마무리 하고 있다.

이어진 2장에서는 '데이터 드리븐 보고 절차'에 대한 본격적인 내용을 담고 있는데 [목표 설정(Objective) - 데이터 선정(Necessary dta) - 분석 방법 경정(Analytics) - 해석 및 검증(Interpretaation) - 보고(Report) : ON AIR 분석 절차]라는 이름으로 그 과정에 대해 소개함으로써 데이터 드리븐 보고가 단순한 데이터 분석이 아닌 체계적이고 전략적인 프로세스라는 점을 강조하고 있다.

이렇게 이론적인 배경을 바탕으로 예제를 통한 학습과정이 3장에 펼쳐지는데, 예제를 통해 데이터를 이해하고 이미지/시각화 하는 방법이나 가설을 세우고 검증하는 방법이나 올바른 예측을 찾아가는 방법을 소개하기도 하고 마지막으로는 숫자로 된 정형화된 데이터가 아닌 비정형 테이터를 분류되는 텍스트 분석에 대한 예제를 통해 다양한 실습 과정을 소개한다.

그리고 이 모든 과정이 마무리 되었다면 4장에서는 상사 또는 고객을 설득한는 켜뮤니케이션의 중요성에 대해 설명을 하고 있다. 기본적으로 이 켜뮤니케이션이 얼마나 중요하고 필요한지에 대한 설명을 시작으로 구성요소와 도구, 방법 등에 대한 내용과 이 모든 것들을 논리적으로 배치하고 설득해 나가는 스토리텔링에 대한 설명으로 정리하고 있으며 마지막으로 최종 보고에 앞서 확인해야될 체크리스트와 보고를 마친 후의 조치 상황에 대해 설명하는 것으로 마무리하고 있다.

마지막 5장에서는 책 제목에 있는 'with 파이썬'이라는 제목에 걸맞게 개인 PC환경에서 실행가능한 '구글 콜렙'과 '파이썬 라이브러리'를 설치하고 실행하는 방법과 활용하느 방법에 대한 간단한 설명으로 마무리하고 있다. 물론 5장의 내용외에 2/3장에서는 콜렙과 파이썬에서 활용 가능한 코드 등을 안내하고 있다.

데이터 드리븐 리포터

콜렙이나 파이썬 등의 프로그램을 운용할 수 있는 분들이라면 이 책을 아주 유용하게 활용할 수 있겠지만 그렇지 않는 분들이라도 상사나 고객을 설득하기 위해 무엇을 해야하는지 그 방법을 찾는 독자들에게는 충분히 도움이 될 만한 책이라고 추천한다.

1. 21세기 빅데이터 시대에서 살아남는 설득법 기르기 

대학생활을 하거나 직장에 다니면서 우리는 많고 다양한 요구사항들을 접하게 됩니다. 대다수는 어떤 안건에 대해 자료를 수집하고 정리하여 보고자료를 만드는 데 있죠. 그러한 보고자료들은 채점자인 교수, 혹은 상사, 나아가서는 불특정 다수들에게 노출되고 심판대 위에 서게 됩니다. 그리고 딱 두 가지 판단만이 존재하게 됩니다. 매력적인가, 그렇지 않은가 이 두 가지겠지요. 이를 가르는 가장 중요한 요인은 놀랍게도 데이터를 어떻게 다루고 표현하느냐에 달려있다는 것이 이 책의 골자입니다.

우리가 지금까지 살아온 시대는 감성보다는 이성, 논리를 앞세운 설득법을 가르치는 데 집중했었죠. 논술의 중요성을 내세워 논리적인 글쓰기를 자꾸만 가르쳐왔죠. 이러한 교육이 불필요하게 되었다는 건 아닙니다만, 이런 교육방향은 다소 구시대적인 방법이라고 말씀드리고 싶네요. 제시된 근거를 갖고 주장하는 일은 누구나 할 수 있는 능력이 되었고, 이제는 주장에 맞는 근거를 적절하게 생성해내는 사람이 필수적인 시대가 되었습니다. 데이터들은 세상에 너무나 많아졌고, 이 데이터를 어떻게 쓸지는 개개인의 몫이 되었습니다. 저자는 이런 시대에서 Data를 원하는 방향으로 Drive 하여 report 하는 능력은 자신의 직무 역량을 한층 높여줄 수 있을 것이라고 말합니다.

첫 장에서 저자는 독자들이 자신의 책에 설득될 수 있도록 데이터 드리븐 리포트를 사용하며 그 힘을 여실히 보여줍니다. 그리고 곧 독자들 역시 자신처럼 역량을 기를 수 있을 것이라고 북돋아주며 데이터 드리븐 리포트 세계로 초대합니다.

 

2. 정석적이면서 연속적인 문제해결적 보고  : 철저히 실무에 집중하는

이 도서의 가장 큰 장점은 정석적인 문제해결적 보고 기법을 가르쳐주는 것이라고 생각합니다. 마치 정확하고 완벽한 사수가 바로 옆에서 알려주는 느낌마저 듭니다. 그럴 법도 한 것이, 많은 data-driven report경험이 있고 능력 있는 HR분석가로 인정받는 저자로선 애매모호하고 의미 없는 기법들을 가르쳐 줄 리가 없겠죠. 독자들이 왜 이런 방법들을 쓰는지 납득가게 하면서, 깔끔한 설명과 적용을 보여줍니다. 저자는 이런 정석적인 방법만 잘 알고만 있어도, 데이터 분석가로서의 역량을 충분히 기를 수 있음을 보여주는 듯했습니다.

이 글을 보고 있는 분들 중에는 혼공학습단에 참여를 해보셨거나, 혼자 공부하는 시리즈를 접해보신 분이 있으실지도 모르겠습니다. 이 책은 '혼자 공부하는 R데이터분석'과 어느 정도 배우는 것이 비슷합니다. 다만, 실무에서 직접 활용되는 양상을 더 많은 예제로 기록해 둔 것은 이 책입니다. 좀 더 발전적이고 연속적이죠. 통계에 대해 약간이라도 베이스가 있다면, 혹은 파이썬을 활용한 분석에 관심이 가신다면 이 책을 추천드리고 싶습니다. 

 

3. 친절한 구성에 탄식마저 들었던 책

제가 대학에서 통계 과목을 수강할 때 느꼈던 점은 너무나도 어렵게 가르쳐주신다는 것이었습니다. 교수님께선 기본적인 배경지식을 다 아는 걸로 간주해 생략하시고, 자주 쓰는 통계 기법을 왜 이럴 때 써야 하는지 제대로 얘기도 해주지 않은 채 가르치시는 걸 자주 봐왔었습니다. 그러다 보니 수업을 쫓아가는데 어려움을 많이 겪었습니다. 실제로 제 동기들, 그리고 대학을 나오신 분들도 통계를 제대로 전공하지 않는 경우에는 좋은 기억을 갖고 있지 않는 경우가 허다했습니다.

그러나 이 책은 탄식을 자아내기 충분했습니다. 통계 지식뿐만 아니라 코딩 지식도 어느 하나 빠뜨리는 것 없이 세세하게 담아 설명해 줍니다. 그리고 통계 기법이 실제로 적용되는 양상을 예제를 통해 보여주죠.  읽어 내려가면서 친절하고 자세한 설명에 감사함은 물론, 진작에 이런 책을 갖고 공부했더라면 조금이라도 더 재미 붙이며 배울 수 있었지 않았을까 하는 아쉬움 마저 들었던 것 같네요.

 

앞서 설명했다시피, 이 책은 보고를 위한 통계법들을 알려주는 데 포커싱이 되어있습니다. 그렇지만, 기본적으로 설득력 있는 보고를 위해 쓸 수 있는 기술들도 기록되어 있습니다. 차례도 가독성 있게 잘 구성되어 있으니, 꼭 데이터 분석이 아니더라도 기본적인 보고 능력을 기르고 싶은 누구라도 읽기 좋은 책이라 생각합니다.

 

 

☆ 이 포스팅은 한빛미디어 <나는 리뷰어다> 활동을 위해 책을 제공받아 제작된 서평입니다 ☆

저는 21학번으로 인공지능공학과 다니다, 현재는 메디컬 관련 학과 전공하고 있는 대학생입니다. 21년도 당시엔 C++라는 낯선 프로그래밍 언어를 접하고 애먹었던 기억이 있죠. 그 와중에 같이 입시 공부도 병행했던 지라 아무래도 학과 공부량은 조금 부족했던 것이 사실입니다. 그렇지만 인공지능 프로그래밍이 언젠가는 꼭 필요하게 쓰일 것이라 믿음이 있었기에, 꿋꿋이 공부해 나갈 수 있었습니다.
그리하여 22년도 중고 신입생이 되어 1학년을 보낸 겨울방학, 이따금씩 작년에 프로그래밍하던 기억이 떠오르더군요. 그 기억을 살려 다시 컴퓨터 공부를 하면 좋겠다는 생각이 들었습니다. 그렇지만 학과 공부처럼 각 잡고 하고 싶진 않아서 고민하던 중에, '혼공학습단'을 알게 되었습니다. 딱 6주 동안 혼공책을 가지고서, 정해진 분량을 갖고 숙제를 해나가면 되는 활동이었습니다. 혼공책 자체도 혼자 공부하기 정말 좋은 책입니다만 학습단 활동까지 하니, 공부한 내용을 학습단의 다른 분들과 공유하기도 좋고, 스스로도 공부한 내용을 정리할 수 있는 시간을 가질 수 있었습니다. 정말 좋은 시간이었죠. 동기부여도 되고, 좋은 정보도 많이 알아가면서 근 1년의 방학을 그렇게 보내왔습니다.

이번 <나는 리뷰어다> 활동은 '혼자 공부하는' 시리즈를 출판한 한빛미디어에서 주관하고 있는 활동입니다. 한빛미디어는 주로 프로그래머들을 위한 책들을 출판하고 있는데, 요즘은 디자인이나 스타트업 등 다방면으로 좋은 책들을 내고 있는 듯하더군요. 게다가 책을 읽고 리뷰하길 좋아하는 사람들을 대상으로 한 달의 한번 책을 지원받고 서평 쓰는 활동을 지원해 준다 하니, 저는 너무 감사했죠. 한빛미디어에서 내는 책들은 주로 혼공시리즈만 접했는데, 다른 책들도 읽을 수 있다고 하니까 말이죠. 그리고 책 자체도 힙하기 때문에 예비독자분들께 포인트들을 뽑아내기 참 괜찮습니다. 앞으로는 틈틈이 읽고 싶었던 책들 지원받으면서 매달 한편씩 서평을 쓰고자 합니다.

회사에서 크고 작은 의사 결정함에 있어 데이터 기반 분석은 자체 만으로 아주 강한 설득력을 가진다. 마케팅, 개발등 여러 직무에서 보고와 의사 결정 단계에서 데이터 분석 결과는 신뢰성을 보증하며 감에 의한 오류와 주관적인 판단을 최소화 할 수 있다

현대 사회는 방대한 양의 데이터가 생성되고 활용되는 데이터 시대며, 이러한 시대를 살아가는 개인과 조직 모두에게 데이터는 필수적인 요소가 되었다. 기존의 비즈니스 프로세스를 데이터 기반으로 혁신하는 과정인 디지털 트랜스포메이션이나 데이터를 조사하고 해석하여 의미 있는 정보를 얻는 과정인 데이터 분석, 데이터 분석을 통해 비즈니스 문제를 해결하고 의사결정을 내리는 비즈니스 애널리틱스등 관련 분야의 도메인 지식이 있는 사람들은 몸값이 높고 중요한 의사 결정에 참여한다.

이렇듯 데이터 활용은 효과적인 의사결정으로 더 정확하고 합리적인 결과를 도출할수 있으며,

데이터를 활용하여 새로운 시장 기회를 창출하고 운영 효율성을 높여 경쟁력을 강화 할 수 있다.

또한 데이터 분석을 통해 새로운 제품과 서비스를 개발할 수도 있다.

이 책은 데이터 기반 의사결정의 중요성을 강조하며, 특히 데이터 드리븐 보고 역량의 중요성을 명시한다. 책에서 정희한 '데이터 드리븐 보고'는 '데이터 수집, 정제, 분석부터 스토리텔링과 시각화까지를 포함하는 일련의 과정이며, 의사결정자에게 설득력 있게 데이터를 전달하는 방법'

데이터 시대를 살아가는 개인과 조직 모두에게 필수적인 데이터와 관련된 주요 개념들을 소개하고, 데이터 활용의 중요성을 강조한다. 또한, 개인과 조직이 데이터 활용 능력을 향상시키기 위한 노력의 방향을 제시한다.

통상의 데이터 사이언스 책은 Python, R등 언어에 집중되어 데이터 분석 전체 숲을 보지 못하는 맹점에 빠지기 쉬운데, 이 책은 데이터 분석의 전반적인 프로세스를 처음부터 끝까지 해보는 것에 중점을 둔 것 같아 마음에 들었다.(전체 적인 흐름만 알고 있으면 세부적인 코딩은 AI의 도움을 받을수 있는 세상이라, 이를 활용할 수 있는 감만 있다면 코딩은 그리 큰 문제가 아니라는 개인 생각이다) 그리고 분석결과로 상대방을 설득 시켜보는 목적을 위한 역량 배양에 중점을 두었다는 점도 이 책의 강점이다고 생각한다.

데이터 드리븐 리포트는 데이터 분석과 보고를 처음 접하는 입문자부터 전문가까지 모두에게 유용한 책이 될 것이다. 체계적인 절차와 다양한 실전 사례, 최신 기술 활용 방법 등을 통해 데이터 드리븐 의사결정의 모든 과정을 이해하고 실천할 수 있도록 돕는다. 이 책은 데이터 중심의 사고와 분석 방법을 익히고자 하는 모든 이들에게 강력히 추천할 만한 필독서라고 생각한다.

여태 여러 데이터 분석 책을 보았지만, 데이터 분석 분야의 돋보이는 책이다.

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

단순히 분석 결과 전달이 목적이 아닌, 보고를 받는 사람이 그 가치를 이해하고 활용하게 만들 수 있게 되는 책.

데이터가 중요하다고 하는데 정말 데이터 드리븐 의사결정이 되고 있는 조직은 많이 없는 것 같다.
조직문화나 의사결정자마다 다르겠지만, 보고를 하는 실무자 입장에서도 데이터 기반의 의사결정을 할 수 있도록 올바른 리포트를 작성하는 것도 중요하다.
 
#️⃣ 데이터가 중요함을 데이터로 설득한다.
저자는 데이터를 가지고 조직에서 소통하는 방법을 제시한다. 개인의 경험이나 감이 아니라 데이터를 통해 상대방을 설득하는 것의 중요성을 강조한다. 이를 위해 데이터로 독자에게 설명한다. 실제 설문조사나 통계자료를 가져와서 말이다.
 
#️⃣ 암묵지를 형식지로 꺼내준다.
암묵지란 경험, 직관, 감각 등 개인에게 내재되어 있으나 명확한 표현하기 어려운 지식을 말하고 형식지란 문서, 데이터베이스, 매뉴얼 등 명확하게 표현되고 기록할 수 있는 지식을 말한다. 자전거 타는 법, 수영하는 법이 사실 명확하게 표현할 수 없는 것 처럼 세상엔 암묵지로 된 지식의 비주이 더 많다.
 
책은 보통 형식지를 대표하는데 이를 내재화하여 암묵지로 바꾸는 과정을 거친다. 이 책은 그러한 내재화에 충실하다고 할 수 있다. 비즈니스 환경에서 겪을 수 있는 상황과, 실제 사례, 그리고 파이썬을 활용한 코드 예시를 통해 독자의 이해를 돕고 있다.
 
특히 2장에서 제시한 데이터 분석 보고 프로세스는 일반적인 데이터 분석방법론을 토대로 짜여진 내용이지만 몰입하여 이해할 수 있게 잘 구성되어 있다고 있다고 생각한다. 시나리오도 상상하면서 직접 실습도 해본다면 형식지를 금방 암묵지로 바꿀 수 있을 것 같다.
 
반대로 4장은 짧지만 필자의 암묵지를 다시 형식지로 펼쳐놓았는데 사회초년생때 보았다면 분명 상사에서 한결 더 좋은 평가를 받았을 거란 생각이 든다.

#️⃣ 혼자서도 할 수 있는 데이터 분석 방법을 제시한다.
파이썬이 배우기 쉽고, 컴퓨터공학이 대중화되었지만, 아직도 비전공자에게는 진입장벽이 있는 분야다. 말 그대로 프로그래밍 언어이기 때문이다.
 
나 역시 데이터 분석을 본업보다는 서브로 하는 입장에서 Chat GPT와 같은 생성형 AI의 등장은 새로운 패러다임을 만들었다. 교양수준의 통계 지식을 이용해서 간단한 ML모델을 만들어보거나, 간단한 탐색적 데이터분석은 큰 허들없이 할 수 있게 되었다.
 
이 책은 그러한 최근 트렌드를 가장 잘 반영한 책이다. 실제로 Chat GPT의 어떤 프롬프트를 작성해야 혼자서 분석을 할 수 있는지를 설명해놓았다. 그러니까 이 책을 1회독을 하고 나면 그 다음부터는 생성형 AI가 사수가 되어 직접 분석할 수 있도록 구성했다.

추천독자
매주 혹은 매달 전년대비, 동시점 비교, 성장률, 매출, 수익 등 단순 숫자를 나열하는 보고만 하는 직장인이라면 이 책을 통해 새로운 세계에 눈 뜰 수 있다고 생각한다.
 
반면, 현업 데이터 분석가라면 기초적인 내용이 많은 이런 책보다는 좀 더 데이터 커뮤니케이션에 포커싱을 둔 책을 보는 게 낫겠다. 기본적인 분석 방법론은 굳이 필요하지 않을테니 말이다.
 
이 책을 통해 포트폴리오를 만들려고 이 책을 추천하는 것이 아니라, 일반적인 비즈니스 환경에서 왜 데이터 분석이 필요한지, 어떤 프로세스로 분석 프로젝트가 이루어지는지 간접적으로 알 수 있다.


 

1. 시작

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

2023년 11월달에 소개할 책은 「데이터 드리븐 리포트」입니다

 

 
                                                      <표지>



이 책은 데이터를 근거로 의사소통해야 하는 모든 실무자를 위한 데이터 기반의 의사결정 가이드입니다.

다음과 같은 내용을 다루고 있습니다.

 

  • 데이터를 기반으로 하는 보고의 5원칙
  • 실제 분석 업무에 적용할 수 있는 단계별 실습 사례
  • 데이터 유형별 적절한 분석 기법 선정 방법
  • 보고 대상자에 따른 맞춤형 커뮤니케이션 방법
  • 챗GPT를 활용한 노코딩 데이터 분석 실습
  • 선형회귀분석을 통한 고객 설득 방법


이 책의 내용을 더 알아보도록 하겠습니다.

 

2. 책의 구성

 

이 책은 총 4개의 장으로 구성되어 있습니다.

 

제 1장. 데이터 드리븐 보고

  • 일상에서 데이터를 기반으로 의사결정하는 사례를 소개하고 데이터 기반 의사결정이 비즈니스에 어떻게 활용되는지 알아본다. 데이터 드리븐 보고가 비즈니스에 어떻게 적용되는지 살펴본다

제 2장. 데이터 드리븐 보고 절차

  • 성공적인 데이터 드리븐 보고를 위한 ON AIR 분석 절차(목표 설정 - 데이터 선정 - 분석 방법 결정 - 해석 - 보고)를 단계별로 설명한다.

제 3장. 데이터 드리븐 보고 실전 사례 with 챗GPT

  • 실제 비즈니스에 활용되는 데이터셋을 통해 데이터 형식과 보고 목적이 각각 다른 여섯 가지 사례를 직접 실습한다. 사례별로 챗GPT를 활용하여 코딩에 대한 지식 없이도 파이썬 코드 작성할 수 있도록 했다.

제 4장. 데이터 드리븐 커뮤니케이션

  • 분석 결과로 상사 혹은 고객을 설득해 원하는 결과를 얻는 것은 분석 과정 만큼이나 중요하다. 데이터를 기반으로 의사소통할 때 꼭 점검해야 할 체크리스트를 안내한다.




3. 책의 내용

 

1) 데이터 드리븐 보고

데이터 기반의 의사결정(Data driven decision making, DDDM)을 위한 데이터 드리븐 보고(리포트)가 무엇인지? 데이터 드리븐 보고가 우리의 일상에서 어떻게 적용할 수 있는지? 비즈니스에서는 어떻게 가치를 창출하는지? 실제 기업에서 어떻게 활용하는지?를 알려준다. 데이터 드리븐 보고의 중요성을 깨닫길 바랍니다.

 

 

33페이지

 

 

 

 

35페이지

 



 

49페이지

 

 

 

 

2) 데이터 드리븐 보고 절차

제2장에서는 데이터 드리븐 보고의 전략적인 단계를 살펴보고 분석을 하기 전에 알아야 할 기본 용어, 개념을 이해하고, 목표 설정 -> 데이터 선정 -> 분석 방법 결정 -> 해석 및 검증 -> 보고(리포트) 까지 단계에 대해서 알려줍니다.

 

65페이지

 

 

 

140페이지

 

 



3) 데이터 드리븐 보고 실전 사례 with 챗GPT

실제 현장의 절차를 기반으로 데이터 드리븐 보고를 진행하는 것을 알려줍니다. 실제 비즈니스 적용 방법이 궁금한 실무자를 위한 내용을 다루고 있습니다. 

 

 

167페이지

 

 

 

 

179페이지

 



 

215페이지

 



 

276페이지

 



 

306페이지

 

 

4) 데이터 드리븐 커뮤니케이션

데이터 드리븐 보고의 마지막 절차인 ‘데이터 드리븐 커뮤니케이션'에 대해서 알려줍니다. 왜 데이터 드리븐 커뮤니케이션이 필요한지? 커뮤니케이션의 성공 기준부터 효과적인 메시지, 시각화, 스토리텔링까지 다양한 측면을 다루고 있습니다.

 

 

363페이지

 

 

 

 

371페이지

 



 

380페이지

 

 

4. 책을 읽은 후

데이터 분석은 정말 쉬운 분야가 아닙니다. 

분석의 80%는 기본 통계와 시각화를 통해 이뤄지고

20%는 고도화된 분석 도구를 사용할 수 있어야 합니다.

기본을 알고 있어야 고도화된 분석이 가능합니다.

데이터 분석관련 책이 어려운 이유입니다.

하지만 데이터 분석 책 가운데 실제 예시를 통한 전반적인 분석 절차에 대한 예시가 다양하고, 좀더 쉽게 접근하려는 저자의 의도를 볼 수 있습니다.

그리고 예시를 따라할 수 있도록 모든 소스코드는 GitHub에 공개를 하고 있습니다.

 

OpenAI 사의 ChatGPT가 출시되고 전세계에 지각 변동이 일어나고 있습니다.

‘AI는 당신을 대체하지 않는다. AI를 사용하는 사람이 당신을 대체할 것이다.’ 라고 산티아고 발다라마 가 말했습니다.

 

직장인의 생존 스킬, 지속가능한 비즈니스를 위한 필수적인 도구임에는 틀림이 없습니다. 

이 책을 통해서 고객을 설득하고, 상사를 설득할 수 있는 직장인, 분석가가 되기를 희망합니다. 



"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

감사합니다

 

회사생활을 하다 보면 업무와 직군 상관없이 굉장히 많은 자료를 만들게 된다. 그리고 그 자료의 목적이 상황마다 다르겠지만 기본적으로 내가 준비한 자료는 내가 말하고자 하는 것을 뒷받침할 때 사용된다. 사람은 객관적인 자료에 신뢰를 느낀다. 그리고 최근에 느낀 점인데 근거가 빈약하거나 잘못된 자료라 하더라도 그럴싸해 보이면 신기하게도 뭔가 신뢰를 느끼는 경우가 종종 있는 것 같다. 그렇기 때문에 자료의 근거와 출처를 꼼꼼히 확인하고 올바른 선택을 할 수 있도록, 이성적인 판단을 할 수 있도록 비판적으로 보는 시각이 필요한 것 같다.

 

내가 말하고자 하는 것은 보기 좋은 떡이 맛있다는 말도 있는 것처럼 내가 고생해서 얻은 자료와 지표에 더 힘을 실어주기 위해선 이를 위한 적절한 표현법이 필요다는 것이다. 아무런 정렬 없이 문장으로 나열하는 것보다는 리스트 형식으로 정리하는 것이 눈에 더 잘 들어온다. 하지만 여기서 조금 더 신경 써본다면 데이터의 성격에 따라서 적합한 표현법을 찾아 이것을 적용해 볼 수 있다. 이 책은 그런 것들을 파이썬 예제와 함께 실습해 볼 수 있는 내용을 담고 있다. 

 

최근에 발표자료를 몇 번 만들 일이 있었는데 고민이 많았다. 나는 디자이너는 아니지만 그럼에도 불구하여도 조금 더 내가 준비한 좋은 내용을 표현할 수 있는 알맞은 그릇이 없을까라는 생각을 했다. 이 책에서 제시하는 방법은 코드를 작성해야 한다는 점에서 허들은 있지만 개발자들에게는 굉장히 유용할 것 같다.

 

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

 

 

 

"데이터 드리븐 리포트"는 데이터 분석의 실무적 적용에 중점을 둔 책으로, 실무에서 데이터 분석에 고민하는 모든 이들을 위한 귀중한 자료이다. 이상석 저자는 이 책을 통해 데이터를 기반으로 한 의사결정의 필요성을 강조하며, 실제 비즈니스 상황에서 데이터를 효율적으로 활용하는 방법을 제시한다. 이 책은 단순히 데이터 분석의 이론적인 측면을 넘어서, 실무자들이 데이터 분석을 통해 의사결정을 내리고 이해관계자들을 설득하는 데 필요한 실질적인 지침을 제공한다.

 

 

저자는 상사나 고객을 설득하기 위해서는 데이터에 기반하여 소통해야 한다고 강조한다. 이 책에서는 방대한 데이터 속에서 핵심 인사이트를 찾아내고 그 결과를 명확하게 전달하는 방법을 상세하게 설명한다. 데이터 분석의 궁극적인 목적을 이해관계자를 설득하여 효율적인 의사결정을 내리는 것으로 정의하며, 이를 위한 구체적인 방법론을 제시한다.

실무자들이 직면하는 다양한 문제 상황을 고려하여, 데이터 유형별로 적절한 분석 기법을 선택하는 방법을 안내하는 이 책은, 데이터 분석가가 아닌 일반 실무자들도 쉽게 이해하고 적용할 수 있는 실질적인 지식을 제공한다. 예를 들어, 행복에 영향을 미치는 변수 분석, 회사의 중장기 인력구조 예측 등의 다양한 실습 사례를 통해 실무자들이 실제 업무에 적용할 수 있는 데이터 분석의 접근 방식을 배울 수 있다.

 

데이터 기반의 의사소통 기술에도 중점을 두고 있는 이 책은, 데이터 드리븐 보고의 절차와 실전 사례, 커뮤니케이션 방법에 대한 체크리스트를 제공하여 실무자들이 데이터를 통해 보다 설득력 있는 보고를 할 수 있도록 지원한다. 데이터 분석 결과를 비즈니스에 성공적으로 적용한 여러 사례를 통해 구체적인 학습 경험을 제공하며, 실무자들은 데이터 분석 사고의 폭을 넓히고 복잡한 데이터 분석 결과를 의사결정자에게 설득력 있게 전달하는 방법을 배울 수 있다.

"데이터 드리븐 리포트"는 데이터 분석의 기술적 측면뿐만 아니라, 실무에서의 응용과 커뮤니케이션 기술에 중점을 두는 독특한 접근 방식으로 구성된 책이다. 실무에서 데이터 분석에 고민하는 실무자들에게 필수적인 지식과 기술을 제공함으로써, 데이터 기반의 의사결정 과정을 강화하고, 보다 효과적인 결과를 도출할 수 있도록 돕는다. 이 책은 데이터 분석의 복잡한 세계를 구조적이고 체계적인 방식으로 탐구하며, 이를 통해 독자가 데이터 분석의 깊은 이해를 얻을 수 있게 돕는다. 실제로 이 책은 데이터를 '실제로 분석하면서 학습한다'는 목표를 더욱 효과적으로 달성할 수 있도록 도와주며, 이를 통해 독자는 데이터 분석 프로젝트를 성공적으로 수행할 수 있다. 또한 이 책은 최신 데이터 분석 도구와 기술 트렌드를 업데이트함으로써 데이터 분석 분야의 최신 동향을 파악할 수 있는 기회를 제공한다. 이 책은 또한 독자에게 실용적인 예제를 통해 데이터 분석의 다양한 적용 영역을 보여준다. 실제 실무에서 겪을 수 있는 문제를 해결하는 데 필요한 실질적인 지식과 능력을 제공함으로써, 독자에게 데이터 분석의 실제 적용에 대한 귀중한 통찰력을 제공한다. 이런 점에서 "데이터 드리븐 리포트"는 데이터 분석 분야에 깊이 있는 이해를 원하는 모든 이에게 권할만한 책이다.
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

1.들어가며

 

창업동아리를 하다보면 자연스럽게 창업경진대회를 나가게 된다. 그럴땐 자신의 아이템이 왜 세상에 나와야하고, 어떻게 매출이 이루어지며, 지속 성장 방향 등을 설명하게 된다. 이때 처음 하는 사람들이 놓치는게 바로 '설득하는 데이터' 이다.

회사도 마찬가지이다. 보고를 할 때, 의사결정에 대한 근거가 필요하다. 일반적으로 의사결정, 협업등은 구두보다는 보고서로 이루어지며, 이때 필요한게 바로 데이터 드리븐 리포트이다.

 

 

2.중요 요소

-글보다는 숫자가 좋으며, 숫자가 없다면 1)수치화를 하거나 (설문조사가 대표적 예이다.) 2) 데이터를 시각화해서 보여줘야 한다.

-직관을 배제해서는 안된다. 시작 단계를 넘어가다보면, 100% 직관없는 보고서를 꿈꾸기도 한다. 직관자체가 나의 과거 경험들에 의한 산물이다. 비지니스 최종 선택은 직관적이여야한다. 즉, 직관으로만 결정이 되는게 아니라, 데이터가 양쪽 다 합리적인 경우, 시간관계상 데이터 드리븐을 빠르게 줄여 업무 효율성을 높여야 하는 경우, 과거 매우 흡사한 사례가 있던 경우가 직관을 사용할 수 있는 예이다.

-분석 도구는 화려한게 중요한게 아니라 의사 결정자의 판단에 도움을 주는게 본질이다. 추가 설명도 가능하면 없는게 중요하다. 뽑는 방식에 따라 추가설명이 필요한 경우에는, 직접 2차 가공화하여 한번에 알아 볼 수 있도록 하자.

-도메인 지식도 중요하다. 과거 kt엠하우스 데이터 분석대회에서 포기하는 팀들이 많았다. 이유는 제공된 데이터로 너무나 당연한 이야기만 도출되기 때문이다. 토익 스피킹으로 비유하면, 토익 스피킹 점수가 높은사람은 발음도, 문법도, 단어도 훌륭하다. 라는 너무 당연한 결과가 나온다. 분석의 관점을 설정이 잘못되서 그런거고, 관점을 제대로 잡으려면 도메인 지식이 필요하다. 토익 스피킹을 예시로 들자면, 만점에서 뭐가 부족할 수록 단계가 떨어지는지를 분석하는 관점으로 접근해야하는것이 그 예이다.

 

3. 활용 예시

image.png

사진 설명을 입력하세요.

사진은 NIA(한국정보화 진흥원) 데이터 분석 대회에 참가했을때의 자료이다. 당시 KBO의 선수영입 모델을 주제로 발표를 했었다.

(위의 사진은 기록이 아닌, 키워드 중심 분석을 했던 자료이다)

1)LDA는 야구선수 관련 크롤링 키워드를 군집화하여 감정분석했던 방식이다.

2)군집화를 위해 KoNLPy 불용어 사전을 활용하여 불용어를 처리하고

KSNU 긍부정 사전 기반으로 감정분석을 하였다.

3)부정 키워드를 분석해본 결과 연봉, 코로나, 범죄 관련 키워드가 도출됐다.

 

image.png
 

사진 설명을 입력하세요.

(위의 분석은 타격, 수비 지표를 통해 분석한 자료이다.)

 

1)일반적으로 WAR중 타격은 굉장히 객관적이지만, 수비는 사이트에서 정의를 한다. 이유는 도전적 수비, 호수비를 노리지 않을경우 수비 스탯이 오르기 떄문에 불공정하기 때문이다.

해당 이유로 미국 논문을 참고하여 수비 요인(Factor)을 만들고 타자의 수비 가치를 분석한 자료이다.

 

이처럼 데이터 드리븐 리포트는 1.키워드 같은 정성적 데이터 2.야구 성적과 같은 정량적 데이터 모두 분석이 가능하며

설득을 위해서의 본질은 결국 '설득 하는 사람이 1)납득이 가고 2)쉽게 이해하도록 3)객관적으로 전달하는 것이다.

 

 

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

모든 조직에서 올바른 전략을 수립하고 계획을 실행하기 위해서는 의사 결정이 무엇보다 중요하다. 의사 결정에 이르는 과정이 적절하지 않고, 그로써 합리적인 결정이 도출되지 않는다면 조직은 당면 과제를 해결할 수 없고 결국엔 원하는 바를 이룰 수가 없다. 그렇기에 최선의 의사 결정을 돕는 훌륭한 도구가 필요한데, 바로 그 무기가 '데이터'이다. 데이터를 통해서 문제를 제대로 정의하고, 올바른 의사 결정이 뒷받침된다면 조직은 어떠한 문제라도 효율적으로 해결할 수 있고 종국적으로 소기의 목적을 달성할 수 있게 된다. 이렇게 데이터를 기반으로 또는 데이터 주도적(데이터 드리븐)으로 의사 결정하는 흐름이 하나의 트렌드로 부상했지만, 도처에서 올바른 방법으로 데이터 드리븐을 시도하거나 그러한 문화를 정착하는 데 많은 시행착오와 어려움을 겪는 것으로 전해진다. 너나 할 것 없이 데이터 드리븐의 중요성은 너무나 잘 알고 있지만, 막상 그것을 구현하고 실행해 나가는 데 있어 실질적으로 도움받을 만한 리소스가 충분하지 않은 실정이다. 이러한 와중에 데이터 드리븐 보고를 통해 조직이 올바른 방향으로 나아가게끔 안내해 주는 서적이 등장했다. 오늘 소개할 책은 '데이터 드리븐 리포트'라는 서적이다. 

 

KakaoTalk_20231126_185751080.jpg

 

본 서적은 총 4개의 장으로 구성되어 있고, 첫 장은 데이터 드리븐 의사 결정의 정의와 데이터 드리븐 보고 그리고 그에 따른 5원칙을 설명하고 있다. 이를 통해 독자는 데이터 드리븐 보고의 첫 발을 내딛게 된다. 2장에서는 본격적으로 데이터 분석을 위해 필요한 핵심 용어 및 개념을 학습하게 되고 데이터 분석에 필요한 제반 절차, 이를테면 목표 설정, 계획서 작성, 데이터 선정, 분석 방법 결정 및 해석/검증, 보고 방식 등에 대한 각각의 요소를 상세하게 나열하면서 데이터 드리븐 보고의 초석을 다지게 된다. 

 

이윽고 3장에서는 데이터 드리븐 보고의 실전 사례를 파이썬 코드 및 ChatGPT의 일부 도움을 받아 실제 적용하는 학습을 진행하게 된다. EDA와 기술 통계, 데이터 시각화, 가설 검정, 선형 회귀 분석, 분류 예측, 토필 모델링 등의 총 6가지 사례를 2장에서 얻게 된 데이터 분석 절차를 통해 파이썬 코드로 구현하고, ChatGPT를 활용하여 완성도 높은 결과물을 이끌어 낸다. 

 

마지막 장에서는 데이터 드리븐 의사 소통에 대해 다루고 있는데, 데이터 드리븐 의사 소통의 필요성, 구성 요소, 방법, 스토리텔링과 체크리스트 등의 내용을 통해 효율적으로 데이터 분석 결과를 이해관계자에게 전달하고 궁극적으로 목적을 달성하기 위한 실질적인 팁과 노하우를 배울 수 있고, 이로써 데이터 드리븐 보고의 정수를 여실히 체험하게 된다. 

 

데이터 활용은 더할 나위 없이 중요해지고 있고, 모든 조직은 어떻게 데이터를 분석하느냐에 따라 그 결과를 기반으로 하여 최선의 의사 결정을 이루고 목적을 달성할 수 있다. 그런데 데이터 분석도 중요하지만, 문제는 그에 따른 결과를 어떻게 효율적으로 조직의 이해관계자에게 전달하고, 의사 결정권자가 올바른 결정을 내릴 수 있도록 지원하는 과정 역시 굉장히 중요하다. 시중에는 데이터 분석에 관련된 서적이 편재해 있지만, 데이터 드리븐 보고에 대한 책은 아마 본 서적이 유일무이할 것이다. 3장에서 실제 사례를 파이썬 코드로 다루기 때문에, 이 책을 제대로 활용하기 위해서는 파이썬에 대한 기본 문법과 기초를 사전에 익히고 있어야 한다. 파이썬에 대한 기본을 갖추고 있는 상태라면, 조직의 올바른 의사 결정 과정을 지원하고 데이터를 기반으로 원하는 바를 이룰 수 있도록 하기 위해 당장 이 책과 함께 데이터 드리븐 보고의 여정을 시작해 보자. 데이터 드리븐 보고를 통해 조직의 성공을 위해서라면 주저하지 말고 이 책을 가이드로 삼아 앞으로 나아가 보자. 

 

P.S 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다. 

AI 시대에 데이터 리터러시가 중요해졌다. '리터러시=문해력'으로, 이 경우엔 데이터를 읽고 이해하는 능력을 말한다.

AI와 데이터는 무슨 상관일까? 챗GPT를 보면 온라인상에 있는 엄청난 양의 데이터를 활용하고 있으며 사용자가 추가적인 데이터를 던져주면 나에게 맞춤형 결과를 내놓는다. 그야말로 개인 비서가 되는 셈. 데이터를 잘 가지고 놀 줄 알수록 직장에서, 세상에서 살아남기 수월해 지는 것이다.

지금 리뷰하는 '데이터 드리븐 리포트' 책 안에 이런 내용이 나온다.

"AI는 당신을 대체하지 않는다. AI를 사용하는 사람이 당신을 대체할 것이다."

밥벌이에 컴퓨터를 사용하는 직군이라면 앞으로는 데이터와 AI를 활용하지 않고는 생산성 차이를 극복할 수 없을지도 모른다.

책에서는 데이터 드리븐 리포트를 이렇게 정의한다. 올바른 문제 해결을 위한 문제 정의부터 데이터 수집, 정제, 분석을 거쳐 스토리텔링과 시각화로 설득을 끌어내는 일련의 과정이다.

데이터 문해력을 높였다면 최종적으로는 어떤 결과를 이끌어내야 할 것이다. 그것은 곧 (상사 또는 고객의) 의사결정이다. 실무자는 이들이 좀 더 쉽게 결정을 내릴 수 있게 데이터 중심의 보고서를 쓰는 것이 중요하다.

어떻게 쓸 수 있을까? 나는 데이터 중심으로 보고서를 써본 적이 없는데...!

책에 모든 실무적인 내용이 다 나와 있으니 걱정하지 않아도 된다.

대상 독자는 다음과 같다.

  • 파이썬 기초 문법을 알고 데이터 분석을 해본 적 있는 직장인
  • 상사와 고객을 설득해야 하는 데이터 분석가
  • 기존의 보고 방식을 뛰어넘어 예측 가능하고 선제적인 분석 기법을 알고 싶은 사람
  • '해봤는데 안 돼.' '예전에 검토해봤어' 등의 이유로 상사에게 거절당한 경험이 있는 사람
  • 분석 업무에 챗GPT를 활용하고 싶은 사람
  • 데이터 분석 자격증과 실무를 동시에 고민하고 있는 사람

출판사인 한빛미디어에서 책 분류를 '중급'으로 설정했다. 어느 정도의 수학 능력과 기본적인 파이썬, 최소한의 통계 지식이 필요하기 때문이다. 원래 데이터를 다루는 것 자체가 종합 예술이어서 육각형 인재가 되어야 이 분야의 전문가가 될 수 있다. 초급자가 처음부터 이 책을 이해하기는 쉽지 않겠지만 그만큼 실무에 도움되고 수준 높으며 흥미로운 내용으로 채워져있다.

구성은 모두 4장으로 되어 있다.

  • 1장 : 데이터 드리븐 보고
  • 2장 : 데이터 드리븐 보고 절차
  • 3장 : 데이터 드리븐 보고 실전 사례 with 챗GPT
  • 4장 : 데이터 드리븐 커뮤니케이션

1장과 4장은 술술 읽히는 재밌는 챕터이다. 데이터 드리븐 보고에 대한 기본 정의부터, 왜 우리가 이걸 해야 하는지, 상사(또는 고객)에게 잘 전달하려면 어떻게 해야 하는지 등의 내용이 있다. 저자가 독자인 우리가 이 책을 완독하게끔 설득하는 장이다.

2장은 데이터 분석을 하기 위해 필수로 알아야 할 기본적인 용어와 개념을 설명한다. 가설을 설정하고 데이터를 선정한 후 분석 방법을 결정 -> 해석과 검증을 하고 최종적으로 내가 설득할 대상에게 보고하는 데이터 드리븐 리포트의 절차가 나와 있다.

3장은 이 책의 핵심으로 실전 사례로 데이터 기반 보고를 학습한다. 가장 지면을 많이 차지하는 챕터이다. 여기서는 여러 상황이 주어진다. 각 상황은 아무렇게나 주어지는 건 아니고, 데이터 시각화나 가설검정, 선형회귀분석, 분류예측 등 데이터 드리븐 보고에 해당하는 여러 유형에 익숙해 질 수 있는 사례들이 나온다. 여기서 흥미로운 부분은 현실 문제를 해결하는 과정에서 챗GPT를 활용한다는 점이다. 창의성이 부족한 나는 이렇게 딱딱 알려주는 게 넘 좋다.ㅎㅎㅎ


책 '데이터 드리븐 리포트'를 다 보고 느낀 건 데이터의 활용가치가 참 높다는 거다. 기업들이 왜들 그렇게 사용자 데이터를 확보하려고 책을 읽다보면 느껴진다.

그리고 상사를 설득하기 위한 리포트 용도 뿐만 아니라 개인적으로 의사결정을 하는데에도 데이터가 도움이 될 것 같다. 매일매일이 선택의 연속이다 보니 가끔은 무지성으로 무언가를 선택하기도 하는데, 데이터 분석이 습관화 되면 이런 단점도 좀 고칠 수 있지 않을까^^;;

1장부터 4장까지 내용이 다 좋아서 버릴 부분이 없는, 종이 아깝지 않은 책이다. 3장 실전 사례는 따라하면서 데이터를 분석해 가는 과정이 특히 재밌었다. 데이터 자격증을 준비하는 사람이나 직무에 관심있는 사람, 현재 실무자인 사람 모두에게 도움이 도리 것이라 생각한다.

--------------------

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

    데이터 분석이라는 분야는 이미 관련책 책이 상당히 많이 출간되어 있고 이제는 어떤 책을 고를지만 고민하면 될 정도로 많이 알려진 분야가 되었습니다. 조금은 성숙되어 가고 있는 분야가 되다 보니 순수한 데이터 분석의 영역을 넘어서서 다른 분야로 적용되는 방법에 대한 책들도 하나 둘 나오고 있습니다. 이번 책 데이터 드리븐 리포트는 HR전문가인 저자의 손을 거쳐서 데이터 분석을 통해 어떻게 의사결정을 하고 좋은 리포트를 만들어서 보고를 할 수 있는지에 대해 가르쳐 줍니다. 책의 내용이 크게 어렵지 않으니 하나씩 따라가보면 다양한 인사이트를 얻을 수 있습니다.

 

 

 

 

    책은 총 4개의 장으로 구성되어 있습니다.

  • 1장. 데이터 드리븐 보고
  • 2장. 데이터 드리븐 보고 절차
  • 3장. 데이터 드리븐 보고 실전 사례 with 챗GPT
  • 4장. 데이터 드리븐 커뮤니케이션

책의 내용을 순서대로 조금만 살펴보겠습니다.

 

 

 

 

    이 책의 주요 요점은 설득하는 사람이 되는 것입니다. 그리고 여기에 필요한 기술 중 하나가 바로 데이터 기반의 의사결정 방법입니다. 인공지능 전문가인 산티아고 발다라마는 이렇게 말했습니다. 

 

"AI는 당신을 대체하지 않는다. AI를 사용하는 사람이 당신을 대체할 것이다." 

 

 

 

 

    데이터를 기반으로 어떤 일을 한다는 것은 사실 단순히 몇 가지 일에만 적용되는 것이 아닙니다. 아무 많은 일반인들이 고민하는 주식 투자에 있어서도 데이터 드리븐 의사 결정이 적용될 수 있습니다. (현실에서는 그냥 감으로 투자하는 사람이 많다고 하지만 말이죠) 데이터를 기반으로 한 의사 결정을 한다고 해서 정확한 예측을 보장할 수는 없지만 많은 부분을 보완해 줄 수 있는 것은 너무나도 당연한 사실입니다.

 

 

 

 

    이 책에서 데이터를 다루는 주된 이유는 보고하고 전략을 수립하기 위함입니다. 책의 2장에서는 데이터 드리븐 보고 전략에 대해서 다루고 있습니다. 기본적으로 아래와 같은 커뮤니케이션 ON AIR 분석 절차를 따른다고 합니다. 목표를 설정하고 데이터를 선정한 후 분석 방법을 결정해서 해석하고 검증한 뒤 보고하는 순서입니다. 가장 중요한 것은 이 모든 과정에서 보고 대상자인 의사 결정자와 지속적으로 대화해야 한다는 것이라고 합니다.

 

 

 

 

    잘 분석된 데이터와 좋은 결과가 나온 보고서라도 결국은 시각적으로 잘 표현되어야 의사 결정에 도움이 됩니다. 3장에서는 데이터 시각화에 대해서도 다루고 있습니다. 다양한 데이터들을 분석해서 데이터를 뽑고 이를 시각화해서 의사 결정자에게 인사이트를 제공하는 것을 목적에 두고 있습니다. 실제로 인간의 뇌는 텍스트보다 6만 배 빠른 속도로 이미지를 처리한다고 합니다.

 

 

 

 

    특정 데이터에 대해 시각화하고 데이터 분석을 하는 과정에 필요한 파이썬도 책을 통해 배울 수 있습니다. 이미 파이썬이 익숙한 개발자라면 아주 쉽게 이해할 수 있는 수준이고 그렇지 않은 사람들도 이 책을 통해 하나씩 배워나가면 쉽게 데이터 드리븐 리포트를 작성할 수 있습니다.

 

 

 

 

    회귀 분석과 같은 아주 간단한 데이터 분석 기법을 사용해서 실제 데이터를 분석하면서 배우는 파트도 준비되어 있습니다. 책의 목적에 맞게 아주 깊은 인공지능 모델이나 데이터 분석 기법에 대해서는 다루지는 않습니다. 다만 이 책을 기반으로 해서 다른 머신 러닝 기법들을 함께 공부한다면 훨씬 멋있는 데이터 드리븐 리포트를 만들 수 있을 것 같네요.

 

 

 

 

    토픽 모델링(텍스트 데이터 내 단어 빈도 분석 후 LDA 방식 토픽 자동 분류)을 사용해서 대통령 연설문을 분석한 결과의 예입니다. 아주 간단하고 쉬운 기법이지만 장문의 텍스트 데이터에 적용했을 때, 그냥 봐서는 알 수 없는 인사이트를 얻을 수 있게 됩니다. 데이터 분석 그리고 시각화의 힘이 이런 것이라고 생각됩니다.

 

 

 

 

    책이 결코 어렵지 않게 쓰여졌습니다. 그럼에도 불구하고 배울 부분이 많고 특히, 단순히 데이터 분석이라는 기술을 배우는데 그치는 것이 아니라 실제 업무에서 어떻게 적용될 수 있을지에 대한 노하우를 담고 있기 때문에 개발자뿐만 아니라 관련 분야에 데이터 분석 기법을 적용해보고 싶은 분들이 많은 도움을 얻을 수 있을 것 같습니다.

 

끝.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

data00001.jpg

 

데이터 드리븐을 아시나요?

 

경험이나 직관의 한계를 넘어 상사나 이해관계자를 설득할 줄 알아야 합니다.

 

설득하지 못하는 것에는 반드시 이유가 존재합니다.

 

이유를 찾는 사람은 상대방을 설득할 수 있게 됩니다.

 

당신은 설득하는 사람인가요? 그렇다면 설득률을 몇 퍼센트입니까?

이 질문에 스스로 답변하고 이 책을 읽어보시길 추천합니다.

 

데이터 드리븐 리포트를 작성하는 노하우를 알려주는 책을 소개하려 합니다.

 

소개해 드릴 책은 ‘데이터 드리븐 리포트’입니다.

 

데이터의 힘을 실무에서 어떻게 효과적으로 활용할 수 있는지에 대한 체계적인 가이드를 제시하고 있습니다.

 

이 책은 저자가 경험이나 직관만으로는 한계를 느끼는 상황에서 데이터 사이언스를 공부하게 됐습니다.

 

저자의 동기부터 시작하여, 상사나 이해관계자를 설득이 필요했습니다.

 

저자의 깊은 내공을 쌓기 위한 핵심 원리부터 실무적인 적용 방법을 상세하게 다루고 있습니다.

 

이 책에서는 데이터의 힘을 효과적으로 활용하는 방법을 체계적으로 안내합니다.

 

어떻게 효과적으로 활용하는지 같이 살펴보겠습니다.

 

 

data00003.jpg

 

 

 

1) 데이터 드리븐 보고의 실무 적용

데이터 드리븐 보고의 실무 적용은 개념과 이론을 설명한 뒤, 어떻게 실무에서 적용하는지에 대한 가이드를 제공합니다.

 

다양한 통계적 기법을 활용하여 근거자료로 활용하는 방법을 다루며, 이론보다는 실무적인 측면에 중점을 두고 있습니다.

 

여기서는 여섯 가지 다양한 비즈니스 사례를 통해 데이터 형식과 보고 목적이 다른 상황에서 데이터 분석과 보고 과정을 실습함으로써 독자는 다양한 시나리오에서 데이터 활용에 대한 실질적인 경험을 쌓을 수 있을 것입니다.

 

이를 통해 독자는 이론을 실제 상황에 적용하는 데 있어 실질적인 능력을 키울 수 있습니다.

 

 

 

data00002.jpg

 

 

2) 데이터 드리븐 보고의 핵심 원리와 적용 방법

데이터 드리븐 보고의 핵심 원리와 적용 방법은 올바른 문제 해결을 위한 과정입니다.

 

문제 정의부터 데이터 수집, 정제, 분석, 스토리텔링, 시각화까지의 단계를 데이터 드리븐 보고의 중요한 핵심 원리를 알려줍니다.

 

이는 데이터 문해력과 스토리텔링의 결합을 통해 데이터를 단순히 해석하는 것을 넘어, 데이터의 전체적인 유기적 연계성을 이해하고 함정과 오류를 피하는 능력을 키우는 것을 강조합니다.

 

초년생 분석가들이 직면하는 어려움에 대한 해법을 제시하며, 다양한 데이터 중에서 핵심을 찾는 방법과 데이터 분석 역량의 중요성을 강조합니다.

 

특히, 현대사회에서는 AI와 데이터 분석이 중요성을 더하고 있으며, 데이터 분석 역량 향상이 개인의 가치를 높이는 핵심이라고 강조하고 있습니다.

 

 

 

 

PS

이 책은 데이터의 활용과 분석에서 나오는 결과를 효과적으로 전달하는 방법과 중요성에 대해 다루고 있습니다.

 

데이터 드리븐 리포트를 통해 데이터를 효과적으로 활용하여 의사소통하고 설득력 있는 결과물을 만들어 내는 방법을 제시하며, 실무에서의 적용을 위한 다양한 예시를 제공합니다.

 

종합적으로, 상사와 고객을 설득하는 데이터 기반의 의사결정은 데이터에 기반한 의사결정의 중요성을 강조하고 싶습니다.

 

이를 실제 업무에 어떻게 적용할 수 있는지를 실질적으로 가르치는 데 그 목적을 두고 있습니다.

 

다양한 비즈니스 사례를 통해 독자들은 데이터 분석 역량을 향상하는 데 큰 도움을 얻을 수 있을 것입니다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

저의 꿈은? 목표는 데이터 과학자 였습니다.

데이터의 힘을 믿는다!

이것 저것 공부도 하고 책도 많이 보고 그렇게 이론은 공부를 했는데....

문제가 생겼습니다.

 

내가 공부한 이 내용들을 어디에 어떻게 사용해야 하는지 잘 모르겠더라구요.

혼자서 이것 저것 파일럿 프로그램도 만들어 보고

미니 프로젝트도 하고 했었는데요.

이 책이 필요한 순간 이었네요!

 

"데이터 드리븐 리포트"

이 책은 HR 분석가로 감정 분류 모델, 인재 추천 시스템 등을 개발하여 특허 출원까지 한 이상석님의 책입니다.

이 책은 네개의 장으로 구성되어있습니다.

1장은 데이터 드리븐 의사결정과 , 데이터 드리븐 리포트가 무엇인지 리고 데이터 드리븐 리포트의 필요성 등을 알 수 있습니다.

데이터 드리븐 보고 5원칙이 있습니다.

① 설명 가능해야 한다.

② 데이터 드리븐 보고는 중립적이지 않다.

③ 문제를 정의할 수 있어야 한다.

④ mvp부터 시작하라

⑤ 추론과 예측을 구분하라.

 

이 중 4번 mvp(최소 기능 제품)는 '린 스타트업'에서 이미 살펴 본 내용이었습니다.

"MVP 목적은 제품을 통해 문제를 해결하려는 문제와 가설을 명확히 하는 것"

저는 MVP는 제품 개발에만 쓰인다고 생각했습니다.

그런데 '데이터 드리븐 리포트'에서 가설을 명확히 하기 위해 사용할 수 있다는 것을 알게 되었습니다.

이 책을 읽어야 하는 이유가 바로 이런 것 입니다.

제가 공부는 하는데 이 공부한 내용을 어디에 어떻게 적용해야 하는지 모르겠더라는 것이죠.

그런데 이 책은 저같은 사람들을 위해 꼭 필요한 내용이라는 것이죠.

 

2장에서는 데이터 드리븐 보고 절차가 나옵니다.

데이터 과학의 기본 이론이 나옵니다.

EDA(exploratory data analysis) 탐색적 데이터 분석이라는 멋진 말도 나옵니다.

"EDA는 주어진 데이터를 활용해서 기술통계 및 간단한 그래프를 그려보며 내가 세운가설 혹은 앞으로 세울 가설에 대한 윤곽을 정해가는 절차다."

 

3장은 실제 사례를 살펴봅니다.

파이썬을 이용한 데이터 분석 기법 및 챗GPT를 이용하여 코드를 작성하고 데이터를 분석하는 방법도 상세하게 나옵니다.

이 부분은 공부를 위해서 볼 부분은 아닙니다.

실제 사례에 어떻게 적용할 수 있는 사례가 나옵니다.

 

처음으로 나오는 사례가  "행복에 영향을 미치는 변수와 국가별 행복지수 분석하기" 였는데

혼자 공부하는 R 데이터 분석에서 제가 한 미니 프로젝트였기 때문에 너무나 반가웠습니다.

제가 R로 했던 내용을 파이썬 코드로 보니 무척이나 새롭더라구요.

그리고 챗 GPT를 활용한 EDA라니!

 

다른 예로는 저자가 HR 부분 전문가이다보니 인력구조 예측 분석과 시각화, 유학 컨설팅을 위한 해외 대학 합격률 분석, 당뇨병 예측모델 수립 및 사전 예방 솔루션 등 데이터 분석 교재에서 볼 수 있는 이론에 따른 실제 사례들 6가지가 나옵니다.

3장은 어느정도 데이터 분석에 관련된 학습이 되어있는 상태에서 보면 좋을 것 같습니다.

 

마지막 4장은 보고 방법을 위한 시각화방법 및 데이터 분석을 어떻게 표현하고 보고서로 작성하는지 방법이 나옵니다.

솔직히 저는 보고 보수적 기업문화가 자리 잡은 회사이다보니

보고서에도 정해진 포멧이 있고 이에 따르지 않으면 혼납니다. ㅜ..ㅜ

하지만 조금씩 업무에 도입해 보고 싶은 욕심이 들었습니다.

그렇게 변화될 수 있겠죠.

 

이 책은 우리 짱님들도 많이들 읽어보시고 우리 조직문화 및 보고 방식도 더 발전적으로 변화하면 좋겠습니다.

 

이상석 저자님 감사합니다.

그리고 좋은 책 만들어서 보내주신 한빛미디어 감사합니다.

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

KakaoTalk_20231126_224040079.jpg

 

KakaoTalk_20231126_224040079_01.jpg

 

이번에 리뷰할 서적은 한빛미디어에서 출판된 "데이터 드리븐 리포트" 입니다.

부제 "상사와 고객을 설득하는 데이터 기반의 의사결정 with 파이썬"라고 설명하고 있는 이 도서는 데이터를 근거로한 의사소통을 해야 하는 모든 실무자에게 도움이 되는 가이드 서적 입니다.

도서는 408페이지를 할애하여, 파이썬의 여러 라이브러리를 사용하여 데이터 분석을 하는 방법과 챗GPT를 활용한 실전사례를 다루고 있습니다.

목차와 간략히 설명한 내용은 다음과 같습니다.

목차

1장 데이터 드리븐 보고

1.1 일상의 보고 상황

- 일상의 보고 상황을 상사와의 마케팅 전략 보고라 가정하여 대화식으로 설명하고 있습니다.

1.2 데이터 드리븐 의사결정이란

- 일상부터 비즈니스의 의사결정까지 데이터 드리븐 흐름과 효과에 대해 설명하고 있습니다.

1.3 데이터 드리븐 보고란

- 데이터 드리븐 보고의 정의에 대해 설명하며, 데이터 드리븐 보고의 오해와 여섯가지 유형,

보고와 나와의 상관관계에 대해 설명하고 있습니다.

1.4 데이터 드리븐 보고 5원칙

- 데이터 드리븐의 5원칙으로 설명가능과 보고는 중립적이지 않고, 문제를 정의할 수 있어야 하며, MVP부터 시작하며, 추론과 예측을 구분할 수 있어야 한다고 설명하고 있습니다.

2장 데이터 드리븐 보고 절차

2.1 데이터 드리븐 보고 전략

- 데이터 드리븐의 ON AIR 분석절차라 명명한 절차에 대해 설명하고 있습니다.

2.2 분석 전 알아야 하는 용어

- 분석 전 알아야 하는 용어로 독립변수와 종속변수, 테이블, 행과 열, 데이터 분리 모델링에 대해 설명하고 있습니다.

2.3 분석 목표 설정

- 분석 목표(가설)의 확실한 정의와 의사결정자에게 최대한 많은 질문을 하라는 내용을 설명하고 있습니다.

2.4 계획서 작성

- 분석 계획서의 필수요소(범위설정, 가설/목표 설정, 사용데이터 정의, 분석도구 선정, 기대효과 정의)에 대해 설명하고 있습니다.

2.5 데이터 선정

- 데이터 선정에 필요한 데이터 수집과 EDA & 데이터 정제에 대해 설명하고 있습니다.

2.6 분석 방법 결정 및 해석/검증

- 분석방법 결정 및 해석/검증에 필요한 기본통계, 가설검정, 선형회귀분석, 분류예측모델에 대해 설명하고 있습니다.

2.7 보고 대상자에 따른 보고 방식

- 보고 대상자에 따른 실무자용 보고 및 의사 결정자용 보고에 대해 설명하고 있습니다.

3장 데이터 드리븐 보고 실전 사례 with 챗GPT

3.1 데이터와 친해지자: EDA & 기술통계

[사례] 행복에 영향을 미치는 변수와 국가별 행복지수 분석하기

- 실전사례를 챗GPT를 활용하여 상황, 분석목표 파악하기, 분석 계획 세우기, 데이터 선정하기, EDA 수행하기,

해석하기, 보고하기, 챗GPT 활용하여 EDA 수행하기 의 과정을 통해 실습해보는 내용을 설명하고 있습니다.

3.2 데이터도 백문이 불여일견: 데이터 시각화

[사례] 회사의 중장기 인력구조 예측, 분석, 시각화하기

- 실전사례를 챗GPT를 활용하여 상황, 분석목표 파악하기, 분석 계획 세우기, 데이터 선정하기, EDA 수행하기,

분석 및 예측 방법 결정하기,시각화하기, 해석하기, 보고하기, 챗GPT 활용하여 EDA 수행하기 의 과정을 통해

실습해보는 내용을 설명하고 있습니다.

3.3 당신의 질문에 데이터가 답한다: 가설검정

[사례] 마케팅 효과 분석 및 최적의 광고 플랫폼 찾기

- 실전사례를 챗GPT를 활용하여 상황, 분석목표 파악하기, 데이터 선정하기, 분석 방법 결정하기, 해석하기,

보고하기, 챗GPT 활용하여 가설검정하기 의 과정을 통해 실습해보는 내용을 설명하고 있습니다.

3.4 데이터에 맞는 직선을 찾아라: 선형회귀분석

[사례] 유학 컨설팅을 위한 해외 대학 합격률 분석하기

- 실전사례를 챗GPT를 활용하여 상황, 분석목표 파악하기, 분석 계획서 작성하기, 데이터 선정하기,

EDA 수행하기, 분석하기, 해석하기, 컨설팅하기, 챗GPT 활용하여 회귀분석하기 의 과정을 통해 실습해보는 내용을 설명하고 있습니다.

3.5 합격이냐 불합격이냐: 분류예측

[사례] 당뇨병 예측모델 수립 및 사전 예방 솔루션 제공하기

- 실전사례를 챗GPT를 활용하여 상황, 분석목표 파악하기, 분석 계획서 작성하기, 데이터 확인하기,

EDA 수행하기, 분석하기, 해석하기, 솔루션 제공하기, 챗GPT 활용하여 분류예측모델 만들기 의 과정을 통해 실습해보는 내용을 설명하고 있습니다.

3.6 대량의 텍스트 데이터를 이해하다: 토픽 모델링

[사례] 전 직원 대상 설문조사의 서술형 응답 분석하기

- 실전사례를 챗GPT를 활용하여 상황, 결과물 미리 보기, 검증하기, 토픽 모델링 따라하기, 챗GPT 활용하여 워드 클라우드 만들기 의 과정을 통해 실습해보는 내용을 설명하고 있습니다.

4장 데이터 드리븐 커뮤니케이션

4.1 데이터 드리븐 커뮤니케이션의 필요성

- 데이터 드리븐 커뮤니케이션의 필요성을 상사와 나와의 관심 포커스가 어디에 있는지 설명하며,

타이밍의 중요성에 대해 설명하고 있습니다.

4.2 데이터 드리븐 커뮤니케이션 구성 요소

- 데이터 드리븐 커뮤니케이션 구성 요소로 메시지, 시각화, 스토리에 대해 설명하고 있습니다.

4.3 데이터 드리븐 커뮤니케이션 방법

- 데이터 드리븐 커뮤니케이션 방법으로 효과적인 차트와 도구, 적합한 전달 방식에 대해 설명하고 있습니다.

4.4 스토리텔링

- 스토리텔링의 핵심과 스토리 만들기에 대해 설명하고 있습니다.

4.5 데이터 드리븐 커뮤니케이션 체크리스트

- 데이터 드리븐 커뮤니케이션 체크리스트로 다음에 대해 설명하고 있습니다.

1. 내가 이해하는 만큼 상대방도 이해한다

2. 보고는 내가 하고 싶은 이야기를 전달하는 것이 아니다

3. 나보다 보고 주제를 더 잘 아는 사람은 없다

4. 보고의 성패를 가르는 사전 준비 질문

5. 보고가 끝났다고 모든 일이 끝난 것은 아니다

전반적으로 데이터를 기반으로 하는 보고서를 작성하기 위한 방법을 설명하고 있으나, 파이썬의 여러 라이브러리를 활용하여 전문적으로 분석하고, 챗GPT를 활욯하여 여러 실전사례들 분석하는 방법에 대해 심도 있게 자세히

알기 쉽게 설명 하고 있습니다. 내용이 알차서, 제가 따로 준비하는 빅데이터 분석기사 자격증 준비도 많은 도움이 되었습니다. 여러 서적들이 있지만 최근에 나온 서적중에 데이터 분석 기법에 대해서는 잘 다뤄주고 있다는 생각이 들었습니다.데이터 분석에 관심이 많은 독자들에게 추천하며, 파이썬과 챗GPT를 이용한 분석기법을 알고자 하는 독자들에게 아주 유용한 서적이 될것입니다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

IMG_4546.JPG

 

대부분의 데이터 분석 관련 책들은 분석 자체에만 집중하는 경우가 많은데 이 책은 목적을 가장 중요하게 생각하고 알려주는 책이라서 마음에 들었다. 데이터 드리븐은 '데이터에 기반하여 의사결정을 하는 것'이다. 다른 말로 분석 결과를 통해 이해관계자들을 '설득'시켜야 한다는 것이다. 분석가들의 실질적인 목표인 보고를 위한 '보고를 위한 분석'에 중점을 둔 책이여서 데이터 분석이 업무에 들어가는 모든 직군이 읽어보면 큰 공부가 될 것이라고 생각한다. 또 보고 능력이 분석 능력에 비해 떨어지는 사람들을 위한 책이라고 한다. 데이터는 쌓는 자, 분석하는 자, 보고하는 자, 문제 해결자가 같은 사람일수록 큰 힘을 발휘한다. 요즘 등장하는 생성형 AI를 통해 이 간극이 좁혀지고 있지만 설득을 어떻게 해야하는지는 이 책을 통해 충분히 공부할 수 있다고 생각한다.

 

IMG_4547.JPG

 

책 내용은 크게 데이터에 기반한 보고 방법, 구글 콜랩/파이썬/챗GPT를 실제 보고에 활용하는 방법, 보유한 데이터 특성에 따른 적절한 데이터 분석 기법 선정 방법, 데이터 분석 결과물을 바탕으로 설득 대상에 따라 효과적으로 의사소통하는 방법, 실제 분석 업무에 적용할 수 있는 단계별 실습 사례, 선형회귀분석을 통한 고객 설득 방법, 수치형/범주형 데이터에 적용하는 추론과 분류예측 방법, 텍스트 데이터에 적용하는 워드 클라우드와 토픽 모델링 방법이 있다. 각 사례 문단 첫번째에 요약이 있어서 핵심 내용을 빠르게 파악할 수 있고 QR코드를 통해 바로 예제 코드가 들어있는 콜랩에 들어갈 수 있어서 빠르게 예제를 실행해볼 수 있다.

 

IMG_4548.JPG

 

 

또 챗GPT를 이용하는 방법 또한 기재되어 있어 어떻게 적용해봐야 하는지 알 수 있다. 아마도 이 책은 파이썬 기초 문법을 알고 데이터 분석을 해본 적 있는 직장인, 상사와 고객을 설득해야 하는 데이터 분석가 기존의 보고 방식을 뛰어넘어 예측 가능하고 선제적인 분석 기법을 알고 싶은 사람, 분석 업무에 챗GPT를 활용하고 싶은 사람, 데이터 분석 자격증과 실무를 동시에 고민하고 있는 사람이 읽는다면 큰 도움이 될 것이다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

#한빛미디어 #이상석 #데이터드리븐 #데이터기반의사결정 #챗GPT #데이터분석

 

[소개]

 

"데이터 드리븐 리포트"는 데이터를 근거로 의사소통해야 하는 모든 실무자를 위한 데이터 기반의 의사결정 가이드이다. 

 

데이터 주도형 보고서 작성에 중점을 둔 책으로, 다양한 산업 분야에서 데이터를 효과적으로 활용하여 의사 결정 및 전략 수립을 수행한 사례를 제시한다. 

 

 

[특징]

 

이 책에서 눈에 띄는 주요 특징은 다음과 같다. 

 

1. 데이터 기초와 이해

 

데이터의 기본 개념과 다양한 유형의 데이터 소스에 대한 이해. 데이터 수집, 정제, 저장 및 관리에 대한 기본적인 개념을 제시한다. 

 

2. 시각화와 효과적인 커뮤니케이션

 

데이터 시각화 기술과 도구를 사용하여 효과적인 보고서 작성. 데이터를 이해하기 쉽게 전달하고 다양한 이해관계자에게 정보를 전달하는 방법을 보여준다.

 

3. 통계 및 분석 기법

 

다양한 통계 및 분석 기법을 활용하여 데이터에서 통찰력을 도출. 효과적인 통계 및 분석 결과를 포함한 의사결정자료 작성 방법을 제시한다. 

 

4. 실전 사례 케이스 스터디

 

실제 비즈니스 케이스를 기반으로 한 데이터 보고서 작성 예시와 그에 따른 결과 해석 및 다양한 업종과 상황에서의 데이터 주도형 접근 방법을 알려준다.

 

 

[소감]

 

데이터 분석에 대해서 대단히 실무적이고 실용적인 접근을 하는 책이다. 

 

이론뿐만 아니라 실제 사례와 함께 실용적인 지침을 제공한다. 또한, 독자가 책에서 배운 내용을 실제 업무에 적용할 수 있도록 돕는다.

 

또한, 다양한 산업 분야에서의 데이터 보고서 작성에 관한 예시와 지침을 다루고 있다. 

 

데이터 분석과 시각화와 관련된 최신 도구와 기술도 소개한다. 

 

현대적인 데이터 시각화 및 분석 도구, 기술, 플랫폼 등에 대한 최신 정보를 제공하며, 독자가 최신 도구를 활용하여 보다 효과적으로 데이터를 다룰 수 있도록 한다. 

 

 

[결론]

 

경험이 풍부한 데이터 전문가의 실무 경험과 교훈을 공유하여 독자들에게 실제 현장에서 어떻게 데이터를 다뤄야 하는지에 대한 인사이트를 제공한다. 

 

이 책은 데이터 분석을 실무에 제대로 적용하기를 원하는 거의 모든 사람들이 많은 것을 얻어갈 수 있는 제대로 된 도서로, 대단히 추천할만한 책이다. 

 

KakaoTalk_Photo_2023-11-26-18-17-40.jpg

 

 

이 책에서 정의하는 ‘데이터 드리분 보고’란 올바른 문제 해결을 위한 문제 정의부터 데이터 수집, 정제, 분석을 거쳐 스토리텔링과 시각화로 설득을 끌어내는 일련의 과정을 말한다.

10쪽, 데이터 드리븐 리포트.

 

 기업에서의 데이터 분석은 점점 더 중요한 위치를 차지하고 있다. 어떤 직급과 업무이든 간에 유의미한 토대가 되지만 상사에게 보고를 하며 설득하는데 있어 중요한 역할을 하는 것이 데이터 분석 결과이기도 하다. ‘데이터 드리븐 리포트’는 단순히 분석을 하는 것뿐 아니라 어떤 데이터를 가지고 어떻게 분석할 것인지, 또 어떻게 해석할 것인지에 대해 설명하고 있다. 보고를 하는 과정에서 필요한 데이터 분석 방식과 커뮤니케이션에 중점을 두고 있다. 데이터 관련 종사자보다는 그 외의 부서에서 데이터를 기반으로 하는 보고를 수행하는 이들이 읽으면 좋겠다는 생각이 든다. 데이터 사이언티스트 독자라면 커뮤니케이션 요소를 주목하는 것도 도움이 될 것이다. 

 

 각 장에서는 실제 회사에서의 데이터 활용 사례와 올바른 접근 방법에 대해 설명한다. 1장 데이터 드리븐 보고에서는 데이터 기반 의사결정 활용 사례에 대해 설명하고, 2장 데이터 드리븐 보고 절차에서는 성공적인 데이터 드리븐 보고를 위한 ON AIR 분석 절차( 목표 설정 - 데이터 설정 - 분석 방법 결정 - 해석 - 보고)를 단계별로 설명한다. 3장 데이터 드리븐 보고 실전 사례 with Chat GPT에서는 실제 비즈니스에 활용되는 데이터셋으로 직접 실습하고 Chat GPT를 통해 파이썬 코드를 작성한다. 4장 데이터 드리븐 커뮤니케이션에서는 설득해야할 대상과의 의사소통 시 점검해야할 체크리스트를 확인한다.

 

 

 

 

과거에는 고려하지 않았던 데이터가 현재는 의사결정에 반영되면서 복잡성이 높아졌다. 글로벌 기업들은 이 복잡성을 관리하고 분석할 수 있는 데이터 드리븐 능력을 앞으로의 시장을 선점하기 위한 가장 중요한 요인으로 보고, 데이터 드리븐 의사결정을 하기 위한 트랜스포메이션을 위해 수조 달러를 투자해왔다.

33쪽, 데이터 드리븐 리포트.

데이터 드리븐 보고는 비즈니스에서 데이터 드리븐 방식으로 의사결정하기 위해 보고하는 절차와 커뮤니케이션을 말한다.

36쪽, 데이터 드리븐 리포트.

 

 데이터 드리븐 보고에는 여섯 가지 유형이 있다. 기초통계, 시각화, 가설검정, 선형회귀분석, 분류예측, 토픽 모델링의 개념을 소개한다. 이후 독립변수와 종속변수, 테이블의 행과 열, 데이터 분리 등 이론적 통계와 분석 시 필요한 개념을 설명한다.

 

 기본 용어 설명과 더불어 파이썬으로 라이브러리를 import하여 데이터셋을 가져와 최댓값 최솟값, 첨도, 왜도 값을 구하는 기본 통계를 실습한다. 상관분석이나 t-검정, 선형회귀분석 등 기본 통계의 간단한 분석들을 살펴본다. 구글 colab을 통한 실습이라 파이썬이나 R을 설치할 필요가 없어 실습을 용이하게 진행할 수 있다.

 

 기본 통계를 살펴본 후 EDA를 수행하여 EDA상에서의 시각화, 결측치/이상치 처리 등에 대해 언급한다. 요즘 핫한 Chat GPT를 활용하여 EDA를 수행하는 방법(히스토그램, xy 플롯 생성 등)에 대해서도 설명하는데 사용자 입장에서 데이터 분석 코드를 받기 타이핑 해야할 문장과 예상 답변을 제공한다. QR코드로 프롬프트 및 결과 또한 설명하여 이해하기에는 어려움이 없었다. Chat GPT로 코드를 받아 활용할 수는 있겠지만 제대로 된 데이터를 받기 위해 잘 유도해야겠다는 생각이 든다.

 

스크린샷 2023-11-27 오후 11.04.10.png

 

책의 가이드 대로 git에 있는 데이터를 불러왔다. pandas 라이브러리를 import하고 데이터프레임을 살펴보았다. 아래 도표는 따로 그린 것이 아니라 colab에서 제공해준 것이라 신기하기도 하고 편리하기도 했다. 

 

스크린샷 2023-11-27 오후 11.18.40.png

 

Chat GPT에서는 간단한 데이터를 제시한 뒤 정규성 검증을 요구했다. 

 

스크린샷 2023-11-27 오후 11.21.16.png

 

알아서 분석부터 print까지 짠 Chat GPT... GPT에서 받은 코드를 colab에서 돌리고 colab에서 받은 결과를 다시 실행시키면 결과도 받을 수 있다. 

 

 

 

 

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

단순히 이 기술 좋아요! 핫!해요 보다 데이터를 이용해서 설득하는 법에 관해 배울 수 있었다. 

 

프로그래밍을 하면서 여러 데이터를 읽고 다루고 통계치를 낼 수는 있어도 어떤 의도를 가지고 설득하는 것은 전혀 다른 영역이었다. 

 

저자는 파이썬 코드와 ChatGPT를 적극적으로 활용해서 여러 종류의 데이터를 내가 원하는 의도에 맞춰서 분석하고 시각화해낸다. 정형/비정형 데이터로 ChatGPT를 사용해 실습을 해보며 이 정도 분석은 나도 할 수 있을 것 같은데..? 라는 자신감을 가질 수 있었다. 

 

4장의 데이터 드리븐 커뮤니케이션 부분에서 많은 팁을 얻었다.

 

나보다 내 보고 주제를 아는 사람이 없으므로 중요 수치 및 지표 암기하기, 처음 보는 사람에서 질문 생각하기

현재 보고 상황 (ex. 상사가 보고 내용을 잘 알고 있으나 동의하지 않는 경우인가? 보고 내용을 처음 접하는가 등)에 따라 다르게 생각할 것들 등

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

오늘 리뷰할 책은 [데이터 드리븐 리포트] 입니다.

https://www.hanbit.co.kr/store/books/look.php?p_code=B5932813354

1-표지 IMG_20231126_185945.jpg

 

 

저도 데이터 관련 일을 꽤 했었던지라 이 책을 보게 되었네요.

일단 분량은 400 페이지 정도로 큰 부담 없습니다.

그런데 위 링크에 가보시면 이 책은 중급용 으로 표시되어 있습니다.

그 이유는... 이 책은 데이터 분석을 위한 기본서가 아닙니다.

데이터를 다루는 세세한 내용에 대해서는 다루고 있지 않으며,

살짝 큰 그림을 바라보는 입장? 이랄까... 이런 내용들이 더 많아 보입니다.

이 책을 보기 위해서는 구글 코랩/주피터 노트북은 기본적으로 다룰 수 있어야 합니다.

파이썬에 대한 기본적인 문법 설명 따위는 없으니 다른 책을 참고하세요.

아래 내용에서도 나오듯이 의사결정자에게 질문하라,

즉 데이터/리포트를 보는 사람에게 질문을 많이 하라는 내용입니다.

기술적인 설명이 아니라, 현장 경험에서 얻을 수 있는 조언들입니다.

 

2-의사결정자 IMG_20231126_190133.jpg

 

그렇다고 기술적인 내용들이 아주 없는건 아닙니다. 그리고 데이터를 다루는 기본이 되는 통계적인

내용들에 대해서도 설명들이 많이 있습니다. 저도 예전에 공부하다가 왜도? 라는 내용이 나오길래

뭔가 찾아봤던 기억이 있는데 이 책에 마침 그림과 함께 설명이 나와 있드라구요.

 

3-왜도 IMG_20231126_190344.jpg

 

이 책의 좋은 점은 제가 늘 강조하는 컬러판이라는거!

모든 그림이 컬러로 인쇄되어 있어서 가독성이 아주 좋습니다.

그리고 이 책은 올해 한참 유행하는 챗GPT를 함께 사용하는 것을 다룹니다.

개발을 직접 했던 입장에서는 얼마나 도움이 될지는 모르겠지만,

비개발자라면 챗GPT를 사용하는게 상당한 도움이 되겠네요.

 

4-프롬프트 IMG_20231126_190423.jpg

 

책의 내용 대부분이 영어로 된 데이터를 다루고 있어서 좀 아쉬웠는데, 뒷부분에 한국어 데이터를 다루는 내용들도 있네요. 이 부분은 꼭 보시길 권합니다.

 

5-한글 IMG_20231126_190724.jpg

 

 

정리하면, 이 책은 데이터 분석을 주로 하고 C 레벨급들에게 보고를 하는 사람들에게 적당한 책으로 보입니다.

기술적으로 세세한 내용들은 제외하고,

데이터 기반 리포트를 다루는 내용들만 잘 정리 되어 있는 좋은 책이라 추천 하고 싶네요.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

데이터 드리븐 보고가 의사결정의 설득을 위한 것이라면 데이터 드리븐 커무니케이션의 핵심은 바로 인사이트가 있는 스토리를 전달하는 것이다.

 

모든 보고서는 또는 커뮤니케이션의 핵심은 전달이 핵심이 아니라 설득이다.

 

이를 위해 스토리를 만들어야 하는데, 여기에 AI를 잘 적절히 포함하는 방법을 이 책을 통해. 배울 수 있다.

당연히 인공지는 프로그래밍의 기본인 파이썬과 통계기술, 그리고 기본적인 인공지능 모델을 배울 수 있다.

무엇보다도 line by line으로 잘 정리된 내용은 사용자 수준을 넘어 누구나 쉽게 이해하고 또한 응용 할 수 있는 방법으로 구성된 점이 훌륭하다.

 

 

최대한 빨리 데이터를 정리하고 포토폴리오에 업데이트 하기를 원하는 모든이에게 감히 추천한다.

 

 

    "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

 

 

KakaoTalk_20231126_190928130_01.jpg

 

KakaoTalk_20231126_190928130.jpg

 

 

소개

"데이터 드리븐 리포트"는 실무 중심의 데이터 분석에 깊이 있는 내용을 담은 책으로, 저자의 풍부한 경험과 이론적 지식을 토대로 체계적이고 자세한 데이터 분석 소개를 제공합니다. 이 책은 데이터 분석을 시작하는 사람들을 위한 가이드로 파이선 프로그래밍, 통계학, 머신러닝, 딥러닝 등 다양한 주제를 아우르고 있습니다.

 

 

 

목차

1장. 데이터 드리븐 보고

  • 소개: 일상에서 데이터를 활용한 의사결정 사례 소개
  • 적용 분야: 데이터 드리븐 의사결정이 비즈니스에 미치는 영향

2장. 데이터 드리븐 보고 절차

  • ON AIR 분석 절차: 성공적인 데이터 드리븐 보고를 위한 단계별 절차 설명

3장. 데이터 드리븐 보고 실전 사례 with 챗GPT

  1. 행복 지수 분석: 국가별 행복지수와 영향을 미치는 변수 분석
  2. 인력구조 예측: 중장기 회사의 인력구조 예측, 분석, 시각화
  3. 마케팅 효과 분석: 광고 플랫폼 최적화를 위한 마케팅 효과 분석
  4. 유학 컨설팅: 해외 대학 합격률 분석 및 컨설팅 방향 제시
  5. 당뇨병 예측모델: 예방 솔루션을 위한 당뇨병 예측모델 수립
  6. 설문조사 분석: 전 직원 대상 설문조사의 서술형 응답 분석

4장. 데이터 드리븐 커뮤니케이션

  • 체크리스트: 데이터 기반 의사소통 시 확인해야 할 사항 체크리스트
  • 맞춤형 커뮤니케이션: 보고 대상자에 따른 맞춤형 의사소통 방법 안내

 

추천

"의사 결정에 있어 개인의 경험이나 직관이 아닌 객관적인 데이터를 기반으로 하는 의사결정이 필요한 분들에게 이 책을 적극 추천합니다. 현실적이고 체계적인 데이터 분석의 시작을 지원하며, 다양한 주제를 아우르고 있어 전공자와 비전공자 모두에게 유익한 내용입니다."

 

 

 

 
 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

그리하여 저는 최대한 이 책이 어떻게 정리되어 있는지 펼쳐드리는 역할을 하도록 하겠습니다.

내용을 보시고 도움이 될것 같으면 구매해서 보시면 되지 않을까 싶네요.^^

 

1. 다루는 내용 

데이터에 기반한 보고 방법 

구글 콜랩, 파이썬, 챗GPT를 실제 보고에 활용하는 방법 

보유한 데이터 특성에 따른 적절한 데이터 분석 기법 선정 방법 

데이터 분석 결과물을 바탕으로 설득 대상에 따라 효과적으로 의사소통하는 방법 

실제 분석 업무에 적용할 수 있는 단계별 실습 사례

선형회귀분석을 통한 고객 설득 방법 

수치형, 범주형 데이터에 적용하는 추론과 분류예측 방법 

텍스트 데이터에 적용하는 워드 클라우드와 토픽 모델링 방법 

 

2. 대상 독자 

파이썬 기초 문법을 알고 데이터 분석을 해본 적 있는 직장인

상사와 고객을 설득해야 하는 데이터 분석가

기존의 보고 방식을 뛰어넘어 예측 가능하고 선제적인 분석 기법을 알고 싶은 사람 

‘해봤는데 안 돼’,‘예전에 검토해봤어’ 등의 이유로 상사에게 거절당한 경험이 있는 사람 

분석 업무에 챗GPT를 활용하고 싶은 사람 

데이터 분석 자격증과 실무를 동시에 고민하고 있는 사람 

 

3. 책의 구성

1장 데이터 드리븐 보고

   일상에서 데이터를 기반으로 의사결정하는 사례를 소개하고 데이터 기반 의사결정이 비즈니스에 어떻게 활용되는지 알아본다.

   데이터 드리븐 보고가 비즈니스에 어떻게 적용되는지 살펴본다.    

2장 데이터 드리븐 보고 절차  

   성공적인 데이터 드리븐 보고를 위한 ON AIR 분석 절차(목표 설정 - 데이터 선정 - 분석 방법 결정 - 해석 - 보고)를 단계별로 설명한다.

3장 데이터 드리븐 보고 실전 사례 with 챗GPT 

   실제 비즈니스에 활용되는 데이터셋을 통해 데이터 형식과 보고 목적이 각각 다른 여섯 가지 사례를 직접 실습한다.

   사례별로 챗GPT를 활용하여 코딩에 대한 지식 없이도 파이썬 코드 작성할 수 있도록 했다. 

   - 행복에 영향을 미치는 변수와 국가별 행복지수 분석하기 

   - 회사의 중장기 인력구조 예측, 분석, 시각화하기 

   - 마케팅 효과 분석 및 최적의 광고 플랫폼 찾기 

   - 유학 컨설팅을 위한 해외 대학 합격률 분석하기 

   - 당뇨병 예측모델 수립 및 사전 예방 솔루션 제공하기 

   - 전 직원 대상 설문조사의 서술형 응답 분석하기 

4장 데이터 드리븐 커뮤니케이션

   분석 결과로 상사 혹은 고객을 설득해 원하는 결과를 얻는 것은 분석 과정 만큼이나 중요하다. 

   데이터를 기반으로 의사소통할 때 꼭 점검해야 할 체크리스트를 안내한다.

 

5. 개발 환경 

   구글 콜랩 기본 설정인 파이썬 3.10.12 버전(23.9.27 기준)으로 집필했다.

   독자 여러분의 사용하는 로컬 컴퓨터의 파이썬 버전 혹은 라이브러리 설치 유무에 따라 실행 결과가 책의 내용과 다를 수 있으니 참고하길 바란다. 

 

6. 예제 다운로드 

   실습에 필요한 예제 파일은 아래 깃허브를 통해 내려받을 수 있다. 

   구글 콜랩에서 실행하는 과정은 3장 각 절에서 안내하는 QR 코드를 참고하여 진행할 수 있다. 

   https://github.com/sangsucki/DataDrivenReport 

 

7. 소감

- “AI는 당신을 대체하지 않는다. AI를 사용하는 사람이 당신을 대체할 것이다.” - 산티아고 발다라마  

- 우선 이 책의 가장 큰 장점은 업무를 조금이라도 경험을 해봤던 사람들이라면 실질적으로 접근하고 생각할 수 있게 유도하고 있다는 점이다. 

- 요즘의 책들이 어떤 것들은 사례만 집대성해 놓고 분석을 해놓는 것도 있는데 그런 것들은 이론상으로는 알겠지만 실질적으로 적용하기가 힘든데 그런 부분에서 데이터를 분석하고자 하는 사람들이 접근하기 친근한 책인 것 같다. 

- 그리고 개인적으로는 데이터 분석 성숙도 모델이 잘 정리가 되어 있어 참 좋은 것 같다. 

   코드화 - 수집 - 처리 - 모델 - 설명 - 해석 - 처방 

   이런 식으로 놓고 실무를 처리하는 것도 좋은 것 같고, 기술적으로도 보면 어떤 기술을 이 시점에 적용해야 할지도 정리가 되는 것 같아 아주 인상적이다. 페이지가 공개되어 있지 않아 일단은 텍스트로만 정리를 해봤다. 

- 그리고 보고 대상자에 따라 어떤 식으로 보고를 해야할지도 설명하고 있는데 이것은 마치 어떤 사람에게 조언을 할 때 그 사람에 맞는 조언을 하는 것이 가장 좋은 것과도 일맥상통한다. 

- 모든 사람에게 똑같은 조언을 하면 안되는 것처럼 보고도 보고 받는 사람의 입장에 맞게 이야기를 하고 있는 점도 실무를 하고 있는 사람들에게 매우 도움이 되는 것 같다. 

- 그리고 구글 콜랩의 사용방법도 잘 설명이 되어있어 구글 콜랩 사용방법을 혹시라도 모르는 분들은 일단 그것을 살펴본 후에 챗GPT를 활용하는 장을 보면 좋을 것 같다. 

- 또한 데이터 드리븐 커뮤니케이션의 필요성에서 타이밍이 중요한 이유가 나오는데 보고를 할 때도 상사에게 그 보고가 필요한 시점이 있다. 그 시기가 지나면 보고 하고도 욕을 먹을 수도 있다. 인생사 다 모든 게 타이밍이다.

- 그리고 같은 데이터를 보더라도 지금 내가 해결하려고 하는 것이 어떤 것이냐에 따라 분석하고 처리하고 대응하는 결과가 달라진다. 많은 경험을 통해 하나만 정답이라는 생각을 갖지 말고 이렇게도 될 수 있고 저렇게도 될 수 있다는 생각을 하는게 중요하고, 자신만의 깊은 통찰력이 중요함을 이야기 하고 있다. 

그 통찰력을 결국에는 다른 사람에게 전달을 해야 하기 때문에, 전달할 때 스토리를 어떻게 만들어서 전달을 하느냐에 따라 전달력이 달라지기 때문에 이런 스토리 텔링 능력이 중요하다고 이야기하고 있다. 

- 예를 들면 자바에서 상속을 이야기 할때, 코끼리, 아시아 코끼리, 아프리카 코끼리 이렇게 설명을 하면 이해를 못하는 사람들도 있지만, 커피, 아메리카노, 라떼 이렇게 설명하면 이해를 하는 사람이 많은 것처럼 어떤 스토리로 만들어내느냐가 매우 중요하다고 이야기 하고 있다. 

- 프로그래밍을 배우지 않았던 사람이 시각적인 데이터를 보고, 챗GPT를 활용해서 인사이트를 키우는 경험을 하기에 매우 좋은 책이라고 생각한다.

기본적으로 프로그래밍을 안해봤던 사람이 프로그래밍을 잘해보고 싶지만 막상해보면 어려움에 봉착하게 되는게 그때 가장 쉽게 접근할 수 있는 언어가 파이썬이 아닌가 싶다. 그리고 인공지능까지 활용할 수 있는 방법까지 나오기 때문에 python 잘모르고 연습하고 싶은데 그냥 따라서 해보고 데이터 분석도 해보고 싶은 사람들에게 딱 알맞는 책이 아닌가 싶다. 

- 그리고 컬러로 되어 있어서 이해도 잘되는 편이고, 저자가 데이터에 노력을 많이 하신 것 같고, 글도 쉽게 잘 읽히는 것같다. 어떤 저자들은 이공계적인 글쓰기를 통해 무슨 말인지는 알게는데 어려워서 이해하는데 오래 걸리는 책이 있다면 이 책은 글도 쉽게 읽히는 것 같다. 물론 개인차는 있겠지만, 데이터 분석을 경험하기에 전천후로 좋은 책이라고 생각한다. 

데이터 분석은 꼭 분석가 직군 뿐만 아니라 비즈니스나 경영, 학술 등 분야를 막론하고 필요한 스킬이지 않을까 싶다. 평소 데이터 분석에 관심이 많고 다양한 데이터를 다루다 보니 관심있게 보게 된 책이기도 하다.

 이미지 출처 : generated by OpenAI’s DALL-E

 의사결정의 정확성, 시장 트렌드 파악, 고객 이해, 효율성 및 생산성, 위험 관리, 혁신 촉진, 규제 준수 등 다양한 비즈니스 환경에서 데이터를 활용한 비즈니스 성장 전략이 공유되고 있고 또 어느 때보다 데이터가 넘쳐나는 시대이지 않을까 싶다.

 이 책은 비즈니스 환경에서 데이터 기반 의사결정의 중요성을 강조하며, 실제 업무에 적용할 수 있는 구체적이고 실용적인 지침을 알려준다.

 이미지 출처 : generated by OpenAI’s DALL-E

 데이터 분석의 기초부터 시작하여, 구글 콜랩, 파이썬, 챗GPT 같은 도구를 활용하는 방법을 쉽게 설명한다. 다양한 데이터 유형(수치형, 범주형, 텍스트 등)에 대한 분석 방법과 이를 활용한 설득 전략을 제시하여 데이터 분석 초보 뿐만 아니라 현업 전문가에게도 가이드를 제공한다.

 선형회귀분석, 워드 클라우드, 토픽 모델링 등을 포함한 분석 기법이 실제 사례를 통해 설명되어 있어, 어려운 모델링 기법을 이해하고 적용하기 위한 이론과 실제 사이의 간극을 잘 메워주고 있기도 하다.

 이 책은 데이터 기반 보고 방법, 구글 콜랩과 파이썬을 활용한 실제 보고 방법, 그리고 챗GPT를 포함한 다양한 도구들을 실제 보고에 어떻게 활용할지에 대한 내용을 다룬다. ChatGPT를 활용한 프롬프트 작성법을 통해 원하는 결과를 얻기 위해 어떻게 질문하고 활용해야 하는지에 대한 구체적인 접근법을 제시해 주기 때문에 막상 프롬프트와 마주했을 때 어떤 질문을 해야할지 모르겠다면 이 가이드를 참고해 보는 것도 좋겠다.

 데이터 특성에 따른 분석 기법의 선택, 데이터 분석 결과물을 효과적으로 의사소통하는 방법, 선형 회귀분석을 통한 고객 설득 방법, 수치형과 범주형 데이터의 추론과 분류예측 방법, 텍스트 데이터의 워드 클라우드와 토픽 모델링에 대한 내용을 통해 정형 데이터 뿐만 아니라 비정형 텍스트 분석을 파이썬 라이브러를 통해 코드 몇줄로 구현할 수 있는 방법을 제시한다.

 데이터 분석에 대한 전반적인 내용을 비즈니스 사례에 적용가능하도록 작성된 책으로 의사결정에 가이드가 되는 분석을 하는 노하우와 팁을 얻을 수 있는 책이다.

 

 

다음 내용 구성으로 데이터 분석 뿐만 아니라 의사결정과 설득을 위한 데이터 분석 기법에 대해 고민해 보기에 좋은 책이었다.

 

1장. 데이터 드리븐 보고

일상에서 데이터를 기반으로 의사결정하는 사례를 소개하고 데이터 드리븐 의사결정이 비즈니스에 어떻게 적용되는지 알아본다.

 

2장. 데이터 드리븐 보고 절차

성공적인 데이터 드리븐 보고를 위한 ON AIR 분석 절차를 단계별로 설명한다.

 

3장. 데이터 드리븐 보고 실전 사례 with 챗GPT

실제 비즈니스에 활용되는 데이터셋을 통해 데이터 형식과 보고 목적이 각각 다른 여섯 가지 사례를 실습한다.

  • 행복에 영향을 미치는 변수와 국가별 행복지수 분석하기
  • 회사의 중장기 인력구조 예측, 분석, 시각화하기
  • 마케팅 효과 분석 및 최적의 광고 플랫폼 찾기
  • 유학 컨설팅을 위한 해외 대학 합격률 분석하기
  • 당뇨병 예측모델 수립 및 사전 예방 솔루션 제공하기
  • 전 직원 대상 설문조사의 서술형 응답 분석하기

4장. 데이터 드리븐 커뮤니케이션

데이터를 기반으로 의사소통할 때 꼭 점검해야 할 체크리스트와 보고 대상자에 따른 맞춤형 커뮤니케이션 방법을 안내한다.

이 리뷰는 한빛미디어의 나는 리뷰어다 이벤트를 통해 책을 제공받아 작성했습니다.

 

일반적인 데이터 분석내용 보다 두걸음 앞선 실제 실무 내용들을 다루고 있습니다. 

때문에 파이썬 기초 및 통계 기초에 대해서 간단하게 선행학습을 한 뒤 이책을 보게 된다면

실무에 바로 적용하여 활용할 수 있을 정도로 도움이 많이 될 것입니다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다"

 

 

의사결정, 설득력의 필요성을 느꼈을 때

학교에서 건축 설계 수업을 들을 때 굉장히 어려운 질문을 받을 때가 있었다.

“근거가 뭐야? (이거 왜 그래야해?)”

“그 컨셉에서 나온 이 단어의 정의는 뭐야?”

진땀이 빠진다. 만약 데이터를 가져갔는데 교수님의 마음에 안든다면 (예를 들면 “나는 그렇게 생각하지 않는데?”)

사례를 가져가면 반례를 들어버리면 정말 난감하다.

노년층의 요양과 여가 관련한 시설을 설계 수업에 진행했을 때는 “요양이 뭐야?” 같은… 질문을 들으면 그 뒤에 나올 많은 데이터, 사례, 설계 자료들이 무너지는 경험을 하게 됐다.

그래서 나는 늘 논리는 의외로 수학적으로만 딱 떨어지지 않을 수 있다는 생각을 해왔다. ‘아’와 ‘어’는 다르고 교수님의 기분과 컨디션에 따라서 그 논리가 통과가 될 때도 있고 아닐 때가 있다. 발표하는 나의 말투, 옷차림, 제스쳐도 의외로 영향이 가곤 했다. 논리를 증명하는 것이 아니라 설득하는 과정이기 때문인 것 같다.

이런 무시무시한 일을 당한 나의 의문에 이유를 찾게 해준건 개발, 데이터 관련 책인 데이터 드리븐 리포트인 것 같다.

이 책에서 다루는 내용

데이터 드리븐 의사결정의 중요성을 다룬다.

데이터가 어떻게 의사결정 과정을 개선할 수 있는지, 그리고 이 접근법이 가져오는 효과가 어떤지 알 수 있다.

데이터 리포트의 오해와 실체, 그리고 접근법을 다룬다.
이런 일종의 리포트 '방법론'을 통해서 제공하는 가치. 그리고 이런 데이터에 대한 오해를 알려준다. 내가 리뷰글 초반에 생각했던 고민에 답을 찾는데 큰 도움을 얻었다.
그리고 이러한 데이터를 활용한 접근법, 원칙, 절차에 대해서 알려준다. (파이썬을 통해 만든 그래프로 인사이트를 얻어내는 과정을 알려준다.)

커뮤니케이션과 스토리텔링에 대해서 다룬다.
데이터 기반 리포트는 논증이 아니라 듣는 이(상사, 교수, 클라이언트같은...)를 설득하는과정이 되어야한다. 데이터에 대해서 받아들일 수 있도록 하기 위한 커뮤니케이션, 이해하기 쉽도록하는 스토리 텔링에 대한 인사이트를 다룬다.

의견에 설득력을 주는 것은 데이터

책의 초반 부분에 전무에게 보고하는 내용이 나오는데, 꽤나 자주 겪었던 이야기여서 공감을 하고 시작할 수 있었다.

내가 느꼈던 것은 이 2가지였고 극복하기 위해선 데이터를 통한 설득이 필요하다.

  • **내가 갖고 있는 편향성, 편승 효과로 인해서 내 시야를 가리기도 한다.
  • **상대방의 확증 편향에 의해 내 의견이 반려당하거나 의외로 쉽게 통과되기도 한다.

편향성의 예

화자 : "채널 A, B에만 집중했던 기존 전략과 차별화하기 위해 이번에는 획기적으로 채널 C에 전폭 집중하려고 합니다." → 친혁신 편향 (혁신의 중요성을 과대평가하고 반대로 단점을 과소평가하는 경향)

화자 : (5년 전에 채널 C가 효과가 없었다라는 피드백에 대해서) "그래도 요즘 MZ 세대에서는 채널 C의 효과가 가장 좋다고 합니다. 5년 전과는 확실히 다른 결과를 전망합니다." → 편승 효과 (대중적으로 유행하고 있다는 정보의 선택에 더욱 힘을 실어주는 효과)

전무 : "MZ세대에게 효과가 좋은 것이 장기적으로 우리 회사 브랜드에 도움이 되는 건가요? 5년 전과 다른 결과를 전망하는 근거가 무엇인가요?" → 확증 편향 (가설의 진위를 가리거나 문제를 해결할 때 자신의 신념과 일치하는 정보만 취하고 상반되는 정보는 무시하는 무의식적 사고 경향)

데이터 드리븐 의사결정을 위해 필요한 4가지

  • 숫자 : 숫자가 들어가면 신뢰도가 높아지고 데이터를 통한 의사결정에 도움을 준다. 그러나 이 숫자를 통해 어떤 인사이트를 줄 것인가는 필요하다.
  • 도구 : 화려하게, 복잡한 문제를 풀어내는 것은 설명이 어려워진다. 짧은 시간 내에 의사결정을 위해서는 의사결정자가 한 번에 이해할 수 있는 보고를 위해서 필요하다.
  • 도메인 지식 : 그저 데이터를 읽는 행위를 넘어서 인사이트를 끌어내기 위해서는 배경지식이 필요할 수 밖에 없다.
  • 직관 : 최종 결정은 항상 직관적이다. 과거의 경험을 현재의 의사 결정에 연결하는 방법이기 때문에 배제해서는 안되는 항목이다.

→ 이 4가지 항목을 무기로 커뮤니케이션과 스토리텔링을 버무리면 너무 좋은 리포트가 된다.

후기

내가 갖고 있던 고민인 설득력을 어떻게 보여줄 것인가를 책으로 읽을 수 있었다. 내가 갖고 있는 생각이 그냥 의견을 넘어서 설득력을 갖는 배경이 될 수 있을 것 같다.
논리적인 의사결정, 그리고 듣는 이가 호의적인지, 반발심을 갖고 있는지에 따른 커뮤니케이션 방법도 알려주는 세심한 내용이 나오기 때문에 나같은 귀여운 초보들에게 알려주는 선배의 조언이라 느꼈다.

결국 개발도 의사결정도 사람이 한다. 이 점을 잊지 않아야한다는 것을 이 책을 통해 알 수 있었다.

그리고 저번에 읽었던 앤서블 책도 그렇고 ChatGPT를 활용한 코드 작업(그래프를 만들어줘!) 같은 방법이 책에서 나오게 되는데, 이젠 AI에게 단순 작업을 위임하는 방식이 대중화되고 있음을 느낀다.

안녕하세요 마개입니다.

이번 달에 소개해 드릴 책은 "데이터 드리븐 리포트, 상사와 고객을 설득하는 데이터 기반의 의사결정 with 파이썬"입니다. 해당 책에 대해 알아봅시다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

도서 소개

● 도서명 : 데이터 드리븐 리포트, 상사와 고객을 설득하는 데이터 기반의 의사결정 with 파이썬

● 지은이 : 이상석

● 출판사 : 한빛미디어

● 출간 일자 : 2023-10-31

● 페이지 : 408쪽

● 가격 : 정가 33,000원

 

해당 책을 보면서 많은 공감을 할 수 있었습니다. 기존에 책들은 데이터 분석의 하드 스킬을 많이 다룬다고 하면 이 책은 하드 스킬뿐만 아니라 소프트 스킬도 다루어 회사에서 바로 적용해 볼 수 있을 만큼 정교하게 지식을 공유해 주고 있습니다. 회사에서 의사결정을 할 때 왜 데이터를 기반으로 의사결정을 해야 하고 같은 데이터를 이용하여 보고하더라도 어떻게 더 효율적이고 효과적으로 보고할 수 있는지 등 여러 고민을 담은 책이라고 생각됩니다.

데이터 분석을 하는데 필요한 순서의 절차를 알려주고 해당 절차에서 각 단계에서 해야 할 내용도 같이 공유하고 코딩이 익숙하지 않은 사용자들을 위해 ChatGPT를 이용하여 코딩하는 방법도 직접 보여주고 있습니다. 그리고 모든 상황을 제시하여 해당 상황을 해결해나가는 방식으로 진행되어 더 이해하기 쉽고 실생활에서 경험해 볼 만큼 공감이 되도록 잘 설명해주고 있습니다. 데이터 분석을 하는데 하드 스킬이 있지만 실생활에서 어떻게 이용해야 할지 모른다면 이 책을 강력 추천합니다.

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.
이상석 지음

 데이터 드리븐 리포트 책을 처음 봤을 때, 소제목이 굉장히 매력적으로 다가왔습니다. 상사와 고객을 설득하는 데이터 기반의 의사결정은 데이터분석가에게 회사 생활에서 가장 중요한 부분이라고 생각합니다. 데이터 분석가는 늘 많은 데이터 속에서 새로운 인사이트를 찾아내지만, 이 내용을 어떻게 효과적으로 전달할 지 고민하는 경우가 많습니다. 개인적으로는 저처럼 주변 동료들이 데이터 전문가보다는 도메인 전문가들이 많은 곳은 더더욱 중요한 것 같습니다.

1. 대상 독자

 이 책은 의사결정을 위해 다양한 데이터를 사용하고 분석하시는 분들에게 도움이 될 만한 책이라고 생각합니다. 당연히, 파이썬을 다루시는 분이라면 더 잘 이해가 되고 도움이 많이 되실 것입니다. 그럼에도 데이터를 통해 효과적으로 보고서를 작성하고 싶으신 분들에게도 도움이 될만한 것이 많이 있습니다. 한 예로, 책의 내용을 살펴보다보면 독자가 matplotlib이라는 시각화 라이브러리를 몰라도, gpt를 활용해서 효과적으로 시각화하는 방법을 알려줍니다.
 특히나, 책에서는 다양한 상황을 가정하여, 회사에서 일어날 법한 대화들을 통해 어떻게 효과적으로 전달할 수 있는 지에 대해서 소개하고 있습니다.

2. 책의 내용 및 장단점

책의 목차는 다음과 같습니다.

  • 1장. 데이터 드리븐 보고
    • 일상의 보고 상황
    • 데이터 드리븐 의사결정이란
    • 데이터 드리븐 보고란
    • 데이터 드리븐 보고 5원칙
  • 2장. 데이터 드리븐 보고 절차
    • 데이터 드리븐 보고 전략
    • 분석 전 알아야 하는 용어
    • 분석 목표 설정
    • 계획서 작성
    • 데이터 선정
    • 분석방법 결정 및 해석/검증
    • 보고 대상자에 따른 보고 방식
  • 3장. 데이터 드리븐 보고 실전 사례 with 챗GPT
    • 데이터와 친해지자: EDA & 기술통계
    • 데이터도 백문이 불여일견: 데이터 시각화
    • 당신의 질문에 데이터가 답한다: 가설검정
    • 데이터에 맞는 직선을 찾아라: 선형회귀분석
    • 합격이냐 불합격이냐: 분류 예측
    • 대량의 텍스트 데이터를 이해하다: 토픽 모델링
  • 4장. 데이터 드리븐 커뮤니케이션
    • 데이터 드리븐 커뮤니케이션의 필요성
    • 데이터 드리븐 커뮤니케이션 구성요소
    • 데이터 드리븐 커뮤니케이션 방법
    • 스토리텔링
    • 데이터 드리븐 커뮤니케이션 체크리스트
  • 부록
    • 구글 코랩 시작하기
    • 라이브러리 설치하기
    • 데이터 훑어보기

 파이썬에 익숙하지 않고, 데이터 분석을 해보지 않으신 분이라면, 2장에서 기본적인 내용에 대해서 소개하고 있으니, 그것들을 참고하면서 읽어보시면 도움이 많이 될 것 같습니다. 주의해야할 점은 회사의 데이터로 직접 적용을 시키고자 한다면, 3장에서 챗GPT에 고스란히 데이터를 넣는 것은 위험할 수 있습니다. 일부 변환시키거나 동일한 포멧이지만 임의의 숫자를 넣은 데이터로 변경한 뒤 활용하시는 것을 추천드립니다.

 이 책을 읽으면서 가장 좋았던 일부분을 발췌했습니다. 단순히 결과만 도출하는 것에서 끝나는 것이 아니라, 어떤식으로 해석하고, 인사이트를 줄 것인지에 대해 디테일하게 적힌 부분이 좋았습니다.

 또한 다양한 시각화를 진행할 때, 어떻게 전달하느냐에 따라 어떤 차트를 사용하는 것이 좋을 지를 알려주는 내용도 포함되어 있습니다. 이러한 내용은 특히나 초년생인 데이터 분석가들에게는 도움이 많이 되는 부분이라고 생각합니다.

 당연하게도, 어떻게 전달하느냐에 초점이 맞춰져있다보니, 깊은 분석 방법들을 다루지는 않습니다. 그럼에도 데이터분석가라면 한번 쯤은 반드시 읽어보면 좋을 책임은 분명한 것 같습니다. 단순하게 팩트만 전달하는 사람들에게 좋은 가이드가 될 수 있을 것 같습니다.

 

3. 총평

 많은 초년생 분석가들은 다양한 데이터 중에서 어떠한 내용을 강조시켜야할 지, 어떻게 내용을 전달할 지에 대한 고민을 많이 하고 계실 것 같습니다. 데이터 드리븐 리포트는 이러한 궁금증에 대해 어느 정도 해소시켜줄 수 있는 책이라고 말할 수 있습니다. 이론만 주구장창 들어있기보다는 실제 상황을 가정해서 기술하고 있어서, 생각보다 쉽게 읽어지는 책입니다. 이 책은 실무에서 충분히 도움될 수 있는 책이므로 꼭 한번쯤은 읽어보시기를 추천드립니다. 비록 다양한 통계적인 기법 부분에서는 부족한 부분이 있으나, 그런 것들을 어떻게 활용해서 근거자료로 사용하게 되는 지를 알려주는 책입니다. 지식의 깊이보다는 실제 업무 과정 속에서 어떻게 해야 하는가에 집중해보면서 읽으시면 많은 도움이 될 것 같습니다.

도서명: 데이터 드리븐 리포트

출판사: 한빛미디어

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

요약

상사나 고객을 설득하기 위한 데이터 기반의 리포트

- 데이터 드리븐 보고란?

- 데이터 드리븐 보고를 위한 절차

- 데이터 드리븐 보고의 실전 사례

- 데이터 드리븐 커뮤니케이션

 

 

후기

몇년 뒤면 직장 생활을 한지 20년이 된다.

직장생활을 하면서 많은 회의를 진행하며, 필요에 따라 상사나 타부서 또는 고객을 설득해야 하는 경우가 많다.

이러할 때 가장 중요한 것이 자료를 기반으로 한 설득이며, 자료는 객관적인 자료이며 상대방이 납득할 수 있는 자료이어야 한다.

 

'데이터 드리븐 리포트'는 이러한 데이터 기반의 보고에 대한 책이다.

다만, 단순히 데이터를 기반으로 한 보고서를 넘어서

ChatGPT를 활용한 보고서 작성이나, 선형회귀분석, 분류예측 같은 ML적인 요소들도 다룬다.

또한 데이터를 어떻게 보여 주는지가 중요하기에 데이터의 시각화에 대한 내용도 포함이 되어 있다.

(개인적으로는 데이터도 중요하지만 데이터를 시각화 하는 인포그래픽도 굉장히 중요하다고 생각한다.

회사 내 고위직이나 중요 고객에 대해서는 많은 표와 데이터보다 적절한 인포그래픽이 훨씬 더 많은 것을 전달할 수 있다.)

 

추가로 커뮤니케이션에 대한 내용도 포함이 되어있다.

이 책의 목적 자체가 상사나 고객을 설득하기 위함이다.

설득을 하기 위해서는 어떠한 데이터를 추출하여 어떻게 시각화를 하고,

어떠한 도구를 써서 표현을 하며, 스토리텔링을 어떻게 할지에 대한 것을 다룬다.

아마 한국 사람들이 가장 어려워 하는 부분일 것이라 생각된다.

직장생활을 하다보면 아는 것은 많은 데, 그것을 정리하고 표현을 하는데 있어서 잘 못하는 사람을 많이 보곤 한다.

 

 

추천

직장인이면서 보고와 설득을 하기 위한 업무가 많은 사람

파이썬, ML, ChatGPT 등에 대해서 기초적인 지식을 갖고 있는 사람

데이터의 처리와 표현에 대해서 어려움을 겪는 사람

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

	

《데이터 드리븐 리포트》는 데이터 분석 실무에 중점을 둔 심도 있는 내용으로 구성된 책으로, 저자의 풍부한 경험과 이론적 지식을 통해 데이터 분석에 대한 체계적이고 자세한 소개를 제공합니다. 이 책은 데이터 분석을 공부하는 사람들에게 추천합니다.

책은 데이터 분석을 시작하는 사람들을 위한 책으로, 파이선 프로그래밍 언어와 통계학, 머신러닝, 딥러닝 등 다양한 주제를 아우르고 있습니다. 저자는 처음에 파이선이라는 프로그래밍 언어부터 시작하여, 통계학적 개념, 머신러닝 알고리즘, 딥러닝의 작동 원리, 신경망의 종류와 언어 등 다양한 주제를 다루고 있습니다.

주요 내용

데이터 드리븐 보고 : 책의 첫 장에서는 데이터 드리븐 보고의 개념과 5가지 원칙에 대해 설명합니다. 특히, 설명 가능성과 중립성, 문제 정의의 중요성, MVP 개념, 추론과 예측의 차이 등을 강조하며 데이터 드리븐 보고의 핵심을 소개합니다.

데이터 드리븐 보고 절차 : 두 번째 장에서는 데이터 분석을 위한 절차를 상세하게 설명합니다. 분석 목표 설정의 중요성과 실제 데이터 수집, 전처리, EDA, 시각화에 대한 실전적인 내용을 다루면서 이론을 실제 데이터와 코드를 통해 더욱 쉽게 이해할 수 있도록 합니다. 다만, 혼동 행렬에 대한 내용에서 일부 불일치가 있어 수정이 필요할 것으로 언급되었습니다.

데이터 드리븐 보고 실전 사례 with 챗GPT : 세 번째 장에서는 데이터 분석 기획부터 보고까지의 프로세스를 A부터 Z까지 다루며, 최근의 트렌드에 맞게 챗GPT와 같은 기술을 활용한 실습 사례를 제시합니다. 이를 통해 최신 동향을 반영하면서도 실무적인 능력 향상을 도모합니다.

데이터 드리븐 커뮤니케이션 : 네 번째 장에서는 데이터 분석 결과를 효과적으로 발표하는 방법에 대해 다룹니다. 그래프 활용, 대상별 전달 방식 등에 대한 자세한 내용을 통해 리포팅의 효과를 극대화하는 방법을 제시합니다. 단, 몇몇 부분에서 오해를 불러일으킬 수 있는 내용이 있어 주의가 필요하다고 언급되었습니다.

  "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

데이터 분석가에게 중요한 건, 데이터 드리븐 보고다. 분명 나는 고도의 분석 방법을 사용해서 예측력을 10% 상승 시켰는데, 막상 상사에게 보고 하면 '그래서?'라는 반응이 나온다. 데이터 드리븐 방식의 보고를 사용하지 않았기 때문이다. 데이터 드리븐 보고는 분석 결과를 전달하는 것이 목표가 아닌, 보고 받는 이가 그 가치를 인정받고 활용할 수 있게 만드는 것이다.

실무자와 의사결정권자에게 보고하는 방식은 각각 다르다. 실무자 보고는 서론 - 데이터 - 분석 - 인사이트 도출 및 해석 - 제언으로 구성되며, 의사결정권자 보고는 OREO를 사용한다. OREO란, Opinion - Reason - Evidence - Opinion(의견 - 이유 - 증거 및 예시 - 의견/제언)으로 구성한다.

통계 검정에 대해 알려준다. t-test, F-test, Anova 뿐만 아니라 비모수적 검정 방법인 크루스칼 , 만 휘트니, 윌콕슨 부호 순위 검정을 알려준다. 각각의 차이점은 무엇이며, 어떨 때 사용해야 하는지 쉽게 작성해두었다. 특히 Youtube, Facebook, Instagram 중 어떤 채널에 추가적인 마케팅 비용을 들여야 하는지 통계 검정을 사용해서 효과적인 방식을 알려준다.

데이터 드리븐 리포트 

- 데이터 분석 실무를 완벽하게 공부할 수 있는 명저 -

 

데이터드리븐리포트01.jpg

 

 

이번에도 아주 마음에 드는 책을 한 권 소개합니다. 

 

데이터 드리븐 리포트 라는 책인데요. 데이터 분석 실무에 대해서 이렇게 체계적이고 자세하게 소개한 책은 지금까지 없었기 때문에 데이터 분석을 공부하는 사람이라면 반드시 읽어야 한다고 생각하는 책입니다.

 

책을 처음 받고 나서 내용을 훑어 본 결과 너무 마음에 들었고, 최근 가르치고 있는 학생들에게도 사비를 털어 선물로 주었을 만큼 만족스러운 책입니다.

 

빅데이터, 인공지능이 중요해지고 chatGPT 같은 생성형 인공지능이 일상을 파고든 만큼 데이터 분석에 대한 관심은 더 높아지고 있습니다. 직접 데이터 분석이나 인공지능을 배우려는 사람들도 많아지고 있는데요. 데이터 분석을 공부하다 보면  배워야 하는 것이 너무 많아서 뭔가 많이 배우고 공부하기는 했지만 그래서 이걸 어떻게 써야 하는거지? 하는 의문이 생길 수 있습니다. 

 

생전 처음 접하는 파이썬이라는 프로그래밍 언어부터 시작해서 통계학도 공부해야 하고, 머신러닝 알고리즘의 특성과 사용법, 분석된 결과를 보고 다시 튜닝하는 작업, 딥러닝은 또 다른 세계라 딥러닝이 작동하는 원리 신경망의 종류와 언어, 이미지, 음성에는 또 어떤 신경망을 써야하는지 등 할 것이 너무나 많습니다. 그러다가 보면 정작 숲을 보지 못하고 나무만 열심히 파게 되고, 내가 지금까지 열심히 배운 것들로 도대체 뭐를 할 수 있지? 하는 의문이 생기게 되는 것이죠.

 

실제로 제가 데이터 분석 강의를 하면서도 가끔 학생들에게 받는 질문이기도 합니다.  

 

"선생님 그래서 지금까지 배운 머신러닝, 딥러닝으로 뭐를 할 수있는 거에요?"

 

실제로 받은 질문이고 처음에는 좀 충격이었습니다. 수업 초기에 데이터 분석의 필요성이나 실제 사례등에 대해서 설명하고 이론과 알고리즘 설명 그리고 코딩을 통한 실습을 하게 되는데 , 알고리즘이랑 원리를 설명하고 코딩으로 구현하는 것에 집중하다가 보니 학생들은 그것을 이해하기에도 벅차서 정작 데이터 분석을 왜 하고 어떻게 쓸 수 있는지는 잊어버리더군요. .

 

데이터 드리븐 리포트는 데이터 분석을 공부하다가 길을 잃어버린 분들에게  다시 숲을 보게 만들어주는 역할 즉, 왜 데이터 분석을 해야 하고 그것을 어떻게 활용할 수 있는지에 대한 답을 주는 책입니다. 

 

1. 누가 읽어야 하나요?

데이터 분석을 공부하고 있는 사람들에게 적극 추천합니다. 특히 데이터 분석을 공부하기는 했는데 어떻게 써야하는지 잘 모르겠는 사람들에게 아주 유용합니다. 

 

데이터 분석을 아직 공부하지 않았더라도 데이터 분석을 공부하면 어떤 일을 하게 되고 어떻게 활용할 수 있는지 알고 싶은 분들에게도 추천합니다. 

 

 

2. 데이터 드리븐 리포트의 주요 내용

 

데이터 드리븐 리포트의 주요 내용은 아래와 같습니다. 

 

1장 데이터 드리븐 보고

1장에서는 데이터 드리븐 보고가 무엇인지에 대해서 설명하고 구체적으로 어떻게 하는 것인지에 대한 내용이 나와 있습니다.  특히 1장 4절의 내용이 흥미롭습니다. 

 

데이터 드리븐 보고 5원칙

 

1. 설명 가능해야 한다.

2. 데이터 드리븐 보고는 중립적이지 않다.

3. 문제를 정의할 수 있어야 한다.

4. MVP(minimum value product) - 제품을 통해 해결하려는 문제와 가설을 명확히 하는 것 부터 시작하라.

5. 추론과 예측을 구분하라.

 

2장 데이터 드리븐 보고 절차

2장에서는 데이터 분석을 하고 의사결정에 활용되는 과정을 상세하게 보여줍니다.

특히 분석 목표 설정에 대한 중요성이 잘 강조되어 있습니다. 데이터 분석을 공부하는 학생들이 이것을 어떻게 써야 하는가?를 고민하게 되는 이유가 사실 분석 목표가 없기 때문인데, 그 부분을 명확하게 짚어주고 있습니다. 

 

데이터드리븐리포트02.jpg

 

그리고 세부적으로 데이터 수집, 전처리, EDA, 시각화 등을 실제 데이터와 코드를 통해 보여줌으로써 이론이 아닌 실전으로 이해하기 쉽게 설명하고 있습니다.

 

 

데이터드리븐리포트03.jpg

 

2장과 3장을 읽다가 이 책에서 좀 아쉬운 점을 발견했는데요,  분석결과를 검증할 때 많이 사용하는 혼동 행렬(confusion matrix)이 2장과 3장에서 다르게 나와 있다는 것입니다.

 

혼동 행렬의 결과는 예측값과 실제값의 위치, 그리고 True, Flase 값의 위치에 따라서 달라집니다. 그래서 처음 공부할 때 봤던 혼동행렬과 다른 그림이 나오면 아주 어려워 할 수 있습니다. 그런데 이 책에서는 2장에서 설명할때의 그림과 3장의 그림이 예측과 실제 값의 위치뿐만 아니라 True, False 값의 위치도 다릅니다. 

 

데이터드리븐리포트05.jpg

2장 혼동행렬 설명 부분에 있는 Confusion Metrix 

예측값이 좌측, 실제값이 윗쪽에 있고 True, False 순서로 되어 있다.

 

 

데이터드리븐리포트06.jpg

 

3장 분석 결과 해석에 있는 혼동행렬(Confusion Metrix)

사이킷런의 결과이므로 왼쪽에 실제값, 윗쪽에 예측값이 있고 False, True 순서다.

 

혼동행렬을 정확히 이해하고 있다면 실제값과 예측값 방향이 바뀌고 True, Flase 값의 위치가 다르더라도 Accuracy, Precision, Recall, Specificity, Error Rate, F1 Score를 정확히 구할 수 있지만, 아직 혼동 행렬을 정확히 이해하지 못한 사람에게는 가뜩이나 헷갈리기 쉬운 혼동행렬을 더 어렵게 만들 수 있어서 통일이 필요할 것 같습니다.

 

3장 실습 코드에서 파이썬의 사이킷런의 결과물로 혼동행렬(confusion matrix)를 설명하고 있으니 2장의 내용도 이것에 맞추어 수정하는 것이 혼란을 줄일 수 있는 방법이라고 생각합니다. 

 

3장 데이터 드리븐 보고 실전사례 with 챗GPT

3장은 데이터 분석 기획부터 보고까지 실무 프로세스를 A 부터 Z까지 경험해 볼수 있는 내용으로 구성되어있습니다. 그리고 특이한 점은 최근 챗GPT의 등장으로 코딩 스타일이 많이 바뀌었는데, 실무에서 챗GPT를 사용하여 어떻게 코딩 효율을 높일 수 있는지 잘 보여주고 있어서 최근 트랜드를 잘 반영했다고 생각합니다. 

4장 데이터 드리븐 커뮤니케이션

4장은 데이터 분석 결과를 보고할 때 어떻게 효과적으로 발표할 수 있는지에 대한 내용을 실제 사례를 들어 자세히 설명하고 있습니다.  특히 효과적인 전달을 위해 그래프를 어떻게 활용할 것인지에 대해서 자세히 나오고 누구에게 보고 하느냐에 따라서 내용이 어떻게 바뀌어야하는지도 잘 설명하고 있습니다. 

 

4장에서 조금 우려되는 부분은 책  내용이 자칫 오해를 불러 일으킬 수도 있다는 점이 있습니다. 

 

책 내용중 1.4.2 데이터 드리븐 보고는 중립적이지 않다. 의 내용에서 y축을 조작해 실제로 차이가 크지 않은 내용을 과하게 강조하는 내용이라던지, 4.3.1 에서 어떤 차트를 써야하는가에 대해서 설명 할 때 바 차트 부분 그리고 4.4.1에서 스토리 텔러의 핵심은 속임수? 부분은 조금 주의해서 봐야 할 필요가 있습니다. 

 

저자의 의도대로 객관적으로 분석한 결과를 가지고 어떻게 설득력 있게 전달 할 것인가를 고려하면 충분히 이해가 가는 내용입니다. 하지만 읽는 사람에 따라서 자칫 데이터 분석 결과는 객관적으로 전달해야 하는 것이 아니고 주관을 담아 과장하거나 축소해서 보고해도 된다는 오해를 불러 일으킬 수도 있을 것 같습니다.

 

데이터드리븐리포트07.jpg

 

책 내용에서 데이터와 분석은 객관적이지만 그것을 해석하는 것에 있어서는 주관이 들어갈 수 밖에 없다는 것은 충분히 설명하고 있지만 위와 같은 그래프 트릭은 주의해야 하는 부분임을 조금 더 강조해 주는 것이 좋을 것 같습니다. 

 

3. 마무리

데이터 드리븐 리포트는 데이터 분석 실무를 실제 사례를 들어 소개하는 책으로 데이터 분석을 공부하는 사람들에게 꼭 필요한 책이고 누구나 읽어봐야 하는 책이라고 생각합니다. 

 

제가 가르치고 있는 학생들에게 선물을 해주었을 만큼 만족스럽고 적극 추천하는 책입니다. 

 

다만, 2,3장의 혼동행렬을 설명하는 부분이 통일되었으면 좋겠습니다.

 

그리고, 데이터 분석 결과를 어떻게 의사결정자들에게 설득력 있게 전달해야 하는가? 하는 부분에 대한 내용은 이해 할 수 있으나, 자칫 결과를 전달하는 과정에서 분석가의 의도대로 과장해도 된다고 오해할 수 있는 부분은 좀 아쉽습니다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

 


[도서 소개]

무조건 안 된다는 상사, 데이터로 설득하라!

데이터를 근거로 의사소통해야 하는

모든 실무자를 위한 데이터 기반의 의사결정 가이드


경험 또는 직관만으로 의사결정자나 이해관계자를 설득할 확률은 0%에 가깝다. 상사나 고객을 설득하려면 데이터에 기반하여 소통해야 한다. 이 책은 데이터 분석을 실무적으로 다루며 방대한 데이터 속에서 핵심 인사이트를 찾아내 그 결과를 명확하게 전달하는 방법을 안내한다. 또한 데이터 분석 결과를 비즈니스에 성공적으로 적용한 여섯 가지 사례를 통해, 분석 목표 파악부터 데이터 유형에 따른 적절한 분석 기법 선택, 분석 결과를 바탕으로 의사결정자를 설득하는 실무 과정까지 익힐 수 있다. 데이터 기반의 의사결정 절차를 살펴보면서 데이터를 효율적으로 분석하고, 그 결과를 근거로 원활히 소통하는 전문 역량을 키워보자.


[내용 구성]

1장. 데이터 드리븐 보고

일상에서 데이터를 기반으로 의사결정하는 사례를 소개하고 데이터 드리븐 의사결정이 비즈니스에 어떻게 적용되는지 알아본다.


2장. 데이터 드리븐 보고 절차

성공적인 데이터 드리븐 보고를 위한 ON AIR 분석 절차를 단계별로 설명한다.


3장. 데이터 드리븐 보고 실전 사례 with 챗GPT

실제 비즈니스에 활용되는 데이터셋을 통해 데이터 형식과 보고 목적이 각각 다른 여섯 가지 사례를 실습한다.- 행복에 영향을 미치는 변수와 국가별 행복지수 분석하기

- 회사의 중장기 인력구조 예측, 분석, 시각화하기

- 마케팅 효과 분석 및 최적의 광고 플랫폼 찾기

- 유학 컨설팅을 위한 해외 대학 합격률 분석하기

- 당뇨병 예측모델 수립 및 사전 예방 솔루션 제공하기

- 전 직원 대상 설문조사의 서술형 응답 분석하기


4장. 데이터 드리븐 커뮤니케이션

데이터를 기반으로 의사소통할 때 꼭 점검해야 할 체크리스트와 보고 대상자에 따른 맞춤형 커뮤니케이션 방법을 안내한다.


[대상 독자]

- 파이썬 기초 문법을 알고 데이터 분석을 해본 적 있는 사람

- 데이터를 근거로 의사결정자 또는 이해관계자를 설득하고 싶은 사람

- 다양한 상황별로 적합하고 효율적인 분석 기법을 알고싶은 사람

- 분석 업무에 챗GPT를 활용하고 싶은 사람

- 데이터분석전문가(ADP), 빅데이터분석기사를 준비하는 사람



[주요 내용]

- 데이터에 기반한 보고 방법

- 보유한 데이터 특성에 따른 적절한 데이터 분석 기법 선정 방법

- 데이터 분석 결과물을 바탕으로 설득 대상에 따라 효과적으로 의사소통하는 방법

- 실제 분석 업무에 적용할 수 있는 단계별 실습 사례

- 구글 콜랩, 파이썬, 챗GPT를 실제 보고에 활용하는 방법

- 선형회귀분석을 통한 고객 설득 방법

- 수치형, 범주형 데이터에 적용하는 추론과 분류예측 방법

- 텍스트 데이터에 적용하는 워드 클라우드와 토픽 모델링 방법



[서평]


데이터 드리븐 리포트는 데이터를 기반으로 한 보고를 통해 의사결정자를 설득하고 효율적인 의사결정을 내리는 데 초점을 맞춘 책입니다. 이 책은 데이터 수집, 정제, 분석, 스토리텔링, 시각화까지의 과정을 통해 데이터로 이해관계자를 설득하는 방법을 제시합니다.


ON AIR 분석 절차를 단계별로 설명하며, 성공적인 데이터 드리븐 보고를 위한 방법을 제시합니다. 또한, 실제 비즈니스에 활용되는 데이터셋을 통해 다양한 사례를 실습하며, 상황별 가장 적합한 분석 기법을 선택하는 방법을 알려줍니다.


데이터를 기반으로 의사소통할 때 꼭 점검해야 할 체크리스트와 보고 대상자에 따른 맞춤형 커뮤니케이션 방법을 안내합니다. 이를 통해 데이터를 근거로 의사결정자 또는 이해관계자를 설득하고 싶은 사람들에게 유용한 정보를 제공합니다.


이 책은 데이터 분석 사고의 폭을 넓히고, 데이터를 기반으로 한 보고 방식에 대한 명쾌한 해답을 얻을 수 있습니다. 또한, 데이터에 익숙하지 않은 사람들도 쉽게 이해할 수 있도록 구성되어 있습니다.


데이터 드리븐 리포트는 데이터 분석가의 필독서로 추천할 만한 책입니다. 데이터 분석에 관심이 있는 사람들에게 이 책을 추천합니다.



 "한빛미디어 리뷰어 활동을 위해서 책을 제공받아 작성된 서평입니다."

직급이 올라갈수록 대기업에서는 단순히 개발 실력만 요구하지 않게 된다.

슬프다... 하지만 별 수 있는가 그에 맞게 적응을 하고 앞으로 나아가야 한다. 개발 실력에서 나아가서 길러야 할 역량은 바로 커뮤니케이션이다. 

이때 커뮤니케이션에서 근간이 되는 것은 어조, 화법, 경청 등 태도는 기본이 되어야 겠지만,

특히나 남을 설득하거나 공감대 형성을 하는 과정에 필수적인 것은 바로 데이터를 기반으로 하는 것이다.

가령, 어떤 프로덕트를 Initiation을 해야 하는데, 트렌드에 엮어서 할수도 있지만 데이터를 활용해서도 근거를 만들어내어 할 수 있다. 구체적으로 데이터 엔지니어링을 하는데 데이터 품질이 ~ 부분에서 이렇고 정량적으로 측정하면 ~%가 떨어진다는 점을 근거로 내세워 데이터 품질 관리시스템 Initiation을 할 수도 있을 것이다.


이런 역량을 강화하는 데 특화된 책이 있다. 바로 '데이터 드리븐 리포트'이다.

제목에서도 알 수 있듯이 데이터 기반 보고서라는 의미를 지닌다. 그렇다면 이 책에서는 단순히 이론적인 것만을 다룰까? 아니다. Python과 ChatGPT와 같이 핫한 기술들을 이용해 실습 과정까지 다룬다.

또한, 저자의 이력이 특이해 내 눈을 사로잡았다. 저자는 HR에 열정적인 사람인데 대학원을 듀크대를 가면서 데이터 사이언스 쪽에 커리어를 기울인 분이다. 특이하지 않는가? 역시 깊이를 팔 수 있는 역량을 가진 분이라면 다른 분야에서도 충분히 깊이를 팔 수 있다는 것을 느낀다.


이야기가 딴데로 잠시 샜는데 내용 중에 아래와 같은 부분들이 인상적이었다.

1. Comm을 하는데 철저히 데이터 관점에서 바라보지 않는다. 설득 대상에 따라 다르게 접근하는 방법을 제시한다.

2. 단순 데이터 조작 기술을 다루지 않는다. 선형회귀 분석, 워드 클라우드와 토픽 모델링 방법 등 분석 방법론도 다룬다.

3. 이론적인 소개 뿐만 아니라 실제 분석 업무에 적용할 수 있는 단계별 실습 사례를 제시한다.


이런 내용들로 하여금 기획자, 사업가, 마케터 등 다양한 분야에 있는 현대인들에게 커뮤니케이션과 공감대 형성 능력을 기르는데 도움이 될 것이다.


    "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


설득하기 위한 비빌 레시피 "데이터 드리븐 리포트"

 

[도서] 데이터 드리븐 리포트

 

 

1.jpg

 

 

 

설득을 하는 과정은 생각보다 힘듭니다.

설득이란 상대방이 생각하고 있는 관점을 바꿔야 하기 때문입니다.

설득하기 위해서는 데이터를 기반으로 소통 해야 신뢰가 높아지면서 설득의 가능성이 높아 집니다. 

 

데이터 드리븐을 통해서 설득을 잘 할수있는 데이터 보고서에 접근을 해보자

 

 


▶ 데이터 드리븐 보고란?     

올바른 문제 해겨을 위한 문제 정의부터 데이터 수집, 정체 분석을 거쳐 스토리텔링과 시각화로 설득을 끌어내는 일련의 과정을 말한다.

 

 

 

 

▶ 데이터 드리븐 리포트

출처 : 책내용 일부

  • 데이터에 기반한 보고 방법
  • 구글 콜랩, 파이썬, 챗GPT를 실제 보고에 활용하는 방법
  • 보유한 데이터 특성에 따른 적절한 데이터 분석 기법 선정 방법
  • 데이터 분석 결과물을 바탕으로 설득 대상에 따라 효과적으로 의사소통하는 방법
  • 실제 분석 업무에 적용할 수 있는 단계별 실습 사례
  • 선형회귀분석을 통한 고객 설득 방ㄷ법
  • 수치형, 범주형 데이터에 적용하는 추론과 분류예측방법
  • 텍스트 데이터에 적용하는 워드 클라우드와 토픽 모델링 방법

 

2.jpg

 

 

 

▶ 데이터 드리븐 리포트 추천 독자는?

출처 : 책내용 일부

  • 파이썬 기초 문법을 알고 데이터 분석을 해분 적 있는 직장인
  • 상사와 고객을 설득해야하는 데이터 분석가
  • 기존의 보고 방식을 뛰어넘어 예측 가능하고 선제적인 분석 기법을 알고 싶은 사람
  • '해봤는데 안 돼 ','예전에 검토해봤어' 등의 이유로 상사에게 거절당한 경험이 있는 사람
  • 분석 업무에 챗 GPT를 활용하고 싶은 사람
  • 데이터 분석 자격증과 실무를 동시에 고민하고 있는 사람

 

 

 

▶ 데이터 드리븐 리포트의 책구성

출처 : 책내용 일부

  1. 데이터 드리븐 보고
  2. 데이터 드리븐 보고 절차
  3. 데이터 드리븐 보고 실전 사례 WITH 챗 GPT
  4. 데이터 드리븐 커뮤니케이션

 

.

 

▶ 데이터 드리븐 리포트의 실전 예시들

출처 : 책내용 일부

  • 행복에 영양을 미치는 변수와 국가별 행복 지수 분석하기
  • 회사의 중장기 인력구조 예측, 분석, 시각화하기
  • 마케팅 효과 분석 및 최적의 광고 플랫폼 찾기
  • 당뇨병 예측모델 수립 및 사전 예방 솔루션 제공하기
  • 전 직원 대상 설물조사의 서술형 응답 분석하기

 

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

 

 

우선 목차 부터 확인해보자.

 


|1장 | 데이터 드리븐 보고
1.1 일상의 보고 상황
1.2 데이터 드리븐 의사결정이란
1.3 데이터 드리븐 보고란
1.4 데이터 드리븐 보고 5원칙

|2장 | 데이터 드리븐 보고 절차
2.1 데이터 드리븐 보고 전략
2.2 분석 전 알아야 하는 용어
2.3 분석 목표 설정
2.4 계획서 작성
2.5 데이터 선정
2.6 분석 방법 결정 및 해석/검증
2.7 보고 대상자에 따른 보고 방식

|3장 | 데이터 드리븐 보고 실전 사례 with 챗GPT
3.1 데이터와 친해지자: EDA & 기술통계
3.2 데이터도 백문이 불여일견: 데이터 시각화
3.3 당신의 질문에 데이터가 답한다: 가설검정
3.4 데이터에 맞는 직선을 찾아라: 선형회귀분석
3.5 합격이냐 불합격이냐: 분류예측
3.6 대량의 텍스트 데이터를 이해하다: 토픽 모델링

|4장 | 데이터 드리븐 커뮤니케이션
4.1 데이터 드리븐 커뮤니케이션의 필요성
4.2 데이터 드리븐 커뮤니케이션 구성 요소
4.3 데이터 드리븐 커뮤니케이션 방법
4.4 스토리텔링
4.5 데이터 드리븐 커뮤니케이션 체크리스트

 

위와 같이 구성되어있다. 해당 도서를 이번에 고른 이유는 내 첫 직장에서 일일 보고 리포팅을 굉장히 자주 했었다.

 

이를 수동으로 작성하는 작업자들이 있었고 이를 자동화 하는 업무를 중점적으로 일을 시작했던 기억이 있다.

 

하지만, 의사결정권자 분들이 원했던 일일 보고 데이터들은 과연 유의미한 데이터를 보고자 했던 것일까? 이러한 의문이 들고 데이터 드리븐이라는 말을 많이 들어보았지만 정확히 어떤 의미인지 모르는 상황에 좀 흥미로운 도서가 될 것 같아서 신청했다.

 

먼저, 데이터 드리븐 보고는 확증 편향을 제거하고 데이터를 기반으로 한 의사결정을 위한 보고 체계 또는 보고 프로세스라고 설명이 나와 있다.

 

데이터 드리븐 보고의 원칙 중 가장 인상 깊었던 부분은 '설명 가능성' 부분이었다.  AI를 조금 아는 사람들은 다 알만한 사실인데, 모델을 개발하고 모델의 결과가 어떻게 이 결과를 도출했는지에 대한 해설 즉, 설명이 불가능한 점이 존재한다.

 

이를 블랙박스라 표현하고 블랙박스와 같은 부분이 존재하는 것은 지양하게 되는 것이 데이터 드리븐 보고이다. 그렇기에, 설명 불가능한 딥러닝 모델은 데이터 드리븐 보고에는 적합하지 않다고 나와있다.

 

하지만, 조금은 열려있게 생각해야 된다고 생각한다. 데이터를 기반으로 한 의사결정을 위해 보고를 진행하는 것인데, 딥러닝의 결과는 보통 의사결정을 위한 참고자료로도 많이 사용된다. 그렇기에 나는 해당 부분이 의사결정권자가 원한다면 조금은 필요한 부분이라고도 생각이 된다.

 

그리고 생각보다 리포팅에 필요한 구성요소들에 대한 설명들이 잘 나와있었다. 기본 통계적 분석부터 시작해서 EDA에 관한 부분까지 나와있고 심지어 파이썬 코드도 잘 나와있는 부분이 인상적이었다.

 

그리고 보고서를 작성하는 프로세스다 보니 설계 부터 시작해서 체계적인 리포팅이 구성된다. 그리고 챕터 3 부터는 설명가능한 ML모델링도 모델링을 모르는 사람도 가볍게 보기 좋은 느낌이다.

 

각 사례들도 나오며 최신 책이라 그런지 챗 지피티로 EDA 를 하는 방법도 나와있는게 신기했다.

참고로 나도 EDA를 챗지피티로 귀찮은 코드나 시각화 코드 같은 것을 질의하며 진행한 적이 있기에 해당 방법을 추천하는 편이다.\

 

물론, 답으로 받은 코드에 대한 해석이 가능한 능력이 되었을 때 해당 방법을 추천한다.

이유는 해당 코드가 옳고 그름을 판단할 수 있는 역량이 되어야 올바르게 사용할 수 있기 때문이다.

어떤 데이터를 기반으로 보고를 할 때 "분석"이라는 과정이 필요하다. 분석과 보고는 결코 별개의 것이 아니다. 데이터를 분석하는 것은 이를 기반으로 하고자 하는 말을 전하기 위함이다. "데이터 분석"만 있고 "보고"가 없다면 그 데이터는 가치를 온전히 발휘하지 못하고, "보고"만 있고 "데이터"가 없다면 신뢰가 떨어지며, "데이터"와 "보고"만 있고 "분석"이 없다면 내용을 이해하기 어렵다.

"데이터 드리븐 리포트", 다시 말해 "데이터 드리븐 보고"에 대해 저자는 다음과 같이 정의한다.

 

이 책에서 정의하는 '데이터 드리븐 보고'란 올바른 문제 해결을 위한 문제 정의부터 데이터 수집, 정제, 분석을 거쳐 스토리텔링과 시각화로 설득을 이끌어내는 일련의 과정을 말한다.

 

그리고 이를 해내기 위해 알아야 할 데이터 분석 기법 선정 방법, 추론 및 분류예측 방법, 고객 설득 방법 등을 안내한다. 또한 데이터 드리븐 보고 절차를 알아본 후에 다양한 실전 사례로 실습해볼 수 있는 예제를 넣음으로써 독자가 그저 읽는 게 아니라 온전히 익힐 수 있게 돕는다. 마지막으로 단지 보고를 위한 어떤 결과물을 만드는 것뿐만 아니라 결과적으로 상사, 고객 등 누군가를 설득해서 원하는 결과를 얻어야 한다는 게 중요한데, 그 커뮤니케이션에 대해서도 다루어 데이터 드리븐 보고를 위한 모든 준비를 가능하게 한다.

데이터 분석에 필요한 내용부터 분석 후 보고에 필요한 내용까지 모든 내용을 담고 있어 한 권의 책으로 여러 방면에서 유의미한 성장을 경험할 수 있는 것 같다. 

 

데이터 분석을 하여 보고하였을 때 노력한 것에 비해 보고 대상자로부터 좋은 반응을 얻지 못했다면, 이 책을 읽으며 적절한 보고 전략을 찾아가는 것도 좋을 듯하다. 데이터 분석에 ChatGPT를 활용해보고 싶었지만 어떤 식으로 사용해야 할지 헤매고 있다면 이 책의 실습을 따라하며 감을 잡을 수 있을 것이다. 목차 구분이 안 되어 있는 전자책이라, 현재 읽고 있는 위치가 어느 정도고 앞으로 어떤 내용이 이어지는지 중간중간 확인하고 싶은 사람은 전자책보다는 종이책으로 읽는 게 좋을 것 같다.

 

 

한빛미디어 〈나는 리뷰어다〉 활동을 위해서 책을 제공받아 작성된 서평입니다.

 

 

우리는 사회 생활을 하면서 다양한 사람을 설득하게됩니다.

하지만 이과정에서 경험과 직관만으론 설득할 확율은 매우 낮다고 생각된다.

저자 이상석님의 "데이터 드리븐 리포트"는 이해관계자를 설득하기 위한 데이터 분석과 보고에 대한 모든 것을 담고있다.

이 책은 비즈니스 영역에서 데이터 분석의 궁극적인 목적인 효율적인 의사결정을 내리기 위한 방법을 상세하게 제시하고있으며, 문제 해결을 위한 올바른 문제 정의부터 데이터 수집, 정제, 분석 그리고 스토리텔링, 시각화까지의 과정을 통해 데이터로 이해관계자를 설득하는 능력을 키우는 방법을 제시하고 있다.

또한, 이 책은 다양한 비즈니스 사례를 바탕으로 상황별 가장 적합한 분석 기법을 어떻게 선택하는지, 방대한 양의 데이터에서 핵심 인사이트를 찾아내고 이를 설득력 있는 보고로 만들어내는 방법, 그리고 상대방이 가진 편향을 고려해 효과적으로 의사소통하는 방법까지 제시하고 있습니다.

이 책은 총 4장으로 구성되어 있습니다.

1장에서는 일상에서 데이터를 기반으로 의사결정하는 사례와 데이터 드리븐 의사결정이 비즈니스에 어떻게 적용되는지를 설명하고,

2장에서는 성공적인 데이터 드리븐 보고를 위한 분석 절차를 단계별로 설명합니다.

3장에서는 실제 비즈니스에 활용되는 데이터셋을 통해 데이터 형식과 보고 목적이 각각 다른 여섯 가지 실습을 제공하며,

4장에서는 데이터를 기반으로 의사소통할 때 꼭 점검해야 할 체크리스트와 보고 대상자에 따른 맞춤형 커뮤니케이션 방법을 안내합니다.

이 책은

데이터 분석가

빅데이터 분석기사를 준비하는 사람

파이썬을 활용한 데이터 분석을 해본 적 있는 사람

데이터를 근거로 의사결정자 또는 이해관계자를 설득하고 싶은 사람

다양한 상황별로 적합하고 효율적인 분석 기법을 알고 싶은 사람

분석 업무에 챗GPT를 활용할수 있도록 쉽게 설명하고있다.

이 책을 통해 독자는 데이터 분석 사고의 폭을 넓히고 데이터를 기반으로 한 보고 방식에 대한 명쾌한 해답을 얻을 수 있을 것입니다.

 

[한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다]

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리뷰쓰기

닫기
* 도서명 :
데이터 드리븐 리포트
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
데이터 드리븐 리포트
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
데이터 드리븐 리포트
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실

최근 본 책0