Head First Data Analysis : 당신을 최고의 데이터 분석가로 이끌어줄 마법 같은 학습서

qeee***l2017-02-25

최고의 학습서! 헤드 퍼스트!

이번에 처음 헤드 퍼스트 책을 읽어보았습니다.

그리고 헤드퍼스트라는 브랜드가 학습서로서 최고라는 것을 알았습니다.

책 첫머리에 책의 구성에 대한 철학을 보고 깊은 감명을 받았고,

덕분에 데이터 분석에 대해 아주 재미있게, 이해하며, 기억할 수 있었습니다.

단, 11장 오류 파트부터는 조금씩 내용이 부실하다는 생각이 들었습니다.

그래도 데이터 분석의 큰 그림을 그릴 수 있었습니다.

또한, 통계학에 대한 기초 개념이 있는 사람이 이 책을 읽는다면

데이터 분석에 대한 구체적인 이미지를 그릴 수 있을 거란 생각을 했습니다.

고맙습니다. 헤드 퍼스트!

vitas***l2013-12-01

데이터분석으로의 재미있는 초대

최근 IT서비스분야에서 가장 주목하는 키워드는 BIG DATA이다.
기존의 관계형 DATABASE에서는 분석이 힘들고 오래걸리던 대량의 무의미한 DATA를 어떻게 비지니스에서 활용가능한 유용한 정보로 도출할 것인가? 란 질문에 대한 해답을 얻고자
많은 분들이 BIG DATA 관련 책을 읽고, 기술을 공부하고 사업을 구상한다.
재경DOMAIN에서 IT서비스를 업으로 삼고 있는 나도 이 조류에 예외일수는 없다.
하지만 BIG DATA를 떠나 과연 나는 DATA 분석에 대한 개념이나 방법에 관해 알고 있는지 자문해 보았다.
결론은 기초가 부족하고, BIG DATA에 대한 연구 이전에, DATA 분석에 대한 연구가 우선되어야 한다는 것이다.

내가 찾은 해답이 바로 "Head First Data Analysis" 이다.

이책 역시 다른 Head First 시리즈가 그러하듯, 빽빽하고 이론적인 설명으로 졸음을 부르는 다른 책들과 달리
재미있는 삽화들과 다양한 도형으로 눈을 지루하지 않게 만들어준다.
처음부터 화장품회사의 매출확대, 경제악화에 따른 커피브랜드 매출악화에 대한 대처하기 등 우리주변에서
마주할 수 있는 실사례를 통해 DATA분석에 대한 설명을 확대해나가면서 자연스럽게 독자가
DATA분석이 무엇인지 고민하고 이해할 수 있게 되어있는 구성덕분에 지루하지 않게 DATA분석에 공부할 수 있었던것 같다.

이 책은 DATA분석의 정의와 단계에서부터 , 몇가지 확률통계방법, 관계형데이터가 무엇인지까지 설명한다.
그리고 R과 엑셀을 DATA분석에 어떻게 활용하는지도 보여준다.
부록으로는 친절히 컴맹을 위한 DATA분석을 위해 사용하는 엑셀의 분석도구와 R의 설치법도 다루고 있다.

HeadFirst 시리즈를 경험해본 사람이라면 이 책이 어떻게 독자를 주제를 향해 이끌어주는지,
그리고 어느수준의 깊이에 대해 말하는지 알수 있으리라 믿는다.

이책 한권을 읽었다고 해서 DATA분석에 대해 깊이 알게되거나 유능한 DATA ANALYST가 된다고 믿지는 않는다.
하지만 처음부터 두꺼운 이론서에 지치고싶지 않다면, 지루하지 않은 방식으로 DATA분석에 대한 기초를 다지고 싶다면
워밍업으로 이 책을 추천한다.

rjsdnrk***l2013-05-26

최고의 데이터 분석가가 되기 위한 가장 첫번째 책

마케팅과 사업팀 이외 데이터 통계를 직접 분석하는 경우는 흔치 않다. 주관적으로 분석되고 정의내려진 다양한 데이터들이 뉴스, 논문, 증권가 분석 자료에 널리 퍼져있기 때문이다. 기획자를 비롯한 대부분의 사람들은 주어진 통계 데이터를 인용하는 정도 수준이었다.

하지만, 시장에 "빅데이터"라는 이름을 달아버린 거대한 데이터에 대한 시장의 관심이 높아지며, 누구나 빅 데이터와 밀접해야 하는 것이 오늘 날의 현실이다. 오늘 이시간에도 무수히 많은 사용자 데이터가 축적되고 있지만 어떤 식으로 사용될지, 제안 해야 할지 감이 안잡힌다면, 직접 빅데이터를 분석,제안해야 하는 때가 왔다면 당연 "Head First"를 추천하겠다.

좋은 책을 고르는 가장 좋은 방법은 1, 말머리와 2, 목차를 읽었을 때, 내가 필요한 내용이 있는지를 살피는 것이다.

이 책은 처음 빅데이터를 다루기 시작한 사용자가 어떤 절차(커리큘럼)에 의해 정보를 배울 수 있는지부터 데이터를 정리/엑셀도구로 분석 통계 내리는 일 까지 데이터 분석의 A to Z를 보여준다.

제목만 보았을때, 감이 안오더라도 "Head First"는 "그림"과 "예시"가 함께하기 때문에 이해가 쉽다.

이 때문에 한빛미디어의 "Head First"를 먼저 구매하곤 한다. 보통 어떤 정보를 습득할 때 책을 구매하는 순서는

1)헤드퍼스트 2)오라일리 시리즈 3)그중에서도 쿡북으로 초입/학습/적용 의 단계를 거치곤 한다.

그 중 헤드퍼스트는 해당 정보 지식에 관하여 흥미를 가질 지, 어려움부터 가질 지를 보여주는 첫 단추이다.

헤드퍼스트는 그림과 사례, 연습문제가 함께하기 때문에 책에서 제안하는 "캐릭터"에 감정이입하며 같이 문제를 해결해나가는 듯한 느낌을 받는 것이 가장 큰 장점이다. 헤드퍼스트의 "쉽게 다가가기" 전략은 언제나 옳다.

각 챕터의 첫 장에는 위 이미지와 같이 제목, 이미지, 내용이 적혀있다. 중요한 키워드는 볼드 처리되어있으며, 한 장에서 다음에 배울 내용을 요약하여 보여준다.

독자와 대화하는 듯한 QnA와 연습문제 등을 통해서 지식을 반복 심화할 수 있다.

헤드퍼스트 데이터 아날리시스(Data Analysis)를 두 번 정도 반복하면 데이터 분석에 대한 기초를 확실히 다질 수 있다. 하지만 이 모든 내용은 어느정도의 "데이터를 추출 할 수 있는 환경"이 부여되었을 때 이루어진다. 책에서는 데이터가 어디에선가 제공되고 우린 분석만 하면 된다. 하지만 실제 시장에서는 어떤 데이터가 필요할 지 발로 뛰며 조사해야 하고, 생각보다 머리를 쓰는 때 보다 몸과 시간으로 매달리는 부분이 많다는 점도 간과해선 안된다.

책에서 나오는 방법은 어찌보면 고등학교, 통계 등의 시간에서 배운 내용을 엑셀로 옮기는 방법. 보기 좋게 정리하는 법의 확장된 버전일 지도 모른다. 하지만 기초를 간과하면 심화를 배울 수 없음을 기억해야 한다.

ngni***l2013-05-26

큰 그림을 그릴 수 있는 데이터 분석

이번 도서는 빅데이터 시대가 부각이 되면서 중요시 되는 "데이터 분석"에 대한 책입니다. 빅데이터는 아래와 같은 특징을 가지면서 각 분야에서 비지니스 마케팅 전략부분에서 많은 관심을 가지고 있습니다.

* 빅데이터의 특징 ( 3V )

1) 대용량 ( Volume ) - 경제적 타당성으로 방대한 내용의 저장이 가능해짐
2) 다양성 ( Variety ) - 저장이 불가능 했던 다양한 것들이 디지털화 시켜서 저장되어진다 .
3) 빠른속도 ( Velocity ) - 고성능 분산병렬처리 기술의 보급

고객들에 의해서 자동으로 발생되는 로그 데이터, 임의의적으로 생성하는 데이터들 속에서 "의미 있는" 어떤 데이터를 찾는 것이 제일 중요한 부분입니다. 이런 데이터를 찾는데 필요한 인프라구축, 기술은 당연히 제일 중요한 부분입니다.

요근래 빅데이터에 대한 많은 책들이 등장을 하였습니다. 빅데이터에 대한 개념부터 시작을 해서 정치적인 부분, 사회적인 부분, IT기술 분야에서의 사례들이 많이 포함되어 있었습니다. 그리고 그 안에서 사용되는 기술 - 하둡, 맵리듀스, R프로그래밍 등에 대해서도 각각 주제를 선택하여 책으로 나왔습니다. 하지만, 이런 기술들 익히는데는 인프라를 구축하는데(환경을 구성하는데) 많은 시간을 소비해야 하며, 일반 사람들에게 접근하기는 매우 어려움이 있습니다.

이 책은 이런 문제점들을 해소하면서 매우 쉽게 풀이한 책입니다. "Head First"는 입문자를 대상으로 쓰여지며, 흐름도 및 프로세스를 그림으로 모두 표현을 하여 이해를 높입니다. 어떤 어려운 주제가 나올지라도 우선은 입문자 레벨에서 중급레벨까지 갈 수 있는 길을 열어줍니다.

이 책도 전문IT서적에서 어렵게 설명하는 부분을 단계별로 쉽게 설명을 해놓았습니다.

데이터의 중요성이 어떤 것이지, 이런 데이터들이 비지니스 경영입장에서 어떤 중요성을 가지고 있는지 설명을 하고 있으며, 이런 수많은 데이터들의 관계성을 RDBMS를 통해서 어떻게 연결성을 찾을 수 있을지 고민하고 있습니다. 그리고 마지막는 빅데이터 분석에서 개인 사용자들이 응용할 수 있는 R프로그래밍에 대해 간단하게설명이 되고 있습니다.

책 구성은 샘플 사진을 보듯이, 글보다는 그림들이 페이지에서 더 차지하고 있습니다. 상세한 환경분석을 구성하는 엔지니어링에게는 참고자료로 활용할 수 있으며, 입문자들에게는 그림을 통해 기억을 오랫동안 할 수 있으며 응용을 할 수 있는 기회를 줍니다. 다른 사람들에게 "데이터 분석"에 대한 설명을 할 시에 이 그림들을 샘플로 사용한다면 좋은 전달자가 되지 않을까 싶습니다.

robi***l2013-05-25

최고의 데이터 분석 입문서!

근 몇 년전부터 IT업계에서 떠오른 화두를 말하라 하면 대다수의 IT업계의 종사자들은 Big Data를 언급할 것이다. 폭발적으로 증가한 Data를 이용하여 Business Insight를 찾는다는 Big Data Trend는 미래 기업의 생존을 결정할 요소라고 말하는 사람도 있다.
사실 Big Data라는 주제의 근저를 들어다보면 분석 대상 데이터의 범위가 확대되었다는 것이지, 기존에 있던 데이터 분석에서 벗어나지는 않는다.
달리 말한다면, Big Data로 인해 Data에 대한 관심이 과거 어느 때보다 높아졌으며, 데이터 분석 능력에 대한 중요성이 강조되는 시대가 도래되었다는 것이다.
하지만, 데이터 분석이라는 것이 말로는 쉽지만 막상 자신이 한다면 그렇게 만만치 않은 업무라는 것은 웬만한 사람들은 느낄 것이다. 당장 고등학교 때 배우는 수학의 범위를 보아도 이산 분포, 분산, 표준 편차 등 (데이터 분석에 필요한) 통계 수학 영역은 미적분과 더불어 가장 골머리를 썩히는 분야지 않는가?
개인적으로 데이터 분석에 대한 학습이 필요하다고 느끼면서도 그 어려움에 주저하던 차에 Head First Data Analysis를 만나게 되었다. 다른 Head First 시리즈처럼 쉽고 친절하게 나를 데이터 분석 분야로 이끌어 주겠지 하는 믿음을 가졌었고, 역시 나의 믿음을 저버리지 않았다.
책은 총 13장으로 구성되어 있는데, 각 장 별로 가상의 고객을 대상으로 데이터 분석하는 사례를 다루고 있다. 각 사례를 다루면서 여러 가지 데이터 분석 기법을 설명해주고 있다.
데이터 분석을 배울려면 통계에 관련된 수학을 피할 방법은 없다. (이 때문에 많은 사람들이 통계를 공부하는 것을 포기하기도 한다!) 역시나 이 책에서도 꽤 많은 수학 공식이 나온다. 하지만, Head First 시리즈답게 최대한 간결하게 수학 공식을 나타내고 있고 또한 어렵지 않게 이해할 수 있도록 도와주고 있다. 중학교 수학 정도로 쉽게 설명하기 때문에 내용을 이해하는게 큰 무리가 없다.
또한 데이터 분석 업무의 특성 상 엑셀과 같은 데이터 분석 도구를 사용하는 것은 피할 방법이 없다. (모든 데이터를 수기로 작성하고, 대조, 조회, 필터링 하는 것을 손으로 하는 어리석은 사람은 없을것이다.) 기본적으로 이 책의 주요 분석 도구는 엑셀이다. 엑셀 기능 중 약간의 함수만 사용하기 때문에 내용을 따라하는데 어려움을 느끼진 않았다. 후반부에 좀더 고급적인 데이터 분석을 할 때는 오픈소스 데이터 분석 도구로 유명한 R을 사용한다. R은 엑셀과 달리 사용이 무척 까다롭다. 하지만 책의 부록으로 R을 사용하는 방법을 수록해두어 사용에 큰 어려움을 겪지는 않는다.
국가가 선진국에 가까워질수록 사회 구성원들은 직관에 의거한 행동보다는 (데이터에 근거한) 확률에 의거하여 행동하는 경향을 보인다. (세계에서 가장 발전한 통계 분석은 모두 미국에서 나왔다!) 비단 Big Data가 아니더라도 우리나라에서 데이터 분석은 계속 중요성이 높아질 분야라고 생각한다. 이런 시대적 조류에 맞추어 데이터 분석을 학습하고 싶어하는 분들에게 Head First Data Analysis는 무척 괜찮은 데이터 분석 입문서라고 감히 추천한다.

booiljo***l2013-05-21

체험을 통한 데이터 분석 입문

시간이 난다면 - 먹고사니즘이 해결된다면 - MathLab 같은 도구를 배워우고 싶다는 생각을 가지고 있었다. 이번에 O"REILLY의 Head First Data Analysis을 경험할 읽을 좋은 기회를 얻었다.

정말 이렇게 재미 있게 쓴 책은 드물었던것 같다. 이 책을 읽기 시작한지 24시간 만에 모두 독파하였다.

이 Data Analysis에 대한 책을 펼치고 읽으면 마치 Data Analyst가 된 기분이다. 이 책은 사실적이고 실무에 가까운 전개로 독자들이 책에서 눈을 떼지 못하게 한다. 회사에서 짤리지 않기 위해서라도 독자는 정말 정확한 모델로 Error까지 포함하여 분석된 보고서를 심플하게 고객이나 보스에게 제공해야 한다. 독특한 방법으로 유머와 긴장감을 준다.

이 책을 읽는데 필요한 수학은 고등학교 수준이면 충분하다. 또한, 엑셀을 다룰줄 알아야 한다. 그리고 R을 살짝 소개하고 다루므로 타이핑을 할 줄 알아야 한다.

이 책은 데이터 분석 입문에 대한 것이다. 경험을 통해 데이터분석가가 어떤 역할을 해내고 어떤 지식이 필요한지 소개한다.

그리고 이 책은 깊은 수준의 엑셀이나 R 매뉴얼이 아니다. 엑셀이나 R을 다룰줄 모른다면 따로 심도있게 공부해야 한다.

이 책에 예제로 나오지만, 직관적인 판단보다, 모델과 가설을 통해 판단을 내리는것이 경영에 필요 하겠다는 생각이고, 요즘 미국에서 Data Analyst가 뜨고 있다는 이유도 충분히 이해가 되었다.

이 책을 데이터 분석을 시작하려는데 어떻게 해야 할지 모르겠다 분에게 권한다. 그리고, 마치 경영학이 경제, 회계, 재무, 조직, 인사, 마케팅, 무역 등을 종합한것처럼 데이터 분석을 통한 정보 분석도 회사 경영에 필요한 지식이므로 가볍게 읽을 수 있으므로 경영자나 임원들에게 권한다.

Head First Data Analysis : 당신을 최고의 데이터 분석가로 이끌어줄 마법 같은 학습서

자료 다운로드시 유의사항

▶ 부록/자료 관련 FAQ