비즈니스를 위한 데이터 과학 : 빅데이터를 바라보는 데이터 마이닝과 분석적 사고

ghost8***l2014-10-29

[빅데이터?? 사물인터넷?? 과연...]

요즘 IoT 사물인터넷으로부터 많은 양의 데이터들이 주는 많은 정보력과 분석의 필요성에 대해 많은 이야기가 대두되고 있다. 특히 이런 데이터들의 양은 빅데이터라 불릴만큼 많아질 것이며, 그만큼 빅데이터를 분석하고 분석할 환경을 만들 인재에 대해서 정부와 학계에서 발벗고 나서서 많은 지원사업을 벌이고 있다. 과연 많은 양의 데이터로부터 정말 의미있는 정보를 얻을 수 있을까??..
누구나 빅데이터 분석에 대한 이야기를 처음 접한 사람이라면 한번쯤은 생각해볼 의문일 것이다.
빅데이터... 필자의 생각에는 충분히 이 빅데이터로부터 의미있는 정보를 얻을수 있다. 단, 그만큼의 분석력과 분석 계획 및 목표가 명확하다면 말이다..

[비즈니스를 위한 데이터 과학]
필자가 맨 처음 이 책을 펼쳐 목차를 보고 사실 좀 아쉬운 감이 있었다. 바로 챕터간 연관성이 부족하다고 생각했기 때문이다. 사실 공부를 하는 학생의 입장에서 보면 각 챕터의 연관성은 곧 공부의 흐름이기 때문에 중요하다고 생각한다. 이 목차가 각각의 연관성을 가지고 잘 배치가 되어있다면 학생의 이해도는 높아져 정보의 흡수력이 높아질 것이다. 하지만 반대로 목차의 배치가 연관성이 부족하게 배치가 되어있다면 이대로 공부했던 학생의 이해도는 떨어져 여러번 책을 읽어봐야 할꺼 같다는 생각이 든다. 물론 책이 전체적으로 이상하다 그런게 아니라 각 목차들이 연관성이 조금 떨어지게 배치되었다는 것이다. 즉, 이 책은 초보자들에게는 약간 어려울 수 있다고생각한다.

물론 내용은 아주아주 명쾌하고 하나하나 단어들의 설명이 자세해서 좋다. 내용면으로 봐서는 너무나 이책은 자세하다. 용어 하나하나에 대한 정의와 설명이 세세하게 잘 되어있다. 마치 용어사전을 보는 것 같이 정의와 쓰임세들이 잘 나와있다.

이 책에서 아쉬운 점이 하나 더 있다. 처음부터 끝까지 약간 딱딱한 느낌이 든다. 많은 수식과 모델링 개념들 그리고 다양한 유사도 비교를 포함한 알고리즘들에 대해선 설명이 잘 되어있다. 하지만 이런 개념들로만 끝나있다. 실제 약간의 소스들을 이용한 구현부분이나 활용된 사례들이 좀 들어가 있다면 보기 좋지 않을까라는 생각이 든다.

아!! 그리고 처음부터 끝까지 흑백이다. 조금 컬러풀하게 나와도 되는 부분에서도 흑백이라서 눈은 즐겁지 못하다.
하지만 이 책은 데이터 분석 개념서로써 많은 마이닝 알고리즘들에 대해서 다루지는 못했지만 각각의 기본 개념 설명은 아주 충실하다. 표과 설명을 위한 그림도 충실히 들어가 있기 때문에 어느정도 데이터 분석에 대한 기본 개념이 있는 사람이라면 한번쯤 읽어봐도 좋을꺼 같다.

[서평을 마치고..]
위에서 언급했던 이 책의 장점과 단점을 나열하자면 아래와 같다.

[장점]
- 용어 하나하나에 대한 정의와 설명이 세세하게 잘 되어있다. 마치 용어사전을 보는 것 같이 정의와 쓰임세들이 잘 나와있다.

- 데이터 분석 개념서로써 많은 마이닝 알고리즘들에 대해서 다루지는 못했지만 각각의 기본 개념 설명은 아주 충실하다.

- 표과 설명을 위한 그림도 충실히 들어가 있기 때문에 어느정도 데이터 분석에 대한 기본 개념이 있는 사람이라면 한번쯤 읽어봐도 좋을꺼 같다.

[단점]
- 각 목차들이 연관성이 조금 떨어지게 배치되어 데이터 분석을 처음 접하는 사람에게는 전체적으로 이해가 어려울 수 있다.

- 조금 컬러풀하게 나와도 되는 부분에서도 흑백이라서 눈은 즐겁지 못하다. 게다가 수식이 많아서 그런지 조금 지루하고 딱딱하게 느낄수 있다.

이로써 이책의 리뷰를 마치고자 한다. 이책은 막 데이터 분석 공부에 빠진 사람들에게 이 책은 자신의 지식을 좀더 촘촘히 다듬어서 빈틈이 없게 만들어줄 마감재 역할을 해줄 것이라 생각한다.

fkdtj***l2014-10-27

비즈니스를 위한 데이터 과학

이 책을 고른 결정적인 이유는

학과 수업으로 데이터 마이닝 등 관련 분야를 접한 적이 있지만, 설명을 해보라면 벙어리가 되어 버린다.
그런데 이 책은 말한다 "오늘날 사용되는 여러 데이터 마이닝 기법을 쉽게 이해할 수 있을 겁니다" 라고..

그래서 책장을 펼치게 되었다.

목차에서부터 알 수 있지만 개념부터 차근차근 나아가는 느낌이다.

수업때 배웠던 용어도 보이고 읽는 재미는 있었지만.. 내공이 부족한 나에겐 쉽지 않은 책이었다. 슬퍼3

그래서 점점 읽는 속도가 떨어지면서 꾹꾹 눌러 읽기보다는 방법을 바꿔 사례 중심으로 읽게 되었다.

그래서 데이터 과학이란? 데이터로부터 지식을 뽑아내는 방법을 알려주는 근본적인 원리로, 데이터 마이닝은 이 원리에 따르는 기술을 이용해 데이터에서 지식을 뽑아내는 기법을 말한다. 즉, 데이터 과학은 현상을 이해하는 원리와 절차, 기법을 통해 더 나은 의사 결정을 할 수 있도록 하는데 목적을 둔다.

그리고 데이터 과학은 누구나 쉽게 알 수 있는 구조화된 프로세스에 따라 데이터 마이닝을 할 수 있게 하는데 집중한다.

데이터 마이닝 알고리즘에는 1. 분류와 계층 확률 추정 2. 회귀 분석(가치 추정) 3. 유사도 매칭 4. 군집합 5. 동시 발생 그룹화 6. 프로파일링 7. 연결 예측 8. 데이터 축소 9. 인과 모델링 등이 존재한다. 이들의 차이를 통해 효율적인 알고리즘을 사용하는 것이다.

장점!!
★ 챕터마다 마무리할 때 요약을 해주는 공간은 나에게 단비같은 페이지였다!!

단점!!
☆ 저자가 절적하게 말하려는 핵심 위주로 말하기 때문에 관련 용어 등 모든 것을 한번에 말할 수 없다는 것은 이해한다. 하지만 너무 빈번하게 ex. 이 내용은 챕터 -에서 자세하게 설명하겠다 와 같은 말이 나온다. 그로인해 맥이 끊기는 느낌이 들기도 한다...

책을 덮으면서 "좀 더 배우고 다시 읽어야 겠다" 란 목표가 생겼다. 열공

lao***l2014-09-11

참고문헌이 없네요

책평가에서 별 하나 준 이유는 단지 참고문헌이 없기 때문입니다.
책 자체는 추천할만합니다.
왜 참고문헌 목록을 뺐는지 알 수가 없네요.

how***l2014-07-27

명확히 설명할 수 없다면 그것을 제대로 알고 있는 것이 아니다.

비즈니스 관점에서 바라본 데이터 과학에 대한 교과서로 데이터에 관심(빅데이터)이 많은 분들이 읽기를 권합니다.

데이터에서 지식과 가치를 뽑아내는데 필요한 지식(데이터 과학의 근본 원리와 데이터 분석적 사고 방식)을 얻을 수 있으며, 비즈니스 문제를 해결하는데 필요한 프로세스와 전략의 토대를 데이터 마이닝 기법을 통해 해결