최근에 파이썬의 기세는 무섭다. 간단한 코딩과 엄청나게 많은 라이브러리로 인해서 정말 빠른 개발이 가능해졌다. 최근에는 RPA에서 파이썬은 많은 역할을 하고 있는 분위기다. 자료를 받아와 분석하고 데이터를 만들고 보여주는 것은 물론이거니와 인터넷에서 자동으로 자료를 취득하는 것도 가능하다. 일련의 과정은 C++과 비교해 보면 정말 경이롭다.
파이썬을 배워보려고 주피터 노트북도 깔아보고 Visual Code로도 해봤지만 역시 가장 귀찮은 것은 라이브러리 설치다. 명령어만 치면 설치되긴 하지만 가끔은 설정이 꼬이기도 하고 반응하지 않기도 했다. 하지만 책에서 소개한 구글의 Colab을 이용하면 대부분의 라이브러리를 지원해서 좋았다. 처음 시작할 때 시간이 약간 걸리는 것을 제외하면 파이썬을 공부하기에 좋은 환경을 제공해 주었다. 코랩의 좋은 점은 웹상에 존재하기 때문에 PC에서 하다가 태블릿으로 하다가 심지어 폰으로도 할 수 있다는 것이다.
이 책은 파이썬을 이용하여 데이터 분석을 하는 예제들을 포함하고 있다. 지방청이나 국가에서 제공하는 자료 등을 이용해서 데이터를 분석하고 지도로 표시해 보는 것부터 데이터를 수집하는 크롤링, 그리고 직접 하려면 난감한 상관분석, 회귀분석, 시계열 분석에 대해서도 다룬다.
직접 코드를 짜보기 때문에 일단 재미가 있다. 그리고 지도와 그래프를 이용하여 결과를 바로바로 볼 수 있으니 그 또한 즐겁다. C++로 이걸 해내려면 상상도 하기 싫다. 물론 라이브러리를 이용하면 조금 더 편하긴 하겠지만.. 힘든 일을 이렇게 간편하게 해내니 조금만 해도 벌써부터 고수가 된 느낌도 든다. 예제가 있다는 건 활용은 쉽게 할 수 있다는 얘기니까.
앞부분에 간단한 설명이 있지만 이 책은 기본적인 언어적 지식은 있어야 할 것 같다. 파이썬을 하지 않았더라도 다른 코딩을 해봤다면 분명 쉽게 접근할 수 있을 것 같다. 파이썬의 간단한 코드를 짜봤다면 더 쉽게 접근할 수 도 있다. 사실 DB와 연동해서 보여주는 것도 궁금했는데 그 부분은 찾질 못했다. 대신에 크롤링은 재미나게 했다.
저자가 준비해 둔 자료를 가지고 작업하는 게 아니라 어디서 자료를 찾을 수 있는지도 알 수 있어서 좋았다. 국가 기관에서 이런 데이터를 제공하고 있었고 그 종류도 무척이나 다양했다. 데이터 분석이 필요한 여러 사람에게 간단하게 접근하기 좋은 책이었다. 매뉴얼과 조금만 비교해서 코딩하면 훨씬 다양한 앱도 가능할 듯했다.
*한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.