fastai와 파이토치가 만나 꽃피운 딥러닝

kcsgood***l2022-03-31

요새는 인공지능 교육에 대한 수요가 많기도 하고, 유무료로 교육자료가 제공되는 형태들도 많아졌다. 맘만 먹으면 양질의 인공지능 강의를 무료로도 들을 수 있는 것이다. 물론 수많은 강의들이 있겠지만, 그 중에 한 축이라고 할 수 있는 강의 중 하나가 fast.ai일 것이다.

fast.ai · Making neural nets uncool again

15 Mar 2022 Rachel Thomas On the surface, I may seem into math: I have a math PhD, taught a graduate computational linear algebra course, co-founded AI research lab fast.ai, and even go by the twitter handle @math_rachel. Yet many of my experiences of acad

www.fast.ai

이 단체는 진짜 어떻게보면 인공지능 교육에서 다양한 영향력을 미친다. 물론 Andrew Ng 교수의 ML 강의나 Stanford대학의 cs231n과 같이 이론적인 내용을 다루는 강의도 있겠지만, fast.ai에서 제공하는 강의는 뭔가 이론적이라기 보다는 실용적으로 활용할 수 있는 방법론에 대해서 주목한다. 예를 들어서 tensorflow나 pytorch와 같이 특정 딥러닝 프레임워크에 초점을 맞추기보다는 번거로운 작업을 대신 구현해놓은 fastai 패키지들이나 교육 내용을 공유할 수 있는 fastpages같은 것을 통해서 사람들이 인공지능 교육을 어렵다고 느끼기 보다는 실용적으로 접근할 수 있도록 해준다. 사실 오늘 소개할 책도 이 단체에서 만든 MOOC 강의인 "Practical Deep Learning for Coders"을 풀어쓴 책이기도 하다.

책의 두께는 여타 다른 인공지능 관련 책과 비교했을 때 무척 두껍다. 그런데 신기한 것은 이 두꺼운 책 내에 수학 공식이나 어떤 이론을 증명할 때 그 복잡한 과정이 거의 없다. 예를 들어서 신경망 이론을 처음 공부할 때 다루게 되는 Perceptron에서도 output이 어떻게 도출되는지 weight과 bias의 복잡한 곱셈 연산부터 쭉 다루는 반면, 이 책의 첫번째는 이런 이론적인 내용이 아니라 딥러닝을 공부하면서 다루게 될 수많은 예시들을 간단하게 체험해보는 것이다. 그래서 책의 내용이 뭔가 딱딱하지 않고, 술술 풀어서 전개된다. 강의 사이트에서도 명시되어 있는 내용이지만, 이 책에서는 다음의 내용을 최대한 배제하려고 했다.

few things you absolutely don't need to do world-class deep learning

간단하게 설명하자면, 흔히 딥러닝을 할 때 장애물이라고 생각할 수 있는 것이 세가지가 있는데, 바로 수학과 방대한 데이터, 그리고 이를 학습시킬 고성능의 컴퓨터인데, 이 강의에서는 이런게 필요없다는 것을 강조한다. 그런 내용이 책에도 반영되어 있어서 책에서 다뤄지는 내용이 막 엄청 이론적인 지식을 요구하거나 그렇지 않다. 참고로 책에서 다뤄지는 내용은 다음과 같다.

딥러닝 맛보기
딥러닝에서 다뤄지는 데이터 윤리
fastai API를 활용한 비전 모델과 언어 모델 구현
fastai API를 활용한 데이터 처리 등..

물론 어떤 사람에 따라서는 "왜 굳이 tensorflow나 pytorch를 알아서 쓰면 되는데, 굳이 fastai 패키지까지 알 필요가 있을까?" 하고 의문을 가질 수 있는데, fastai API 자체가 복잡하고 번거로운 작업을 간단하게 할 수 있도록 도와주고, 모델 생성이나 이론적인 내용을 구현할 때는 PyTorch의 도움을 받는다. 진짜 책의 의도대로 최대한 실용적으로 딥러닝에 접근할 수 있도록 해주는 것이라고 생각한다.

개인적으로 생각하는 책의 장점은 "생각할 수 있는 여지"를 매 장마다 부여한다는 것이다. 딱 책 자체가 실용적으로 구현해보는 것 위주로 되어 있기는 하지만, 책을 읽다보면 "어 이런 부분이 궁금한데..." 라는 부분에서도 책에서 그에 대한 설명이 이뤄지고, 더 생각해볼 내용에 대해서는 끝부분에서 질문 형태로 만들어서 제공한다. (가령 인공지능 관련 인터뷰를 하게 된다면 도움이 될 듯 하다) 한편 책의 내용 중 데이터 윤리에 관한 내용을 다루는 부분도 있어서, 평소에는 가볍게 넘어갔을 법한 주제에 대한 내용도 소개되어 있다.

책 자체가 두껍기 때문에 선뜻 손이 안갈수도 있겠지만, 한번 딥러닝 공부를 해보겠다 하면 이 책 (+ 강의)를 가지고 시작해보면 어떨까 생각해본다.

(해당 포스트에서 소개하고 있는 "Deep Learning for Coders with fastai & PyTorch" 책은 한빛 미디어로부터 제공받았음을 알려드립니다.)

출처: https://talkingaboutme.tistory.com/entry/Book-Deep-Learning-for-Coders-with-fastai-PyTorch [자신에 대한 고찰]

nado***l2022-03-31

다양한 활용을 통해 딥러닝 원리를 이해하게 돕는 강의식 딥러닝 입문 책

내가 처음 fastai라는 단어를 보고 이게 뭐지 하고 당황했던 기억이 난다. 점 하나만 찍으면, 의미가 확실해지는데, 그걸 몰랐다. fast.ai 빠른 인공지능이었다. 내가 너무 어렵게 생각했던 것이다.

fastai는 파이토치에서 사용하는 딥러닝 라이브러리로 탄탄한 커뮤니티를 구축하고 있어서 이를 통해 정보도 얻기 편리하고 배우기도 좋은 환경을 가지고 있다.

이번에 접한 'fastai와 파이토치가 만나 꽃피운 딥러닝'은 fastai가 가진 교육적 기반 환경을 잘 활용하여, fastai와 함께 딥러닝을 제대로 배울 수 있는 기회를 제공하는 책이다.

워낙 시중에 딥러닝 관련 책들이 넘쳐 나는 상황이다 보니, fastai라는 새로운 거 하나 알려주는 책인가 보다 할 수 있으나, 읽어 보면 알겠지만, 내용면에서 상당히 독특한 특징이 풍기는 개성이 넘치는 책이다.

첫 번째로 이 책은 세미나 또는 수업 강의를 듣는다는 느낌을 크게 받는다. 720쪽이나 되는 두툼한 책의 분량만 봐도 저자가 얼마나 많은 것을 알려주고 싶어 안달이 났는지 알 수 있을 것이다. 실제 책에서는 딥러닝 설명에 영화 이야기도 나오고, 역사적 사실, 저자들의 경험, 각종 중요 논문 이야기 같은 것들이 불쑥불쑥 튀어나온다. 사각 박스로 처리되어 나오기도 하고, NOTE로도 나온다. TIP을 통해서는 제러미, 실뱅 저자의 부가적 설명도 나와서 대화식 강의의 느낌도 들게 한다.

물론 이렇게 정보가 많으면 산만해질 수도 있다. 그러나 각 장 끝날 즈음해서 내용을 제대로 이해했는지 체크할 수 있는 '질문지' 파트가 있어서 길을 잃지 않고 정리할 수 있게 돕는다. 아울러 '추가 연구' 코너는 각 장의 주제를 좀 더 깊은 공부할 수 있게 방향을 제시해준다.

두 번째 특징은 내용을 보면, 보통 책들은 인공지능에 대한 기본 지식을 설명하고 테스트 코딩이나 활용이 나오는데, 이 책은 반대로 파트1 실전 딥러닝이란 주제로 딥러닝 소개와 함께 개와 고양이 인식, 곰의 종류 분류 같은 간단한 활용부터 해본다.

이런 학습 방식은 사람에 따라서 호불호가 있을 수 있다. 일단 뭔가 짜봐야 이해가 빠른 분에게는 이 방식이 아주 잘 맞을 수 있을 것이다. 나도 그런 쪽이긴 한데, 원리부터 배우고 활용하는 식으로 된 책을 더 많이 봐서 그런지, 나도 처음에는 살짝 당황스러웠다.

파트1에서 수박 겉핥기 활용을 하며, 기본 용어와 지식을 익히고, 파트2에서 본격적으로fastai를 조금씩 깊이 있게 알아보고, 파이토치의 내부적인 성능에 대해서 많은 이야기를 하며, MNIST, 시그모이드, 모델 해석, 다중 레이블 분류, 이미지네트, 평활화 등 여러 딥러닝 관련 알고리즘과 기법에 대해 배운다.

이렇게 활용 위주로 학습을 하고, 파트3에서 언어 모델과 합성곱 신경망, ResNets, 영상처리, 자연어처리 같은 딥러닝의 기반지식을 배우게 된다. 파트4에선 신경망, CNN 같은 것을 익히다 보니, 아마 일반적인 인공지능 책을 보셨다면, 이쪽 파트가 더 익숙하게 느껴질 것이다.

이렇게 역으로 가는 학습 구성은 진도가 나갈수록 앞에 것을 다시 곱씹어 보게 만든다. 주입식이 아닌, 근본적인 원리를 생각하며 찾아보는 능동적 학습을 하게 한다. 'WARNING_잠시 멈추고 생각해봅시다!' 같은 코너를 봐도 그런 의도를 알 수 있다. 물고기를 주는 것이 아닌, 낚시하는 방법을 알려주고 있는 것이다. 그만큼 주제별로 깊이 있게 파고들며, 스스로 문제 해결책을 찾는 힘을 길러준다. 더욱더 공부하라고, 도움이 되는 책도 곳곳에서 추천하고 있다. fast.ai에 모든 것을 익힐 수 있게 어떻게 하면, 제대로 활용할 수 있는지 구체적인 학습 방법이나 book.fast.a, course.fast.ai의 활용법도 알려주고 있으며, 학습한 것의 완벽한 소화를 위해 블로깅을 하라고도 조언한다.

다양한 사고를 독려하고 있으면서도 코드 설명에 있어서는 아주 꼼꼼하다. 함수에 인자들이 어떤 역할을 하는지, 어떤 의미를 가졌는지, 자세히 알려주고 있다. 인공지능에 있어 이것들을 제대로 알고 있지 않으면, 전혀 엉뚱한 결과를 가져오게 되므로 매우 중요하다.

세 번째 특징으로 'fastai와 파이토치가 만나 꽃피운 딥러닝'은 가급적 어려운 수학을 사용하고 있지 않다는 점이다. 고등학교 수준 정도이고, 그나마도 책에 비중이 크지 않다. 어쩌다 상위 개념의 수학이 나오면, 프로그램 코드로 개념을 바꿔 설명하고 있어 프로그래머 입장에서는 더욱 편하게 받아들일 수 있다.

이는 딥러닝에 대한 거부감을 더는데 도움이 된다. 비전공자도 좀 더 쉽게 접근하게 만들고, 이를 통해 자신이 잘하는 업무에 딥러닝을 활용하도록 용기를 준다. 이 책의 저자인 제러미 하워드도 세계적으로 유명한 딥러닝 전문가이지만, 철학 전공자다.

책 내용 중에 독특했던 것은 데이터 윤리 부분이었다. 다른 딥러닝 책에서는 거의 다루지 않는 주제의 내용이었다. 과학자의 생명 윤리와도 비슷한 느낌인데, 잘못된 알고리즘이 어떤 문제를 낳는지 구체적 사례를 보며, 데이터 윤리가 왜 중요한지를 말하고 있다.

여기에는 여러 예가 나오는데, 그중 IBM의 기술이 홀로코스트에 일조했다는 것은 충격적이었다. IBM은 단지 기술적인 일을 했을 뿐이지만, 그 결과는 참혹한 만행에 일조를 한 것이다.

자동화나 인공지능 개발자도 비슷한 상황일 수도 있다. 내가 만든 자동화 기기, 인공지능 프로그램이 결국 사람들의 일자리를 뺏고 있는 것이 아닌가 하는 그런 거 말이다.

많은 책에서 그건 시대의 흐름이고 러다이트 운동 같은 짓을 해서는 안된다고 한다. 새로운 일자리도 창출될 거라고 한다. 하지만, 현재 상황은 일자리가 줄고 있다는 것이 사실이며, 새로운 일자리는 더 고도화된 기술 가진 인력만이 누릴 수 있다. 단순노동자는 녹아가는 빙산 위에 있는 것과 마찬가지 형국이다.

자신이 개발하고 있는 알고리즘이 어떤 편향을 가지고 있는 게 아닌지, 또는 도덕적, 윤리적, 사회적으로 어떤 영향을 끼칠지 신중히 고민할 필요가 있다.

'fastai와 파이토치가 만나 꽃피운 딥러닝'은 초보자를 위한 책이기는 하지만, 적어도 파이썬 코드는 볼 줄 알아야 한다. 인공지능을 아예 모르는 분들은 다소 버겁게 느낄 수도 있다. 급한 마음으로 단기간에 책을 정복하겠다는 생각보다 좀 여유를 가지고 하나씩 실습하며 진도를 나가는 것이 좋을 것이다.

반면, 인공지능을 좀 접해 본 분들은 기존 지식을 새로운 시각으로 볼 수 있는 기회가 될 것이다. 미흡한 부분을 다시 체크하는데도 도움이 되는 책이기도 하다. 인공지능 공부는 결과도 중요하지만, 어떻게 그런 결과가 나왔는지 제대로 이해하는 것이 더욱 중요하다. 그래야 더욱 효율 좋은 알고리즘도 만들 수 있다고 생각한다. 그런 면에서 'fastai와 파이토치가 만나 꽃피운 딥러닝'이 그런 생각 근육을 길러주는데 여러 도움이 될 것이다.

seren***l2022-03-31

다른 책 다보니 이제서야 나오다니! 쉽게 쉽게 가자 딥러닝!

딥러닝 공부는 ‘fastai’를 만나기 전과 후로 나뉜다.

내가 짠 코드가 딥러닝을 한다! 이제 조금 게으르게 살아도 되겠다!

- 사이트 책 소개 중 -

책 소개에는 저런 내용이 있다. 정말 게으를 수 있는 것인가.

차일 파일 공부를 미루다 보니 이전 보다 더 쉽게 그리고 더 좋은 기능들이 많이 나오고 있다.

사람은 역시.. 게으름을 위해 부지런해지는 동물인가 보다. 책 뒷면도 같은 내용 !

개발자에서 말하자면 늘 내가 짠 코드가 딥러닝을하지만.. 과거보다 훨씬 쉽고 다양한 것으로 그리고 딥러닝에 대해서 잘 알지 않아도 충분히 이해할 수 있게 해주겠다는 자신감으로 보인다.

과연 그러한지 하나씩 보자면..

정말 책이 두껍다. 종이도 얇은데 두께가 어마무시 하다. 600 페이지가 넘는 양이라니..이쑤시게통 높이의 절반 두께라면 얼마나 두꺼운지 짐작 해 볼 수 있다.

책은 코딩경험이 없어도 충분히 이해 할 수 있도록 작성되었다고 말하고 있다. 과연 책의 대부분의 내용은 코드와 결과를 눈으로 볼 수 있도록 충분히 수록되어 있고 컬러와 함께 설명도 잘되어 있다. 이미지를 설명할 때는 이미지를 텍스트일 땐 텍스트를 수식은 수식을 이해할 만큼 충분한 양으로 설명한다.

또한, 책은 기술에 대해서만 설명하지 않는다. 머신 러닝에서의 데이터 윤리에 대한 내용도 정리하고 있다.

단순 사용만이 수록되어 있는것이 아니라 데이터를 구성하고 사용하기 위한 생각법과 머신러닝 어플리케이션을 만들고 배포하는 것도 알려주며, 주피터로 블로그를 만드는 방법 또한 설명한다.

정말로 제로에서 시작하는 머신러닝 배움의 책!

최신 정보까지 잘 정리해 놓은 책으로 또 다시 세상이 바뀌기 전까지 꾸준히 보고 실습에 사용하기 좋은 책이라고 생각한다.

한줄 한줄 읽고 코드는 따라 하다 보면 어느새 fastai가 무엇인지, 어떻게 사용하는지를 알게 될 것이다.

번역서라는 것을 잊을 만큼 깔끔하게 정리되어 있다!

ㅂ

ksh***l2022-03-31

접근하기 쉬운 라이브러리 fastai로 딥러닝을 시작해보고 싶은 사람에게 추천드리는 책

1. 대상 독자

위의 책은 보통의 책들과는 다르게 기초부터 쌓기보단 큰 숲을 먼저 경험하고 세부적으로 살펴보는 책입니다. 책의 저자는 어느정도의 프로그래밍 방법과 수학 기초 지식(고등학교)이 있는 독자를 대상으로 작성했습니다. 실제로도 저자가 잘 풀어쓰기 위해 노력했다는 것이 느껴집니다. 직접 만들어보는 작업을 통해서 흥미를 가지고, 점차 세밀하게 배우고 싶은 독자라면 좋은 책이 될 것 같습니다.

2. 이 책의 특징

1) 데이터 윤리 파트

과학기술의 발달로 데이터 윤리 또한 부각이 되어가고 있습니다. 우리가 만든 모델이 윤리적인 문제를 발생시킬 수 있다는 부분을 언급해주며, 다양한 사례를 통해 인공지능을 만드는 제작자로 올바른 결정과 고민을 하도록 도와주는 부분이라고 할 수 있을 것 같습니다.

2) 수학을 최대한 이해하기 쉽도록 구성

수학과를 졸업했음에도 수학적인 정의는 현실적으로 이해하기가 어려운 경우가 많습니다. 저자의 말을 통해 쉽게 자신의 것으로 만드는 방법 등을 표현해줌으로써 자신 만의 방법으로 이해하도록 돕는 부분이 인상적이었습니다. 이외에도 수식적인 부분이 등장할 때마다 그림을 통해 최대한 이해하기 쉽도록 구성하였습니다.

3) 챕터가 끝날 때마다 포함되어 있는 질문

각 챕터별로 알아야할 개념에 대해 마지막으로 짚어볼 수 있도록 구성한 부분이 인상적이었습니다. 이 챕터를 읽고 해당 질문에 대해 답변하지 못하는 부분이 있다면 해당 파트를 스스로 공부할 수 있도록 도와줄 수 있을 것 같습니다. 혼자 공부해본 경험을 살려보면, 어떤 것이 더 중요한 지에 대해 알고 접근하기가 어려웠습니다. 해당 질문지가 그런 어려움을 해결해주는 길잡이가 될 것이라고 생각합니다.

3. 총평

최근에 많이 활용되는 PyTorch, Tensorflow를 활용해서 밑바닥부터 쌓기보다는 먼저 접근하기 쉬운 라이브러리로 딥러닝을 배우고 싶은 사람에게 추천드리는 책입니다. 또한 PyTorch에 대한 내용도 많이 포함하고 있어서, fastai를 시작으로 PyTorch까지 확장해나가기 괜찮은 책인 것 같습니다. 특히, 번역서의 경우에 문맥이 매끄럽지 못한 부분이 많은데, 이 책은 번역 측면에서 아쉬운 느낌은 없는 책입니다.

sua***l2022-03-31

딥러닝 맛보고 처음 접하기에 좋은 책

el***l2022-03-31

친절한 딥러닝 안내서

jaei***l2022-03-31

직접 만져보면서 딥러닝 입문하기 좋은 책

딥러닝을 쉽게 배울 수 있는 리소스가 아직도 점점 더 많아지고 있고, 그 덕에 초보자들은 기초적인 이론지식부터 복잡한 딥러닝 모델과 태스크에 도달하기까지의 시간이 많이 단축되었다.

<fastai와 파이토치가 만나 꽃피운 딥러닝> 또한 딥러닝 공부를 시작하고자 하는 사람들에게 좋은 입문책이 되어줄듯 하다. 다른 입문책과 차별되는 점이 있다면 CV, NLP, 추천시스템과 같은 굵직한 딥러닝 분야들 맛보기를 다뤄주고 있다는 점. 아직 어떤 필드를 할지 결정하지 못했거나 필드들이 서로 어떻게 다른지 알아보고싶은 사람들에게 제격이다.

개인적으로는 <밑바닥부터 시작하는 딥러닝> 책과 병행해도 좋겠다는 생각이 들었다. <fastai와 파이토치가 만나 꽃피운 딥러닝>이 fastai라는 높은 레벨의 프레임워크를 이용해서 딥러닝 어플리케이션을 쉽게 구현해보는 반면, <밑바닥부터 시작하는 딥러닝>에서는 딥러닝 프레임워크 없이 numpy와 파이썬의 기본 라이브러리만을 사용해서 말그대로 “밑바닥부터” 딥러닝을 구현해본다. 이 두가지 경험 모두 초보자에게는 중요하다. 딥러닝 “이론”만 백날 붙잡고 있어도 딥러닝을 이해하는 데에는 한계가 있고, 잘 되어있는 프레임워크를 사용해서 딥러닝 모델을 “구현”해본다고 해도 무엇이 이론 밑바탕이 되는지 알기 힘들기 때문이다. 만약 초보자 때부터 이 두가지를 모두 경험해본다면, 시작할 때부터 좋은 인사이트를 가지고 딥러닝을 공부할 수 있는 기회를 가질 것 같다. “밑바닥” 시리즈와 이 포스트에서 소개하는 <fastai와 파이토치가 만나 꽃피운 딥러닝> 모두 입문자를 대상으로 출판된 책이니, 겁먹지 말고 펼쳐봐도 좋다.

이 책이 지향하는 방향을 잘 나타내는 책 속 문장들은 다음과 같다.

먼저 간단하면서도 사용하기 좋은 도구를 사용해 실세계 문제를 해겨하는 데 사용할 수 있는 최신 딥러닝 모델을 사용하는 방법을 보여드리겠습니다. 그다음 이런 도구가 만들어진 방시고과 이런 도구를 만든 도구가 만들어진 방식 등을 점점 더 깊이 파고듭니다. (P40)

지금까지 딥러닝은 특정 집단의 전유물처럼 사용됐습니다. 저희는 그 경계를 허물고, 모두가 딥러닝을 쓸 수 있도록 합니다. (P40)

저희는 기술의 기본기를 이해하고, 이를 실제로 적용하고, 새로운 도구와 기법이 출시될 때 신속하게 전문성을 확보하는 방법을 배우는 것이 핵심이라고 믿습니다. (P44)

…그리고 도중에 읽기를 포기했습니다. ‘윽! 나는 도저히 수학을 이해하지 못할 거야!’라고 수천 번 생각했습니다. 그러기를 반복하다가 복잡한 수학적 용어를 접할 때마다 코드로 바꿔 개념을 터득하는 방법을 생각해냈습니다… (P195)

여기서는 그레이디언트 부스팅 트리 앙상블을 학습시키는 방법을 자세히 다루지 않습니다. 빠르게 변하는 분야라서, 이 책을 읽을 때쯤엔 여기서 습득한 지식이 구식이 될 가능성이 높기 때문이죠. (P415)

개인적으로 이 책에 대해 높이 평가하고 싶은 부분이 있다. 바로 Chapter 3 통째로 데이터 윤리를 다룬다는 것이다. 머신러닝은 그저 우리가 먹여주는 데이터를 가지고 학습을 하기 때문에, 데이터의 내용과 퀄리티에 따라 천차만별한 결과를 보일 수 있다. 최근 몇년동안 데이터 윤리에 대한 중요성이 점점 더 조명을 받고 있는데, 과거 딥러닝 입문 책에서는 거의 다루지 않거나 조금만 언급하고 말았던 데이터 윤리 내용을 한 챕터에서 디테일하게 설명해준다. 건강관리 알고리즘의 버그가 많은 환자들에게 피해를 끼쳤던 사례, 유튜브 추천 시스템이 갑작스러운 음모론 유행을 일으킨 사례에 더불어 아프리카계 미국인 이름을 구글링하면 범죄 신원 조회 광고가 등장했던 사례를 소개하고 이와 같은 문제에 대응할 수 있는 기술적인 방법론과 사회적으로 요구되는 책임감을 다룬다. 혐오 표현, 알고리즘 필터 버블과 같은 관련 연구들이 활발하게 진행되고 있는 시기인 만큼, 입문자들도 이와 관련해서 처음부터 공부할 기회가 있다면 딥러닝을 조금 더 넓은 시각에서 바라볼 수 있을 듯 하다.

이처럼 이 책은 딥러닝을 직접 만져보면서 입문하기에 매우 적합한 책이고, 많은 실질적인 문제들을 쉬운 예시를 들어 소개해준다. 번역이 어색한 부분들이 있어서 아쉽긴 했지만 번역본들의 특성상 어쩔수 없는 부분이기도 하다. 직접 만지면서 공부하기 좋아하는 입문자들에게 추천한다. :)

Statement: 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

hahajj***l2022-03-30

fasti와 파이토치가 만나 꽃피운 딥러닝

* 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

fastai와 파이토치가 만나 꽃피운 딥러닝

최소한의 지식으로 딥러닝을 쉽게 배울 수 있는 도서

www.hanbit.co.kr

리뷰하기에 앞서서...

사실 저는 fastai API를 쓸 일이 없다고 생각했습니다. Scratch로 구현할 수 있기 때문이기도 하지만, API를 활용하면 API가 지원하지 않는 최신 모델들과는 호환성이 떨어진다고 생각했기 때문이기도 합니다. 보통 그러한 이유로 저는 PyTorch를 베이스로 모델을 구성하고, optuna/ray 등으로 하이퍼파라미터 서치를 하는 경우가 많았습니다.

그럼 왜 fastai?

베이스라인을 구성하는 데에는 이만큼 적합한 것이 없습니다. 리서치 환경에서의 Static data가 아닌 Flow data를 다루고, Cutting-edge architecture와 SOTA 모델을 목표로 하는 것이 아닌 이상 fastai는 정말 빠르고, 간결하고, 편리한 API임에 분명합니다.

이 책은...

결론부터 말하자면 정교하고, 그 내용이 결코 얕지 않은 책입니다.

많은 번역서에서 나타나는 과대번역(Leaky ReLU를 누설 렐루함수라고 번역하는 경우도 봤습니다.) 문제는 심하지 않은 편입니다. 오히려 영어 원문 그대로의 표기를 활용하는 것이 의사소통의 측면에서 정확하다는 생각을 많이 하곤 하는데, 이 책에서는 지나치게 한글 표현을 사용하려고 애쓰다 보니 발생하는 어색한 번역을 찾아볼 수 없었습니다.

저는 개인적으로 ~교과서 라는 제목의 입문서를 썩 좋아하지 않습니다. 간혹 유명한 모델들의 설계도를 그려 놓고서, 이대로 건축을 해봤더니 잘 되는군요! 라고 말하는 경우가 있기 때문입니다. 장기적으로는 이 책처럼 "왜 이러한 설계를 해야 하는가?"라는 Intuition이 훨씬 중요하다고 생각합니다. 아키텍처에 따라 달라지는 Data flow, 혹은 Data의 Geometric Structure(혹은 Topology)를 직관적으로나마 파악하는 것이 훨씬 중요하다고 생각합니다.

이 책은 그러한 욕구를 충족시키기에 충분한 것 같습니다. Pytorch를 활용한 딥러닝 구조 설계 파트와 fastai의 철학을 설명하는 두 파트로 나누어 볼 수 있는데, Pytorch를 활용한 딥러닝 구조 설계 파트에서는 Kaggle Notebook을 여러 번 필사하다 보면 경험적으로 알게 되는 디테일들이 풍부하다고 생각합니다. fastai의 API를 활용하는 11장의 파트가 조금 더 길었으면 참 좋았겠다는 생각이 들기도 하지만, fastai API 입문으로는 충분하고 fastai docs를 보면서 빠르게 적용해 볼 수 있도록 초석을 잘 다져 놓았다는 생각이 들었습니다.

nanhmjj***l2022-03-28

fastai와 파이토치가 만나 꽃피운 딥러닝

딥러닝의 민주화를 꿈꾸는 fast.ai를 다룬 책으로 애플리케이션 구동부터 밑바닥 구현에 이르기까지 Top-Down 방식으로 fast.ai의 철학과 구현의 묘를 알려주는 양서이다.

fast.ai는 손쉽게 딥러닝을 가능하게 해주는 Pytorch보다 고수준의 딥러닝 라이브러리이다. 흔하게 알려진 Tensorflow, Pytorch에 비해 문자 그대로 얼마나 빠르고 쉽게 AI를 구현할 수 있는지 본 도서의 1장만 참조해도 쉽게 파악할 수 있다.

예를 들면 1장에는 개와 고양이의 분류기를 만드는 예제가 등장하는데 필요한 코드량이 고작 6줄이다. 딥러닝 입문자 수준만 되어도 fast.ai 라이브러리의 학습 유무와 무관하게 직관적으로 이해할 수 있는 코드라는 점이 특징이다.

위 코드를 한 번 해석해 보는 것이 fast.ai의 정체가 무엇인지 가장 빠르게 느낄 수 있는 방법이 될 것 같다는 생각이 든다. 그 외에 data 기반으로 손실 함수를 자동 선택하는 매력적인 기능에서부터 doc() 함수와 같이 사소한 부분까지 fast.ai에는 매력적인 기능들이 넘쳐난다.

이 책의 학습 방식은 다소 독특한데 전반적으로 Top-Down 방식으로 구성되어 있다. 먼저 위와 같이 최소한의 코드로 빠르게 개와 고양이 분류기를 만들고 눈으로 직접 확인하며 어플리케이션 사용자가 되어 본다.

다음으로 코드를 한 줄씩 뜯어보며 정체를 알아본다. 코드를 해석하고 난 다음에는 필요한 딥러닝의 개념, 모델의 구조를 알아보는 식이다. 상세코드

종국에는 fast.ai 없이 밑바닥까지 구현하는 구성으로 되어 있으며 필요 시 논문 및 연구 결과를 해석해보는 것은 물론 그 안에 포함된 수식도 주저없이 다룬다.

fast.ai라는 것이 밑바닥 레이어를 가리고 빠르고 쉽게 딥러닝을 구현 가능하게 해주는 라이브러리라는 것이 무색할 정도로 시간이 흐를수록 책이 뒷부분으로 넘어갈수록 깊이 있는 내용까지 세세하게 파고든다는 것이 꽤 아이러니했다.

얼마나 상세하게 다루는지 그동안 기초라고 생각하며 넘어갔던 내용도 상세히 뜯어주고 있어 당연하듯 외우고 넘어갔던 부분을 내가 얼마나 모르고 있었는지 부끄럽게 만들어 줄 정도이다.

왠만한 교과서 이름 들어가는 딥러닝 책을 수 십권 이상 읽은 것 같은데 새롭게 배우게 된 내용들이 많아서 충격이었다.

대충 알고 있던 연구 결과의 심오한 의미를 다시 깨닫게 된 것에서 시작하여 마빈 민스키 교수가 XOR과 관련하여 여러 층의 신경망으로 해결할 수 있다는 사실을 증명했다는 사소한 것까지 이 책 덕분에 바로 잡을 수 있었다.

분량도 700p가 넘고 fast.ai를 사용하는 사람들의 기대와는 다르게 왜 딥러닝의 밑바닥까지 기술했는지 읽을 수록 궁금했다. 상당한 분량의 책을 오랜 시간 1회독한 후에야 저자들의 의도를 어렴풋이나마 알 수 있게 되었다.

아마도 이 책을 읽는 독자는 수준이나 경험의 차이는 있을지 몰라도 딥러닝으로 어떤 솔루션을 구현하는데 있어 저마다의 방법론을 갖고 있을 것이다.

때로는 그 방법이 매우 뛰어난 방법이 될 수도 있는 반면 크게 도움이 되지 않는 조촐한 방법이 될 수도 있을 것이다. 그리고 아마 대부분 후자에 해당될 것이다.

나 역시 딥러닝을 활용한 나름의 해결 방법론을 갖고 있는데 이 책 덕분에 나의 방법이 얼마나 조악하고 임기 응변 식이었는지 적나라하게 깨달을 수 있었다.

fast.ai의 껍데기에서 11장의 중간수준 API를 거치고도 밑바닥까지 구현하는 방법을 모두 소개하는 과정 덕분에 fast.ai는 어떤 철학으로 만들어졌으며 나의 방법과는 어떤 차이가 있는지 깨달을 수 있었다.

그리고 이 책의 저술 방식 또한 fast.ai의 철학을 그대로 따르고 있다는 사실을 알게 되었다. fast.ai가 딥러닝의 민주화로 칭송받는 만큼 이 책은 fast.ai가 어떻게 만들어졌는지 투명하게 공개하여 다른 고수들의 도전을 받아들일 준비가 되었음을 시사하는 것 같아 감회가 새로웠다.

읽는 내내 세상에 완벽한 시스템은 없지만 이 정도 철학과 구현에 토를 달 수 있을 것인지 만약 그렇다면 fast.ai를 업그레이드하는데 참여해 볼 생각이 없느냐는 저자 심중의 말이 들리는 느낌이었다.

아무튼 fast.ai가 어떻게 구현되고 설계되어있으며 현존하는 다른 솔루션과 어떻게 연결할 수 있는지를 파악하며 내 딥러닝 세계의 모래성이 상당 부분 허물어졌고 새롭게 쌓아 올리게 되었으며 그 과정에서 많은 것들을 배울 수 있었다.

즉, 이 책은 fast.ai의 모든 것을 다룬 책이지 결코 fast.ai의 장점이나 활용 측면만을 다룬 책이 아니라는 것을 꼭 알아두었으면 한다.

개인적으로 가장 재미있던 파트는 9장과 11장이다. 9장은 Tabular 데이터를 다루는데 딥러닝이 얼마나 개입할 수 있고 딥러닝이 무엇을 도와줄 수 있는지에 대해 꽤 깊이있게 다룬다.

캐글 경진대회에 관심이 많거나 기존 레거시를 그대로 안고 AI를 도입하려는 조직에 몸담고 있는 분들이라면 공감이 될 만한 장이다. AI로 새 출발을 하는 스타트업이나 부서라면 모르겠지만 대부분의 기존 부서들은 RDBMS에 대한 의존도가 상당히 높기 떄문이다.

영상처리나 NLP, 시계열에는 딥러닝이 우위를 점하고 있지만 Tabular 데이터 앞에서는 그다지 활용도가 높지 않다. 기존 머신러닝 세계의 앙상블만으로도 꽤 좋은 성능을 내기 때문이다.

하지만 흔히 활용되는 랜덤 포레스트, 그레이디언트 부스팅과 비교하여 딥러닝을 활용하는 방법은 구체적으로 어떤 차이가 있을지 다차원의 피처에서 어떤 도움을 받을 수 있는지 등 다른 책에서 찾아보기 힘든 내용이 많이 담겨 있어 흥미롭게 읽을 수 있었음은 물론 배울 내용이 많았다.

11장은 중간 수준 API를 통해 fast.ai의 내부를 엿볼 수 있는 장이다. Python이 제공하는 추상화의 위력을 실감할 수 있고 콜러블, 데코레이터 등 특수한 기능을 어떻게 fast.ai에 녹였는지 짧지만 쉽게 이해할 수 있도록 잘 정리하고 있다.

fast.ai의 철학을 엿보기 쉬운 장이므로 조금 더 많은 분량을 할애하여 설명해 주길 바랬지만 이 책이 fast.ai의 활용과 이해에 주안을 두고 있는 것을 알았기에 아쉬움을 뒤로 할 수 있었다.

전체적으로 파트1에서는 실제로 눈으로 확인 가능한 제품을 만들고 확인하는 것에서 출발한다. 파트2는 fast.ai의 애플리케이션 레이어에 대한 설명을 다루고 있으며 영상처리, 협업 필터링과 관련한 추천시스템 등 제품 관점에서 필요한 지식 위주의 설명을 담고 있다.

파트3는 딥러닝의 기반을 이루는 모델에 대해 분석하고 논문 등의 연구 결과를 뜯어 본다. 마지막 파트4에서는 밑바닥 수준의 신경망을 구현하는 방법 등을 다루는 데 특히 Learner 클래스를 직접 구현해 보는 19장이 흥미로웠다.

그 외에도 이 책은 많은 흥미로운 서드 파티 요소들을 소개하고 있다. IPython, Voila 등을 이용해서 주피터 노트북을 애플리케이션화하는 방법이나 배포하는 방법 혹은 깃허브 블로그를 만들어 연동하는 방법까지 보다 생태계를 널리 활용하는 방법도 담고 있다.

책의 구성 방식도 매우 독특한데 주인공 세명이 등장한다. 컴퓨터에 강하지만 수학에 약한 제러미, 수학은 잘 하는데 IT에 약한 실뱅, 독자와 비슷한 눈높이를 가진 동료같은 알렉시스가 어려운 내용이 등장할때마다 TIP 박스에 등장한다. 마치 옆에서 얘기해주는 느낌이 들 만큼 친절한 구성이었는데 깊이 있는 이해와 졸릴 때마다 많은 도움이 되었다.

또, 각 장 말미에는 질문지가 등장하는데 딥러닝을 어느 정도 학습한 독자라면 이 질문지를 먼저 읽을 것을 권하고 싶다. 이미 알고 있는 내용은 빠르게 건너뛰고 질문지에서 답하기 힘들었던 내용을 중심으로 입체적으로 읽어나간다면 더 빠르고 확실한 이해에 도움이 될 것이다.

리뷰가 너무 길어져 이만 정리하지만 사실 하고 싶은 말이 너무 많았다. 700p가 넘는 책을 읽다보니 언급하고 싶었던 것도 많지만 너무 글이 통일성도 없고 두서없이 늘어놓는 것만 같아 이즈음에서 줄인다.

꼭 fast.ai를 활용하지 않더라도 밑바닥에서 고수준을 아우르는 라이브러리를 직접 구현하여 사용한다면 스스로의 작품과 fast.ai와의 진검승부에 이 책은 좋은 가이드가 되어 줄 것 같다.

상당히 심오하고 깊이있는 내용임에도 매우 쉽게 전달하는 저자들의 능력과 노력에 감탄했다. fast.ai와 무관하게 딥러닝에 관심이 있는 독자라면 누구에게라도 반드시 도움이 될 것을 확신하며 리뷰를 마친다.

책소개 - fastai와 파이토치가 만나 꽃피운 딥러닝

eehoesk***l2022-03-27

딥러닝의 A부터 Z까지 수록되어있는 책

한빛미디어에서 "fastai와 파이토치가 만나 꽃피운 딥러닝" 이라는 책이 출간되어 읽어보았다. 먼저 fastai가 무엇인지 알아보았다. fastai는 제레미 하워드라는 사람이 만든 PyTorch의 상위 Wrapper 같은 개념이며, PyTorch를 이용하여 다양한 기능들을 자동화시켜주고, 딥러닝 모델 구현을 용이하게 한다고 한다.

이 책에서는 fastai를 이용하여 최고의 결과를 달성하는 모델을 학습 시키는 방법, AI 모델을 웹 어플리케이션으로 바꾸는 방법, 딥러닝 모델이 작동하는 이유와 방법 등을 다룬다. 또한 딥러닝을 처음 접하는 사람들을 대상 독자로 다루고 있으며, 코딩 경험이 없더라도 내용을 이해하는데에는 무리가 없다. 다만 책이 총 720 페이지에 달하기 때문에 들고다니기에는 약간 무리가 있지만, 그만큼 구성되어있는 딥러닝 내용들이 알차고, 꼼꼼하고 세심하게 잘 설명되어있기 때문에 딥러닝 사전이라고 생각하면 좋을 것 같다. 개인적으로 A부터 Z까지 다룬 책 한 권을 읽는게 지식을 습득하는데 굉장히 도움이 많이 되는 듯 하다.

Part 1. 실전 딥러닝

1장에서는 신경망의 역사부터 시작해서 딥러닝 학습 방법, GPU를 탑재한 딥러닝 서버 구하기, 검증용 및 테스트용 데이터세트까지 딥러닝을 시작하는데 필요한 기본적인 것들을 전반적으로 설명하고있다. 2장에서는 컴퓨터 영상처리 문제를 예시로 딥러닝 애플리케이션 제작 과정을 처음부터 끝까지 살펴본다. 3장에서는 데이터 윤리에 대해 설명한다.

Part 2. fastai 어플리케이션 계층 이해하기

4장에서는 학습을 진행할 때 적용될 수 있는 기법들에 대해 소개한다. 5장에서는 이미지 분류에 대해 다루며, 6장에서는 다중 레이블 분류 및 회귀 문제를 다룬다. 7장에서는 최신 모델 학습 기법에 대해 다루고 있으며, 그 예로 TTA, Label Smoothing 등이 있다. 8장에서는 사용자가 많고 다양한 제품을 보유한 상황에서 어떤 제품이 어떤 사용자에게 가장 유용할지 추천할 때 쓰일 수 있는 Collaborative filtering을 설명한다. 9장에서는 CSV나 스프레드시트와 같은 테이블 형식의 데이터를 모델링 하는 방법에 대해 알아본다. 10장에서는 NLP에 대해 다룬다.

Part 3. 딥러닝의 기반 지식

11장에서는 fastai의 중간 수준 API로 데이터 변환하는 방법에 대해 알아본다. 그리고 12장에서는 언어모델을 밑바닥부터 구현하는 방법에 대해 다루며, 13장에서는 CNN에 대해 다룬다. 14장에서는 ResNet에 대해 다룬다. 15장에서는 애플리케이션의 구조에 대해 살펴본다. 즉 fastai가 제공하는 응용 모델의 작동 방식과 구현의 상세 부분을 다루게 된다. 16장에서는 학습이 어떻게 진행되는지를 다룬다.

Part 4. 밑바닥부터 구현하는 딥러닝

17장에서는 역전파를 구현하는 것 부터 시작해서 정말 밑바닥부터 신경망 계층을 구현하는 방법에 대해 다룬다. 또한 18장에서는 Class Activation Map을 이용한 CNN의 해석에 대한 내용을 다루게 되는데 특징 맵이 어떻게 구성되는지에 대해 이해할 수 있었다. 19장에서는 Learner 클래스를 만들어 학습을 하는 방법에 대해 다루는데, 아마 이 장을 혼자 할 수 있다면 딥러닝 개념은 모두 배운게 아닌가 싶다.

이 책에서 좋았던 점은 무엇보다 책의 두께가 두껍기 때문에 그만큼 유익한 내용을 A부터 Z까지 많이 담고 있었다. 예를 들면 테스트용과 검증용 데이터셋이 왜 중요한지에 대해서 상세히 설명해놓은 점, 당연했다고 생각했던 딥러닝에서 사용되는 용어들을 상세히 설명해놓은 점, 이미지 증강 종류에 따른 단계를 상세히 그림으로 설명해 놓은 점, 이 책 기준 최신 딥러닝 기법의 논문을 해설해놓은 점 등이 있다. 심지어 기술적 글쓰기(Technical Writing)를 독려하고, 블로그 개설을 추천하는 조언들까지 정말 다양한 내용을 많이 담고있다.

또한 책의 매 장마다 "질문지"를 제공한다. 수 많은 개념을 읽다 보면 집중해야 하는 주요 내용이 무엇인지 알아차리기 어렵기 때문에 각 장의 마지막에 배운 내용을 정리하는 질문 목록이 포함되어있다. 혼자 딥러닝을 공부하려는 사람에게 제격인 듯 하다. 딥러닝을 가르치려는 사람이 이 질문지를 보고 시험을 내도 좋을 것 같다.

그리고 책에서 개념을 설명할 때 첨부된 그림자료들의 출처가 매우 다양했기에 정말 많은 자료들을 쉽게 접할 수 있었다. 블로그를 통해 봤었던 그림도 있었고, 논문의 그림도 참조하는 등 다양한 자료들을 상세한 글과 함께 볼 수 있어서 매우 친절하게 설명되어있는 블로그 글을 읽는 느낌이 들었다. 또한 각 장마다 설명하는 개념이 다음 장에도 다른 개념과 함께 설명되는 경우가 많았어서 마인드 맵 연결된 것 처럼 어려운 내용들이 서로 연결되어 이해가 잘 되었다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

ksh60***l2022-03-26

수식을 공부할 필요없이 딥러닝을 경험할 수 있는 책

joyf***l2022-03-21

fastai와 파이토치가 만나 꽃피운 딥러닝 리뷰

요즘 딥러닝에 관심을 갖고 무엇을 공부해야 하나 고민을 하다가 대세를 따르기로 했다.

언어는 파이썬이 대세다.

언제부터인가 파이썬이 주력 언어가 된 느낌이다.

이렇게 파이썬을 많이 사용하는 이유 중에 하나는 가벼우면서도 강력한 기능에 있다고 생각한다.

이번에 읽게 된 fastai와 파이토치가 만나 꽃피운 딥러닝 책도 파이썬을 기반으로 fastai와 파이토치 라이브러리를 통해 가볍게 딥러닝을 학습할 수 있도록 도와준다.

파이토치는 페이스북 인공지능 연구집단에 의해 개발되었다.

간결하고 구현이 빨리되며, 텐서플로우보다 사용자가 익히기 훨씬 쉽다는 특징이 있다.

텐서플로우는 Define-and-Run 프레임워크인 반면에, 파이토치는 Define-by-Run이다.

출처 Complex neural networks made easy by Chainer

Define-by-Run 정의와 값 초기화가 동시에 된다.

여러 장점이 있겠지만 일단 쉽고 편리하다.

파이토치도 파이썬 처럼 코딩이 쉽고 비슷하다.

그래서 요즘 딥러닝 프레임워크로 많이 사용된다.

fastai 라이브러리도 파이토치 기반으로 구축이 되어 둘의 조합은 높은 시너지 효과를 만들어 준다.

인공지능을 가장 쉽게 공부하는 방법이 뭔지라고 검색해 봤더니

이 책을 읽고 무료 과정을 학습하는 것이라 한다.

바로 이 책을 지은 제러미 하워드가 한 말이다.

딥러닝을 공부하기 위해 박사과정을 학습할 필요없이 이 책과 무료 과정을 통해 학습할 수 있다는 것이다.

책은 바로 코딩을 통해 첫번째 모델 개와 고양이를 인식하는 이미지 분류 모델을 학습하도록 한다.

책과 함께 fastai에서 도움을 받을 수 있다.

딥러닝을 공부하려는 사람의 조건이다.

박사 학위는 필수가 아니다.

고등학교만 졸업했다면 딥러닝을 공부할 수 있다고 하는데

이 책을 통해 딥러닝을 공부하려면 파이토치, fastai, 주피터 노트북 소프트웨어만 있으면 된다.

모두 무료로 사용할 수 있기 때문에 정말 누구나 이 책 한 권만 있으면 딥러닝을 공부할 수 있는 세상이 왔다.

딥러닝을 가장 쉽게 공부하는 방법을 찾는 독자에게 수 많은 사람들이 추천하는 책이다.

wizm***l2021-09-23

진입장벽을 낮춘 fastai와 파이토치가 만나 꽃피운 딥러닝

머신러닝, 딥러닝을 수학적으로 잘 풀어준 교육, 교재는 많다. 아무래도 수학이 장벽으로 느껴지곤 하니 아예 딥러닝 관련 수학을 알려주는 교육과정과 책도 꽤 있다. 그런데 좀 색다른 책이 나왔다.

딥러닝 교재의 기본 스타일은 Coursera의 Deep learning specialization 과정이다. (https://www.coursera.org/specializations/deep-learning) 어지간한 인공지능 이론/실습 과정은 선구적인 이 교육과정의 영향을 받았다고 해도 과언이 아닐 것이다.

그래서 책 안내를 접하고 기대 반 걱정 반이었다. 일단 딥러닝의 원리를 수학 공식을 들먹이지 않고 설명하는 것에 감탄했고 컬러 인쇄를 해서 뭔가 더 다가가기 쉬웠으나, TensorFlow나 PyTorch가 아닌 fast.ai를 통해 배우면 결국 실전에 돌입할 때에는 머신러닝 프레임워크를 새로 배워야 하지 않는가 하는 걱정이었다. 더구나 다른 입문서는 책이 얇은 편인데 700쪽이 넘는 두꺼운 책이라 분량이 도리어 장벽이 되지 않을까 우려가 되기도 했다.

드롭아웃이 12장이나 되어야 나올 정도로 딥러닝 원리를 풀어 나가면서도, 이미지와 자연어를 막론하여 다양한 데이터를 찬찬히 다루어 나갔다. 700쪽이 넘는 이유는 설명이 다방면에 걸친 데이터를 상세하게 다루었기 때문이었다. 에포크와 배치를 늘이고 줄이는 노하우도 눈에 들었다. 다방면으로 원리를 충분히 배우니 프레임워크를 바꾸더라도 어렵지 않게 적응할 수 있겠다는 생각이 들기도 했다.

2021년 기준으로 이 책이 다루지 않는 인공지능 주제는 없다시피하다. 실제 현장에서는 모델을 경량화하곤 하는데, 그런 주제만 다루지 않는 편이다. 파이썬 문법에 어려움을 겪지 않는 수준이라면, 검색 좀 섞어서 이런 저런 프로그래밍 예제를 풀 수 있는 사람이라면 이 책으로 인공지능을 시작해도 괜찮다고 본다. 아니면 개념 검증 차원에서만 계속 fast.ai를 사용하고, 본사업은 전문업체에 맡겨서 진행해도 좋겠다. 강인공지능이 나오기 전까지는, 한 번 보고 꽂아놓고 잊어버릴 게 아니라 현안을 새로 만날 때마다 다시 열어 볼 만한 책이다.

8delp***l2021-09-23

fast.ai로 쉽고 즐겁게 공부하는 딥러닝과 인공지능 안내서

책을 처음 봤을 때의 첫 인상은 두껍다는 느낌을 받았다. 부록을 포함하여 페이지수가 700 페이지를 넘어가니 처음엔 약간의 부담감이 있었다. 그러나 책을 펴서 내용을 학습해보니 왜 이렇게 분량이 많았는지 이해가 갔다. 지금까지 내가 접했던 다른 딥러닝, 머신러닝 학습서들도 대부분이 분량이 적지 않은 편이다. 그런 책들은 하나같이 어려운 통계학 용어, 복잡한 수식, 끝없이 펼처지는 길고 불친절한 코드의 연속이었다.

그러나 이 책은 달랐다. 첫째로 '어려운 통계학 용어'는 절대로 그냥 넘어가지 않고 책 한켠에 용어 사전으로 정리를 하였다. 용어의 뜻이 나중에도 기억나지 않으면 용어 사전이 있는 그 페이지로 가서 다시 복습하면 된다. 두번째로 '복잡한 수식'은 거의 등장하지 않는다. 처음 조우했던 수식은 로그를 다룬 것이었고 그 외에 수식이 직접 등장하는 경우는 손가락에 꼽을 정도이다. 물론 수식이 적다고 좋다는 것은 아니다. 그래도 이 책은 우선 수식을 이해하기 힘들어서 시작도 하기 전에 겁에 질리는 사람들이 딥러닝을 '일단' 시작할 수 있도록 도와주는 것이다. 딥러닝은 어떻게 구현하는지 따라해보면서 딥러닝의 원리와 작동 방법을 익히고 나서 이를 떠받치는 수학적 내용은 후에 보강하면 된다. 세번째로는 '끝없이 펼쳐지는 길고 불친절한 코드'인데 어떤 책들은 예제 코드 한 단위 당 분량이 한페이지를 넘어가는 것이 있을 정도로 긴 것도 있는데 설명까지 그냥 지나가버리는 경우도 있다. 이 책에서는 각 코드 예제들이 전반적으로 길지가 않다. 밑바닥에서부터 딥러닝을 구현한다는 말처럼 최소 단위로 코드가 구성되어있고 코드 설명도 빠뜨림 없이 상세했다.

이렇게 상세하고 자세한 설명이 들어가다보니 분량이 많아지는 것은 당연한 것이었다. 분량으로 인한 부담감을 입문자의 이해도를 높이는 것으로 상쇄해버렸다. 입문자에게 초급 내용부터 중, 고급 내용까지 설명하려다보니 하나의 두터운 기본서가 되었다.

나는 책을 평가할 때 가장 중요하게 보는 것 중에 하나가 비슷한 주제를 다루는 책과 비교할 때의 차별성이다. 이 책의 차별성은 fast.ai 라이브러리를 중심으로 딥러닝을 다뤘다는 것이다. 기존에는 numpy, pandas 등의 라이브러리를 중심으로 많은 책이 쓰여졌다. fast.ai는 딥러닝을 쉽고 빠르게 활용할 수 있게 해주는 라이브러리이다. 딥러닝을 할 때 쉽고 편리한 최신의 라이브러리를 사용하는 것은 시간, 노력을 상당히 줄여준다. 이 책 표지에 나온 것처럼 '박사 학위 없이 폼나게 AI를 구현하는 법'이라는 수식어는 바로 이러한 fast.ai 라이브러리의 특징으로부터 나왔을 것이다.

한편 이 책으로부터 내가 인상 깊었던 점은 옮긴이의 주석(각주)이 매우 친절하고 자세하다는 것이었다. 본문을 그대로 직역하다보면 우리 현실과 달라 조금 더 설명이 필요한 부분이 있는데 이 부분은 해당 분야의 전문가이기도 한 옮긴이가 채워주었다.

또 다른 특징으로는 한 가지 분야에서 적용되는 딥러닝 구현 사례를 살펴보는 것이 아니라 정말 다양한 분야에서 사용되는 딥러닝 사례를 예시로 보여주었다. 이 예시마다 도움이 될 사진, 코드, 그림을 페이지에 아낌 없이 담음으로써 절대로 포기하는 법 없이 사례로 소개된 부분을 이해할 수 있도록 아주 큰 배려를 하였다. 그리고 각 장(챕터) 마무리 부분마다 질문지가 나오는데 본문의 상세한 설명이 여기에서는 예외이다. 즉, 남이 해주는 주입식 학습이 아니라 이 부분만이라도 혼자서 생각해보는 힘을 기르게 해준다. 이것 또한 나에겐 꽤나 인상적이었다. 그리고 이 질문지에 자신있게 답할 수 없다면 해당 장의 내용을 완벽하게 내것으로 익히지 못했다는 의미도 된다. 일종의 자기 평가, 복습의 역할을 하는 것이다.

내가 관심있던 부분은 전혀 예상치 못했던 캐글 사용법, NLP 처리 방법 등이었다. 또 GPT-2 알고리즘에 기반한 모델이 레딧이라는 커뮤니티에서 스스로 댓글로 토론하는 모습을 보고 소름이 돋기도 했다. 인공지능이 벌써 이런 수준까지 도달했구나라고 생각하며 인공지능, 딥러닝을 이용해 정말 무궁무진하고도 혁신적인 응용 사례가 앞으로 쉼없이 등장할 것 같다.

hbko***l2021-09-23

학위 없이 AI를 폼나게 구현하는 법

박찬성, 김지은 옮김 | 한빛미디어

현재 많은 제품들에 인공지능 또는 머신러닝 기술이 적용되어 있다고 광고하고 있다. 또한 많은 사람들이 머신러닝에 관심을 가지고 공부하고 있는 것 같다. 하지만 머신러닝으로 첫 걸음을 떼기 위해 접하는 책이나 참고 자료들은 일단 수학적인 배경과 이론위주로 설명을 하기 때문에 시작이 어렵다고 느껴지는 것도 사실인 것 같다.

그런 면에서 이 책은 조금은 색다른 방식으로 초보자가 딥러닝을 시작할 수 있도록 도와준다. 복잡한 수학적 배경지식이 없어도 약간의 수학지식과 소규모 데이타, 짧은 코드를 이해할 수 있는 수준이라면 딥러닝을 구현할 수 있는 경험을 할 수 있다. 이 부분이 중요하다고 느끼는 것 중의 하나는 딥러닝을 공부하는 초반에 코드를 실행해서 결과를 확인할 수 있다는 것이다.

대부분 책들은 지루한 이론적 설명을 하고 복잡한 수식을 보여준 다음에 간단한 예제를 설명한다. 따라서 초반부에 제대로 따라가지 못하면 쉽게 포기하게 되는 것 같다. 하지만 이 책은 초반에 자신이 뭔가 동작하는 코드를 실행하고 원하는 결과를 눈으로 볼 수 있기 때문에 한층 흥미있게 공부를 이어할 수 있도록 해 준다고 생각한다.

초반부에 딥러닝에 대한 개요를 설명하고 바로 데이타 윤리에 대해 설명한다. 이 부분도 이 책이 가지는 독특한 점이면서 장점이라고 생각한다. 요즘 머신러닝이 탑재되어 출시되는 많은 제품에서 일부 인종 차별적인 결과 또는 여성 비하적인 학습 결과를 보이는 사례가 발견되어 논란이 된 적이 있다. 학습 과정에서의 문제도 있겠지만 근본적인 부분은 데이타에 대한 부분, 즉 데이타 윤리가 중요하다는 것은 잘 알려준다고 생각한다. 그런 면에서 딥러닝을 학습하기 전에 데이타 윤리를 제대로 이해하는 것이 꼭 필요한 점이라고 생각되고 이 책이 그런 면에서 중요한 포인트를 잘 제시하고 있다고 생각한다.

fastai 라이브러리는 지난 6년간 샌프란시스코 대학교의 fast.ai 연구 단체에서 진행해 온 딥러닝 교육의 접근법을 그대로 녹여낸 것이다. 이 책을 통해 라이브러리를 배운다는 생각보다 딥러닝으로 무언가를 만들면서 그런 결과가 어떻게 나왔는지 고민하고 더 나은 결과를 만들어낼 수 있는지를 생각한다면 보다 많은 것을 경험할 수 있다고 생각한다.

책 소개에는 코딩경험이 없어도 괜찮다고 되어 있지만 전반적인 책의 구성이 코드 위주로 설명되고 있기 때문에 기본적인 python 개발 경험은 필요하다고 생각한다. 그리고 딥러닝에 대한 디테일한 부분까지 상세히 설명하고 있기 때문에 추상적으만 생각했던 딥러닝의 세계를 새롭게 경험할 수 있는 유용한 책이 된 것 같다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

zzo***l2021-09-22

딥러닝을 쉽게 그리고 잘 다루는 태도까지 배울 수 있는 책

어떤 머신러닝 전문가가 기본적인 수학, 프로그래밍에 대한 내용이 어렵다면 머신러닝과 딥러닝을 하겠다고 하면 안 된다는 얘기를 해서 적잖아 놀랐던 적이 있다.

딥러닝을 익히고 다양한 분야에 적용하면서 사용하는 라이브러리는 점점 더 추상화 되어 기본적인 철학을 이해하고 있다면 수백, 수천줄로 구성된 딥러닝 알고리즘을 추상화된 코드 몇줄로 좋은 성능을 내는 모델을 만들 수가 있게 되었다.

코딩 경험이 없어도 고등 수학을 이해하고 있지 못하더라도 딥러닝을 시작할 수 있게 용기를 준다. 그리고 딥러닝의 핵심적인 내용을 대부분 다루면서도 Fast.ai 라는 추상화된 도구를 통해 직접 모델을 구현할 수 있게 해준다.

대부분의 딥러닝 책은 딥러닝을 구성하는 신경망의 기초부터 시작하는데 이 책은 탑다운방식으로 구성되어 있다. 딥러닝의 개요와 윤리를 가장 먼저 설명하고 바로 CNN으로 넘어간다. 데이터 윤리를 초반에 강조해서 설명하는 것도 인상적이다.

이 책은 초반에 다음의 원칙을 제시한다.

게임 전체를 가르친다.
항상 예시를 사용한다.
최대한 쉽게 설명한다.
경계를 허문다.

기술을 배울 때 지금 배우는 내용이 전체의 어느 부분인지 어떻게 응용될 수 있는지 자세하고 친절하게 설명하고 있다. 그래서 꼭 파이토치, Fast.ai 사용자가 아니더라도 데이터 윤리를 이해하고 적정기술로 활용하고자 하는데 도움이 된다. 이 책을 통해 기술을 다루고 그 기술을 다른 사람에게 알려주는 태도에 대해 배울 수 있었다. 게다가 fast.ai는 다양한 커뮤니티를 포용하고 있다.

국내에서도 fast.ai 커뮤니티를 이끌고 있는 역자 두 분이 번역해 준 책이라 더 신뢰가 가는 책이다.

모든 실습 코드를 colab 으로 바로 연결할 수 있는 링크를 제공하고 있어서 전체적인 소스코드를 실행해 볼 수 있다.

Using Colab - Practical Deep Learning for Coders

이 리뷰는 한빛미디어의 나는 리뷰어다 이벤트를 통해 책을 제공받아 작성했습니다.

lkh7***l2021-09-22

탑다운 방식으로 소프트웨어 개발자가 입문하기 좋은 서적

lowgi***l2021-09-22

fastai와 파이토치가 만나 꽃피운 딥러닝

minki1***l2021-09-22

입문자가 머신러닝을 어떻게 시작해야할지 고민하지 않도록 읽기 쉽게 잘 구성된 입문서

일단 이 책은 fast.ai 의 공동설립자인 제러미 하워드와 리서치 사이언티스트였던 실뱅 거거가 직접 저술한 책이다. 또한 기본적으로 책의 내용들은 fast.ai (https://www.fast.ai/) 를 근간으로 하고 있다고 한다. 영어에 아무런 부담이 없다면 fast.ai 의 Online Courses 를 같이 활용하면 최신 정보를 받아들이면서 더 쉽게 공부할 수 있을 것이다. 나는 부담 많이 된다. 특이한 점은 제러미는 철학 전공에 인공지능과 관련된 정식 교육을 받은 적이 없다고 하며 실뱅은 그 제러미의 강의를 보고 머신러닝을 처음 시작했다고 한다.

책의 장점

(0) 읽기 편한 입문서

저자가 비전공자이면서 교육에 뜻이 있는 부분이 반영된 결과일까. 아직 훑어보는 정도로 읽어봤지만 책의 내용이나 구성이 정말 심플하고 읽기 좋게 작성되어 있다. fast.ai 를 통해 한번 검증된 교육 코스를 기반으로 작성한 책이라서 그럴수도 있고. 설립자이기에 더 정성을 쏟았는지도 모르겠다. 어쨋든 이 책은 머신러닝과 딥러닝 자체를 처음 시작하는 독자를 대상으로 하고 있고 심지어 코딩 경험이 없는 사람도 따라올 수 있도록 구성되어 있다. 그러다보니 책의 두께가 700여 페이지가 되버린 참사가 일어나긴 했지만 이런 방식의 과한 친절은 나처럼 파이썬을 주언어 사용하지 않는 개발자에게는 정말 고마운 호의다.

(1) 깔끔한 번역

잘 써진 책이면 뭐하겠는가... 최근에는 내가 공부하는 속도보다 몇 배는 빠른 속도로 전문적으로 번역 책을 찍어내듯이 하는 훌륭한 분들이 많아져서 검증된 옮김이나 역자분들의 책은 믿고 볼 수 있지만 사실 번역책은 어투가 자연스럽지 않으면 내용이 훌륭하고 말고를 떠나서 집중이 안되는 경우가 많다. 이 책을 보는 동안에는 그런 느낌을 전혀 받지 못했다. 그냥 한글로 바로 쓰인 책이 아닌가 싶을 정도로 깔끔하고 좋았다.

(2) 보기 좋은 올 컬러

언제 부터인가 나에게 있어 가장 중요한 요소 중 하나는 컬러다. 처음부터 끝까지 정독한 책은 몇 권 없지만 예쁘고 깔끔한 책은 읽을 맛이 난다. 특히 소스코드 색깔이나 차트, 이미지 등에 색깔이 씌워져 있기만 해도 왠지 모를 읽는 재미가 있다고 할까. 괜히 사람들이 블로그에 소스코드를 첨부할 때 코드 스타일을 씌우는 귀찮은 작업을 하는게 아닌 것도 다 이유가 있기 때문이라 생각한다. 단언컨데 이 책은 몇 안되는 소스코드에 스타일이 씌워진 훌륭한 머신러닝 입문용 책이다.

wltk***l2021-09-22

[서평] fastai와 파이토치가 만나 꽃피운 딥러닝

pacien***l2021-09-22

[리뷰] fastai와 파이토치가 만나 꽃피운 딥러닝

comeco***l2021-09-22

fastai와 파이토치가 만나 꽃피운 딥러닝을 읽고

tbea***l2021-09-21

[Book Review] fastai와 파이토치가 만나 꽃피운 딥러닝

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

책 리뷰

풀컬러

다른 분들의 리뷰들을 보시면 아시듯이 이 책은 풀컬러입니다. 정말 별 거 아니지만 이런 번역서들을 풀컬러로 만나면 기분이 그렇게 좋더라고요. 또한, 720p라는 두꺼운 책인데도 불구하고 풀컬러로 인쇄한 출판사가 정말 대단하다고 느껴집니다. 덕분에 시각적으로도 편하게 볼 수 있었습니다.

TIP

이 책의 저자 2명과 함께 Alexis Gallagher라는 사람이 수학과 공학적 배경지식이 적거나 실제로 코딩 경험이 없는 사람들을 위한 TIP을 알려줍니다. 각 분야에 대한 멘토가 나와서 한 번씩 조언해주고 알려주는 느낌입니다. 매우 도움이 됐습니다.

하향식

일반적인 머신러닝, 딥러닝 책이었다면 밑바닥부터 무언가를 구현하여 하나하나 단계를 올라가는 느낌인데 이 책은 다릅니다. 이 책은 top-down(하향식)으로 쓰여진 책입니다. 일반적인 강의 또는 책과는 정반대의 방식이기 때문에 딥러닝에 대한 사전 지식이 있으면 좀 더 읽기 쉬울 것 같습니다.

처음부터 모델을 만들어보고 사용해보는데 이런 과정 속에서 모든 개념들을 이해하기는 어렵습니다. 이러한 초반부에서는 그저 딥러닝에 대한 흥미를 느끼는데 목표를 갖기를 바랍니다. 후에 내부적으로 어떻게 작동되는지 설명합니다.

개발 환경

이 책은 Jupyter Notebook을 사용합니다. 그러나 이런 환경을 구성하는 방법까지 자세히 알려주지는 않습니다. 그렇기에 자신이 환경을 구성할 줄 알아야 합니다. 전 GPU가 매우 좋지 않기 때문에 구글에서 제공하는 [Colab]을 사용했습니다. 근데 전 Colab Pro를 사용했는데 왜 저자의 환경에서 코드를 실행시키는 것보다 더 오래 걸리는지 아직도 잘 모르겠습니다.

저처럼 GPU가 좋지 않다면 Colab 사용 방법도 알아야겠죠. 책에서는 자세히 설명되어 있지 않지만 [fast.ai course]에서 Colab에서 코드를 사용하는 방법을 알려줍니다.

질문지(Questionnaire)

각 장이 끝날 때마다 질문지가 주어집니다. 개인적으로 전 이 질문지가 독특하다고 느꼈고 정말 도움이 많이 됐습니다. 이 질문지는 각 장을 공부하기 전에 먼저 읽어도 좋고 한 장을 다 읽고 후에 복습용으로 읽어봐도 좋습니다. 사전에 읽으면 어떤 부분에 집중할 지 미리 알 수 있고 공부한 후에 읽으면 자신이 제대로 공부했었는지 지식을 점검할 수 있겠죠. 책을 잘 읽었다면 대부분의 질문들은 대답할 수 있을 것입니다. 그래도 질문지의 정답을 모르면 [Fastbook questionnaire solutions - fast.ai forum]에서 solution이 주어지니 참고하시면 좋을 것 같습니다. 나중에 기회가 된다면 블로그에 질문지에 대한 솔루션을 올려볼 예정입니다.

대상독자

책에서는 1년 정도의 코딩 경험, 고등학교 이상의 수학 과정을 마친 사람을 대상으로 합니다. 그러나 전 이 책을 읽기 전에 추가적으로 파이썬, PyTorch, 조금의 딥러닝 지식이 있으면 책을 읽는 데 더 편할 것이라고 예상됩니다.

전 딥러닝이 공부하기 어려운 이유가 '다양한 개념들과 기초 지식들'이라고 생각합니다. 개념을 세부적으로 다 설명해줘도 갑자기 무수히 많은 개념들이 등장하면 머리가 혼란스러워집니다. 또한, 딥러닝을 공부하기 위해서 기초 지식이 충분하지 않다면 이해하기 어려울 수도 있다고 생각합니다. 그렇기에 이 책을 읽을 때 빠르게 읽기 보다는 천천히 시간적 여유를 두고 이해하면서 읽으시는 걸 추천드립니다.

stylep***l2021-09-21

쉽고 따라하며 배울 수 있는 딥러닝 입문서적!

blueg***l2021-09-20

수식보다 딥러닝

young***l2021-09-20

[fastai와 파이토치가 만나 꽃피운 딥러닝] 도서 리뷰

khj0***l2021-09-20

딥러닝을 접하는 게 처음인 개발자에게 적합한 책

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

pytorch를 기반으로 만든 국내에서는 아직은 생소한 fastai 패키지를 다루는 책입니다.

게으른 딥러닝, 좀더 접근성이 높은 딥러닝을 추구하는 것이 이 책의 목적이지만, 개인적으로는 텐서플로, 파이토치 정도를 알고 있는 상황에서 이 책을 읽으면서, 딥러닝을 오랫동안 사용할 것이 아닌 프로젝트 때문에 한 두번 정도 사용할 사람들에게 좋은 책이라는 것을 느꼈습니다.

fastai라는 패키지가 파이토치나 텐서플로였다면, 2~3단계를 거쳐야 하는 것들을 한 가지의 함수를 적용하여 뛰어 넘을 수 있도록 도와주는 패키지이라는 점에서 다른 딥러닝 프레임워크에 익숙하지 않았다면, 오히려 좋은 모델을 만들 수 있겠다는 생각이 들었기 때문입니다.

책의 내용적인 부분으로 들어가면, 다른 책이었다면 30페이지 안밖에 끝났을 내용을 딥러닝의 역사와 실제 작성될 모델에서의 효과 등 자문자답의 형식으로 중심적인 내용에 살이 상당히 많이 붙어 있습니다.

다른 책에서 초반에 나오는 딥러닝의 역사 부분에서 다루는 배경 설명 부분에 그치지 않고, 실무에서 데이터를 어떻게 사용해야 할 것인가 등등의, 데이터 품질 관리 책에서 다룰 법한 내용도 있어, 책을 읽는 동안 마치 딥러닝 캠프를 한 것 같은 느낌이었습니다.

이 점에서 파이토치, 텐서플로에 능숙하시면서도, 딥러닝 프로젝트에 대한 경험은 적어서 우왕자왕하시는 분들에게도 도움이 될 것 같습니다.

(이 분들은 자기에게 익숙한 프레임워크로 진행하시는 게 나을 것 같습니다. )

이 책의 내용은 작가가 강사로서 학생들과 부딪치면서 겪은 경험을 그대로 녹였기 때문에 꼼꼼하게 집어나갔다는 생각이 들었습니다.

그러나 이 책이 상세하고 친절하다고 해서, 이 책을 프로그램 언어에 대해서 이해가 없는 딥러닝만을 보고 시작하는 초심자에게는 권하고 싶지 않습니다.

이 책 자체에 모든 코드가 들어가 있지 않기 때문입니다. 즉, 코드 한줄 한줄 치면서 해도 다 될 정도의 책이 아니라는 것입니다.

작가가 작성한 코드를 다운 받고 읽으면서 하는 것을 전제로 하고 있는 책으로, 아마 코드를 치는 것이 생판 처음인 분들은 책을 머리글부터 꼼꼼히 읽는 분이 아니라면, 며칠은 고생하다가 악몽으로 남을 것 같은 책입니다.

물론 이런 것들을 지적해줄 수 있는 교수님이 이 책을 교재로 사용한다면, 오히려 학생들에게 프로그래밍에 더 익숙해질 수 있도록 해주는 계기가 될 수도 있는 책이라고 생각합니다.

그렇기 때문에, 프로그래밍에 나는 관심없다, 딥러닝 하나만 보고 공부하고 있다+ 코드 대로 눌렀는 데, 안 됬을 때 주변에 도움을 줄 사람이 없다 하시는 분들은 파이토치 기본책을 읽고 오는 게 좋을 것 같다고 생각합니다.

bum***l2021-09-19

[리뷰] fastai와 파이토치가 만나 꽃피운 딥러닝

zid***l2021-09-19

fastai와 파이토치가 만나 꽃피운 딥러닝 / 한빛미디어

2021년 올해의 책리뷰 / fastai와 파이토치가 만나 꽃피운 딥러닝 / 한빛미디어

이 책은 딥러닝과 머신러닝을 처음 접하는 사람들을 대상으로 쓰여진 책입니다. 파이썬 프로그래밍, 문법을 알고 있다면 도움이 많이 됩니다. 높은 수준의 수학 지식을 갖고 있지 않아도 되며, 딥러닝 실무자에게 도움이 되는 내용들일 많이 있습니다.

딥러닝을 쉽게 사용할 있는 파이썬 라이브러리인 fast.ai를 직접 개발한 개발자인 실뱅과 제레미가 이 책을 집필하였습니다. 제레미는 약 30년 동안 머신러닝을 사용하고 가르쳤으며, 25년 전부터 신경망을 사용해 왔다고 합니다. 또한 실뱅은 일반적인 기술 교육 과정을 매우 잘 알고, 심화 수학 교과 과정을 다루는 교과서를 다수 집필하였다고 합니다. 코딩 및 머신러닝 전문가와 수학 전문가가 만나 집필한 책이라고 볼 수 있습니다.

이 책은 실제 사례로 딥러닝의 거의 모든 것을 설명하기 때문에, 맥락 속에서 필요한 이론적 기초를 점진적으로 학습하며, 이론이 중요한 이우와 작동 방식 등을 이해하기 수월합니다. 이 책을 이해하기 위해 딥러닝 분야에 대한 박사 학위 등 학문적 배경이 필요하지는 않지만, 그래도 딥러닝이기 때문에 많은 인내를 요구합니다.

파이썬으로 실습을 하는데, 주피터 노트북을 이용하고 있습니다. 주피터 노트북을 설치하여 책을 보면서 실습하고 이해하면 좋을 것 같고, 컴퓨터 사양이 안좋아서 GPU를 사용할 수 없다면 구글에서 제공하는 COLAB을 사용해도 됩니다.

딥러닝이 공부하기 어려운 이유 중에 하나가 어려운 용어들이 많이 등장하기 때문인데, 이 책에서는 어려운 용어들을 쉽게 풀어서 설명하고 있어서 쉽게 이해하기 좋습니다. 각 장마다 마지막 부분에 질문지와 추가 연구하는 부분에 대하서도 기술되어 있어서 더 심도있게 연구하고, 고민할 수 있도록 합니다.

fastai 애플리케이션 계층을 이해하기 위해, 숫자 분류기의 학습 내부, 이미지 분류, 영상처리 문제, 최십 모델의 학습, 협업 필터링, 테이블 데이터 모델링, NLP(자연어 처리), fastai의 중간 수준 API로 데이터 변환을 다루고 있습니다.

딥러닝의 기반 지식을 이해하기 위해, 밑바닥부터 구현하는 언어 모델, 합성곱 신경망, ResNets, 애플리케이션 구조, 학습 과정에 대해 다루고 있습니다.

딥러닝을 구현하기 위해 신경만, CAM을 이용한 CNN의 해석, Learner 클래스의 내용을 다루고 있다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

one2***l2021-09-18

fastai와 파이토치가 만나 꽃피운 딥러닝

jehyun***l2021-09-17

가장 강력한 맛의 하향식 딥러닝 기술서

상향식 학습
- 뭔가를 설명할 때는 기초부터 고급까지 차근차근 올라가는 것이 일반적이다.
- 더하기 빼기를 배워야 곱하기 나누기를 알 수 있고, 미분과 적분처럼 어려운 것들은 나중에 배운다.
- 이를 상향식(bottom-up) 접근이라고 하며 공교육과 사교육을 막론하고 일반적인 접근이다.
- "이런거 배워서 어디에 써요?"라는 질문은 공부하기 싫은 이의 핑계처럼 여겨지기도 하고,
  "크면 다 알게 돼"라는 답이 여기에 더해지면 지식과 무관한 나이가 권위처럼 여겨진다.
하향식 학습
- 학교를 벗어나 사회에 나와서 뭔가를 배우다 보면 당장 성과를 내야 할 때가 잦다.
- 기초부터 차근차근 배우기를 기대하기는 어렵고 일단 일이 되게 만드는 것이 최우선이다.
- 왜 그런지는 나중에 배우는데 안 배워도 되는 경우, 배울 수 없는 상황도 많다.
- 흔히 이런 상황을 몸으로 배운다고 하는데, 나중에라도 원리나 개념을 익히면 하향식(top-down) 학습이 된다.
북극점 정복하기
- 상향식의 가장 큰 단점은 결과물을 만져보기까지 시간이 오래 걸린다는 것이다.
- 재미를 느끼지 못하는 기간이 길어지면 지치기 마련이고, 결과물을 만져보지 못했으니 가치도 못 느낀다.
- 특히 빠르게 발전하는 분야는 공부하는 사이에 목표가 저만치 달려가고 있어서 절대로 끝이 나지 않는다.
- 탐험가들은 남극점보다 북극점이 다다르기 어렵다고들 한다.
- 남극점은 육지에 속해있어서 나만 열심히 달려가면 언젠가 다다를 것이라는 희망이 있는데,
  북극점은 바다 위를 떠다니는 얼음덩어리 위에 있기 때문에 죽어라 가봐야 얼음이 반대로 흘러가면 끝이다.
- 대부분 북극점까지 가는 루트를 확보하는 것이 목적이 아니라 북극점에 도착하는 게 목적이다.
- 눈밭을 뚫고 달릴 것 없이 일단 비행기에서 낙하산을 메고 뛰어내려 북극점에 도달하고 천천히 돌아와도 된다.
극단적인 하향식 기술서
- 대부분의 딥러닝 책의 진도는 이렇다.
- 행렬연산 배우고, 역전파 배우고, FCN 만들고, CNN 만들고, .... 레이블 스무딩 배우고, 웹 애플리케이션 개발.
- 트리 모델 같은 고전 머신 러닝을 같이 배운다면 딥러닝 배우기 전에 배운다.
- 이 책의 진도는 이렇다.
- 웹 애플리케이션 만들고, CNN 모델 만들면서 역전파 배우고, 레이블 스무딩 배우고, 트리 모델을 배운다.
- 그 다음에서야 합성곱 연산이 어떻게 되는지, 행렬끼리 곱셈은 어떻게 하는지, 데이터 로더를 배운다.
에반게리온을 처음 봤을 때 느낌.
- 처음에 굉장히 혼란스럽다.
- 뭐가 뭔지 모르겠는데 건물이 부서지고 있다.
- 그 속에서 차 한대가 달려오더니 설명도 없이 주인공을 로봇에 태우고 적을 무찌르란다.
- 이게 어떻게 된 세상인지는 회차가 진행되면서 하나씩 밝혀진다. (그나마도 마지막까지 모르는게 많다)
- 이 책이 그렇다.
- 다짜고짜 웹 애플리케이션을 만들더니 내가 알던 진도와 거꾸로 간다.
- 심지어 딥러닝 경험이 많은 사람들이나 고민할만한 AI 윤리부터 짚고 넘어간다.
내가 생각하는 최적의 독자: 컴퓨터를 조금은 다뤄보셨는데 딥러닝은 처음인 분들
- 하향식은 당장 결과를 손에 쥘 수 있기 때문에 흥미를 잃지 않고 달릴 수 있다.
- 특히 딥러닝처럼 계속 새로운 모델이 나오는 분야라면 필수적인 방식이다.
- 그런데 컴퓨터 자체가 낯설다면 문제가 될 것 같다.
- 갑자기 딥러닝 붐이 불면서 클릭과 드래그로만 컴퓨터를 사용해보신 분들이 딥러닝에 입문한다.
- 메모장같은 터미널에 어려서 영어단어를 외우듯 외운 명령어를 입력하는 방식은 피할 수 없다.
- 적어도 이 과정이라도 손에 익어야 이 극단적인 하향식을 따라갈 수 있지 않을까 생각한다.
- 이 정도만 가능해도, 초반부터 등장하는 코드를 조금씩만 바꿔도 결과물을 얻을 수 있다.
두 번 읽으면 더 좋을 책.
- 에반게리온은 제레의 인류보완계획을 웬만큼 이해하고 다시 보면 또 다른 재미가 있다.
- 이 책도 마찬가지. 저자의 설계를 따라 책을 한번쯤 따라간 뒤, 다시 보면 더 좋을 것 같다.
- "이게 이래서 그렇구나?" 라는 즐거움은 뇌에 상당한 양의 도파민을 분비시킨다.
- 즐거움이 묻은 기억은 오래 간다.

icon***l2021-09-17

딥러닝을 공부하는 목적을 정확히 알려준 책