반응형

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

머신러닝의 한축 강화학습에 관한 책이다.
대게는 딥러닝과 함께 지도학습과 비지도학습에 많은 관심을 갖을 것도 같지만 
나는 공부를 하면 할수록 강화학습이 더 매력적으로 느껴졌다.

무엇보다 딥러닝이라는 방법론 자체에 대한 이해도 강화학습을 통해서 더 가까워지는 것 같았다.(물론 심리적으로)

강화학습은 시뮬레이션 환경에서 마르코프 결정과정을 통해 에이전트가 학습하는 과정이다.
이 강화학습에 대해 알아가는 방법으로 
시뮬레이션 환경의 특성에 알맞게 적당히 성능이 좋은 강화학습 알고리즘을 적용해보며 알고리즘에 대해 공부할 수도 있겠고
반대로 이론적인 접근을 통해 기초부터 차근히 학습후에 강화학습 알고리즘에 대해 공부할 수도 있겠다.

나는 일단 전자의 방식대로 했다. gym을 통해 다양한 환경에서 알고리즘들을 적용해보며 알고리즘 자체에 대한 흥미와 호기심이 생길때쯤 이책을 접하였다.
운이 좋았다고 본다. 이 책을 통해 부족했던 이론적인 내용을 이해할 수 있었다.
머신러닝 책을 보다보면 지도학습 비지도 학습에 대한 내용은 충분하지만 
강화학습에 대해서는 제한된 지면상의 이유로 매우 가볍게 훝고 지나가는일이 부지기 수였던거 같다. 
적어도 내가 봤던 책들에선.
하지만 딱 강화학습을 떼어내 설명을 하다보니 온전히 집중해 학습할 수 있어 좋다.

수식에 친절히 모든 의미를 주석으로 달아놓은 것에서 저자의 배려를 느낄 수 있었다.

하지만 친절히 알려준다고 하여 강화학습 난이도 자체가 낮아지는 것은 아니다.
책을 읽는데에는 많은 시간이 들었다.

 

반응형