서평

[책] 파이썬을 활용한 베이지안 통계 2판

eunsour 2022. 7. 24.
반응형

 

 이 책은 기존의 파이썬을 활용한 베이지안 통계를 개정한 개정판이다. 개정판은 무려 8년 만에 나왔으며, 5개의 챕터가 추가된 20개의 챕터로 이루어져 있다. 따라서 책 페이지도 거의 2배가 되었다. 

 

 베이즈 정리에 관한 책은 머신러닝 엔지니어가 되기 위해 조금 더 전문적이고 이론적인 공부가 필요할 때 꼭 필요한 책이다. 따라서 이 책을 읽기전에 미적분학이나 선형대수학을 알 필요는 없지만 넘파이나 판다스 등 파이썬에 익숙해야 한다고 권장한다. 

 

 베이즈 정리는 조건부 확률에 사전확률을 활용하여 통계적 추론을 하는 방법이다. 따라서 1장은 조건부 확률로 시작하여 베이즈 정리를 도출한다. 

베이지안 통계의 기본은 베이즈 이론이고, 베이즈 이론의 기본은 조건부 확률이다. 

 

 베이즈 이론은 오늘날 머신러닝에 사용되는 예측 모형의 방법론으로 굉장히 많이 사용되는 개념이며, 다른 기계학습 방법론들에 비해 상대적으로 알고리즘이 간단한데도 불구하고 현실 세계의 많은 문제를 효과적으로 풀 수 있다는 장점이 있다. 

 

 2장 부터는 1장에서 도출한 베이즈 정리를 명시적으로 사용해서 다양한 쿠키 문제를 풀어본다. 이후 3장에서는 같은 문제를 '확률질량함수'로 풀어보며, 4장부터 본격적으로 베이지안 통계에 입문한다. 

 

  1판과 2판을 보면 같은 내용의 챕터도 그 순서가 달라진 점을 알 수 있는데, 베이지안 통계에 입문하는 독자들이 직접 따라해보면서 쉽게 이해할 수 있게 어느 정도 조정을 한 듯했다. 

 

 

 이 책의 대부분의 문제는 실생활 문제를 사용한다. 따라서 데이터가 있을 경우와 없을 경우에 대해서 모델링을 어떻게 해야할 지, 실생활의 어떤 부분을 반영하고 어떤 부분을 단순화할지, 분석 기법은 어떤 방법을 적용할지 다양한 방법론을 배울 수 있다. 

 

 또한 이론과 실습을 진행하면서 각 장의 중간 또는 마지막에 항상 연습문제가 있다. 독자가 직접 풀어보면서 각 장의 내용들을 복습할 수 있다는 장점이 있다. 

 

이 책은 말 그대로 베이지안 통계 전체를 다루고 있다. 확률과 분포, 가설을 수립하고 신뢰 정도를 표현하는 공산, 로그 공산 등 우리에게 어느정도 익숙한 개념도 있고 그렇지 않은 개념도 있다. 어느정도 말하려고 하면 기억은 나지만 설명은 쉽지 않은 그런 이론들을 세세하게 배울 수 있다. 

 

 현재 많은 사람들이 머신러닝과 딥러닝에 입문하고 파이썬을 다루고 있지만, 이 책의 독자층은 다른 입문 책에 비해 그리 넓지는 않을 것이라고 생각한다. 사람들이 많은 관심을 가지는 머신러닝이나 딥러닝 책들에 비해 베이지안 통계에 관해 다루는 책이 아직까지는 많지 않은데 다시 한 번 개정판을 내어주신 한빛미디어에 감사드린다. 

 

 

"한빛미디어 < 나는 리뷰어다 > 활동을 위해서 책을 제공받아 작성된 서평입니다."
반응형

댓글