서평

[책] 실무로 통하는 인과추론 with 파이썬

eunsour 2024. 3. 24.
반응형

 

 

개요

새로운 프로젝트를 시작하거나 서비스를 도입할 때, 모델 선택, VRAM 용량, 자원 확보 등의 기술적인 요소들이 우선적으로 고려된다. 하지만 실제로 중요한 것은 주어진 일정 내에 서비스를 구현하거나 원하는 기능을 만드는 것만이 아니라 데이터 확보 및 관리, 외부 요인 분석 등의 인과추론 역시 성공적인 프로젝트를 위해 필수적인 역할을 한다.

 

성공적인 테크 기업들은 A/B 테스트, 스위치백, 통제집단합성법 등 다양한 인과추론 방법론을 적용하고 개발하여 시장, 제품, 사용자에 대한 이해를 높인다. 이러한 접근 방식은 까다롭고 복잡할 수 있지만, 기업의 성장과 발전에 필수적인 역할을 합니다.

 

이 책은 데이터 사이언티스트의 시각에서 인과추론의 기초부터 심화까지 다루는 전문 서적이다. 다양한 실제 사례를 통해 인과추론 개념을 이해하고, 실제 문제에 적용하는 방법을 배우도록 도와준다.

 

책의 구성

1부에서는 인과추론의 기본 개념을 다룬다. 1장에서는 가격 인하가 미치는 영향을 분석하는 데 필요한 인과추론의 주요 개념을 소개한다. 2장에서는 A/B 테스트(또는 무작위 통제 실험)의 중요성을 다룬다. 이는 의사결정 도구로서뿐만 아니라, 다른 인과추론 도구들을 평가하는 기준점 역할을 한다. 3장에서는 주로 이론에 중점을 두고, 인과관계 식별과 그래프 모델을 다룬다. 이렇게 1부를 다 읽고 나면 인과추론에 대한 기본적인 이해를 갖추게 된다.

 

2부에서는 인과관계와 상관관계를 구분하는 데 중요한 선형회귀분석과 성향점수 가중치에 대해 배운다. 4장에서는 선형회귀분석을 새로운 관점에서 다루는데, 특히 직교화라는 중요한 편향 제거 방법에 초점을 맞춘다. 5장에서는 성향점수와 이중 강건 추정법을 살펴본다.

 

3부에서는 머신러닝과 빅데이터를 이용해 2부에서 배운 내용을 확장한다. 또한 인과추론을 개인화된 의사결정 도구로 활용하는 방법을 배운다. 6장에서는 처치효과의 다양성을 알아보고, 7장에서는 머신러닝과 인과추론이 만나면서 나타나는 최근의 발전상을 탐구한다. T러너, X러너, S 러너와 이중/편향 제거 머신러닝과 같은 방법들을 처치 개인화 측면에서 배운다.

 

4부에서는 인과추론에 시간 차원을 더한다. 8장에서는 이중차분법과 관련 최신 연구를 다루고, 9장에서는 마케팅 캠페인의 영향을 분석하는 데 사용하는 통제집단합성법과 그 변형을 알아본다.

 

마지막으로 5부에서는 랜덤화가 어려운 상황에서 활용할 수 있는 다양한 실험 설계 방법을 소개한다. 10장에서는 지역 실험을 다루는데, 실험군과 대조군 지역을 선정하는 방법과, 분석 대상이 적을 떄 처치효과를 파악하기 위한 스위치백 실험을 진행하는 방법을 소개한다. 11장에서는 불응이 존재하는 실험을 다루고, 도구변수를 사용하는 방법과 불연속 설계에 대해 간략히 설명한다.

 

마치며

인과추론은 과학, 의학, 경제학, 사회과학 등 다양한 분야에서 중요한 역할을 하는 도구이다. 그러나 국내에서는 관련 도서가 부족하여 학습에 어려움을 겪는 경우가 많았다.

 

이 책은 이러한 상황을 해결하기 위해 인과추론의 이론부터 실제 사례에 대한 적용까지 깊이 있게 다루는 책이다.

 

 

    "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
반응형

댓글