서평

[책] 머신러닝 시스템 설계

eunsour 2023. 4. 23.
반응형

 

서론

몇 년 전부터 전 세계적으로 MLOps는 AI 개발에서 큰 화제가 되고 있다. 스탠퍼드 대학의 ‘앤드류 응(Andrew Ng)’ 교수는 MLOps에 대해서 다음과 같이 말했다.

 

모델 중심 AI 시대가 아닌 데이터 중심의 AI 시대가 도래할 것이다. 따라서 체계적인 데이터 관리를 위해 MLOps가 중요하다.

 

그렇다면 MLOps란 무엇일까?

 

MLOps는 ML 시스템 개발(Dev)과 ML 시스템 운영(Ops)을 통합한 것으로, 데이터 레이블링의 일관성을 위해 인프라를 만들어 자동으로 운영되도록 만드는 역할을 한다. 데이터의 품질을 높이려면 데이터의 양만큼이나 질도 중요하기 때문에 데이터를 체계적으로 관리하고 개선시키는 MLOps의 중요성이 강조되고 있다.

 

이 책은 스탠퍼드 대학의 ‘CS 329S: Machine Learning Systems Design’ 강의 노트를 기반으로 확장되었다. 머신러닝 시스템 설계는 데이터 처리, 모델 개발, 모델 배포 등 많은 단계를 거치기 때문에 체계적이고 확장 가능한 아키텍처가 필요하다. 또한, 데이터 전처리 및 모델 학습 등에서 발생하는 오류 감지 및 예외 처리, 모델을 사용할 때의 평가 및 모니터링 기능 등도 필수적이다.

 

저자는 위 강의에서 축적한 경험을 기반으로, 머신러닝의 엔드 투 엔드 개발 워크플로우를 실무적인 관점에서 쉽게 이해할 수 있도록 소개하고 있다.

 

 

머신러닝 시스템 설계

이 책은 ML 개론서가 아닌 실무적인 측면에 중점을 둔 책이다. 따라서 시작하기 전에 알고 있어야 할 주제들은 다음과 같다.

 

  • ML 모델 : 클러스터링, 로지스틱 회귀, 의사 결정 트리, 협업 필터링
  • ML 기술 : 지도 학습 및 비지도 학습, 경사 하강법, 목적 함수 및 손실 함수, 정규화, 일반화
  • 신경망 아키텍처 : 피드포워드 신경망, 순환 신경망, 합성곱 신경망, 트랜스포머
  • 지표 : 정확도, F1 스코어, 정밀도, 재현율, ROC
  • 통계 개념 : 분산, 확률, 정규 분포, 롱테일 분포
  • 일반적인 ML 작업 : 언어 모델링, 이상 탐지, 객체 분류, 기계 번역

 

이 책은 총 11개의 챕터로 이루어져 있으며, ML 프로젝트 수명 주기의 각 단계를 진행하면서 각 챕터가 진행된다.

 

  • 1 - 2장 : 현재 프로젝트에서 ML의 필요성 및 토대를 다지는 법을 설명한다.
  • 3장 : 데이터 엔지니어링 기초에 대해 설명한다.
  • 4 - 6장 : ML 프로젝트의 학습 데이터를 생성하고 피처 엔지니어링, 모델 개발 및 평가를 하는 배포 전 단계를 다룬다.
  • 7 - 9장 : ML 프로젝트의 배포와 지속적인 모니터링과 같은 배포 후 단계를 다룬다.
  • 10장 : 컴퓨팅 인프라와 ML 플랫폼에 대해 설명한다.

 

챕터 내에서는 특정 개념과 솔루션을 설명하면서, 각자의 유스 케이스에 따라 다른 방식으로 접근하였을 때의 장단점을 살펴보고, 어떤 도구가 가장 적합한지 판단하는 데 도움이 되는 정보를 제공한다. 이를 위해, 트레이드오프, 장단점, 구체적인 예시를 중점으로 논의한다.

 

 

결론

ML 엔지니어는 ML 알고리즘에만 집중하는 것으로는 충분하지 않다. 알고리즘 이외에도 데이터 스택, 배포, 모니터링, 유지 관리, 인프라 등의 다른 측면을 이해하는 것도 중요하다. 이 책은 머신러닝 엔지니어가 모델을 개발하는 것 이상으로, ML 시스템 개발 전체적인 관점에서 시스템의 모든 구성 요소를 어떻게 설계해야 하는지에 대한 실무적인 관점을 반영하고 있다.

 

이 책은 ML 개론서가 아니라, ML을 활용하여 실제 문제를 해결하려는 사람들을 위한 책이다. ML 프로덕션에서 서비스가 부족한 영역을 찾아내고, 생태계에 맞는 도구를 만들어 넣을 방안을 파악하려는 분들 및 기술이나 비즈니스 분야에서 리더로 일하려는 분들이나, ML 관련 직무로 취업하고자 하는 분들께 추천하는 책이다.

 

 

 

"한빛미디어 < 나는 리뷰어다 > 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

반응형

댓글