본문 바로가기

리디 접속이 원활하지 않습니다.
강제 새로 고침(Ctrl + F5)이나 브라우저 캐시 삭제를 진행해주세요.
계속해서 문제가 발생한다면 리디 접속 테스트를 통해 원인을 파악하고 대응 방법을 안내드리겠습니다.
테스트 페이지로 이동하기

머신러닝 시스템 설계 상세페이지

컴퓨터/IT 개발/프로그래밍

머신러닝 시스템 설계

프로젝트 범위 산정부터 프로덕션 배포 후 모니터링까지, MLOps 완벽 해부하기
소장종이책 정가38,000
전자책 정가20%30,400
판매가30,400
머신러닝 시스템 설계 표지 이미지

머신러닝 시스템 설계작품 소개

<머신러닝 시스템 설계> 프로덕션 환경에서 머신러닝을 다룰 때

무수히 생겨나는 물음표를 해결해줄 MLOps 지침서



머신러닝 시스템 개발은 선형이 아닌 순환 프로세스다. 모델을 개발해 배포하고 나서도 끊임없는 모니터링과 업데이트가 필요하다. 이 책은 비즈니스 관점에서 머신러닝 시스템을 설계하고 운영할 때 맞닥뜨리는 모든 단계를 다룬다. 책에서 소개하는 다양한 접근법과 사례 연구는 머신러닝 시스템을 성공으로 이끌기 위한 인사이트를 제공한다. 저자가 수많은 기업과 협업한 경험을 기반으로 제시하는 실무 중심 접근법은 시스템이 안고 있는 난제를 해결하는 데 발판이 되어줄 것이다.


출판사 서평

현업에서 필요했던 ‘진짜’ 머신러닝 이야기



머신러닝이라고 하면 보통 모델 개발과 알고리즘을 떠올리지만 실제로 프로덕션 환경에서 머신러닝을 운영할 때는 그 외에도 고려할 것이 많습니다. 머신러닝 시스템을 이루고 있는 데이터, 피처, 모델 개발·평가·배포, 모니터링, 인프라 등을 전체적인 관점에서 고려해야 합니다. 프로덕션용 머신러닝은 대부분 비즈니스를 중심으로 하는 만큼 비즈니스 문제에 따른 요구 사항과 이해관계자 또한 중요합니다.



이 책은 떠오르는 MLOps 분야의 대표 강의인 스탠퍼드 ‘CS329S: 머신러닝 시스템 설계(Machine Learning Systems Design)’를 기반으로 합니다. 저자인 칩 후옌은 넷플릭스부터 스타트업까지 다양한 기업에서 머신러닝을 배포하고 운영한 경험을 바탕으로, 여러분이 그동안 궁금했지만 답을 찾기 어려웠을 법한 질문에 대해 여러 가지 접근법을 제시합니다. 특정 도구 사용법보다는 각 머신러닝 기법의 개념 및 장단점과 트레이드오프에 집중하며, 더 필요한 정보는 바로 찾아볼 수 있도록 풍부한 참고 자료 링크를 제공합니다.



대상 독자

- 머신러닝 관련 실무자: 머신러닝 엔지니어, 데이터 과학자, 머신러닝 플랫폼 엔지니어, 엔지니어링 관리자 등

- 도구 개발자: 머신러닝 프로덕션에서 서비스가 부족한 영역을 찾아내 생태계에 맞는 도구를 만들어 넣을 방안을 파악하려는 경우

- 구직자 및 학생: 머신러닝 관련 직무로 취업하려는 경우

- 기술 및 비즈니스 리더: 제품 및 비즈니스 프로세스를 개선하기 위해 머신러닝 솔루션 채택을 고려하는 경우



장별 주요 내용



[1장 머신러닝 시스템 개요]

다양한 머신러닝 유스 케이스를 살펴보면서 머신러닝을 적용하기에 적합한 경우와 그렇지 않은 경우를 논의합니다. 프로덕션용 머신러닝을 연구용 머신러닝 및 전통적인 소프트웨어와 비교해봅니다.



[2장 머신러닝 시스템 설계 소개]

비즈니스 목적에 따라 시스템 요구 사항을 정하고, 이를 만족하는 머신러닝 시스템을 설계하기 위한 반복 프로세스를 살펴봅니다. 머신러닝 문제를 구조화하는 방법을 논의합니다.



[3장 데이터 엔지니어링 기초]

머신러닝 프로젝트에서 사용하는 다양한 데이터의 소스와 데이터를 저장하는 포맷을 살펴봅니다. 데이터 스토리지 엔진과 주요 처리 유형, 프로세스 간에 데이터를 전달하는 다양한 모드를 알아봅니다.



[4장 훈련 데이터]

양질의 훈련 데이터를 얻는 기술을 살펴봅니다. 다양한 샘플링 기술을 알아본 뒤 레이블 다중성과 클래스 불균형을 비롯해 훈련 데이터를 생성할 때 흔히 맞닥뜨리는 문제를 논의합니다.



[5장 피처 엔지니어링]

피처 엔지니어링 기법과 주요 고려 사항을 살펴봅니다. 데이터 누수를 감지하고 방지하는 방법을 알아보고 좋은 피처를 설계하는 방법을 논의합니다.



[6장 모델 개발과 오프라인 평가]

작업에 가장 적합한 알고리즘을 선택할 때 유용한 팁을 살펴본 뒤 디버깅, 실험 추적과 버전 관리, 분산 학습, 오토ML 등 모델 개발의 다양한 측면을 알아봅니다.



[7장 모델 배포와 예측 서비스]

머신러닝 배포를 둘러싼 통념을 살펴봅니다. 온라인 예측과 배치 예측을 알아본 뒤 다양한 모델 압축 기술을 살펴봅니다. 에지 디바이스와 클라우드에서 모델을 배포하는 방법을 논의합니다.



[8장 데이터 분포 시프트와 모니터링]

프로덕션에 배포한 머신러닝 모델이 실패하는 이유를 논의합니다. 연구와 실무 양쪽에서 많은 논의가 이루어지고 있는 데이터 분포 시프트 문제를 살펴봅니다.



[9장 연속 학습과 프로덕션 테스트]

데이터 분포 시프트에 적응하기 위해 머신러닝 모델을 업데이트하는 방법을 살펴봅니다. 연속 학습이 무엇이며 어떤 어려움이 있는지 알아보고, 모델 재훈련 빈도와 프로덕션 테스트를 논의합니다.



[10장 MLOps를 위한 인프라와 도구]

프로덕션 규모와 상황에 따라 머신러닝 시스템에 적합한 인프라를 설정하는 방법을 알아봅니다. 인프라를 구성하는 네 가지 레이어인 스토리지와 컴퓨팅, 자원 관리 도구, 머신러닝 플랫폼, 개발 환경을 논의합니다.



[11장 머신러닝의 인간적 측면]

머신러닝 모델의 확률론적 특성에 따라 사용자 경험이 어떻게 영향받는지 논의합니다. 한 시스템을 개발하는 구성원들이 효과적으로 협업하기 위한 조직 구조를 알아보고, 머신러닝 시스템이 사회 전체에 미치는 영향을 들여다봅니다.



저자 소개

저자
칩 후옌

클레이폿 AI의 공동 창립자이자 CEO로서 실시간 머신러닝을 위한 인프라를 개발하고 있다. 이전에는 엔비디아, 스노클 AI, 넷플릭스에 재직하며 머신러닝 시스템을 개발하고 배포하는 일을 도왔으며, 스탠퍼드 학부생일 때는 ‘딥러닝 연구를 위한 텐서플로’라는 강의를 만들어 직접 학생들을 가르쳤다. 현재 스탠퍼드에서 이 책의 토대가 된 ‘CS 329S: 머신러닝 시스템 설계(Machine Learning Systems Design)’를 강의하고 있다. 전문 분야는 소프트웨어 엔지니어링과 머신러닝에 걸쳐 있으며, 링크드인 탑 보이스(Top Voices) 소프트웨어 개발 부문(2019)과 데이터 과학 및 머신러닝 부문(2020)에 이름을 올렸다.

김대근역자
김대근

머신러닝을 공부하기 시작했을 때 접한 톰 미첼(Tom M. Mitchell)의 명언, “머신러닝으로 문제를 해결하려면 그 문제를 명확히 정의해야 한다”라는 말을 상기하며 항상 초심을 잃지 않으려 한다. 학부 과정에서 컴퓨터 과학과 수학을 복수 전공하고 석사 과정에서 머신러닝을 전공했다. 여러 해 동안 스타트업, 제조 및 금융 업계를 거치며 컴퓨터 비전 엔지니어로서 다수의 1저자 특허를 등록하고 제품 양산에 기여했으며, 데이터 과학자로서 다양한 PoC와 현업 프로젝트를 수행했다. 현재는 클라우드 업계에서 고객의 비즈니스 요구 사항을 이해하고 문제를 해결하는 AI/ML 전문가로서 기술적인 도움을 주고 있다.


김영민역자
김영민

학창 시절 문인을 꿈꿨으나 군 시절 수학의 즐거움을 알게 되어 통계학으로 학사 및 석사 학위를 받았다. 금융공학으로 파생상품 가치를 평가하는 증권사 퀀트로 일하던 중 알렉스넷과 알파고의 등장에 충격을 받고 2015년에 커리어를 선회했다. 이후 IT와 금융 업계에서 데이터 과학자 및 머신러닝 엔지니어로 일하면서 다양한 머신러닝 서비스 론칭에 기여했다. 현재는 아마존 웹 서비스에서 엔터프라이즈의 비즈니스 문제를 머신러닝으로 함께 해결하면서 고객 성공을 지원하고 있다. 가치 중립인 AI 기술의 올바른 사용에도 관심이 있다.

목차

1장 머신러닝 시스템 개요

1.1 머신러닝을 사용해야 하는 경우

1.2 머신러닝 시스템 이해하기

1.3 정리



2장 머신러닝 시스템 설계 소개

2.1 비즈니스와 머신러닝의 목적

2.2 머신러닝 시스템 요구 사항

2.3 반복 프로세스

2.4 머신러닝 문제 구조화하기

2.5 지성 vs. 데이터

2.6 정리



3장 데이터 엔지니어링 기초

3.1 데이터 소스

3.2 데이터 포맷

3.3 데이터 모델

3.4 데이터 스토리지 엔진 및 처리

3.5 데이터플로 모드

3.6 배치 처리 vs. 스트림 처리

3.7 정리



4장 훈련 데이터

4.1 샘플링

4.2 레이블링

4.3 클래스 불균형 문제

4.4 데이터 증강

4.5 정리



5장 피처 엔지니어링

5.1 학습된 피처 vs. 엔지니어링된 피처

5.2 피처 엔지니어링 기법

5.3 데이터 누수

5.4 좋은 피처를 설계하는 방법

5.5 정리



6장 모델 개발과 오프라인 평가

6.1 모델 개발과 훈련

6.2 모델 오프라인 평가

6.3 정리



7장 모델 배포와 예측 서비스

7.1 머신러닝 배포에 대한 통념

7.2 배치 예측 vs. 온라인 예측

7.3 모델 압축

7.4 클라우드와 에지에서의 머신러닝

7.5 정리



8장 데이터 분포 시프트와 모니터링

8.1 머신러닝 시스템 장애 원인

8.2 데이터 분포 시프트

8.3 모니터링과 관찰 가능성

8.4 정리



9장 연속 학습과 프로덕션 테스트

9.1 연속 학습

9.2 프로덕션에서 테스트하기

9.3 정리



10장 MLOps를 위한 인프라와 도구

10.1 스토리지와 컴퓨팅

10.2 개발 환경

10.3 자원 관리

10.4 머신러닝 플랫폼

10.5 구축 vs. 구매

10.6 정리



11장 머신러닝의 인간적 측면

11.1 사용자 경험

11.2 팀 구조

11.3 책임 있는 AI

11.4 정리


리뷰

구매자 별점

5.0

점수비율
  • 5
  • 4
  • 3
  • 2
  • 1

1명이 평가함

리뷰 작성 영역

이 책을 평가해주세요!

내가 남긴 별점 0.0

별로예요

그저 그래요

보통이에요

좋아요

최고예요

별점 취소

구매자 표시 기준은 무엇인가요?

'구매자' 표시는 리디에서 유료도서 결제 후 다운로드 하시거나 리디셀렉트 도서를 다운로드하신 경우에만 표시됩니다.

무료 도서 (프로모션 등으로 무료로 전환된 도서 포함)
'구매자'로 표시되지 않습니다.
시리즈 도서 내 무료 도서
'구매자’로 표시되지 않습니다. 하지만 같은 시리즈의 유료 도서를 결제한 뒤 리뷰를 수정하거나 재등록하면 '구매자'로 표시됩니다.
영구 삭제
도서를 영구 삭제해도 ‘구매자’ 표시는 남아있습니다.
결제 취소
‘구매자’ 표시가 자동으로 사라집니다.

이 책과 함께 구매한 책


이 책과 함께 둘러본 책



본문 끝 최상단으로 돌아가기

spinner
모바일 버전