본문 바로가기

리디북스 접속이 원활하지 않습니다.
강제 새로 고침(Ctrl + F5)이나 브라우저 캐시 삭제를 진행해주세요.
계속해서 문제가 발생한다면 리디북스 접속 테스트를 통해 원인을 파악하고 대응 방법을 안내드리겠습니다.
테스트 페이지로 이동하기


만들면서 배우는 파이토치 딥러닝 상세페이지

컴퓨터/IT 개발/프로그래밍

만들면서 배우는 파이토치 딥러닝

12가지 모델로 알아보는 딥러닝 응용법

구매종이책 정가40,000
전자책 정가20%32,000
판매가32,000
만들면서 배우는 파이토치 딥러닝

작품 소개

<만들면서 배우는 파이토치 딥러닝> 딥러닝을 진정으로 가치 있게 활용하는 방법!



딥러닝은 입출력 데이터와 손실함수만 잘 정의한다면 다양한 분야의 과제를 해결할 수 있다. 딥러닝 응용 방법으로 전이학습과 파인튜닝을 활용한 화상(이미지) 분류, 물체 감지, 시맨틱 분할, 자세 추정, GAN을 활용한 화상 생성 및 이상 탐지, 텍스트 데이터 감정 분석, 동영상 데이터 클래스 분류를 다뤘다. 직무 특성에 따른 도메인 지식과 딥러닝 구현 능력을 갖춘 인재로 성장하여 활약하는 데 이 책이 도움이 될 것이다.





★ 각 장의 개요



_1장. 화상 분류와 전이학습(VGG)

학습된 VGG 모델을 활용해 소량의 데이터로 딥러닝 모델을 구축할 수 있는 전이학습과 파인튜닝을 알아봅니다. 또한 이 책에서는 AWS의 클라우드 GPU 머신을 사용하여 딥러닝을 설명합니다.



_2장. 물체 인식(SSD)

물체 감지는 딥러닝 응용 방법 중에서도 특히 복잡한 기술입니다. SSD 모델을 활용해 물체 감지의 흐름을 설명합니다.



_3장. 시맨틱 분할(PSPNet)

픽셀 수준에서 물체를 분류하는 시맨틱 분할을 학습하면서 딥러닝 모델 PSPNet을 설명합니다. 어떻게 픽셀 수준에서 물체를 분류할 수 있는지와 함께 네트워크 구조, 순전파함수, 손실함수도 알아봅니다.



_4장. 자세 추정(OpenPose)

자세 추정은 화상에 포함된 여러 인물을 탐지하여 인체 각 부위의 위치를 식별하고 부위를 연결하는 선(링크)을 구하는 기술입니다. OpenPose가 어떻게 사람의 각 부위를 탐지하고 부위를 서로 연결하는지 구현하며 그 구조를 확인합니다. 모델의 네트워크 구조 확인 방법으로 텐서보드X 사용법을 설명합니다.



_5장. GAN을 활용한 화상 생성(DCGAN, Self-Attention GAN)

Self-Attention은 자연어 처리(NLP)에 활용되는 Transformer와 BERT의 열쇠가 되지만 이해하기 어렵기 때문에 우선은 화상에서 Self-Attention을 구현하고 이해하는 것을 목표로 합니다.



_6장. GAN을 활용한 이상 감지(AnoGAN, Efficient GAN)

이상 화상 검출은 의료 현장에서 질환 및 건강 상태를 판별하거나 제조업에서 이상이 있는 부품을 검출할 경우 등에 사용합니다. 이상 화상이 정상 화상보다 매우 적을 때는 AnoGAN을, 이상 탐지에 걸리는 시간을 해결하기 위해서는 EfficientGAN을 응용할 수 있습니다.



_7장. 자연어 처리를 활용한 감정 분석(Transformer)

텍스트 데이터를 취급하는 자연어 처리를 살펴보고 딥러닝 모델 Transformer를 활용해 텍스트 데이터 내용을 긍정과 부정으로 감정합니다. word2vec과 fasttext를 활용해 단어를 벡터 표현으로 수치화하고 단어에 Attention을 걸어 추론 결과를 시각화해봅니다.



_8장. 자연어 처리를 활용한 감정 분석(BERT)

감정 분석 모델을 구축, 학습하고 추론해 문맥에 따라 단어 벡터가 어떻게 변화하는지 알아보고 Self-Attention으로 시각화해봅니다.



_9장. 동영상 분류(3DCNN, ECO)

화상 분류와 동영상 분류의 차이에 주목하면서 어떻게 동영상을 딥러닝에서 다루고 구현하는지 설명합니다.


출판사 서평

이미지/동영상 분류에서 OpenPose, GAN, BERT까지

최신 딥러닝 모델 구현의 핵심이 한 권에!



비즈니스 현장에서 딥러닝을 응용한 경험을 쌓고 싶다면, 합성곱 신경망을 이용한 화상(이미지) 분류 등과 같이 기본적인 딥러닝 기법을 배운 후 다음 단계로 넘어가고 싶다면 추천합니다. 입문서에서는 알기 어려웠던 전이학습과 파인튜닝을 활용한 화상 분류, 물체 감지, 시맨틱 분할, 자세 추정, GAN을 활용한 화상 생성 및 이상 탐지, 텍스트 데이터 감정 분석, 동영상 데이터 클래스 분류를 12가지 모델로 구현하며 배울 수 있습니다.

딥러닝은 ‘영업×딥러닝’, ‘제조×딥러닝’, ‘의료×딥러닝’ 등과 같이 다른 분야와 함께 활용할 때 비로소 진정한 가치를 발휘합니다. 도메인 지식과 딥러닝 구현 능력이 결합된 인재로 성장하여 현장에서 활약하는 데 이 책이 도움 될 것입니다.


저자 프로필

오가와 유타로

  • 학력 도쿄대학 대학원
    도쿄대학교 공학부 학사
  • 경력 SIer 개발기술부
    도쿄대학 특임 연구원

2021.08.03. 업데이트 작가 프로필 수정 요청

SIer의 기술본부 개발기술부 소속. 딥러닝을 비롯한 머신러닝 관련 기술의 연구 개발 및 기술 지원을 담당한다. 아카시 공업고등전문학교, 도쿄대학 공학부를 거쳐 도쿄대학 대학원, 짐보/고타니 실험실에서 뇌 기능 측정 및 계산 신경과학을 연구했으며 2016년에 박사 학위를 취득했다. 도쿄대학 특임 연구원을 거쳐 2017년 4월부터 현재 직무에 종사 중이다. 저서로 『PyTorch를 활용한 강화학습/심층강화학습 실전 입문』, 『つくりながら學ぶ! Pythonによる因果分析』 등이 있다.


저자 소개

저자
오가와 유타로

SIer의 기술본부 개발기술부 소속. 딥러닝을 비롯한 머신러닝 관련 기술의 연구 개발 및 기술 지원을 담당한다. 아카시 공업고등전문학교, 도쿄대학 공학부를 거쳐 도쿄대학 대학원, 짐보/고타니 실험실에서 뇌 기능 측정 및 계산 신경과학을 연구했으며 2016년에 박사 학위를 취득했다. 도쿄대학 특임 연구원을 거쳐 2017년 4월부터 현재 직무에 종사 중이다. 저서로 『PyTorch를 활용한 강화학습/심층강화학습 실전 입문』, 『つくりながら學ぶ! Pythonによる因果分析』 등이 있다.

역자
박광수(아크몬드)

‘아크몬드’라는 필명으로 더 잘 알려진 블로거. 2004년부터 지금까지 최신 윈도우 정보를 꾸준히 나누고 있다. 2007년부터 2019년까지 마이크로소프트 MVP(Windows 부문)를 수상했다. 윈도우 11 등 마이크로소프트의 최신 기술에 열광한다. 현재 일본에서 서버 개발자로 활동하며 딥러닝에 많은 관심을 두고 있다. 번역서로 『처음 배우는 딥러닝 수학』, 『파이썬으로 배우는 머신러닝의 교과서』, 『파이썬으로 배우는 딥러닝 교과서』(이상 한빛미디어) 등이 있다.

목차

CHAPTER 1 화상 분류와 전이학습(VGG)

1.1 학습된 VGG 모델을 사용하는 방법

1.2 파이토치를 활용한 딥러닝 구현 흐름

1.3 전이학습 구현

1.4 아마존 AWS의 클라우드 GPU 머신을 사용하는 방법

1.5 파인튜닝 구현



CHAPTER 2 물체 감지(SSD)

2.1 물체 감지란

2.2 데이터셋 구현

2.3 데이터 로더 구현

2.4 네트워크 모델 구현

2.5 순전파 함수 구현

2.6 손실함수 구현

2.7 학습 및 검증 실시

2.8 추론 실시



CHAPTER3 시맨틱 분할(PSPNet)

3.1 시맨틱 분할이란

3.2 데이터셋과 데이터 로더 구현

3.3 PSPNet 네트워크 구성 및 구현

3.4 Feature 모듈 설명 및 구현(ResNet)

3.5 Pyramid Pooling 모듈 설명 및 구현

3.6 Decoder, AuxLoss 모듈 설명 및 구현

3.7 파인튜닝을 활용한 학습 및 검증 실시

3.8 시맨틱 분할 추론



CHAPTER 4 자세 추정(OpenPose)

4.1 자세 추정 및 오픈포즈 개요

4.2 데이터셋과 데이터 로더 구현

4.3 오픈포즈 네트워크 구성 및 구현

4.4 Feature 및 Stage 모듈 설명 및 구현

4.5 텐서보드X를 사용한 네트워크의 시각화 기법

4.6 오픈포즈 학습

4.7 오픈포즈 추론



CHAPTER 5 GAN을 활용한 화상 생성(DCGAN, Self-Attention GAN)

5.1 GAN을 활용한 화상 생성 메커니즘과 DCGAN 구현

5.2 DCGAN의 손실함수, 학습, 생성

5.3 Self-Attention GAN의 개요

5.4 Self-Attention GAN의 학습, 생성



CHAPTER 6 GAN을 활용한 이상 화상 탐지(AnoGAN, Efficient GAN)

6.1 GAN을 활용한 이상 화상 탐지 메커니즘

6.2 AnoGAN 구현 및 이상 탐지 실시

6.3 Efficient GAN의 개요

6.4 Efficient GAN 구현 및 이상 탐지 실시



CHAPTER 7 자연어 처리에 의한 감정 분석(Transformer)

7.1 형태소 분석 구현(Janome, MeCab+NEologd)

7.2 torchtext를 활용한 데이터셋, 데이터 로더 구현

7.3 단어의 벡터 표현 방식(word2vec, fasttext)

7.4 word2vec, fasttext에서 학습된 모델(일본어)을 사용하는 방법

7.5 IMDb의 데이터 로더 구현

7.6 Transformer 구현(분류 작업용)

7.7 Transformer의 학습/추론, 판단 근거의 시각화 구현



CHAPTER 8 자연어 처리를 활용한 감정 분석(BERT)

8.1 BERT 메커니즘

8.2 BERT 구현

8.3 BERT를 활용한 벡터 표현 비교(bank: 은행과 bank: 강변)

8.4 BERT의 학습 및 추론, 판단 근거의 시각화 구현



CHAPTER 9 동영상 분류(3DCNN, ECO)

9.1 동영상 데이터에 대한 딥러닝과 ECO 개요

9.2 2D Net 모듈(Inception-v2) 구현

9.3 3D Net 모듈(3DCNN) 구현

9.4 Kinetics 동영상 데이터셋을 데이터 로더로 구현

9.5 ECO 모델 구현 및 동영상 분류의 추론 실시


리뷰

구매자 별점

0.0

점수비율

  • 5
  • 4
  • 3
  • 2
  • 1

0명이 평가함

리뷰 작성 영역

이 책을 평가해주세요!

내가 남긴 별점 0.0

별로예요

그저 그래요

보통이에요

좋아요

최고예요

별점 취소

구매자 표시 기준은 무엇인가요?

'구매자' 표시는 리디북스에서 유료도서 결제 후 다운로드 하시거나 리디셀렉트 도서를 다운로드하신 경우에만 표시됩니다.

무료 도서 (프로모션 등으로 무료로 전환된 도서 포함)
'구매자'로 표시되지 않습니다.
시리즈 도서 내 무료 도서
'구매자’로 표시되지 않습니다. 하지만 같은 시리즈의 유료 도서를 결제한 뒤 리뷰를 수정하거나 재등록하면 '구매자'로 표시됩니다.
영구 삭제
도서를 영구 삭제해도 ‘구매자’ 표시는 남아있습니다.
결제 취소
‘구매자’ 표시가 자동으로 사라집니다.

이 책과 함께 구매한 책


이 책과 함께 둘러본 책



본문 끝 최상단으로 돌아가기

spinner
모바일 버전