상세정보
만들면서 배우는 파이토치 딥러닝
- 저자
- 오가와 유타로
- 출판사
- 한빛미디어
- 출판일
- 2021-08-05
- 등록일
- 2021-11-30
- 파일포맷
- PDF
- 파일크기
- 7MB
- 공급사
- 교보문고
- 지원기기
-
PC
프로그램 수동설치
뷰어프로그램 설치 안내
책소개
딥러닝을 진정으로 가치있게 활용하는 방법!
딥러닝은 입출력 데이터와 손실함수만 잘 정의한다면 다양한 분야의 과제를 해결할 수 있다. 딥러닝 응용 방법으로 전이학습과 파인튜닝을 활용한 화상(이미지) 분류, 물체 감지, 시맨틱 분할, 자세 추정, GAN을 활용한 화상 생성 및 이상 탐지, 텍스트 데이터 감정 분석, 동영상 데이터 클래스 분류를 다뤘다. 직무 특성에 따른 도메인 지식과 딥러닝 구현 능력을 갖춘 인재로 성장하여 활약하는 데 이 책이 도움이 될 것이다.
저자소개
저자 : 오가와 유타로
저자 : 오가와 유타로
SIer의 기술본부 개발기술부 소속. 딥러닝을 비롯한 머신러닝 관련 기술의 연구 개발 및 기술 지원을 담당한다. 아카시 공업고등전문학교, 도쿄대학 공학부를 거쳐 도쿄대학 대학원, 짐보/고타니 실험실에서 뇌 기능 측정 및 계산 신경과학을 연구했으며 2016년에 박사 학위를 취득했다. 도쿄대학 특임 연구원을 거쳐 2017년 4월부터 현재 직무에 종사 중이다. 저서로 『PyTorch를 활용한 강화학습/심층강화학습 실전 입문』, 『つくりながら學ぶ! Pythonによる因果分析』 등이 있다.
역자 : 박광수(아크몬드)
‘아크몬드‘라는 필명으로 더 잘 알려진 블로거. 2004년부터 지금까지 최신 윈도우 정보를 꾸준히 나누고 있다. 2007년부터 2019년까지 마이크로소프트 MVP(Windows 부문)를 수상했다. 윈도우 11 등 마이크로소프트의 최신 기술에 열광한다. 현재 일본에서 서버 개발자로 활동하며 딥러닝에 많은 관심을 두고 있다. 번역서로 『처음 배우는 딥러닝 수학』, 『파이썬으로 배우는 머신러닝의 교과서』, 『파이썬으로 배우는 딥러닝 교과서』(이상 한빛미디어) 등이 있다.
목차
CHAPTER 1 화상 분류와 전이학습(VGG)
1.1 학습된 VGG 모델을 사용하는 방법
1.2 파이토치를 활용한 딥러닝 구현 흐름
1.3 전이학습 구현
1.4 아마존 AWS의 클라우드 GPU 머신을 사용하는 방법
1.5 파인튜닝 구현
CHAPTER 2 물체 감지(SSD)
2.1 물체 감지란
2.2 데이터셋 구현
2.3 데이터 로더 구현
2.4 네트워크 모델 구현
2.5 순전파 함수 구현
2.6 손실함수 구현
2.7 학습 및 검증 실시
2.8 추론 실시
CHAPTER3 시맨틱 분할(PSPNet)
3.1 시맨틱 분할이란
3.2 데이터셋과 데이터 로더 구현
3.3 PSPNet 네트워크 구성 및 구현
3.4 Feature 모듈 설명 및 구현(ResNet)
3.5 Pyramid Pooling 모듈 설명 및 구현
3.6 Decoder, AuxLoss 모듈 설명 및 구현
3.7 파인튜닝을 활용한 학습 및 검증 실시
3.8 시맨틱 분할 추론
CHAPTER 4 자세 추정(OpenPose)
4.1 자세 추정 및 오픈포즈 개요
4.2 데이터셋과 데이터 로더 구현
4.3 오픈포즈 네트워크 구성 및 구현
4.4 Feature 및 Stage 모듈 설명 및 구현
4.5 텐서보드X를 사용한 네트워크의 시각화 기법
4.6 오픈포즈 학습
4.7 오픈포즈 추론
CHAPTER 5 GAN을 활용한 화상 생성(DCGAN, Self-Attention GAN)
5.1 GAN을 활용한 화상 생성 메커니즘과 DCGAN 구현
5.2 DCGAN의 손실함수, 학습, 생성
5.3 Self-Attention GAN의 개요
5.4 Self-Attention GAN의 학습, 생성
CHAPTER 6 GAN을 활용한 이상 화상 탐지(AnoGAN, Efficient GAN)
6.1 GAN을 활용한 이상 화상 탐지 메커니즘
6.2 AnoGAN 구현 및 이상 탐지 실시
6.3 Efficient GAN의 개요
6.4 Efficient GAN 구현 및 이상 탐지 실시
CHAPTER 7 자연어 처리에 의한 감정 분석(Transformer)
7.1 형태소 분석 구현(Janome, MeCab+NEologd)
7.2 torchtext를 활용한 데이터셋, 데이터 로더 구현
7.3 단어의 벡터 표현 방식(word2vec, fasttext)
7.4 word2vec, fasttext에서 학습된 모델(일본어)을 사용하는 방법
7.5 IMDb의 데이터 로더 구현
7.6 Transformer 구현(분류 작업용)
7.7 Transformer의 학습/추론, 판단 근거의 시각화 구현
CHAPTER 8 자연어 처리를 활용한 감정 분석(BERT)
8.1 BERT 메커니즘
8.2 BERT 구현
8.3 BERT를 활용한 벡터 표현 비교(bank: 은행과 bank: 강변)
8.4 BERT의 학습 및 추론, 판단 근거의 시각화 구현
CHAPTER 9 동영상 분류(3DCNN, ECO)
9.1 동영상 데이터에 대한 딥러닝과 ECO 개요
9.2 2D Net 모듈(Inception-v2) 구현
9.3 3D Net 모듈(3DCNN) 구현
9.4 Kinetics 동영상 데이터셋을 데이터 로더로 구현
9.5 ECO 모델 구현 및 동영상 분류의 추론 실시