Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 우선순위큐
- 힙
- Focal Loss
- DataAugmentation
- autograd
- pytorch
- objectdetection
- 밑바닥부터 시작하는 딥러닝
- Optimizer
- clibration
- labelsmoothing
- layernormalization
- 프로그래머스
- ComputerVision
- 정렬
- focalloss
- f1loss
- BatchNormalization
- fasterRCNN
- 네이버 ai 부스트캠프
- mmdetectionv3
- 자료구조끝판왕문제
- cmp_to_key
- l2penalty
- noiserobustness
- inference
- labelsmoothingloss
- 네이버AI부스트캠프
- 중복순열
- ImageClassification
Archives
- Today
- Total
HealthyAI
DL) Pre-trained Information 본문
반응형
Transfer Learning (전이 학습)
- 다른 문제를 해결하는 과정에서 배운 패턴들을 이용하여 비슷한 문제를 해결하는 것을 의미한다.
- 컴퓨터 비전 분야에서는 Transfer Learning의 의미가 사전 학습된 모델 (= pre trained model)을 사용하여 비슷한 문제를 해결하는 것으로 표현되고 있다.
- Deep Learning Model
- 계층적 특징들의 표현을 자동으로 학습할 수 있습니다.
- 첫번째 층에서 계산된 기능은 일반적이며 다른 문제 도메인에서 재사용할 수 있다.
- 반면 마지막 층에서 계산된 기능은 구체적이며 선택한 데이터셋 및 task에 따라 달라집니다.
- Lower layers refer to general features (problem independent)
- Higher layers refer to specific features (problem dependent)
- 계층적 특징들의 표현을 자동으로 학습할 수 있습니다.
Pre trained model
1. Pre trained Model의 FC layers 를 잘라낸다.
2. 새로운 Task를 해결하기 위한 FC layer를 붙인다.
3. 새로운 FC layers 를 붙인 Model 을 어떤 방식으로 학습 시킬 것인지 정해야 한다.
- a. 전체 Model 학습
- Convolution layers는 low learning rate 로 학습, 새로운 FC layers는 high learning rate 로 새로운 task 에 빠르게 적응 할 수 있도록 해준다.
- b. Model 일부분만 freeze 시킨 채 나머지 부분 학습
- frozen layer는 학습 과정에서 변하지 않는다.
- 적은 양의 데이터를 갖고 있다면 많은 layer 들을 freeze 시켜야 overfitting을 막을 수 있다.
- 많은 양의 데이터를 갖고 있다면 많은 layer 들을 새로운 task에 맞게 학습시켜도 된다.
- a, b는 Convolutional part 에서 사용되는 learning rate 에 주의 하자.
- high learning rate는 기존의 학습된 정보를 잃기 쉽기 때문에 CNN 기반의 pre trained model을 사용한다면 small learning rate 를 사용해야 한다.
- c. Convolution layers를 freeze 시킨 채로 새로운 FC layers 만 학습
- FC layers 만 학습하면 되므로 parameter 수가 줄어든다.
- computational power가 약한 경우, 데이터가 적은 경우, pre trained model이 내가 풀려는 새로운 문제와 비슷한 문제를 풀어낸 경우에 사용한다.
pretraining 출처 : Transfer Learning
Transfer Learning Process
1. Select a pre trained model
2. Classify your problem according ot the size-similarity matrix
- pre trained model 이 학습한 데이터셋의 크기와 나의 데이터셋의 크기를 알맞게 조정해야한다.
- cats and dogs 이미지를 학습 데이터로 사용한 ImageNet을 활용하여 암세포를 판별할수 없다.
3. Fine-tune your Model
반응형
'AI > Deep Learning' 카테고리의 다른 글
DL) Loss Function (0) | 2023.04.20 |
---|---|
DL) Regularization (0) | 2023.04.20 |
DL) Training Inference (0) | 2023.04.19 |
DL) Optimization - Gradient Descent (0) | 2023.02.10 |