HealthyAI

DL) Pre-trained Information 본문

AI/Deep Learning

DL) Pre-trained Information

BiteApple 2023. 4. 2. 18:24
반응형

Transfer Learning (전이 학습)

  • 다른 문제를 해결하는 과정에서 배운 패턴들을 이용하여 비슷한 문제를 해결하는 것을 의미한다.
  • 컴퓨터 비전 분야에서는 Transfer Learning의 의미가 사전 학습된 모델 (= pre trained model)을 사용하여 비슷한 문제를 해결하는 것으로 표현되고 있다.

 

  • Deep Learning Model
    • 계층적 특징들의 표현을 자동으로 학습할 수 있습니다.
      • 첫번째 층에서 계산된 기능은 일반적이며 다른 문제 도메인에서 재사용할 수 있다.
      • 반면 마지막 층에서 계산된 기능은 구체적이며 선택한 데이터셋 및 task에 따라 달라집니다.
    • Lower layers refer to general features (problem independent)
    • Higher layers refer to specific features (problem dependent)

 

Pre trained model

1. Pre trained Model의 FC layers 를 잘라낸다.

 

2. 새로운 Task를 해결하기 위한 FC layer를 붙인다.

 

3. 새로운 FC layers 를 붙인 Model 을 어떤 방식으로 학습 시킬 것인지 정해야 한다.

  • a. 전체 Model 학습
    • Convolution layers는 low learning rate 로 학습, 새로운 FC layers는 high learning rate 로 새로운 task 에 빠르게 적응 할 수 있도록 해준다.
  • b. Model 일부분만 freeze 시킨 채 나머지 부분 학습
    • frozen layer는 학습 과정에서 변하지 않는다.
    • 적은 양의 데이터를 갖고 있다면 많은 layer 들을 freeze 시켜야 overfitting을 막을 수 있다.
    • 많은 양의 데이터를 갖고 있다면 많은 layer 들을 새로운 task에 맞게 학습시켜도 된다.
  • a, b는 Convolutional part 에서 사용되는 learning rate 에 주의 하자.
    • high learning rate는 기존의 학습된 정보를 잃기 쉽기 때문에 CNN 기반의 pre trained model을 사용한다면 small learning rate 를 사용해야 한다.
  • c. Convolution layers를 freeze 시킨 채로 새로운 FC layers 만 학습
    • FC layers 만 학습하면 되므로 parameter 수가 줄어든다. 
    • computational power가 약한 경우, 데이터가 적은 경우, pre trained model이 내가 풀려는 새로운 문제와 비슷한 문제를 풀어낸 경우에 사용한다.

pretraining 출처Transfer Learning

 

 

Transfer Learning Process

1. Select a pre trained model

2. Classify your problem according ot the size-similarity matrix

  • pre trained model 이 학습한 데이터셋의 크기와 나의 데이터셋의 크기를 알맞게 조정해야한다. 
  • cats and dogs 이미지를 학습 데이터로 사용한 ImageNet을 활용하여 암세포를 판별할수 없다.

3. Fine-tune your Model

 

반응형

'AI > Deep Learning' 카테고리의 다른 글

DL) Loss Function  (0) 2023.04.20
DL) Regularization  (0) 2023.04.20
DL) Training Inference  (0) 2023.04.19
DL) Optimization - Gradient Descent  (0) 2023.02.10