LayerNorm 과 BatchNorm 의 차이

2023. 5. 17. 23:02·AI/Deep Learning

< Batch Normalization >
표본추출된 mini-batch내부 각 feature 값들의 mean, std를 구해 정규화를 진행해준다.

https://docon.tistory.com/37: 더 자세한 분석입니다!
 

< Layer Normalization >
Batch에 어떤 크기의 데이터들이 있든 관계없이, 샘플단위로 normalization을 시켜준다.
 
 
요점은, 내가 가져온 데이터 혹은 모델 내부에서의 latent vector가 어떤 연산을 하게되는지에 따라 적절한 Normalization 방식을 채택하면 좋을 것 같다.
예를들어, 데이터의 feature중, 특정 feature의 분포가 너무 큰 경우는 Gradient Exploading 등 학습 중 장애가 우려되기에, batch normalization으로 한 샘플 내 feature 간 값의 차이를 줄여주는게 좋을 것 같다.
또는, 모델의 충분히 깊은 hidden layer 중, 특정 feature에 지나치게 의존해 Overfitting을 방지하고자 한다면, Layer Normalization을 통해 feature간 activation value 차이를 상쇄해줄 수 도 있을 것 같다.
마지막으로, 이미지를 처리하는 모델의 경우, 한장의 이미지를 기준으로 Normalization을 진행하는게 더 합리적이기에, Layer Normzlization을 사용하는게 더 적절해 보인다. (상황by상황 이겠지만..)

 
 
 
Reference 
https://m.blog.naver.com/PostView.nhn?isHttpsRedirect=true&blogId=baek2sm&logNo=222176799509&categoryNo=99&proxyReferer=

'AI > Deep Learning' 카테고리의 다른 글

PyTroch DataLoader의 병렬 프로세싱!  (0) 2023.10.30
딥러닝에서 "tensor" 란,  (0) 2022.02.23
'AI/Deep Learning' 카테고리의 다른 글
  • PyTroch DataLoader의 병렬 프로세싱!
  • 딥러닝에서 "tensor" 란,
jh-rrr
jh-rrr
기술의 깊이에 집중하며 성장하길 지향합니다.
  • jh-rrr
    Embedded World
    jh-rrr
  • 전체
    오늘
    어제
    • 분류 전체보기 (64)
      • 소프트웨어 (17)
        • 프로그래밍 (2)
        • C (10)
        • Python (1)
        • 운영체제 (3)
        • 네트워크 (0)
      • Embedded Systems (16)
        • 리눅스 (10)
        • MCU 기본 (2)
        • 임베디드 레시피 (0)
      • Projects (1)
        • Cortex-M3 (1)
        • 재난 구조 로봇 (0)
      • AI (11)
        • Computer Vision (2)
        • Deep Learning (3)
        • cs224n (2)
        • cs231n (2)
      • 취업 준비 (0)
        • 프로젝트 & 자격증 (1)
      • 엔지니어링 뉴스 (3)
      • Paper Reviews (4)
      • Insights (8)
        • Seminar ! (2)
        • 서평 (4)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    리눅스 오류
    일귀
    리눅스
    커널 이미지란
    OS 이미지
    essential deep learning paper reading
    conda: command not found
    stm32f 시리즈를 이용한 arm cortex-m3/m4 구조와 응용
    커널 이미지
    kernel image 란
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.5
jh-rrr
LayerNorm 과 BatchNorm 의 차이
상단으로

티스토리툴바