Cross Entropy Loss with Softmax 미분에 대한 이해

2023. 7. 10. 20:09·AI/cs231n

https://madalinabuzau.github.io/2016/11/29/gradient-descent-on-a-softmax-cross-entropy-cost-function.html

 

Gradient descent on a Softmax cross-entropy cost function

In this blog post, you will learn how to implement gradient descent on a linear classifier with a Softmax cross-entropy loss function. I recently had to implement this from scratch, during the CS231 course offered by Stanford on visual recognition. Andrej

madalinabuzau.github.io

 

위 블로그에 정리된 증명을 통해 과정을 납득할 수 있었다.

아직 벡터(텐서)나 매트릭스의 미분에 익숙하지 않은 것 같아 관련 예제들을 집중하며 봐야겠다.

'AI > cs231n' 카테고리의 다른 글

Stanford CS224N - NLP w/ DL | Winter 2021 | Lecture 4 - Syntactic Structure and Dependency Parsing  (0) 2022.09.16
'AI/cs231n' 카테고리의 다른 글
  • Stanford CS224N - NLP w/ DL | Winter 2021 | Lecture 4 - Syntactic Structure and Dependency Parsing
jh-rrr
jh-rrr
기술의 깊이에 집중하며 성장하길 지향합니다.
  • jh-rrr
    Embedded World
    jh-rrr
  • 전체
    오늘
    어제
    • 분류 전체보기 (64)
      • 소프트웨어 (17)
        • 프로그래밍 (2)
        • C (10)
        • Python (1)
        • 운영체제 (3)
        • 네트워크 (0)
      • Embedded Systems (16)
        • 리눅스 (10)
        • MCU 기본 (2)
        • 임베디드 레시피 (0)
      • Projects (1)
        • Cortex-M3 (1)
        • 재난 구조 로봇 (0)
      • AI (11)
        • Computer Vision (2)
        • Deep Learning (3)
        • cs224n (2)
        • cs231n (2)
      • 취업 준비 (0)
        • 프로젝트 & 자격증 (1)
      • 엔지니어링 뉴스 (3)
      • Paper Reviews (4)
      • Insights (8)
        • Seminar ! (2)
        • 서평 (4)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    리눅스 오류
    conda: command not found
    stm32f 시리즈를 이용한 arm cortex-m3/m4 구조와 응용
    일귀
    OS 이미지
    리눅스
    kernel image 란
    essential deep learning paper reading
    커널 이미지란
    커널 이미지
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.5
jh-rrr
Cross Entropy Loss with Softmax 미분에 대한 이해
상단으로

티스토리툴바