본문 바로가기

[딥러닝] 역전파를 공부시 필요한 자료

ironwhale 2022. 7. 26.

벡터를 행렬로 미분하면?? 

 역전파를 공부할때 필요한 지식은 체인룰과 미분입니다. 그리고 만나는 난관은 벡터를 행렬로 미분해야 하는 과정이 필요한다. 벡터를 행렬로 미분하면 텐서가 나오는데 이부분을 밑바닥부터 시작하는 딥러닝에는 그냥 자세한 설명없이 행렬 X의 전치값이라고 나옵니다. 하지만 수학적으로 계산되서 나오는 값을 알고 싶었던 저는 관련 자료를 찾아보기 시작했고 관련 자료를 찾아 까먹지 않기 위해 여기에 포스팅합니다. 

출처

https://web.stanford.edu/class/cs224n/readings/gradient-notes.pdf

 

gradient-notes.pdf
0.19MB

 

 

 

댓글