티스토리 뷰
이전까지 배운 수치미분을 이용해서 학습을 하게되면 계산 비용이 너무 커서 엄청나게 오래 걸립니다.
우리는 그래서 오차역전파법을 이용해서 계산 비용을 줄여 학습을 시키는 것을 알아 볼 것입니다.
사람이 직접 공식을 써서 미분을 한 후 덧셈과 곱셈만 남겨 컴퓨터에게 유리한 계산만 남기는 것입니다.
합성함수의 미분법은 여러 함수를 합성을 할 때, 합성을 한 후 미분을 하는것이 아닌 각 각을 미분을 한 후 곱해줍니다. 이는 연쇄법칙을 사용한 것입니다.
오차역전파법의 기반은 공식으로 미분을 하고, 연쇄법칙을 사용하는 것입니다.
함수 f z h 가 있으면
h 부터 z f 순으로 미분을 한 후 곱해준다.
계산 그래프 : 순전파
왼쪽에서 오른족으로 계산하는 과정인 것이다.
계산 그래프 : 역전파
계산그래프를 이용한 역전파 ( 수포자를 위한 다변수함수 미분법 이라고도 부릅니다. )
결론은 역전파의 가장 왼쪽의 값은 그 변수로 편미분한 값이 결과로 나온다는 것입니다.
'Study > 인공지능' 카테고리의 다른 글
Optimizer : Momentum, NAG ( 인공지능 기초 #14 ) (0) | 2020.10.23 |
---|---|
Optimizer: SGD ( 인공지능 기초 #13 ) (0) | 2020.10.22 |
경사하강법 (인공지능 기초 #9) (0) | 2020.10.19 |
수치미분과 gradient, 최대 최소 등위선면 (인공지능 기초 #8) (0) | 2020.10.15 |
MNIST, 손글씨 구분하기 + Tensor 개념 (인공지능 기초 #6) (1) | 2020.09.17 |
댓글