학습내용우선, 모델 안에 있는 모든 변수(W, b)를 하나의 벡터( θ )로 concatenate합니다. 그러면 비용 함수는 J(W, b) 에서 J( θ ) 로 변합니다.그후, 수치 미분을 구합니다. dθapprox[i]=2ϵ J(θ1,⋯,θi+ϵ,⋯)−J(θ1,⋯,θi−ϵ,⋯) 최종적으로 수치 미분과 일반 미분을 비교합니다. dθapprox[i]≈dθ 유사도를 계산하는 방법은 유클리디안 거리를 사용합니다. ∥dθapprox[i]∥2+∥dθ∥2 ∥dθapprox[i]−dθ∥2 보통 거리가 10−7 보다 작으면 잘 계산되었다고 판단합니다.
comment