학습목표정규화를 이용해 과대적합 문제를 해결할 수 있다.핵심키워드정규화 (regularization)정규화 매개변수 \lambdaL1 노름 (L1 norm)L2 노름 (L2 norm)Frobenius 노름 (Frobenius norm)
학습내용비용함수: J(w,b)=m 1σi=1mL(y(i)^,h(i))+2m λ∣∣w∣∣2 L1 정규화: ∣∣w∣∣1=σj=1nx∣wj∣ L2 정규화: ∣∣w∣∣22=σj=1nxwj2 Frobenius 노름: ∣∣w[l]∣∣F2=σi=1n[l−1]σj=1n[l](wij[l])2 L2 정규화가 weight decay 라고 불리는 이유는 아래와 같습니다. w[l]=(1−m αλ)w[l]−α (역전파에서 온 값들)위의 식을 보면 weight 에 1보다 작은 값인 ( 1−m αλ ) 가 곱해지기 때문입니다.
comment
학습내용에 오타입니다.
시그마가 전부 소문자 σ로 되어있는데 대문자 Σ로 모두 바꾸어야 합니다. 5개 다 바꾸어야 합니다.
그리고 Σ의 위에 들어가는 nx에서 x는 아래첨자가 되어야 되니까 아래첨자 표기가 안되면 n_x라고 해야합니다.
또 비용함수의 loss함수 안에 h^(i)로 되어있는데 y^(i)의 오타인것 같습니다. 수고하세요~~
w 의 차원을 이전 강의에서는 (w^[l], w^[l-1]) 로 설명된 적이 있는데 여기서는 (w^[l-1], w[l]) 로 나오네요. 후자의 경우에도 구현하기 나름이긴 하겠지만 오타가 아닐까 싶어요. 원본 영상에도 이와 관련된 댓글이 있음