스트라이드는 필터의 이동 횟수를 뜻합니다. 즉, 기존에 필터가 한칸씩 이동해서 계산했다면, 스트라이드를 주게 되면 그 수만큼 필터가 이동해서 계산하게 됩니다.
따라서 최종 크기는 \displaystyle(\frac{n+2p-f}{s} + 1) \times (\frac{n+2p-f}{s} + 1) (sn+2p−f+1)×(sn+2p−f+1) 가 됩니다. 만약에 소수점으로 만들었다면 내림을 하게 됩니다. 보통은 필터에 맞춰서 최대한 크기가 정수가 될수 있도록 패딩과 스트라이드 수치를 맞춥니다.
신호처리에서의 교차상관과 합성곱의 관계를 알아봅니다.
일반적으로 수학에서 정의하는 합성곱은 합성곱을 하기 전에 필터를 가로축과 세로축으로 뒤집는 연산을 해줘야합니다.
지금까지 배운 합성곱은 사실 교차상관 이지만 딥러닝에서는 관습적으로 합성곱이라고 합니다.
딥러닝에서는 뒤집는 연산을 생략합니다. 이 뒤집는 과정은 신호처리에서는 유용하지만 심층 신경망 분야에서는 아무런 영향이 없기 때문에 생략하게 됩니다.
comment
cross correlation 설명 중 flipped matrix가 잘못되었습니다. 실수로 transpose한 것을 flip한 것 같은데 가로, 세로 flip하게 되면 [[7, 9, -1], [2, 0, 1], [5, 4, 3]] 입니다.