About convolutional layers : nn.Conv2d
#9
HyeAnn-Lee
started this conversation in
General
Replies: 1 comment
-
는 아니었구연..,,,,,,,, |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
PyTorch 1.12.1 버전의 nn.Conv2d 클래스의 docs는 input과 output의 shape 이렇게 말하고 있습니다.
ICM 논문을 보면, 아래와 같이 언급이 되어 있습니다.
초기 input$(N, C_{in}, H_{in}, W_{in})$ 이 $(4, 1, 42, 42)$ 라는 뜻입니다.
32 filter, kernel 3, stride 2, padding 1인 convolutional layer를 42x42에 손으로 직접 적용하려고 하면 한두칸씩 오차가 나기 때문에 논문의 설명을 의심할 수도 있습니다. 하지만 PyTorch는 위 이미지의 floor 함수를 통해 이를 잘 처리하고 있는 것으로 보입니다.
논문의 값들을 적용하면,$H_{out} = floor ((H_{in}+1)/2)$ 가 되어 이미지의 크기가 42->21->11->6->3으로 줄어듦을 알 수 있습니다.
Beta Was this translation helpful? Give feedback.
All reactions