https://arxiv.org/abs/2105.07197
Are Convolutional Neural Networks or Transformers more like human vision? (Shikhar Tuli, Ishita Dasgupta, Erin Grant, Thomas L. Griffiths)
이쪽은 cnn보다 트랜스포머보다 인간과 더 비슷한 방식으로 작동하는가 하는 분석. Confusion matrix로 에러의 패턴을 분석하고 shape vs texture bias를 테스트. 여전히 인간과는 멀리 떨어져 있지만 cnn보다 더 나은 패턴을 보여주기는 한다. 그리피스 선생님이 이런 작업에 끼셨음.
#cnn #vision_transformer #inductive_bias