논문리뷰
-
Knowledge Distillation SOTA 논문 리뷰논문리뷰 2022. 5. 30. 14:59
1. Knowledge review (CVPR 2021) https://arxiv.org/pdf/2104.09044v1.pdf ~를 중요한 문제로 여겼다. -> 기존은 똑같은 feature 단에서 feature transformation + loss로 knowledge 를 전달한다. 근데 이 fourth stage output끼리의 비교는 bottleneck in the whole knowledge distillation framework 이다. 이를 어떤 hint를 통해 풀었다. -> teacher의 old knowledge(low level previous feature) connection path cross 을 사용하여 student에 각 stage에서 추가적으로 전달했다. (uses multip..
-
Projected GANs Converge Faster논문리뷰 2022. 2. 25. 04:55
Projected GANs Converge Faster (NerIPS 2021) Intro 본 논문은, GAN의 D가 pretrained model의 deep layer들에 존재하는 feature를 온전히 활용하지 못한다는 단점을 해결코자 했다. 해결책으로 해당 feature들을 채널별로, 해상도별로 mixing하는 작업을 했고 이미지 퀄리티, sample efficiency, 수렴속도면에서 이득을 볼 수 있었다. 또한 22개의 벤치마크 데이타셋에서 FID SOTA를 달성했고, 고해상도 이미지도 잘만들고, 수렴속도도 엄청나게 감소시켰다. 기존의 D는, 가지 역할을 했었다. 첫째로, input으로 들어오는 real, fake image를 meaningful한 space로 projected해서 input의 ..
-
Context-Aware Layout to Image Generation with Enhanced Object Appearance논문리뷰 2022. 1. 13. 12:27
Introduction What is L2I? 본 논문은 L2I 방식으로 이미지를 생성하는 네트워크를 제안한다. L2I(Layout to Image)는 layout을 입력 받아서 해당 bounding box의 라벨들이 담긴 단일 이미지를 생성하는 모델이다. 기존의 L2I 네트워크들은 사실적인 이미지 생성에 있어 2가지 한계가 존재했고, 본 논문은 G, D에 각각 새로운 모듈을 하나씩 추가해줌으로써 본 문제점을 해결했다. 2 major limitations 첫 번째 문제점은 다음과 같다. -The object-to-object relations are often broken. (2열이 baseline, 3열이 proposed network임) 위 이미지의 (1, 2) 이미지를 보면, layout에 따라 생..
-
GANSpace: Discovering Interpretable GAN Controls 리뷰논문리뷰 2021. 11. 18. 16:15
1. Intro 본 논문은 Latent direction을 supervised learning 방식으로 찾는 방식이 아닌, latent space 상에서 PCA를 통해 attribute를 향한 direction을 찾는 방법을 제안했다. 또한 BigGAN StyleGAN처럼 layerwise한 input을 통해 style mixing을 비롯한 control이 가능토록 별도의 training 없이modify하는 아이디어를 제안한다. 본 논문은 별도의 학습을 필요로 하지 않고, 기존 학습된 GAN의 내용물을 PCA를 통해 direction을 찾는다. 2. Discovering GAN Controls 2.1 Background StyleGAN의 장점인 layer별로 다른 w가 들어가는 것을 style mixin..