Paper Review
-
[논문 리뷰] Optimization for Arbitrary-Oriented Object Detection via Representation Invariance Loss (2021)Paper Review/Computer Vision 2022. 8. 9. 17:33
Abstract Rotation detector를 위한 연구이다. 이전 rotation detector들은 Oriented bounding box(OBB) 또는, Quadrilateral bounding box(QBB)를 사용한다. 하지만 rotating object들의 representation의 모호성 때문에 object를 정확히 잡기 어렵다. 이 논문에서는 rotating object에 대한 bounding box regression을 최적화하기 위한 Representation Invariance Loss(RIL)을 제안한다. 1. Introduction 보통 rotating detector들은 OBB나 QBB의 방법을 사용한다. 이들은 object의 representation의 모호성을 유발하며 ..
-
[논문 리뷰] Attention is All you Need (2017)Paper Review/NLP 2022. 4. 4. 11:45
1. Introduction Sequence Modeling, Transduction Problems -> RNN, long short-term memory, gated RNN -> Encoder, Decoder architecture의 발전 Recurrent model에서 입출력 sequence의 position에 따라 순차적으로 계산이 수행되어야 함 -> Sequence의 길이가 길어지면 메모리와 연산 효율에 대한 문제가 발생 Attention Mechanism은 입출력 sequence의 거리에 상관 없이 의존성을 모델링할 수 있도록 한다. 이 논문에서는 이러한 Attention mechanism에 전적으로 의존하는 Transformer라는 모델 아키텍쳐를 recurrence를 없애고 입출력 간의 g..
-
[논문 리뷰] A Style-Based Generator Architecture for Generative Adversarial NetworksPaper Review/Generative Model 2022. 3. 14. 11:15
Abstract 이 논문에서는 style transfer를 위한 GAN을 위한 대체 generator architecture를 제안한다. 새로운 아키텍처는 자동으로 학습된 높은 수준의 속성(예: 사람 얼굴에서 훈련될 때 자세 및 정체성)과 생성된 이미지(예: 주근깨, 머리카락)의 확률적 변화를 초래하고, 직관적이고 규모별 합성을 제어할 수 있다. 이를 위해 generator architecture에 적용할 수 있는 두 가지 새롭고 자동화된 방법을 제안한다. 또한, 새롭고 다양한 고품질의 인간 얼굴 데이터 세트를 소개한다. 1. Introduction GAN에 의해 생성된 이미지의 해상도와 품질은 최근 급격한 개선을 보였다. 그러나 generator는 아직도 latent space(잠재 공간)의 특성도 잘..
-
[DeepFake] 관련 논문 정리Paper Review/Face 2022. 2. 24. 16:40
- 수정 중 - Tools Key Features Link Faceswap_GAN(2018) - Adversarial loss + Perceptual loss - AutoEncoder architecture https://github.com/shaoanlu/faceswap-GAN DeepFaceLab(2020) - Expand from the Faceswap model - Multiple face extraction modes https://github.com/iperov/DeepFaceLab https://arxiv.org/abs/2005.05535 FSGAN(2019) - Adjust to both pose and expression variations https://openaccess.thecvf...
-
[Deepfake] 간단 개념 정리Paper Review/Face 2022. 2. 24. 15:35
- 수정 중 - # Facial Manipulations 사람의 얼굴을 조작하는 기술들은 크게 4가지로 분류할 수 있다. 일반적으로 DeepFake 얼굴 생성이라고 인식되는 카테고리는 3번, 4번의 Facial Expression과 Face Swap이라고 할 수 있다. 1. Face Synthesis 존재하지 않던 얼굴을 생성하여 기존 얼굴과 합성한다. 최근의 StyleGan 같은 GAN 기법을 이용하여 새로운 얼굴을 생성해낸다. 관련 논문 : A Style-Based Generator Architecture for Generative Adversarial Networks https://openaccess.thecvf.com/content_CVPR_2019/html/Karras_A_Style-Based_..
-
[논문 리뷰] DeepPose: Human Pose Estimation via Deep Neural NetworksPaper Review/Computer Vision 2022. 2. 7. 16:33
Abstract Convolutional Deep Neural Networks(DNN)을 기반으로 한 human pose 방법을 제안한다. Pose estimation은 body joint(신체 관절)에 대한 DNN 기반 회귀 문제로 해결한다. 이 접근 방식은 전체적인 방식으로 pose에 대해 추론할 수 있는 장점이 있으며 이를 단순하지만 강력하게 공식화했다. 1. Introduction 인체 관절의 localization 문제로 정의되는 human pose estimation 문제를 joint 회귀 문제로 공식화하고 DNN 네트워크에서 캐스팅하는 방법을 보여준다. 이 방법에는 두 가지 장점이 있다. 1. DNN은 각 신체 관절의 전체 context를 캡처할 수 있다. 각 joint regressor는 ..
-
[논문 리뷰] You Only Look Once: Unified, Real-Time Object DetectionPaper Review/Computer Vision 2022. 1. 28. 14:54
Abstract 이 논문에서는 object detection을 공간적으로 분리된 bounding box와 class 확률에 대한 회귀 문제로 설정한다. 단일 신경망을 사용하며 전체 이미지에서 직접 bounding box와 class 확률을 예측한다. 전체 파이프라인이 단일 네트워크이기 때문에 end-to-end로 최적화가 가능하다. 1. Introduction 이전의 detection은 객체를 감지하기 위해 이미지에서 region proposal 방법을 사용하여 bounding box를 생성한 다음 이 box에서 분류를 실행한다. 이후 fine tuning과 중복된 box들을 제거하는 과정을 실행하지만 각 구성요소들을 별도로 훈련시켜야 하기 때문에 속도가 느리고 최적화에 어려움을 겪는다. 이 논문에서는 ..
-
[논문 리뷰] Deep Residual Learning for Image RecognitionPaper Review/Neural Network 2022. 1. 25. 19:53
Abstract 이전의 신경망들은 층이 깊어질수록 훈련하기가 어렵다. 이 논문에서는 이전의 네트워크보다 매우 심층적인 네트워크의 훈련을 원활히 하기 위한 Residual Learning framework를 제안한다. 참조되지 않은 새로운 함수를 적용하는 대신에 residual function을 학습하는 것으로 layer를 재구성한다. 이 방법을 통해 residual network가 최적화하기 더 쉽고 상당히 깊은 네트워크에서 높은 정확도를 보여준다. 결과적으로 152개의 layer를 통해 VGG net보다 좋은 성능을 내고, 이 논문에서는 100개와 1000개의 layer를 통해 CIFAR-10 데이터에 대한 분석을 제시한다. 1. Introduction 이전의 많은 논문들을 통해 CNN은 이미지 분류에..