[딥러닝 논문 리뷰]Attention Is All You Need 논문 리뷰 (Transformer)
·
Data Science/딥러닝 논문 리뷰
Abstact 기존의 주요 시퀀스 변환 모델들은 복잡한 RNN(순환 신경망)이나 CNN(합성곱 신경망)을 기반으로 하며, 인코더와 디코더를 포함.기존의 가장 성능이 좋은 시퀀스 변환 모델들 또한 인코더와 디코더를 Attention 메커니즘을 통해 연결하는 구조.이 저자들은 RNN, CNN을 완전히 배제하고 Attention을 기반으로 한 Transformer모델을 제안.Transformer 모델은 더 좋은 품질, 더 좋은 병렬성, 더 짧은 학습시간을 자랑하며 SOTA (State Of The Art)모델에 등극. (WMT 2014 Englishto-German translation, WMT 2014 English-to-French translation)1. Introduction 기존 RNN계열 모델들의..
Cycle GAN이란?
·
Data Science/딥러닝 논문 리뷰
Image to Image translation 이미지 데이터셋을 사용하여 input이미지와 output 이미지를 mapping하는 생성 모델의 분야이다. ex) 흑백 ↔ 컬러, 낮 ↔ 밤, 등 Pix-2-Pix image to image translation분야에서 처음 등장한 모델! Loss funtion에서 Generator가 어느것을 택해도 loss가 너무 커지지 않도록 애매한 중간값을 택하는 경향이 있다. → 가운데 사진처럼 뿌옇게 표현된 output이 나온다. cGAN(conditional GAN)이 추가되어 보완된 Pix-2-Pix 모델 한계: 학습시키기 위해 paired-image 데이터셋이 필요함 위 사진처럼 동일한 포즈와 크기의 얼룩말 사진이 필요하다. 이러한 단점을 해결하기 위해 등장..
HaSeon9
'Data Science/딥러닝 논문 리뷰' 카테고리의 글 목록