'transformer' 태그의 글 목록

[딥러닝 논문 리뷰]Attention Is All You Need 논문 리뷰

$Transformer$

2024.10.09·

Data Science/딥러닝 논문 리뷰

Abstact 기존의 주요 시퀀스 변환 모델들은 복잡한 RNN

$순환 신경망$ 이나 CNN

$합성곱 신경망$ 을 기반으로 하며, 인코더와 디코더를 포함.기존의 가장 성능이 좋은 시퀀스 변환 모델들 또한 인코더와 디코더를 Attention 메커니즘을 통해 연결하는 구조.이 저자들은 RNN, CNN을 완전히 배제하고 Attention을 기반으로 한 Transformer모델을 제안.Transformer 모델은 더 좋은 품질, 더 좋은 병렬성, 더 짧은 학습시간을 자랑하며 SOTA

$State Of The Art$ 모델에 등극.

$WMT 2014 Englishto-German translation, WMT 2014 English-to-French translation$ 1. Introduction 기존 RNN계열 모델들의..

단축키

내 블로그

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

블로그 게시글

글 수정 $권한 있는 경우$	`E` `E`
댓글 영역으로 이동	`C` `C`

모든 영역

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.

개인정보

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역