๐ฏ๋ชฉํ
<aside>
๐ฅ Transformer-XL Baseline์ ์ต์ nlp๊ธฐ๋ฒ๋ค์ ์ ์ฉํ์ฌ ์์น์์ผ๋ก ๋ณํ ๊ด์ฐฐํ๊ธฐ
</aside>
- metric
- ์ต์ nlp
- ๋ฐ๋ฏผ์ ๋จธ๋ฆฌ์์์ ์ต์ ๋ฐฉ๋ฒ๋ก
- group encoding
- soft labeling
โ
ํ ์ผ
- [ ] ๊นํ๋ธ
- [ ] ๋ณด๊ณ ์ ์
๋ฐ์ดํธ(์ฌ์ค์ ๋ฆฌ๋๋ฏธ)
- [ ]
๐ฅ์ญํ ๋ถ๋ฐฐ
๊น๋ฏผ์ : Metric(commu)
๊น์ฐ : ๐ฆป sparse attention
๊น์ฑ์ค :
๋ฐ๋ฏผ์ : group encoding + soft labeling
๋ฐ์๋น : Metric(CAS)
์กฐ์ ๋น : ๐ฆป attention, Metric(CAS)
๐๋ฏธํ
- 03/10 ๋น๋๋ฉด (6์-9์)
- 03/11 ๋๋ฉด ์นดํ ์ค (10์-3์)
- ์ฐธ์ฌ
- ๋๋ฉด : ๋ฐ๋ฏผ์,
๊น์ฐ, ๋ฐ์๋น, ๊น์ฑ์ค, ์กฐ์ ๋น
- ์ฐ์ด ๋ ๋ฐ
- 03/12 ๋๋ฉด ์๋ค๋ฅด (์ข
์ผ)
Untitled
Untitled
Attention listup
Sparse transformer
Generating Long Sequences with Sparse Transformers
Linear transformer
Linformer