<aside> ❓

기존 MAR model을 varying length로 학습 시키기 위해선 어떻게 구현 해야할까

</aside>

image.png

1. Masking → Momask의 training strategy 리뷰 필요

2. Inference

3. Positional Encoding

Momask의 forward

image.png

MAR의 forward

image.png