EGO4d clips

0. Annotations

  1. Camera wearer가 말하기 직전 몇 개의 temperal unit (TSN에서 사용한 6개 frame을 한 temperal unit으로 봄)에 label을 달아둔 annotation

/scratch/jisoo/{split}_offset_1.pickle

/scratch/jisoo/{split}_offset_2.pickle

/scratch/jisoo/{split}_offset_5.pickle

  1. Background, camera wearer, normal speaker의 발화에 모든 temperal unit에 label을 달아둔 annotation

/scratch/jisoo/{split}_perfeature_v2.pickle

1. video features

2. Audio features (Wave2vec2)