Notes

  1. media generation : 자연스러운 motion을 만들어내는 것이 목표. goal을 달성하는 것이 목표가 아님.
  2. embodied AI : high level action을 만들어내는 것이 목표

Feedback

  1. 여전히 Goal 이란 범주가 큼. manipulation specific goal이라던가, 범주를 줄이면 좋겠음
    1. embodied AI 쪽에서 정의해놓은 Task들을 참고하면 좋을 것 같음

  2. Hand manipulation module 은 off-the-shelf 를 쓰든 ... (안 써도 됨)
  3. Real world scene이 여전히 필요한지?
    1. synthetic dataset을 사용한다면 language field가 필요할 것 같진 않음