Human conversation from videos (NC)

대화 상황에서 agent가 언제 말할지를 detect

→ pose/faical keypoint/audio/text

치대 협력 과제

<aside> 🧑‍🏫 간호대학 융합연구에 활용가능? → 아마 conversational dataset이 없어서 안될듯

</aside>

멀티모달 언어 모델을 메디컬에 적용시키는 task

Uncertainty Estimation

(교수님)모델이 오답을 만들게 tuning해볼 수 있다

Multimodal-RL

Untitled