VQA(Visual Question Answering, VQA 논문 설명) 질문에는 “What is…”, “Is there…”, “How many…”, “Does the…” 같은 질문들이 있다. 질문의 길이는 4~8단어가 대부분이다. 답변에는 yes/no, 색깔, left/right 등의 답변이 많다. 1 / 2 / 3단어인 경우가 대략 90%, 6%, 2.5% 정도씩 있다. 상식을 필요로 하는 질문은 위에서 설명한 대로 당연이 이미지에서도 정보를 얻어야 답변이 가능하다.
Python, Machine & Deep Learning
GREEKSHARIFA.GITHUB.IO
Python, Machine Learning & Deep Learning
3.0 p
3
0