visual question answering; dense co-attention network; Bi-LSTM; deep learning; natural language processing; computer vision;
机译:使用术语加权问题的多层关注网络,用于视觉问题应答
机译:对象差异驱动的图表卷积网络,用于视觉问题应答
机译:视觉问题解答中的人类注意力:人类和深层网络是否看待同一地区?
机译:密集的对称共同注意对视觉问题的回答,改善了视觉和语言表示的融合
机译:推断回答质量,回答者专业知识以及对问题进行回答的社交网络的排名。
机译:用于视觉问题的多模态显式稀疏关注网络
机译:通过密集的对称关注改进了视觉和语言表示的融合,以了解视觉问题
机译:学习策略培训计划:有效学习的问题和答案。