KnowIT VQA数据集
数据集内容:VQA是一个将NLP与图像处理相结合的任务,通常以一张图片和一个关于这张图片自由、开放式的自然语言问题作为输入,以生成一条自然语言答案作为输出。
简单来说,VQA就是给定的图片进行问答,因此VQA涉及到多方面的AI技术。
以下面图像为例:
● 细粒度识别(这位女士是白种人吗?)
● 物体识别(图中有几个香蕉?)
● 行为识别(这位女士在哭吗?)
● 对问题所包含文本的理解(NLP)
KnowIT VQA是一个视频数据集,将视觉,文本和时间连贯性推理,与基于知识的问题结合在一起。
数据集数量:KnowIT VQA数据集包含24282个有关“大爆炸理论”的人工生成的问题-答案对。
数据集功能:VQA视觉问答
下载链接:https://knowit-vqa.github.io/
彩蛋1:
算法工程师开发重磅福利:
(1)算法工程师模型部署利器,算法开发平台,安卓手机即可使用,点击查看体验。
(2)智慧安防、智慧交通、智慧社区实战训练营,点击加入。
彩蛋2:
大白购买了不少数据集,以及不断整理各种类型的数据集,放到百度网盘中,便于大家下载使用。
数据集列表及下载方式:点击查看
彩蛋3:
《AI未来星球》陪伴成长的人工智能社群,价值过万的各种内部资源及活动,限时特惠中,点击查看。