KnowIT VQA数据集

数据集内容:VQA是一个将NLP与图像处理相结合的任务,通常以一张图片和一个关于这张图片自由、开放式的自然语言问题作为输入,以生成一条自然语言答案作为输出。

简单来说,VQA就是给定的图片进行问答,因此VQA涉及到多方面的AI技术。

以下面图像为例:

● 细粒度识别(这位女士是白种人吗?)

● 物体识别(图中有几个香蕉?)

● 行为识别(这位女士在哭吗?)

● 对问题所包含文本的理解(NLP)

KnowIT VQA是一个视频数据集,将视觉,文本和时间连贯性推理,与基于知识的问题结合在一起。

数据集数量:KnowIT VQA数据集包含24282个有关“大爆炸理论”的人工生成的问题-答案对。

数据集功能:VQA视觉问答

下载链接:https://knowit-vqa.github.io/


彩蛋1:

算法工程师开发重磅福利:

(1)算法工程师模型部署利器,算法开发平台,安卓手机即可使用,点击查看体验。

(2)智慧安防、智慧交通、智慧社区实战训练营,点击加入。

彩蛋2:

大白购买了不少数据集,以及不断整理各种类型的数据集,放到百度网盘中,便于大家下载使用。

数据集列表及下载方式:点击查看

彩蛋3:

《AI未来星球》陪伴成长的人工智能社群,价值过万的各种内部资源及活动,限时特惠中,点击查看。

发表评论

This site is protected by wp-copyrightpro.com