毕业设计飞机大战源码下载项目总结1.ImageCaption1.1项目简介所谓ImageCaption,即看图说话,是指从图片中自动生成一段描述性文字,有点类似于小时候做过的“看图说话”,对于人来说非常简单,但对于机器,却充满了挑战性。
机器要自动完成ImageCaption分为3步:(1)检测出图像中的物体;
(2)理解物体之间的相互关系;
(3)用合理的语言表达出来;
每一步都具有难度。
1.2基本要求ImageCaption(看图说话)任务是结合CV(ComputerVision,计算机视觉)和NLP(NaturalLanguageProcessing,自然语言处理)两个领域的一种比较综合的任务,ImageCaption模型的输入是一幅图像,输出是对该幅图像进行描述的一段文字。
这项任务要求模型可以识别图片中的物体、理解物体间的关系,并用一句自然语言表达出来。
1.3应用场景ImageCaption(看图说话)任务的应用场景非常广泛,主要包括:为照片匹配合适的文字,方便检索或省去用户手动配字;
协助视觉障碍者去理解图像内容;
在艺术创作和罪犯
2020/5/2 9:06:11
25.14MB
系统开源
1