专利名称:基于视觉与语义注意力相结合策略的图像描述方法
及系统
专利类型:发明专利
发明人:王雷全,褚晓亮,魏燚伟,吴春雷,崔学荣申请号:CN201710806029.2申请日:20170908公开号:CN107563498A公开日:20180109
摘要:本发明公开了基于视觉与语义注意力相结合策略的图像描述方法及系统,步骤:利用卷积神经网络CNN从待生成图像描述的图像中提取图像特征;利用图像的视觉注意力模型对图像特征进行处理,将视觉注意力模型处理过的图像特征送入第一LSTM网络产生单词,然后利用语义注意力模型对产生的单词和预定义的标签进行处理得到语义信息,然后利用第二LSTM网络对语义进行处理得到语义注意力模型生成的单词,重复上述步骤,最后将所有得到的单词进行串联组合,产生图像描述;本发明的方法不仅利用了输入图像的概述,而且还丰富了视觉语义方面的信息,让生成的句子更能够真实的反应图像的内容。
申请人:中国石油大学(华东)
地址:266580 山东省青岛市经济技术开发区长江西路66号
国籍:CN
代理机构:济南圣达知识产权代理有限公司
代理人:黄海丽
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容