您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. StructCap:用于图像字幕的结构化语义嵌入

  2. 图像字幕已引起多媒体和计算机视觉领域越来越多的研究关注。 为了对视觉内容进行编码,现有方法通常利用现成的深度卷积神经网络(CNN)模型来提取视觉特征,然后将其发送到基于递归神经网络(RNN)的文本生成器以输出单词序列。 最近,一些方法利用注意力机制对视觉对象和场景信息进行编码。 尽管取得了令人鼓舞的进展,但一个明显的缺点是区分和建模关键语义实体及其关系,而这些语义实体又被广泛认为是我们描述图像内容的重要线索。 在本文中,我们提出了一种新颖的图像字幕模型,称为StructCap。它将模型中的给定图
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:1048576
    • 提供者:weixin_38649356