文件名称:
stylized_image_captioning:在Pytorch中使用LSTM生成样式化的图像字幕-源码
开发工具:
文件大小: 212kb
下载次数: 0
上传时间: 2021-02-14
详细说明:实施StyleNet:使用LSTM生成样式化的图像标题
战队:蔡丽莎,刘德华
介绍
该项目的目的是实现一种图像字幕模型,该模型具有生成风格化字幕(浪漫或有趣)的能力。 我们将基于Microsoft Research Redmond的论文“ StyleNet:用样式生成有吸引力的视觉字幕”建立模型。 我们的模型将以Pytorch编写。
数据
我们的模型使用两个数据集。 第一个是具有图像和事实字幕的Flickr10k数据集,该数据集用于我们的图像字幕任务。 对于我们的语言模型,我们将使用由原始论文的作者发布的FlickrStyle 7k数据集。
技术概述
LSTM模型
我们将从本文应用因式分解LSTM模型。 对于图像字幕,文献中常用的策略是采用预先训练的CNN模型作为编码器,以将图像映射到固定尺寸的特征向量,然后使用LSTM模型作为解码器,以基于图像向量生成字幕。 在这里,“分解的LSTM”
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.