首页
AI
【飞桨论文复现赛-图像描述生成】Soft-Attention

【飞桨论文复现赛-图像描述生成】Soft-Attention

热心网友
转载
2025-07-25
来源:https://www.php.cn/faq/1426614.html

本文为百度论文复现赛第四期相关论文的复现代码介绍。依赖paddlepaddle-gpu2.1.2、python3.7,在coco2014数据集训练,给出复现精度。介绍了模型背景、结构、数据集,还说明了运行、安装依赖、训练及评估的步骤,提及代码解释相关内容。

【飞桨论文复现赛-图像描述生成】soft-attention - 游乐网

前言

本项目为百度论文复现赛第四期《Show, Attend and Tell: Neural Image Caption Generation with Visual Attention》论文复现代码。

依赖环境:

paddlepaddle-gpu2.1.2python3.7

代码在coco2014数据集上训练,复现精度:

模型背景及其介绍

参考论文:《Show, Attend and Tell: Neural Image Caption Generation with Visual Attention》论文链接

近年来,人们提出了几种生成图像描述生成方法。这些方法中许多都是基于递归神经网络,并受到了成功使用序列与神经网络进行机器翻译训练的启发。图像描述生成非常适合机器翻译的编码器-解码器框架,一个主要原因是它类似于将图像翻译成句子。

受机器翻译和目标检测工作的启发,论文首次提出在图像描述模型中引入注意力机制,大幅度提高了模型的性能,并可视化展示了注意力机制如何学习将目光固定在图像的显著目标上,整体框架如下。

【飞桨论文复现赛-图像描述生成】Soft-Attention - 游乐网        

第一步:输入Image到模型中。

第二步:经过CNN进行卷积提取Image特征信息最终形成Image的特征图信息。

第三步:attention对提取的特征图进行加权求和,作为后续进入LSTM模型的输入数据,不同时刻的attention数据会受到上一时刻状态输出数据的影响。

第四步:LSTM模型最终输出caption。

模型结构: 【飞桨论文复现赛-图像描述生成】Soft-Attention - 游乐网        

参考项目地址链接

复现论文代码github地址链接

数据集

coco2014 image captions 论文,采用“Karpathy” data split 论文

数据集总大小:123287张

训练集:113287张

验证集:5000张

测试集:5000张

标签文件:dataset_coco.json

运行

解压预训练数据到work/data/目录下

预训练数据包括: 通过vgg19提取的coco2014图像网格特征、cocotalk.json、cocotalk_label.h5

通过命令 !python3 scripts/prepro_feats.py 和 !python3 scripts/prepro_labels.py 获得

In [5]
%cd /home/aistudio/work/data/!unzip -oq /home/aistudio/data/data106948/coco_data_vgg.zip
登录后复制        
/home/aistudio/work/data
登录后复制        

解压用于训练测试的文件到work/目录下

In [6]
%cd /home/aistudio/work/!unzip -oq /home/aistudio/data/data107076/coco-caption.zip
登录后复制        
/home/aistudio/work
登录后复制        

安装依赖库

In [ ]
%cd /home/aistudio/work/!pip install -r requirements.txt
登录后复制    

训练

训练的日志和模型会放到work/log/目录下

In [ ]
!python3 train.py
登录后复制    

评估

我已经将训练好的model_best.pdparams文件放在了work/log目录下

加载work/log目录下保存的训练模型数据进行验证

In [ ]
%cd /home/aistudio/work/!unzip -oq /home/aistudio/data/data107076/log.zip
登录后复制    代码解释In [ ]
!python3 eval.py
登录后复制    

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章

京东许冉:AI投入三年超万亿,生态构建助力新品落地

在京东全球科技探索者大会上,京东集团SEC副主席兼CEO许冉以 "Enjoy AI "为主题,系统阐释了企业人工智能战略的核心框架。她提出 "人工智能价值=模型能力×用户体验×产业厚度平方 "的创新公式,强

2025-09-25.

阿里吴泳铭解析AI三阶段:从通用到超级AI发展路径

在2025云栖大会上,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭发表了关于人工智能未来发展的深度见解。他明确指出,实现通用人工智能(AGI)已不再是悬念,但人工智能的演进远未止步,其终极

2025-09-25.

华为鲲鹏联合南光集团共建AI算力,助力企业数字化转型

扎根澳门七十余载,与新中国同龄的南光(集团)有限公司,始终秉持“根植澳门、融入内地、拓展海外”的战略方向,构建起覆盖能源保障、民生贸易、酒店旅游、城市建设、综合物流、文创会展、公共交通、现代金融等多

2025-09-25.

京东AI数字人「他她它」上线:毫秒响应,支持外卖点餐

在近日举办的京东全球科技探索者大会上,一款名为“他她它”的AI数字人产品成为焦点。这款基于京东自主研发的JoyAI大模型打造的智能助手,不仅突破了传统AI应用的交互边界,更通过多维度功能创新重新定义

2025-09-25.

京东AI三大产品发布 开启"量产时代"四大场景落地

京东在人工智能领域迈入规模化应用新阶段。9月25日,京东全球科技探索者大会在北京拉开帷幕,数字人主持人以科技感十足的方式亮相会场,标志着AI技术已深度融入会议全流程。大会现场,京东集团CEO许冉宣布

2025-09-25.

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
多多自走棋国际服(Auto Chess)
多多自走棋国际服(Auto Chess) 棋牌策略 2025-09-25更新
查看
剑二十七游戏
剑二十七游戏 角色扮演 2025-09-25更新
查看
天使之翼
天使之翼 角色扮演 2025-09-25更新
查看
文明曙光手游
文明曙光手游 角色扮演 2025-09-25更新
查看
街头霸王3
街头霸王3 飞行射击 2025-09-25更新
查看
奥奇传说vivo
奥奇传说vivo 角色扮演 2025-09-25更新
查看
龙纹
龙纹 角色扮演 2025-09-25更新
查看
停车大师
停车大师 休闲益智 2025-09-25更新
查看
怪怪水族馆
怪怪水族馆 休闲益智 2025-09-25更新
查看
超级玛丽世界手游
超级玛丽世界手游 动作冒险 2025-09-25更新
查看