首页科技资讯软件教程游戏攻略手机游戏

首页

AI

【飞桨论文复现赛-图像描述生成】Soft-Attention

【飞桨论文复现赛-图像描述生成】Soft-Attention

热心网友

转载

2025-07-25

来源:https://www.php.cn/faq/1426614.html

本文为百度论文复现赛第四期相关论文的复现代码介绍。依赖paddlepaddle-gpu2.1.2、python3.7，在coco2014数据集训练，给出复现精度。介绍了模型背景、结构、数据集，还说明了运行、安装依赖、训练及评估的步骤，提及代码解释相关内容。

【飞桨论文复现赛-图像描述生成】soft-attention - 游乐网

前言

本项目为百度论文复现赛第四期《Show, Attend and Tell: Neural Image Caption Generation with Visual Attention》论文复现代码。

依赖环境：

paddlepaddle-gpu2.1.2python3.7

代码在coco2014数据集上训练，复现精度：

模型背景及其介绍

参考论文：《Show, Attend and Tell: Neural Image Caption Generation with Visual Attention》论文链接

近年来，人们提出了几种生成图像描述生成方法。这些方法中许多都是基于递归神经网络，并受到了成功使用序列与神经网络进行机器翻译训练的启发。图像描述生成非常适合机器翻译的编码器-解码器框架，一个主要原因是它类似于将图像翻译成句子。

受机器翻译和目标检测工作的启发，论文首次提出在图像描述模型中引入注意力机制，大幅度提高了模型的性能，并可视化展示了注意力机制如何学习将目光固定在图像的显著目标上，整体框架如下。

【飞桨论文复现赛-图像描述生成】Soft-Attention - 游乐网

第一步：输入Image到模型中。

第二步：经过CNN进行卷积提取Image特征信息最终形成Image的特征图信息。

第三步：attention对提取的特征图进行加权求和，作为后续进入LSTM模型的输入数据，不同时刻的attention数据会受到上一时刻状态输出数据的影响。

第四步：LSTM模型最终输出caption。

模型结构：【飞桨论文复现赛-图像描述生成】Soft-Attention - 游乐网

参考项目地址链接

复现论文代码github地址链接

数据集

coco2014 image captions 论文，采用“Karpathy” data split 论文

数据集总大小：123287张

训练集：113287张

验证集：5000张

测试集：5000张

标签文件：dataset_coco.json

运行

解压预训练数据到work/data/目录下

预训练数据包括: 通过vgg19提取的coco2014图像网格特征、cocotalk.json、cocotalk_label.h5

通过命令 !python3 scripts/prepro_feats.py 和 !python3 scripts/prepro_labels.py 获得

In [5]

%cd /home/aistudio/work/data/!unzip -oq /home/aistudio/data/data106948/coco_data_vgg.zip

登录后复制

/home/aistudio/work/data

登录后复制

解压用于训练测试的文件到work/目录下

In [6]

%cd /home/aistudio/work/!unzip -oq /home/aistudio/data/data107076/coco-caption.zip

登录后复制

/home/aistudio/work

登录后复制

安装依赖库

In [ ]

%cd /home/aistudio/work/!pip install -r requirements.txt

登录后复制

训练

训练的日志和模型会放到work/log/目录下

In [ ]

!python3 train.py

登录后复制

评估

我已经将训练好的model_best.pdparams文件放在了work/log目录下

加载work/log目录下保存的训练模型数据进行验证

In [ ]

%cd /home/aistudio/work/!unzip -oq /home/aistudio/data/data107076/log.zip

登录后复制代码解释In [ ]

!python3 eval.py

登录后复制

上一篇：【ai创造营】电商知识图谱链接预测

下一篇：【机器学习入门与实践】二手车价格交易预测含EDA、特征工程、特征优化、模型融合

免责声明

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

京东许冉：AI投入三年超万亿，生态构建助力新品落地

在京东全球科技探索者大会上，京东集团SEC副主席兼CEO许冉以 "Enjoy AI "为主题，系统阐释了企业人工智能战略的核心框架。她提出 "人工智能价值=模型能力×用户体验×产业厚度平方 "的创新公式，强

2025-09-25.

阿里吴泳铭解析AI三阶段：从通用到超级AI发展路径

在2025云栖大会上，阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭发表了关于人工智能未来发展的深度见解。他明确指出，实现通用人工智能（AGI）已不再是悬念，但人工智能的演进远未止步，其终极

2025-09-25.

华为鲲鹏联合南光集团共建AI算力，助力企业数字化转型

扎根澳门七十余载，与新中国同龄的南光（集团）有限公司，始终秉持“根植澳门、融入内地、拓展海外”的战略方向，构建起覆盖能源保障、民生贸易、酒店旅游、城市建设、综合物流、文创会展、公共交通、现代金融等多

2025-09-25.

京东AI数字人「他她它」上线：毫秒响应，支持外卖点餐

在近日举办的京东全球科技探索者大会上，一款名为“他她它”的AI数字人产品成为焦点。这款基于京东自主研发的JoyAI大模型打造的智能助手，不仅突破了传统AI应用的交互边界，更通过多维度功能创新重新定义

2025-09-25.

京东AI三大产品发布开启"量产时代"四大场景落地

京东在人工智能领域迈入规模化应用新阶段。9月25日，京东全球科技探索者大会在北京拉开帷幕，数字人主持人以科技感十足的方式亮相会场，标志着AI技术已深度融入会议全流程。大会现场，京东集团CEO许冉宣布

2025-09-25.

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

相关攻略

加密货币量化交易：AI自动炒币，躺赚？ PyTorch 2.0常见Bug解析：这4种代码错误你遇到过吗？微软发布mssql-python驱动，性能较pyodbc提升16.5倍 2025年8月TIOBE编程榜：AI助手推动Python持续领跑 ftp扫描工具跨平台 ftp扫描工具多系统支持

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

全明星觉醒坂崎百合强度评测：实战表现与角色解析

全明星觉醒坂崎百合强度评测：实战表现与角色解析发布于 2025-09-25

新三国志曹操传水源污染关攻略：轻松通关技巧分享

新三国志曹操传水源污染关攻略：轻松通关技巧分享发布于 2025-09-25

梦幻西游大闹天宫BOSS通关技巧教学

梦幻西游大闹天宫BOSS通关技巧教学发布于 2025-09-25

妖之乡坐骑鞍具获取攻略与入手方法

妖之乡坐骑鞍具获取攻略与入手方法发布于 2025-09-25

无畏契约手游幽影技能解析：5大强力技能详解

无畏契约手游幽影技能解析：5大强力技能详解发布于 2025-09-25

索尼PS5销量超预期，创历代主机新高

索尼PS5销量超预期，创历代主机新高发布于 2025-09-25

逆水寒AI技术：实现玩家24小时在线体验

逆水寒AI技术：实现玩家24小时在线体验发布于 2025-09-25

莱莎新拼装模型发布还原经典粗腿造型与炼金细节

莱莎新拼装模型发布还原经典粗腿造型与炼金细节发布于 2025-09-25

魔搭社区MCP&Agent大赛收官：20支团队比拼端侧智能体创新

魔搭社区MCP&Agent大赛收官：20支团队比拼端侧智能体创新发布于 2025-09-25

Steam玩家账号突破四万游戏，估值堪比美国房产

Steam玩家账号突破四万游戏，估值堪比美国房产发布于 2025-09-25

iOS 26.1 beta版体验评测

iOS 26.1 beta版体验评测发布于 2025-09-25

iPhone 20周年将换三星CoE OLED屏，亮度提升更轻薄

iPhone 20周年将换三星CoE OLED屏，亮度提升更轻薄发布于 2025-09-25

欧盟调查苹果谷歌防诈措施，违规或面临6%全球营收罚款

欧盟调查苹果谷歌防诈措施，违规或面临6%全球营收罚款发布于 2025-09-25

macOS 26运行Electron应用卡顿？开发者揭示性能问题

macOS 26运行Electron应用卡顿？开发者揭示性能问题发布于 2025-09-25

iPhone 17 Pro拆解：可维修7分，换电池需先拆屏

iPhone 17 Pro拆解：可维修7分，换电池需先拆屏发布于 2025-09-25

酷冷至尊挑战者风冷上架：3DHP热管首销79元起

酷冷至尊挑战者风冷上架：3DHP热管首销79元起发布于 2025-09-25

Intel四年CPU路线图揭秘：100核处理器如何挑战AMD

Intel四年CPU路线图揭秘：100核处理器如何挑战AMD 发布于 2025-09-25

罗技新款太阳能键盘799元起售，彻底取消USB接口

罗技新款太阳能键盘799元起售，彻底取消USB接口发布于 2025-09-25

台积电AI芯片设计提速：2天任务5分钟完成

台积电AI芯片设计提速：2天任务5分钟完成发布于 2025-09-25

小米BE10000 Pro路由器今晚亮相：双万兆AI+私有云存储

小米BE10000 Pro路由器今晚亮相：双万兆AI+私有云存储发布于 2025-09-25

最新下载

多多自走棋国际服(Auto Chess)

多多自走棋国际服(Auto Chess) 棋牌策略 2025-09-25更新

查看

剑二十七游戏

剑二十七游戏角色扮演 2025-09-25更新

查看

天使之翼

天使之翼角色扮演 2025-09-25更新

查看

文明曙光手游

文明曙光手游角色扮演 2025-09-25更新

查看

街头霸王3

街头霸王3 飞行射击 2025-09-25更新

查看

奥奇传说vivo

奥奇传说vivo 角色扮演 2025-09-25更新

查看

龙纹角色扮演 2025-09-25更新

查看

停车大师

停车大师休闲益智 2025-09-25更新

查看

怪怪水族馆

怪怪水族馆休闲益智 2025-09-25更新

查看

超级玛丽世界手游

超级玛丽世界手游动作冒险 2025-09-25更新

查看

热门话题

魔术游戏鸣人的假期刀塔传奇饥荒拉布布游戏洛克王国神魔幻想思美人疯狂越野