人体姿态估计:基于飞桨复现Hourglass

本文基于飞桨复现Hourglass网络用于人体姿态估计,该网络通过多尺度特征融合输出关节概率热力图。在MPII数据集上,256x256和384x384尺寸下Mean@0.1分别达0.321、0.376,接近PyTorch版本,可用于动作识别等领域。
人体姿态估计:基于飞桨复现Hourglass
1.简介
本项目基于PaddlePaddle复现《Stacked Hourglass Networks for Human Pose Estimation》论文,该论文提出了一种人体姿态估计的方法,在MPII数据集上达到如下精度:
本文介绍了一种新的用于人体姿态估计的卷积网络结构。所有尺度上进行特征的处理和融合,做优地捕捉与身体相关的各种空间关系。
人体姿态估计可以应用在很多领域:
1.动作识别,可以检测一个人是否摔倒或疾病,也可以用于健身、体育舞蹈等教学任务。
2.运动捕捉,可以通过人体姿态的估计,在计算机上渲染图形,例如电影特效。
3.训练机器人,可以让机器人跟随一个做特定动作的人体骨架。
2.模型介绍
Hourglass网络采用沙漏形状的设计是为了在每个尺度上捕捉信息。而本地证据对于识别人脸和手等特征至关重要。最终的姿势估计需要对整个身体有一个连贯的理解。人的方位、四肢的排列以及相邻关节的关系都是在图像中不同镜头下最容易识别的众多线索之一。Hourglass是一个简单的,最小的设计,有能力捕捉所有这些功能,并将它们结合起来输出像素级的预测。网络必须有某种机制来有效地处理和巩固跨尺度的数据特征。Hourglass网络选择使用带有跳过层的单一管道来保留每个分辨率下的空间信息。该网络的最低分辨率为4x4像素,允许应用更小的空间过滤器来比较整个图像空间的特征。Hourglass的设置如下:卷积和最大池化层用于处理低分辨率的特征,在每一个最大池化,网络分支,应用更多的卷积在已经做过池化操作的分辨率上。在达到最低分辨率后,网络开始自顶向下的上采样序列和跨尺度的特征组合。为了将两个相邻分辨率的信息聚合在一起,我们遵循Tompson等人所描述的过程,对较低分辨率进行最近邻上采样,然后对两组特征进行元素相加。Hourglass的拓扑结构是对称的,所以每向下呈现一层,就有相应向上的一层。在达到网络的输出分辨率后,使用两轮连续的1x1卷积来产生最终的网络预测结果。网络的输出是一组heatmap,对于给定的heatmap,网络预测各个关节在每个像素上存在的概率。
整个Hourglass 网络有多个Hourglass模块组成,允许重复的自底向上,自顶向下的推理预测
下图是一个Hourglass的单个模块,在整个Hourglass网络中,特征的数量是一致的
上图中的每一个方块都对应了一个redisdual模块,如下图所示
3.数据集下载
MPII:https://aistudio.baidu.com/aistudio/datasetdetail/107551
数据集解压。
In [1]%cd /home/aistudio/data/!tar xvf data107551/mpii.tar.gz登录后复制
4.环境
PaddlePaddle == 2.1.2
python == 3.7
5. 训练
训练图像尺寸为256的模型。
In [4]%cd /home/aistudio/paddle_pose/!python -u train.py --dataset_root /home/aistudio/data/mpii/ --image_size 256登录后复制
/home/aistudio/paddle_pose=> num_images: 14679=> load 22246 samples=> num_images: 2729=> load 2958 samplesW0927 11:25:46.927978 383 device_context.cc:404] Please NOTE: device: 0, GPU Compute Capability: 7.0, Driver API Version: 10.1, Runtime API Version: 10.1W0927 11:25:46.931859 383 device_context.cc:422] device: 0, cuDNN Version: 7.6.登录后复制
训练图像尺寸为384的模型。
In [ ]%cd /home/aistudio/paddle_pose/!python -u train.py --dataset_root /home/aistudio/data/mpii/ --image_size 384登录后复制
--image_size 指定训练出入的图片分辨率,根据验收指标这里可以输入256或384。
--dataset_root 为数据集根目录,可以根据实际情况修改。
6.验证模型
1.预训练模型下载地址:
链接: https://pan.baidu.com/s/13urfrTeJueuXhn4MHcrQcw
提取码: w82w
2.下载模型后使用,下列命令验证模型。
验证图片为尺寸为256x256的模型:
In [ ]!python val.py --image_size 256 --pretrained_model ./output/256_best_model/model.pdparams --dataset_root /home/aistudio/data/mpii/登录后复制
验证结果:
[EVAL] Ankle=79.87761299600484 Elbow=89.09163062349077 Head=96.65757162346522 Hip=88.41959160211289 Knee=83.8608487080676 Mean=88.71714806141036 Mean@0.1=32.10772823107419 Shoulder=95.36345108695652 Wrist=83.77702302257738登录后复制
验证图片为尺寸为384x384的模型:
In [ ]!python val.py --image_size 384 --pretrained_model ./output/384_best_model/model.pdparams --dataset_root /home/aistudio/data/mpii/登录后复制
验证结果:
[EVAL] Ankle=80.86913738917394 Elbow=89.89274782636988 Head=96.8281036834925 Hip=87.81370184355791 Knee=84.62623196807967 Mean=89.13869372885766 Mean@0.1=37.58782180867529 Shoulder=95.44836956521739 Wrist=84.889784060021登录后复制
--image_size 指定训练出入的图片分辨率,根据验收指标这里可以输入256或384。
--pretrained_model 指定训练好的模型地址,可以根据实际情况修改。
--dataset_root 为数据集根目录,可以根据实际情况修改。
7.总结
以下表格是本次论文复现的结果。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
《逆水寒》手游AI剧组模式上线,数百万玩家参与创作
9 月 24 日消息,在今日的 2025 云栖大会主论坛上,网易集团执行副总裁、网易雷火事业群负责人胡志鹏发表了题为“AI 驱动未来:虚拟世界的创造力和现实世界的生产力”的演讲。演讲中,胡志鹏以《
Spotify整治AI音乐乱象 严打侵权低质内容
9 月 25 日消息,北京时间今晚,Spotify 出台新规,重点针对 AI 带来的三大问题:低质内容、冒充以及是否如实披露使用情况。Spotify 全球音乐产品负责人 Charlie Hellm
苹果SimpleFold轻量AI模型发布,蛋白质预测更经济
9 月 25 日消息,科技媒体 9to5Mac 昨日(9 月 24 日)发布博文,报道称苹果研究团队发布了轻量级蛋白质折叠预测 AI 模型 SimpleFold,采用流匹配(Flow Matchi
AI合成皖K888888车牌曝光,警方介入调查
9 月 25 日消息,一名网友 9 月 22 日在视频平台发布视频,晒出自己的车辆悬挂着“皖 K888888”新能源号牌,引发网络关注。随后,阜阳公安交警在线最新评论称:“请问:这幅新能源车牌是在
阿里吴泳铭:AI进入第二阶段,拟打造移动生态新时代
在近日于杭州举办的云栖大会上,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭发表了主旨演讲,深入阐述了其对人工智能(AI)未来发展的独到见解。他指出,AI的发展将历经三个关键阶段,最终迈向超
相关攻略
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程


















