基于Paddle工具链：ROS目标检测部署方案

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

基于Paddle工具链：ROS目标检测部署方案

热心网友时间：2025-07-24

转载

FSACOCO数据集由北理工无人驾驶方程式车队搭建，用于中国大学生无人驾驶赛事视觉部分，含42张带标注的红蓝锥桶图像。介绍了两种基于飞桨的训练方式：PaddleDetection需克隆仓库、改参数等，PPYOLO v2训练后mAP50达99.01%；PaddleX则通过低代码完成全流程。两者均涉及模型导出与部署，可参考BITFSD开源3.0。

基于paddle工具链：ros目标检测部署方案 - 游乐网

数据集介绍

FSACOCO 数据集由北京理工大学无人驾驶方程式车队进行搭建并维护，致力于中国大学生无人驾驶方程式赛事中视觉部分的应用，该项赛事使用红蓝锥桶代表赛道边界，参赛队伍需要在未知地图的条件下得到最快圈时，同类数据集可参考FSOCO ，由苏黎世联邦理工学院AMZ车队进行维护，为德国大学生无人驾驶方程式大赛视觉部分数据集。
此项目作为北京理工大学无人驾驶方程式车队FSD开源3.0中目标检测模块进行展示基于Paddle工具链：ROS目标检测部署方案 - 游乐网

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

解压数据集

In [ ]

!unzip data/data126556/dataset_sample.zip -d ./dataset_sample

登录后复制

方式一

使用PaddleDetection训练

PaddleDetection为基于飞桨PaddlePaddle的端到端目标检测套件，提供多种主流目标检测、实例分割、跟踪、关键点检测算法，配置化的网络模块组件、数据增强策略、损失函数等，推出多种服务器端和移动端工业级SOTA模型，并集成了模型压缩和跨平台高性能部署能力,帮助开发者更快更好完成端到端全开发流程。

特性

模型丰富: 包含目标检测、实例分割、人脸检测等100+个预训练模型，涵盖多种全球竞赛冠军方案使用简洁: 模块化设计，解耦各个网络组件，开发者轻松搭建、试用各种检测模型及优化策略，快速得到高性能、定制化的算法。端到端打通: 从数据增强、组网、训练、压缩、部署端到端打通，并完备支持云端/边缘端多架构、多设备部署。高性能: 基于飞桨的高性能内核，模型训练速度及显存占用优势明显。支持FP16训练, 支持多机训练。

模型性能概览
各模型结构和骨干网络的代表模型在COCO数据集上精度mAP和单卡Tesla V100上预测速度(FPS)对比图。基于Paddle工具链：ROS目标检测部署方案 - 游乐网

1.克隆PaddleDetection

由于原始仓库为github链接，下载较慢，可以更换为gitee链接

In [ ]

!git clone https://gitee.com/Feng1909/PaddleDetection.git

登录后复制

2.安装PaddleDetection的依赖

In [ ]

!pip install -r PaddleDetection/requirements.txt

登录后复制

3.修改各种参数，如路径等

以训练PPYOLO v2为例
同理可以训练所有PaddleDetection支持的模型

修改数据集路径

PaddleDetection/configs/datasets/voc.yaml

修改为以下路径

metric: VOCmap_type: 11pointnum_classes: 3TrainDataset:  !VOCDataSet    dataset_dir: ./    anno_path: ./dataset_sample/train.txt    label_list: ./dataset_sample/labels.txt    data_fields: ['image', 'gt_bbox', 'gt_class', 'difficult']EvalDataset:  !VOCDataSet    dataset_dir: ./    anno_path: ./dataset_sample/eval.txt    label_list: ./dataset_sample/labels.txt    data_fields: ['image', 'gt_bbox', 'gt_class', 'difficult']TestDataset:  !ImageFolder    anno_path: ./dataset_sample/labels.txt

登录后复制

4.训练

In [ ]

# 从头开始训练，大约需要30分钟# bbox mAP50能达到99.01%!python PaddleDetection/tools/train.py -c PaddleDetection/configs/ppyolo/ppyolov2_r50vd_dcn_voc.yml --use_vdl=true --eval# 中途中断，继续训练，更改output/ppyolov2_r50vd_dcn_voc/248.pdparams为中断前的模型参数# !python PaddleDetection/tools/train.py -c PaddleDetection/configs/ppyolo/ppyolov2_r50vd_dcn_voc.yml -r output/ppyolov2_r50vd_dcn_voc/248.pdparams --use_vdl=true --eval

登录后复制

5.模型导出

若需使用TensorRT进行加速，则TestReader.inputs_def.image_shape为必需项目

In [ ]

!python PaddleDetection/tools/export_model.py -c PaddleDetection/configs/ppyolo/ppyolov2_r50vd_dcn_voc.yml --output_dir=./inference_model \ -o weights=output/ppyolov2_r50vd_dcn_voc/best_model # TestReader.inputs_def.image_shape=[3,640,640]

登录后复制

6.模型部署

参见BITFSD开源3.0

经过完整数据集训练后PPYOLO v2识别效果

基于Paddle工具链：ROS目标检测部署方案 - 游乐网

方式二使用PaddleX训练

PaddleX 集成飞桨智能视觉领域图像分类、目标检测、语义分割、实例分割任务能力，将深度学习开发全流程从数据准备、模型训练与优化到多端部署端到端打通，并提供统一任务API接口及图形化开发界面Demo。开发者无需分别安装不同套件，以低代码的形式即可快速完成飞桨全流程开发。

1.安装PaddleX

In [ ]

!pip install paddlex==2.1

登录后复制

2.设置环境

In [18]

# 设置使用0号GPU卡（如无GPU，执行此代码后仍然会使用CPU训练模型）import matplotlibmatplotlib.use('Agg') import osos.environ['CUDA_VISIBLE_DEVICES'] = '0'import paddlex as pdx

登录后复制

3.设置数据集增强

In [ ]

from paddlex import transforms as Ttrain_transforms = T.Compose([    T.MixupImage(mixup_epoch=-1), T.RandomDistort(),    T.RandomExpand(im_padding_value=[123.675, 116.28, 103.53]), T.RandomCrop(),    T.RandomHorizontalFlip(), T.BatchRandomResize(        target_sizes=[192, 224, 256, 288, 320, 352, 384, 416, 448, 480, 512],        interp='RANDOM'), T.Normalize(            mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])])eval_transforms = T.Compose([    T.Resize(        target_size=320, interp='CUBIC'), T.Normalize(            mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])])

登录后复制

4.设置数据集读取

In [ ]

import paddlex as pdxtrain_dataset = pdx.datasets.VOCDetection(    data_dir='dataset_sample',    file_list='dataset_sample/train.txt',    label_list='dataset_sample/labels.txt',    transforms=train_transforms,    shuffle=True)eval_dataset = pdx.datasets.VOCDetection(    data_dir='dataset_sample',    file_list='dataset_sample/eval.txt',    label_list='dataset_sample/labels.txt',    transforms=eval_transforms)

登录后复制

5.训练

In [ ]

num_classes = len(train_dataset.labels)# model = pdx.det.YOLOv3(num_classes=num_classes)# model = pdx.det.PPYOLO(num_classes=num_classes)model = pdx.det.PPYOLOv2(num_classes=num_classes)model.train(    num_epochs=550,    train_dataset=train_dataset,    train_batch_size=24,    eval_dataset=eval_dataset,    pretrain_weights=None,    learning_rate=0.000125,    warmup_steps=100,    warmup_start_lr=0.0,    lr_decay_epochs=[130, 540],    lr_decay_gamma=.5,    early_stop=True,    save_interval_epochs=20,    save_dir='output/ppyolov2',    # resume_checkpoint='output/yolov3/epoch_430',    use_vdl=True)

登录后复制

6.模型导出

若需使用TensorRT加速，则--fixed_input_shape为必需项

In [ ]

!paddlex --export_inference --model_dir=./output/ppyolov2/best_model/ \                            --save_dir=./inference_model # --fixed_input_shape=[224,224]

登录后复制