[AI特训营第三期]全流程前沿超轻量PPLCNetV2苹果病害识别
我们将利用深度学习技术来训练一个神经网络模型,该模型将可以对苹果树上的各种病害进行鉴别和诊断。我们将使用大量的真实数据集来训练和优化模型,以达到最好的预测和诊断效果。具体来说,本项
我们将利用深度学习技术来训练一个神经网络模型,该模型将可以对苹果树上的各种病害进行鉴别和诊断。我们将使用大量的真实数据集来训练和优化模型,以达到最好的预测和诊断效果。具体来说,本项目分类准确率达到0.98461,性能优异,同时模型计算量,参数量较小,便于部署在边缘端。
![[ai特训营第三期]全流程前沿超轻量pplcnetv2苹果病害识别 - 游乐网](https://static.youleyou.com/uploadfile/2025/0723/20250723121452340.webp)
[AI特训营第三期]超越SwinTransformer!全流程前沿超轻量网络PPLCNetv2的苹果病害识别
一、项目背景
首先,随着农业产业的不断发展,对于果实的质量和安全的要求也越来越高。然而,由于缺乏有效的技术手段,传统的病害识别方法往往难以满足这一要求。
其次,深度学习作为人工智能领域的重要技术之一,已经被广泛应用于图像分类、语音识别等多个领域,并取得了很好的成果。在果实病害识别方面,深度学习模型具有强大的非线性映射能力和特征提取能力,可以从复杂的数据集中提取出有用的特征信息。
最后,苹果作为一种重要的农产品,其生长状况和病害情况对于果实的品质和安全具有重要的影响。因此,开发一套高效的苹果病害识别系统,对于提高苹果生产的质量和安全具有重要的意义。
基于上述背景,我们设计了基于深度学习的苹果病害识别项目。我们将利用深度学习技术来训练一个神经网络模型,该模型将可以对苹果树上的各种病害进行鉴别和诊断。我们将使用大量的真实数据集来训练和优化模型,以达到最好的预测和诊断效果。具体来说,本项目分类准确率达到0.98461,性能优异,同时模型计算量,参数量较小,便于部署在边缘端。(written by 文心一言)
需要注意的是,由于数据集限制,本项目输入数据需要为病害数据,模型会预测出具体病害类别。正常叶片,无需模型进行 预测
二、项目任务和项目路线
采用前沿PVT v2作为分类网络采用了数据增强的方法来提高准确度采用了ssld预训练权重的方式提高模型精度同时任务精度要求为: Accuracy≥90%
三、数据集介绍
此数据为苹果病害识别,共26377图片,共有五类,分别为Alternaria_Boltch、Brown_Spot、Grey_spot、Mosaic、Rust 训练数据文件结构:
将提供用于训练的图像数据和识别标签,文件夹结构:
|-- original/Alternaria_Boltch # 存放Alternaria_Boltch标签数据
|-- original/Brown_Spot # 存放Brown_Spot标签数据
|-- original/Grey_spot # 存放Grey_spot标签数据
|-- original/Mosaic # 存放Mosaic标签数据
|-- original/Rust # 存放Rust标签数据
In [ ]#解压数据集!unzip data/data11591/original.zip登录后复制 In [ ]
#下载PaddleClas,如果不成功可以多下几次!git clone https://gitee.com/PaddlePaddle/PaddleClas.git登录后复制 In [ ]
!pip install -r PaddleClas/requirements.txt!pip install paddleclas登录后复制 In [ ]
#导包import paddleimport osimport cv2import globimport paddle.nn as nnfrom paddle.io import Datasetimport pandas as pdimport paddle.vision.transforms as Timport numpy as npimport jsonimport seaborn as snsimport matplotlib.pyplot as pltfrom PIL import Imagefrom sklearn import preprocessingfrom paddle.vision.transforms import ToTensor登录后复制 In [27]
path = 'original'path_imgs = list(glob.glob(path+'/**/*.webp'))登录后复制 In [ ]
labels = list(map(lambda x:os.path.split(os.path.split(x)[0])[1], path_imgs))file_path = pd.Series(path_imgs, name='File_Path').astype(str)labels = pd.Series(labels, name='Labels')data = pd.concat([file_path, labels], axis=1)#打乱数据集data = data.sample(frac=1,random_state =2024).reset_index(drop=True)data.head()登录后复制 In [29]
examples = pd.DataFrame([])unique_labels = data['Labels'].unique()for label in unique_labels: examples = pd.concat([examples, data.query(f"Labels == '{label}'").sample(1)])登录后复制 In [31]fig = plt.figure(figsize=(16, 8))for index, row in examples.reset_index().iterrows(): ax = plt.subplot(4, 3, index + 1) image = cv2.imread(row["File_Path"]) image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) image = cv2.resize(image, (256, 256), interpolation=cv2.INTER_AREA) plt.imshow(image) ax.set_title(row["Labels"].title(),fontsize=20) ax.axis("off")fig.tight_layout(pad=0.1)plt.show()登录后复制 登录后复制 In [7]
counts = data.Labels.value_counts()sns.barplot(x=counts.index, y=counts)plt.axhline(y=counts.mean(), lw=3, color="#346c9a")plt.xlabel('Labels')plt.ylabel('Count')plt.xticks(rotation=50);登录后复制 登录后复制 In [32]
enc=preprocessing.LabelEncoder()enc=enc.fit(unique_labels)#训练LabelEncoder登录后复制 In [45]
#生成标签文件unique_labels_num = enc.transform(unique_labels)unique_labels_numlabel = pd.DataFrame((unique_labels_num,unique_labels))label = label.transpose()label.to_csv('label.txt',sep=' ',header=None,index=None)登录后复制 In [33]data['Labels']=enc.transform(data['Labels'])登录后复制 In [7]
data.iloc[0:int(0.7*len(data))].to_csv('train.txt',sep=' ',header=None,index=None)data.iloc[int(0.7*len(data)):].to_csv('test.txt',sep=' ',header=None,index=None)登录后复制 四、代码实现
4.1 模型介绍
4.1.1 模型简介
骨干网络对计算机视觉下游任务的影响不言而喻,不仅对下游模型的性能影响很大,而且模型效率也极大地受此影响,但现有的大多骨干网络在真实应用中的效率并不理想,特别是缺乏针对 Intel CPU 平台所优化的骨干网络,我们测试了现有的主流轻量级模型,发现在 Intel CPU 平台上的效率并不理想,然而目前 Intel CPU 平台在工业界仍有大量使用场景,因此我们提出了 PP-LCNet 系列模型,PP-LCNetV2 是在 PP-LCNetV1 基础上所改进的。
4.1.2 模型细节
PP-LCNetV2 模型的网络整体结构如上图所示。PP-LCNetV2 模型是在 PP-LCNetV1 的基础上优化而来,主要使用重参数化策略组合了不同大小卷积核的深度卷积,并优化了点卷积、Shortcut等。
4.1.2.1 Rep 策略
卷积核的大小决定了卷积层感受野的大小,通过组合使用不同大小的卷积核,能够获取不同尺度的特征,因此 PPLCNetV2 在 Stage4、Stage5 中,在同一层组合使用 kernel size 分别为 5、3、1 的 DW 卷积,同时为了避免对模型效率的影响,使用重参数化(Re parameterization,Rep)策略对同层的 DW 卷积进行融合,如下图所示。
4.1.2.2 PW 卷积
深度可分离卷积通常由一层 DW 卷积和一层 PW 卷积组成,用以替换标准卷积,为了使深度可分离卷积具有更强的拟合能力,我们尝试使用两层 PW 卷积,同时为了控制模型效率不受影响,两层 PW 卷积设置为:第一个在通道维度对特征图压缩,第二个再通过放大还原特征图通道,如下图所示。通过实验发现,该策略能够显著提高模型性能,同时为了平衡对模型效率带来的影响,PPLCNetV2 仅在 Stage4 中使用了该策略。
4.1.2.3 Shortcut
残差结构(residual)自提出以来,被诸多模型广泛使用,但在轻量级卷积神经网络中,由于残差结构所带来的元素级(element-wise)加法操作,会对模型的速度造成影响,我们在 PP-LCNetV2 中,以 Stage 为单位实验了残差结构对模型的影响,发现残差结构的使用并非一定会带来性能的提高,因此 PPLCNetV2 仅在最后一个 Stage 中的使用了残差结构:在 Block 中增加 Shortcut,如下图所示。
4.1.2.4 激活函数
在目前的轻量级卷积神经网络中,ReLU、Hard-Swish 激活函数最为常用,虽然在模型性能方面,Hard-Swish 通常更为优秀,然而我们发现部分推理平台对于 Hard-Swish 激活函数的效率优化并不理想,因此为了兼顾通用性,PP-LCNetV2 默认使用了 ReLU 激活函数,并且我们测试发现,ReLU 激活函数对于较大模型的性能影响较小。
4.1.2.5 SE 模块
虽然 SE 模块能够显著提高模型性能,但其对模型速度的影响同样不可忽视,在 PP-LCNetV1 中,我们发现在模型中后部使用 SE 模块能够获得最大化的收益。在 PP-LCNetV2 的优化过程中,我们以 Stage 为单位对 SE 模块的位置做了进一步实验,并发现在 Stage4 中使用能够取得更好的平衡。
4.2 模型训练
In [ ]#注销此代码,训练SwinTransformer# !python PaddleClas/tools/train.py -c SwinTransformer_small_patch2_window7_224.yaml登录后复制 In [ ]
#训练PPLCNetV2!python PaddleClas/tools/train.py -c PPLCNetV2_base.yaml -o Arch.pretrained=True -o Arch.use_ssld=True登录后复制
4.3 训练结果可视化
4.3 模型导出
In [ ]!python3 PaddleClas/tools/export_model.py \ -c PPLCNetV2_base.yaml \ -o Global.pretrained_model=model/lcnetv2/best_model\ -o Global.save_inference_dir=deploy/models/PPLCNetV2_base_infer登录后复制
五、模型评价
In [ ]!python3 PaddleClas/tools/eval.py \ -c SwinTransformer_small_patch2_window7_224.yaml \ -o Global.pretrained_model=model/swin/best_model \登录后复制 In [ ]
!python3 PaddleClas/tools/eval.py \ -c PPLCNetV2_base.yaml \ -o Global.pretrained_model=model/lcnetv2/best_model\登录后复制
下面给出不同方案的效果
六、效果展示
需要注意的是,由于数据集限制,本项目输入数据需要为病害数据,模型会预测出具体病害类别。正常叶片,无需模型进行 预测
In [49]test = Image.open('original/Brown_Spot/005586.webp')test登录后复制 登录后复制 In [3]
#模型推理!python3.7 PaddleClas/deploy/python/predict_cls.py -c inference_cls.yaml -o Global.infer_imgs='original/Grey_spot/015951.webp'登录后复制
2024-03-22 23:37:32 INFO: Loading faiss with AVX2 support.2024-03-22 23:37:32 INFO: Could not load library with AVX2 support due to:ModuleNotFoundError("No module named 'faiss.swigfaiss_avx2'")2024-03-22 23:37:32 INFO: Loading faiss.2024-03-22 23:37:32 INFO: Successfully loaded faiss.2024-03-22 23:37:32 INFO: ============================================================= PaddleClas is powered by PaddlePaddle ! =============================================================== ==== For more info please go to the following website. ==== ==== https://github.com/PaddlePaddle/PaddleClas =============================================================2024-03-22 23:37:32 INFO: Global : 2024-03-22 23:37:32 INFO: batch_size : 12024-03-22 23:37:32 INFO: cpu_num_threads : 102024-03-22 23:37:32 INFO: enable_benchmark : True2024-03-22 23:37:32 INFO: enable_mkldnn : True2024-03-22 23:37:32 INFO: enable_profile : False2024-03-22 23:37:32 INFO: gpu_mem : 80002024-03-22 23:37:32 INFO: infer_imgs : original/Grey_spot/015951.webp2024-03-22 23:37:32 INFO: inference_model_dir : deploy/models/PPLCNetV2_base_infer2024-03-22 23:37:32 INFO: ir_optim : True2024-03-22 23:37:32 INFO: use_fp16 : False2024-03-22 23:37:32 INFO: use_gpu : True2024-03-22 23:37:32 INFO: use_tensorrt : False2024-03-22 23:37:32 INFO: PostProcess : 2024-03-22 23:37:32 INFO: SavePreLabel : 2024-03-22 23:37:32 INFO: save_dir : pre_label2024-03-22 23:37:32 INFO: Topk : 2024-03-22 23:37:32 INFO: class_id_map_file : label.txt2024-03-22 23:37:32 INFO: topk : 12024-03-22 23:37:32 INFO: main_indicator : Topk2024-03-22 23:37:32 INFO: PreProcess : 2024-03-22 23:37:32 INFO: transform_ops : 2024-03-22 23:37:32 INFO: ResizeImage : 2024-03-22 23:37:32 INFO: resize_short : 2562024-03-22 23:37:32 INFO: CropImage : 2024-03-22 23:37:32 INFO: size : 2242024-03-22 23:37:32 INFO: NormalizeImage : 2024-03-22 23:37:32 INFO: channel_num : 32024-03-22 23:37:32 INFO: mean : [0.485, 0.456, 0.406]2024-03-22 23:37:32 INFO: order : 2024-03-22 23:37:32 INFO: scale : 0.003921572024-03-22 23:37:32 INFO: std : [0.229, 0.224, 0.225]2024-03-22 23:37:32 INFO: ToCHWImage : None015951.webp:class id(s): [2], score(s): [0.90], label_name(s): ['Grey_spot']登录后复制 七、总结
项目总结:
1.本项目可以使用基于ssld迁移学习的方式来提高精度2.可以通过数据增强的方式来扩充数据集来提高精度3.本项目使用前沿的超轻量网络PPLCNetv2并且达到了98%以上精度改进方向:
进一步扩充数据增强方法尝试半监督知识蒸馏方案![[AI特训营第三期]全流程前沿超轻量PPLCNetV2苹果病害识别 - 游乐网](https://static.youleyou.com/uploadfile/2025/0723/20250723121453565.webp)
![[AI特训营第三期]全流程前沿超轻量PPLCNetV2苹果病害识别 - 游乐网](https://static.youleyou.com/uploadfile/2025/0723/20250723121453978.webp)
![[AI特训营第三期]全流程前沿超轻量PPLCNetV2苹果病害识别 - 游乐网](https://static.youleyou.com/uploadfile/2025/0723/20250723121453155.webp)
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:[AI特训营第三期]全流程前沿超轻量PPLCNetV2苹果病害识别要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点LucidaAI是一款面向企业的AI英语口语教练,通过实时对话提供发音、语法、词汇和流利度的个性化反馈。采用端到端加密并支持合规定制,定价策略注重普及化,旨在以低成本提升团队英语沟通能力。
Screenshot2Code工具能够从截图中自动识别代码,并将其转换为可直接运行的代码。支持Python、HTML及API接口信息提取,帮助开发者快速复用他人分享的代码片段,从而显著提升工作效率。这个工具极大简化了代码复用过程。
SpeakStruct通过可自定义模板将语音转换为结构化数据,适用于会议记录、客户通话等场景。核心功能包括自定义模板、准确转录和随处捕捉,使口语信息直接转化为可用的数据资产。
IzzyAI是一款AI驱动的语音治疗应用,提供全天候服务。通过智能治疗师头像互动,系统评估并治疗五种常见语音语言障碍,融合语音与面部识别技术给予实时反馈。内置综合评估、个性化练习、进展报告及支持性社区,提升治疗效果。
- 日榜
- 周榜
- 月榜
热点快看
