疫情微博情绪识别挑战赛Baseline(PaddlePaddle)-0.9735

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

疫情微博情绪识别挑战赛Baseline(PaddlePaddle)-0.9735

热心网友时间：2025-07-23

转载

本文围绕疫情微博情绪识别挑战赛展开，介绍赛事背景、任务、评审规则等。采用预训练模型+微调方式，通过Multi-dropout和不同特征池化方案优化，从小模型到参数大的模型实验，结合模型融合策略，最终ernie-3.0-base-zh单模线上成绩达0.9735，为情绪识别提供有效方案。

疫情微博情绪识别挑战赛baseline(paddlepaddle)-0.9735 - 游乐网

疫情微博情绪识别挑战赛

举办方：科大讯飞xDatawhale

赛事地址：疫情微博情绪识别挑战赛-点击直达

赛事背景

疫情发生对人们生活生产的方方面面产生了重要影响，并引发了国内舆论的广泛关注，众多网民也参与到了疫情相关话题的讨论中。大众日常的情绪波动在疫情期间会放大，并寻求在自媒体和社交媒体上发布和评论。

为了掌握真实社会舆论情况，科学高效地做好防控宣传和舆情引导工作，针对疫情相关话题开展网民情绪识别是重要任务。本次我们重点关注微博平台上的用户情绪，希望各位选手能搭建自然语言处理模型，对疫情下微博文本的情绪进行识别。

赛事任务

本次赛题需要选手对微博文本进行情绪分类，分为正向情绪和负面情绪。数据样例如下：

疫情微博情绪识别挑战赛Baseline(PaddlePaddle)-0.9735 - 游乐网

评审规则

数据说明

赛题数据由训练集和测试集组成，训练集数据集读取代码：

import pandas as pd pd.read_csv('train.csv',sep='\t')

登录后复制评估指标

本次竞赛的评价标准采用准确率指标，最高分为1。计算方法参考地址：https://scikit-learn.org/stable/modules/generated/sklearn.metrics.accuracy_score.html

评估代码参考：

import sklearn.metrics import accuracy_score y_pred = [0,2,1,3] y_true = [0,1,2,3] accuracy_score(y_pred,y_true)

登录后复制评测及排行

1、赛事提供下载数据，选手在本地进行算法调试，在比赛页面提交结果。

2、每支团队每天最多提交3次。

3、排行按照得分从高到低排序，排行榜将选择团队的历史最优成绩进行排名。

作品提交要求

文件格式：预测结果文件按照csv格式提交

文件大小：无要求

提交次数限制：每支队伍每天最多3次

预测结果文件详细说明：

以csv格式提交，编码为UTF-8，第一行为表头；

标签顺序需要与测试集文本保持一致；

提交前请确保预测结果的格式与sample_submit.csv中的格式一致。具体格式如:

label 1 1 1 1

登录后复制

赛程安排

正式赛：6月24日——7月23日

初赛截止成绩以团队在初赛时间段内最优成绩为准，具体排名可见初赛榜单。

初赛作品提交截止日期为7月23日17:00；正式赛名次将于结束后15天内公布。

长期赛：7月24日——10月24日

正式赛结束后，将转变为长期赛，供开发者学习实践。本阶段提交后，系统会根据成绩持续更新长期赛榜单，但该阶段榜单不再进行奖励。

Baseline思路

情感分析是一个经典的文本分类任务，初始Baseline采用预训练模型+微调下游任务的方式搭建

通过两种策略优化Baseline方法得到一个强基线的Baseline方案

策略一：Mutli-dropout

策略二：比较不同的特征池化方案，选取更合适的特征池化方法

先使用参数少的小模型（erbie-3.0-nano）得到初步的最优组合方案，再更换参数大的（erbie-3.0-base）模型结合最优策略得到较强的单模结果。

Baseline 效果

由于提交次数宝贵，因此仅提交了其中三份结果进行验证

一是小模型上验证效果最好（0.963）的单模结果

二是小模型上多模型融合的结果

三是切换为大模型（ernie-3.0-base-zh）的单模效果

从结果上看：

Mutlidropout策略十分有效，在不同池化策略的基础上添加Mutlidropout验证效果均有明显涨分嵌入策略上动态加权池化方法效果最优，其次是平均池化策略基于Voting的模型融合策略也可以提升模型的性能更换base版本的大模型后，通过两个策略的加持，线上成绩到达0.9735，靠单模成绩上排行第三，

总结：

使用了两种有效的策略（Mutlidropout和动态池化策略）获得一个强基线的baseline,希望对还未提升到0.972分数以上的小伙伴一些启发，基于这个强基线的baseline是可以冲击到0.973等更高的分数。

Baseline项目使用ernie-3.0的nano模型仅72MB,micro和nano版本不超过100MB，对资源要求友好，在当前超参数配置下（最大截断长度200，训练批次大小64）显存占用不到5GB，训练3轮5.4万条样本仅需11分钟左右，取得线上0.9655（Rank35 时间:2024-07-09）

当更换参数量更大的Base模型后，相同配置下显存占用19GB左右，训练时间提升到30分钟。更换Base后的强基线单模线下得到0.9735,进入前五梯队（Rank3 时间:2024-07-09）

疫情微博情绪识别挑战赛Baseline(PaddlePaddle)-0.9735 - 游乐网

后续优化推荐

使用FGM等对抗训练提升模型的鲁棒性使用EMA增加模型在测试集上的健壮性融合不同模型,采用不同的模型融合策略

In [ ]

# 将paddlenlp更新至最新版本 !pip install -U paddlenlp # emoji转换成文字 !pip install emojiswitch

登录后复制

In [6]

# 测试 emojiswitch 效果 import emojiswitch emojiswitch.demojize('心中千万只

登录后复制

来源:https://www.php.cn/faq/1423707.html

上一篇：【新手入门】0 基础掌握大模型训练（一）：监督微调SFT算法全解析：从原理到实战

下一篇：基于PaddlePaddle搭建儿童X光胸部肺炎分类项目

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

Take-Two 采用 AI 技术制作游戏预告片

锚点降临伤害计算公式与实战解析

上海开眼信息以资深经验领跑2026年GEO优化与AI智能营销服务

《命运2》停更后 Bungie新作《马拉松》遭玩家差评

2026年三维扫描仪选购指南精度自动化与服务全面解析

嘉德股份首日上市暴涨710% 中签一手盈利5.6万元

WPS文档背景颜色设置技巧提升视觉体验

通义万象制作壁纸与头像的图片效果实测

奔驰纯电GLC到店实拍 630马力空气悬架豪华科技配置价格解析

PPT演示如何添加背景音乐并提升效果

漫蛙漫画防走失网页链接

永劫无间账号购买平台推荐与安全交易指南

梦幻魔法公主善恶值系统解析与调整方法指南

茶叶蛋的冒险第14关荡秋千怎么过图文通关攻略详解

无畏契约源能行动一局游戏需要多长时间

茶叶蛋大冒险第16关怎么过相对运动图文通关攻略

蓝色星原旅谣角色强度榜与技能实战解析

蔚蓝星球零氪微氪新手攻略 20条技巧助你开局避坑

茶叶蛋大冒险第18关通关攻略图文详解隐藏关卡怎么过

文字三国志游戏评测与新手玩法指南

漫蛙漫画防走失网页链接

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

相关攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

2015-03-10 12:39

《英雄坛说》详细全攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

最后生还者第二季剧情改动未引热议编剧坦言意外发布于 2026-05-23

最后生还者第二季第六集剧情解析艾莉回忆父女情感线发布于 2026-05-23

逃跑吧少年战术道具卡解析挨打装死实战技巧教学发布于 2026-05-23

劲铠生日庆典 DMM角色日玩法全解析发布于 2026-05-23

我的世界传奇天境更新7月14日上线市场发布于 2026-05-23

燕云十六声常平仓玩法攻略详解发布于 2026-05-23

光遇与中国绊爱联动同人作品征集活动开启发布于 2026-05-23

代号妖鬼龙千疮百孔流最强搭配方案与实战教学发布于 2026-05-23

豚豚多财游戏玩法介绍与可玩性深度评测发布于 2026-05-23

夏日清凉活动指南消暑优惠与玩法全攻略发布于 2026-05-23

FURYU新作异界揭踪10月29日上线昭和风异形技能TPS求生发布于 2026-05-23

《极限竞速：地平线6》碾压稻田引热议玩家集体心疼农民劳动成果发布于 2026-05-23

神鬼寓言今秋多平台同步发售 Playground Games正式确认发布于 2026-05-23

代号梦境行者游戏评测与新手玩法全攻略发布于 2026-05-23

最终幻想7重生XBOX版预载开启游戏容量169GB 发布于 2026-05-23

鬼泣5 PC版持续更新 SteamDB页面动态引关注发布于 2026-05-23

Windows批量修改文件后缀名教程使用CMD命令一键快速完成发布于 2026-05-20

Win11 查看 CPU 硬件级安全隔离支持方法提升系统防御力发布于 2026-05-20

如何查询Mac型号年份与配置信息发布于 2026-05-20

Linux系统Nginx服务器HTTPS证书安装配置教程发布于 2026-05-20

Mac放大镜功能开启指南轻松看清屏幕细节发布于 2026-05-20

Mac终端清理DNS缓存详细步骤与操作指南发布于 2026-05-20

Win11任务栏合并标签如何关闭恢复经典文字导航栏发布于 2026-05-20

Mac桌面图标自动整理技巧：堆栈功能高效管理文件发布于 2026-05-20

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

疫情微博情绪识别挑战赛Baseline(PaddlePaddle)-0.9735

疫情微博情绪识别挑战赛

Baseline思路

Baseline 效果

后续优化推荐

蚂蚁开源万亿参数思考模型Ring-2.5-1T详解

Teamily AI：原生智能通讯平台，开启人机协作新纪元

字节跳动Seedream 5.0 Lite AI图像生成模型详解

WorkAny Bot云端AI助手基于OpenClaw框架详解

KiloClaw推出全托管云服务OpenClaw