大数据监控+多维表格+deepseek 分析+大屏可视化,定量分析:2025 年高考数学有多难?
发布时间:2025-07-04 编辑:游乐网
背景
又到一年一度高考时节,2025 年高考数学已经落下帷幕,
在抖音、微博简单冲浪了下,综合讨论和试题,我直观感受了下今年高考数学的难度,
先说结论,鉴于今年没参加高考,我没有分数,但能感觉大概是有一点难,但也没有 2024 年那么难,
搞理工科的不能只谈感受,得拿出实证数据说话,
为了定量分析难得程度,我立刻启动了我的大数据监控系统,
实时采集了今年高考数学结束后也是就 2025.06.07 下午 17 点,到次日 10 点之间,有关高考数学的热议文本,
代码语言:javascript代码运行次数:0运行复制温馨提示:本文不含 AI 科技,已关闭文中广告,请放心阅读登录后复制
共采集 10000 条左右,经过数据清洗后 7000 条左右,数据截图如下:

大模型数据处理
之后就是数据处理了,这一次我利用了飞书的多维表格,号称是像素级接入大模型的推理和多模态能力,
为什么这么说呢,因为以往对表格的借助大模型分析,我都是直接把整个表格某列的所有内容直接喂进大模型,得出结论,
但是飞书这个多维表格,可以只把某一个单元格里面的内容使用大模型处理,而且不用再额外打开其他窗口,直接在多维表格右键选择心仪的大模型能力即可,
而且输出的结构直接新增一列了,非常丝滑,下面我将演示这个过程,
第一步,将数据导入多维表格,这里我选择在网页上传 CSV 文件

导入成功后如下:

然后重点来了,我们点击新增一列,这一列的内容全部由大模型生成,输入是 content 列,大模型处理完之后输出到新增列:

这里我们选择 DeepSeek-R1 模型处理,当然也可以选择其他的一些内置或者外置模型,
然后输入 Prompt 指令:

默认勾选了思考过程和输出结果,这意味着最终会新增三列,也就是除了我们新增的 difficulty 列,还有默认的两列,
我们先取消默认勾选的两列,点击确定,生成,等大模型处理一会儿,结果就自动更新到表格中了,
在等待过程中能看到新增列名处大模型处理的实时进度,

喝几口茶的功夫,就全部处理好了:

大屏可视化
处理完之后,如果想要直观地看到可视化结果,不用下载表格本地然后 Python 大屏可视化,
取而代之的是,多维表格可以直接在线组装大屏可视化,也就是左下角侧边栏里的仪表盘功能,

先选择饼图,扇区分组选择刚才生成的 difficulty 字段,点击确定

从这个图表可归纳出,2025 年高考数学有多难的结论:
1、过半数的与高考数学相关讨论的文本,持中立态度。
2、接近 2/5 的讨论文本认为难。
3、仅不到 1/16 之一的讨论觉得简单,仅为认为难的约 1/7。
可以明显直观量化感受到 2025 年高考难度,不过我觉得应该再精确一些,
让大模型给难易程度打分,而不是直接分类,这是可以优化的地方。
仪表盘还可以选择其他更多折线图、条形图、甚至词云图,还可以自定义停用词,简直是社科小白的救星,
其他图表处理类似,这里不再赘述,展示下方最终可视化结果,

大屏依次是 difficulty 列占比图、publish_time 发布趋势、发布大 V 占比图、ip 属地分布排行榜、content 文本列的词云图、以及超话分布占比图,
有点好奇的是,为什么 ip 属地来自吉林省的排行第一?接下来依次是北京、广东、江苏、浙江、湖北、河南、山东、四川、上海。
可视化大屏是动态交互的,为了方便读者朋友们阅读查阅更多数据,我已经将这个仪表盘发布,公开可见,地址如下:
报告自动推送
而且这个仪表盘还有个实用的功能,自动化推送报告,点击仪表盘最上方的设置自动化发送即可配置,
而且配置非常灵活,可以自由设定触发条件、接受方式(飞书或者邮箱)、甚至发送内容都可以是可配置超链接富文本,

这个时候就有人问了,这个仪表盘内容是固定的,推送有什么用,
实则不然,仪表盘是根据数据表变动而变动的,只要数据发生了变化,仪表盘就会实时更新,
如果触发了条件,就会收到一份仪表盘的实时报告,
有人继续就问了,每次我在网页上编辑改动数据,说明我在电脑前呀,推送没啥用,直接点开仪表盘看就行了
no~no~no,实际上,不一定需要手动编辑数据,
对于非开发者,多维表格可以通过公开表单增加数据,简单来说就是可以通过给表格配置一个公开的表单,让获取链接的人填写表单添加数据,


配置好表单,然后开启分享表单,把链接分享给其他人就能通过填写表格增加数据,并且自动触发大模型计算出 difficulty 列
条件合适还会触发大屏可视化报告,简直太方便了,以后填问卷用这个,简直事半功倍,
我给该表格配置的表单如下:
而对于开发者,多维表格是有增删改查的 API 的,
可操作颗粒度更细,这里的想象空间就很大了,
也就是说,我们可以在服务器上部署数据监控系统,并且接入多维表格的 API,实时增量更新数据,然后推送精美的大屏可视化报告,
这样一套组合拳下来,传统企业很快就能进行数字化转型,个人开发者很快就能搭建起自己的工作流,
并且最新也提供了 Python、Java、PHP 等多个版本的 SDK,可自由选择,
不过我觉得 SDK 太重了,而且过度封装了,比较不灵活,
于是乎,我自己阅读最新的 Python 版本的 SDK,简单封装了下函数,非常灵活,代码贴在下面,欢迎自取
代码语言:javascript代码运行次数:0运行复制import requestsimport json# 获取访问凭证def get_access_token(): url = "https://open.feishu.cn/open-apis/auth/v3/tenant_access_token/internal" headers = { "Content-Type": "application/json; charset=utf-8" } payload = { "app_id": APP_ID, "app_secret": APP_SECRET } response = requests.post(url, headers=headers, data=json.dumps(payload)) result = response.json() if result.get("code") == : print(result) return result.get("tenant_access_token") else: print(f"获取access token失败: {result}") returnNone# 插入数据到多维表格def insert_data_to_bit_table(access_token, records): url = f"https://open.feishu.cn/open-apis/bitable/v1/apps/{APP_TOKEN}/tables/{TABLE_ID}/records/batch_create" headers = { "Authorization": f"Bearer {access_token}", "Content-Type": "application/json; charset=utf-8" } payload = { "records": records } response = requests.post(url, headers=headers, data=json.dumps(payload)) return response.json()登录后复制
不过一些基本的配置,APP_ID、APP_SECRET 获取之类的,还是建议看最新文档,
再说一下,本次公开可访问的大屏可视化链接如下:
以下的一些精选的历史推送,
相关阅读
MORE
+- 深入理解Python中super()方法的作用 07-05 Python内置函数super()简介:继承与重写的得力助手 07-05
- 低价大模型 DeepSeek 实用指南 07-04 三种方法!教会你用DeepSeek绘制各种图表,真的太好用了(视频教程版) 07-04
- 用DeepSeek+腾讯云HAI玩转小游戏代码+图片 07-04 deepseek+dify工作流实现代码审计 07-04
- 1200行代码逆袭!DeepSeek工程师开源轻量级vLLM,吞吐量逼近原版 07-04 大数据监控+多维表格+deepseek 分析+大屏可视化,定量分析:2025 年高考数学有多难? 07-04
- Python类继承中super函数的用法解析 07-04 深入探讨Python异常处理机制 07-04
- 五分钟掌握Python中super()函数的用法 07-04 编程工具有哪些?十大免费在线编程工具推荐2025 07-03
- 旧版本微信实现小店自动登录兼容方案 06-30 2022少儿变成软件推荐 好用的青少年变成软件 06-30
- 掌握Python中super()函数的用法与实例解析 06-30 Excel表格中合并相同内容的单元格 快速整理重复数据 06-30
- 微信小店自动登录双因素认证设置方案 06-29 Python异常处理:方法与实践 06-28