数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

DeepSeek新功能上线：AI再进化，“王炸”能力全解析

DeepSeek新功能上线：AI再进化，“王炸”能力全解析

热心网友时间：2025-12-05

转载

AI领域最近又有了新突破——DeepSeek团队悄然开源了一个参数规模达300亿的小型模型，命名为DeepSeek-OCR。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

别看它体量不大，设计理念却相当炸裂：他们竟打算让人工智能通过"看图"的方式去理解文本内容。

没错，这是真正的"以图识字"。

不仅如此，这不仅仅是简单的文字识别，而是将"视觉模态"作为一种文本压缩媒介，用图像来代表文字，以"视觉token"替代"文本token"，实现所谓的光学压缩（Optical Compression）。

说实话，当我初次看到这篇论文时，第一反应是：难道他们想让语言模型也去上美术课？

不过静心思考后，这个思路确实有其合理之处。

大语言模型（LLM）最突出的痛点是什么？处理长文本时算力消耗巨大。

众所周知，大型模型的注意力机制复杂度呈平方级增长。输入长度翻倍，其计算量就要增加四倍；若要让它记住整篇长文档，模型立刻就会"高负荷运转"。

那么，能否换个思路解决问题？DeepSeek团队提出：既然一张图片能承载大量文字信息，不如直接将文本转化为图像，再让模型去"读图"！

论文中展示了一个特别直观的案例：原本需要1000个token才能表达的内容，现在仅用100个视觉token就能搞定，压缩率达到10倍，同时还能保持97%的OCR准确率。

即便进行20倍极限压缩，仍能维持约60%的准确度。这意味着，模型"读图"的效率竟然比"读文字"还高。

换句话说，模型在几乎不丢失关键信息的前提下，计算负担减轻了十倍。

不少网友看到这里都感到惊讶：AI处理图像的资源消耗竟然比处理长文本还少？这完全颠覆了人类的直觉认知！

也有网友感叹道：DeepSeek这是要让模型"读文档"像刷朋友圈一样轻松。

在我看来，这套操作堪称"降维打击"。

过去我们一直在想办法让模型更懂文字、看得更远；而DeepSeek却反其道而行：让模型把文字变成画，再通过"看画识文"来理解内容。这有点像回到了人类最原始的沟通方式：象形文字。

说到这里，让我们深入了解这个模型的具体构成。DeepSeek-OCR由两部分组成：DeepEncoder（图像压缩模块）+DeepSeek3B-MoE（解码还原模块）。

前者是整个系统的"压缩引擎"，它巧妙地将两大视觉强者SAM-base和CLIP-large串联起来：

SAM负责捕捉细节的"局部注意力"，CLIP则把握整体的"全局注意力"。中间还嵌入了一个16倍卷积压缩模块，专门用于削减token数量。

举例来说，一张1024×1024的图像，理论上需要切割成4096个区块进行处理，现在经过这个压缩模块的优化，直接缩减为几百个token。

经过这样的处理，既保留了足够的清晰度，又大幅降低了计算开销。

而且它还支持多分辨率模式：Tiny、Small、Base、Large，还有一个命名为"Gundam（高达）"的动态模式。

你没看错，这个模型连命名都带着点"二次元"风格。

解码器部分则是DeepSeek的拿手好戏：MoE（混合专家）架构。

64个专家中每次只激活6个，外加两个共享专家，实际算力仅动用了约5.7亿参数，但性能却媲美300亿模型。又快又省电，堪称"节能灯中的战斗机"。

它的任务也并不复杂：从那些压缩后的视觉token中，将文字信息"解码"还原。

整个过程就像是OCR的升级版——不过这次是模型自己在"看图猜字"，而非人类教它识字，而且猜得相当准确。

当然，要让这套玩法真正奏效，必须准备充足的训练素材。DeepSeek这次可谓下足了本钱：整整3000万页PDF文档，涵盖100多种语言，其中中英文就占了2500万页。

他们还构建了一个"模型飞轮"：先用版面分析模型进行粗标注，再用GOT-OCR之类的模型做精标，训练一遍后再反馈更多数据。如此循环往复，模型通过自我喂养不断成长。

除此之外，还有300万条Word文档，专门用于训练公式识别、HTML表格提取，甚至包括金融图表、化学结构式、几何图形等特殊图像结构，也都被纳入了训练集中。

DeepSeek还从LAION、Wukong这些开源数据集抓取了中英文各1000万张场景图，用PaddleOCR进行标注。

可以说，这一轮训练真正实现了"从理工科到艺术科全覆盖"，是用海量数据喂养出来的聪明模型。

那么实际效果如何？论文中展示了几组测试结果，表现相当亮眼。

在OmniDocBench测试集上，DeepSeek-OCR仅用100个视觉token就超越了GOT-OCR2.0（每页256token）。用不到800个视觉token，又超越了MinerU2.0（每页6000+token）。

性能更强、输入更短、推理更快。

这样的处理速度，简直如同"AI印刷机"。

不过，最让我拍案叫绝的，是论文最后那个脑洞：光学压缩还能模拟人类遗忘？

人脑的记忆会随时间衰退，旧事逐渐模糊，新事清晰如昨。DeepSeek团队于是琢磨：AI能不能也学会"选择性记忆"？

如果AI也能像人一样"选择性记忆"，是不是就能在超长对话中运转得更轻松？

他们设计了一个实验构想：超过k轮的历史对话内容就直接渲染成图像；先压缩一遍，减少10倍token；再把图像尺寸缩小一些；图像越小，信息越模糊，最终就"遗忘"了。

有网友看完直接感叹：这不就是在模拟人脑的记忆机制嘛！

当然，也有人泼冷水：DeepSeek的想象力已经够惊人了，要是再让它学会"遗忘"，恐怕忘得比人还快。

我看完这部分内容，确实觉得颇具哲学意味。AI的记忆，究竟该无限扩展，还是该学会适时遗忘？

DeepSeek给出的答案是后者——它通过视觉方式，让模型在"压缩"的同时，也"过滤"掉冗余信息。就像人脑那样：只保留有用的内容。

这背后的意义，其实比OCR技术本身更为深远。

它重新定义了"上下文"的概念：不是记得越多越好，而是记得越精越妙。

说到底，DeepSeek-OCR看似是个OCR模型，实则是在探索一种新范式：能否用视觉模态来高效承载语言信息？

在所有人都追求"更大、更长、更贵"的方向时，DeepSeek却反手做了个"更小、更快、更巧"的模型。

这件事本身就很有DeepSeek的风格。

最后我想说的是：AI的进化路径，未必总是做加法，有时候做减法反而更显智慧。

DeepSeek-OCR就是一个鲜活的例子：一个30亿参数的小模型，却玩出了长文本压缩的新思路，甚至触碰到了"记忆与遗忘"的边界。

如果说去年的关键词是"谁能记住更多"，那么今年，或许是"谁能忘得更聪明"。

而DeepSeek，这一次又走在了前列。

来源:https://36kr.com/p/3523037701840002

上一篇：云计算的AI新趋势：开发者如何与Jeff Barr沟通转型关键

下一篇：博德之门3将登陆新一代任天堂主机？发售时间推测

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

2026北京车展：长城魏牌携AI旗舰与归元平台开启豪华汽车新征程

2026北京车展：长城魏牌携AI旗舰与归元平台开启豪华汽车新征程

在第十九届北京国际汽车展览会上，长城汽车旗下高端品牌魏牌以强大阵容亮相这次北京车展，魏牌的展台绝对算得上一个焦点。他们不仅带来了备受瞩目的“AI豪华六座旗舰”魏牌V9X，还首次展示了号称“世界级豪华平台”的归元S平台。再加上全新高山、全新蓝山以及新摩卡Hi4 Max版等一系列研发成果，阵容可谓相当

时间：2026-04-29 22:43

华硕ROG DAY 2026广州站5月15日举行，包含新品发布会

华硕ROG DAY 2026广州站5月15日举行，包含新品发布会

ROG DAY 2026 广州站定档 5 月 15 日，新品发布与玩家狂欢同日开启玩家们期待已久的年度盛宴来了。华硕旗下高端电竞品牌 ROG（玩家国度）正式官宣，ROG DAY 2026 广州站活动，将于 5 月 15 日在广州市流花展贸中心的大麦 66 livehouse 拉开帷幕。从官方公布

时间：2026-04-29 21:08

国家信誉与短期逐利孰重孰轻？从苹果天价罚单看印度的战略投机

国家信誉与短期逐利孰重孰轻？从苹果天价罚单看印度的战略投机

国家信誉与短期逐利孰重孰轻？从苹果天价罚单看印度的战略投机近日，印度竞争委员会（CCI）的一纸拟议罚单，在全球科技界投下了一枚重磅冲击波。高达380亿美元的处罚金额，不仅相当于苹果全球服务业务年均营收的10%，创下印度反垄断的历史纪录，其严厉程度在全球监管实践中也极为罕见。消息传出，国际商界一片哗

时间：2026-04-29 21:07

21对话｜陪小米智驾长到十八岁

21对话｜陪小米智驾长到十八岁

21对话｜陪小米智驾长到十八岁 21世纪经济报道记者何煦阳 2026年3月，小米新一代SU7正式亮相。这次升级，硬件层面自然不必多说，软件架构更是迈入了“XLA”认知大模型的新阶段。这套系统究竟是怎么炼成的？背后又有哪些过人之处？4月，《21汽车·一见Auto》记者何煦阳与小米智能驾驶基座模型负责

时间：2026-04-29 21:07

千问正式开源FlashQLA 可减少训推过程注意力层的计算开销

千问正式开源FlashQLA 可减少训推过程注意力层的计算开销

千问开源FlashQLA：为线性注意力算子注入“硬核”效率近日，AI开源社区迎来一则重磅消息。4月29日，千问大模型团队正式开源了FlashQLA——一个基于TileLang实现的高性能线性注意力算子库。这可不是一个简单的代码发布，其背后指向一个明确的行业痛点：随着模型参数规模与序列长度的不断攀升

时间：2026-04-29 21:07

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

日榜
周榜
月榜

迷你世界怎么不让别人破坏地图

迷你世界怎么潜行

迷你世界礼包码在哪里输入

迷你世界金矿在哪里

洛克王国蓝色钥匙怎么获得

迷你世界层数和高度怎么看

酒馆战棋S13小饰品多彩罗盘强不强

《阿西美女室友2》手游预约破10万，Storytaco加速影游布局

迷你世界如何下载别人的地图存档

造梦西游之黎尤浩劫篇万岁狐王角色设定与战斗机制详解

新三国志曹操传17期南华幻境9-2怎么过

妖错图强力阵容如何推荐

汤姆猫小镇好玩吗

方舟生存进化手游碳龟蛋饲料怎么做

《亿万光年》装置克制玩法介绍

王者荣耀空空儿价格是多少

体验《子夜之章:历史的终局～MidNights of Desperado～》中最为狂暴的愤怒

名将杀界面操作有什么功能-名将杀界面操作具备哪些功能

《Invincible》第四季动画错误引发粉丝热议

蔚蓝档案绮罗罗角色强度如何-蔚蓝档案绮罗罗角色强度怎样

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

极狐S3预告发布：三电可选、宽体运动设计，2026北京车展亮相

相关攻略

相关攻略

《炎龙骑士团2》详细全攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

《东吴霸王传2013》详细全关攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

《臭作》之100%全完整攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

《兰斯8》剧情攻略详细篇

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

《英雄坛说》详细全攻略

2015-03-10 12:39

《英雄坛说》详细全攻略

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

偷窃少女的教育方法全攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

无法抵挡小恶魔的诱惑攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

《识质存在》中后期BD构筑攻略-中后期配装与战斗策略解析

《识质存在》中后期BD构筑攻略-中后期配装与战斗策略解析发布于 2026-04-29

《黑袍纠察队》主演谈阿什莉隐藏的勇敢：“她必须管教这群‘孩子’”

《黑袍纠察队》主演谈阿什莉隐藏的勇敢：“她必须管教这群‘孩子’” 发布于 2026-04-29

一路向西斩妖除魔《遥遥西土》Steam好评如潮

一路向西斩妖除魔《遥遥西土》Steam好评如潮发布于 2026-04-29

Midnight Season 1 中最快、最简单的地牢挑战

Midnight Season 1 中最快、最简单的地牢挑战发布于 2026-04-29

《红色沙漠》红色拂晓村迷宫解谜攻略-详细步骤解析

《红色沙漠》红色拂晓村迷宫解谜攻略-详细步骤解析发布于 2026-04-29

《暗黑破坏神4》S13术士暗影利爪召唤流加点-加点详解与技能搭配

《暗黑破坏神4》S13术士暗影利爪召唤流加点-加点详解与技能搭配发布于 2026-04-29

《红色沙漠》古代裂缝迷宫解谜攻略-详细步骤解析

《红色沙漠》古代裂缝迷宫解谜攻略-详细步骤解析发布于 2026-04-29

《红色沙漠》布尔鸿村迷宫解谜指南-详细步骤解析

《红色沙漠》布尔鸿村迷宫解谜指南-详细步骤解析发布于 2026-04-29

一路向西斩妖除魔！《遥遥西土》Steam好评如潮

一路向西斩妖除魔！《遥遥西土》Steam好评如潮发布于 2026-04-29

AI做出《黑神话：潘金莲》！韵味拉满了

AI做出《黑神话：潘金莲》！韵味拉满了发布于 2026-04-29

《风启之旅》内容大更新还要等半年将引入全新生态区

《风启之旅》内容大更新还要等半年将引入全新生态区发布于 2026-04-29

《黎明行者之血》开发商还计划打造第二个原创IP

《黎明行者之血》开发商还计划打造第二个原创IP 发布于 2026-04-29

量大管饱《黎明行者之血》主线战役平均50小时

量大管饱《黎明行者之血》主线战役平均50小时发布于 2026-04-29

4月154款游戏版号发布：多款大作过审！腾讯《弧光猎人》获批

4月154款游戏版号发布：多款大作过审！腾讯《弧光猎人》获批发布于 2026-04-29

崩坏星穹铁道余晖残卷第3关巨剑守护怎么搭配阵容-崩坏星穹铁道余晖残卷第3关巨剑守护阵容搭配方法

崩坏星穹铁道余晖残卷第3关巨剑守护怎么搭配阵容-崩坏星穹铁道余晖残卷第3关巨剑守护阵容搭配方法发布于 2026-04-29

星守拼多多阵容如何搭配-星守拼多多阵容搭配方法

星守拼多多阵容如何搭配-星守拼多多阵容搭配方法发布于 2026-04-29

麒麟OS如何安装火狐浏览器_银河麒麟Firefox安装教程

麒麟OS如何安装火狐浏览器_银河麒麟Firefox安装教程发布于 2026-04-29

如何开启 Win11 的“任务栏自动合并”开关自定义任务栏显示风格

如何开启 Win11 的“任务栏自动合并”开关自定义任务栏显示风格发布于 2026-04-29

如何在 Win11 中修改系统默认的截图保存格式 PNG 转 JPG 节省空间

如何在 Win11 中修改系统默认的截图保存格式 PNG 转 JPG 节省空间发布于 2026-04-29

统信 UOS 怎么安装 .exe 文件？这个黑科技一定要知道

统信 UOS 怎么安装 .exe 文件？这个黑科技一定要知道发布于 2026-04-29

如何开启 Windows 11 原生支持的 Wi-Fi 7 协议提升无线网络速度设置方法

如何开启 Windows 11 原生支持的 Wi-Fi 7 协议提升无线网络速度设置方法发布于 2026-04-29

如何关闭Windows系统的“剪贴板跨设备同步” 保护隐私数据不上传方法

如何关闭Windows系统的“剪贴板跨设备同步” 保护隐私数据不上传方法发布于 2026-04-29

如何解决 Win11 系统由于权限无法删除文件夹获取管理员所有权方法

如何解决 Win11 系统由于权限无法删除文件夹获取管理员所有权方法发布于 2026-04-29

如何解决 Win11 系统外接 4K 显示器模糊调整 DPI 高缩放清晰度方法

如何解决 Win11 系统外接 4K 显示器模糊调整 DPI 高缩放清晰度方法发布于 2026-04-29

松下电吹风坏了不转怎么修

松下电吹风坏了不转怎么修发布于 2026-04-29

大疆无人机照片导出到电脑用数据线行吗

大疆无人机照片导出到电脑用数据线行吗发布于 2026-04-29

家用吸尘器的用法适合地毯清洁吗？

家用吸尘器的用法适合地毯清洁吗？发布于 2026-04-29

小米note3铃声在哪找？

小米note3铃声在哪找？发布于 2026-04-29

小米电饭煲重置网络提示失败怎么回事？

小米电饭煲重置网络提示失败怎么回事？发布于 2026-04-29

按摩椅力度调小后还有效果吗

按摩椅力度调小后还有效果吗发布于 2026-04-29

米家扫地机器人怎么用手机远程控制

米家扫地机器人怎么用手机远程控制发布于 2026-04-29

poe交换机测试好坏能用普通测线仪吗

poe交换机测试好坏能用普通测线仪吗发布于 2026-04-29

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集