当前位置: 首页
科技数码
DeepSeek开源OCR模型:少量视觉token高效压缩文本

DeepSeek开源OCR模型:少量视觉token高效压缩文本

热心网友 时间:2025-12-06
转载

10月20日上午,DeepSeek-AI 团队发布最新研究成果《DeepSeek-OCR:Contexts Optical Compression》技术论文,提出了一种利用视觉模态压缩长文本上下文的全新方法。Hugging Face 平台信息显示,这一创新模型的参数量为 30亿。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

DeepSeek 团队开源新模型 DeepSeek-OCR:少量视觉 token 完成海量文本压缩

根据技术文档介绍,此次开源的 DeepSeek-OCR 系统由两大核心模块构成:专为视觉编码设计的 DeepEncoder 与基于混合专家架构的解码器 DeepSeek3B-MoE-A570M。其中,DeepEncoder 针对高分辨率输入场景进行了专门优化,既能有效降低计算复杂度,又能实现极高的压缩比率,从而将视觉 token 数量控制在可控范围内。实验数据表明,当文本 token 数量不超过视觉 token 10倍时,模型的 OCR 识别准确率可达到惊人的 97%;即便将压缩比提升至 20倍,其准确率依然保持在 60% 左右。这一表现充分证明了该方法在历史文档长上下文压缩与大语言模型记忆机制研究领域的巨大潜力。DeepSeek-OCR 在实用性与部署效率方面展现出显著优势。

在权威评测基准 OmniDocBench 的测试中,DeepSeek-OCR 仅使用 100 个视觉 token 就超越了 GOT-OCR2.0(每页需 256 个 token)的表现,而不到 800 个视觉 token 的输入就优于 MinerU2.0(平均每页超过 6000 个 token)的处理效果。

在实际生产环境中,DeepSeek-OCR 仅需单张 A100-40G 显卡即可实现每日超过 20 万页的大语言模型/视觉语言模型训练数据处理能力。

DeepSeek 团队开源新模型 DeepSeek-OCR:少量视觉 token 完成海量文本压缩

DeepSeek 团队开源新模型 DeepSeek-OCR:少量视觉 token 完成海量文本压缩

项目相关资源链接如下:

GitHub:https://github.com/deepseek-ai/DeepSeek-OCR

Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-OCR

来源:https://www.ithome.com/0/890/839.htm

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
8G显卡再战十年!NV新技术:显存爆降85%画质不变

8G显卡再战十年!NV新技术:显存爆降85%画质不变

随着3A大作对画面精度的追求持续升级 现如今,3A游戏对画面细节的追逐几乎陷入了“军备竞赛”。高清材质包一个比一个大,直接带来的后果就是:曾经被视为甜点配置的8GB显存显卡,如今越来越力不从心。爆显存、游戏卡顿、被迫降低画质设置——这些窘境成了不少玩家的日常,8GB卡甚至被戏称为新时代的“残废卡”。

时间:2026-04-06 10:22
微星 2026 款泰坦 18 Max 游戏本国行上市:7 热管 2 风扇,整机双烤 260W

微星 2026 款泰坦 18 Max 游戏本国行上市:7 热管 2 风扇,整机双烤 260W

微星泰坦 18 Max 2026款国行发布:极致双烤260W性能,散热系统全面解析 对于追求极致性能的游戏玩家和专业创作者而言,顶级游戏本市场迎来了一个重磅选项。近日,微星正式在国内推出了其旗舰级新品——2026款泰坦 18 Max(Raider 18 Max HX)游戏笔记本电脑,旨在重新定义高性

时间:2026-04-06 07:03
旗舰配置 25000Pa 吸力 + 95℃ 自清洁:石头 A30 CE 洗地机 1278 元免费用 15 天

旗舰配置 25000Pa 吸力 + 95℃ 自清洁:石头 A30 CE 洗地机 1278 元免费用 15 天

京东百亿补贴开启:石头 A30 CE 系列洗地机享“买贵双倍赔”与“15天免费试用” 如果您正在关注高品质清洁电器,那么现在有一个不容错过的限时机会。石头科技旗下的 A30 CE 系列智能洗地机现已加入“京东百亿补贴”专场。本次促销不仅带来极具竞争力的价格,更提供了两大核心保障:一是“买贵双倍赔”的

时间:2026-04-06 07:02
比官方预告时间更早:消息称“超级小爱”PC 客户端正推送给小米笔记本 Pro 14

比官方预告时间更早:消息称“超级小爱”PC 客户端正推送给小米笔记本 Pro 14

比官方预告时间更早:消息称“超级小爱”PC 客户端正推送给小米笔记本 Pro 14 四月份伊始,小米在AI落地应用方面便带来了令人惊喜的新进展。据知名数码博主@懒酱的日记本透露,备受期待的“超级小爱”PC客户端已开始向小米笔记本 Pro 14用户推送。此次推送的时间点,较官方之前公布的四月中旬计划明

时间:2026-04-06 07:01
红魔姜超“冒险爆料”:Pad 新品不是四月就是五月发布,一定不让大家失望

红魔姜超“冒险爆料”:Pad 新品不是四月就是五月发布,一定不让大家失望

红魔姜超透露:全新游戏平板将于四月或五月发布,承诺带来惊艳体验 游戏硬件领域即将迎来重磅更新。努比亚红魔游戏手机的产品线负责人姜超,近日通过社交媒体进行了一次颇具悬念的“前瞻剧透”,成功引发了广大游戏玩家和科技爱好者的高度关注。他明确指出,红魔全新一代游戏平板的发布日期已锁定在四月或五月,并使用了“

时间:2026-04-05 22:56
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程