DeepSeek开源300亿参数OCR模型:创新光学压缩技术解析

2025年10月21日,DeepSeek在GitHub平台上正式开源了其最新研究成果——DeepSeek-OCR模型。这一模型拥有约30亿参数规模,是研究团队在“光学二维映射压缩”技术方向上,针对长文本上下文处理问题进行的首次系统性探索。
DeepSeek-OCR的核心架构由两部分组成:DeepEncoder编码器与DeepSeek3B-MoE-A570M解码器。其中,DeepEncoder能够在高分辨率图像输入条件下保持较低的激活水平,实现高效的视觉信息压缩,并生成数量适中的视觉token;解码器则基于这些视觉token,精准还原为可读文本。
实验结果表明,在文本token数量不超过视觉token十倍的情况下(即压缩率低于10倍),模型的OCR识别准确率可达97%;即使将压缩率提升至20倍,识别准确率仍能保持在60%左右,展现出较强的鲁棒性。
研究团队指出,该模型不仅验证了光学压缩技术在长上下文处理中的可行性,也为大语言模型在记忆机制、信息遗忘与高效存储方面的理论研究提供了新的技术路径和实验依据。
相关论文题为DeepSeek-OCR: Contexts Optical Compression,项目代码及模型已公开发布,研究资料可通过指定学术平台获取。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
软件企业出海指南:亚马逊云科技平台选型与优势解析
在全球化日益加深的今天,企业出海已成为拓展国际市场、寻求新增长点的重要途径。但对软件企业而言,如何快速触达全球客户、简化跨国交易流程,却成了加速其业务全球增长的核心难题。亚马逊云科技Marketpl
LangChain融资1.25亿美元:开源AI框架估值125亿成独角兽
开源AI智能体框架供应商LangChain近日宣布完成1 25亿美元新一轮融资,公司估值跃升至12 5亿美元,正式跻身全球科技独角兽行列。本轮融资由知名风投机构IVP领投,谷歌旗下CapitalG与
《古墓丽影》周年纪念版延期至2025年11月登陆PS+
根据PlayStation商店的最新信息,古墓丽影:周年纪念版原计划于2025年10月21日与当月其他PS Plus Extra及Premium层级的游戏同步上线,现确认延期至2025年11月18日
小米汽车11月交付破5万,YU7与SU7共筑双车格局
新能源汽车赛道上,小米汽车正以黑马之姿加速突围。据行业观察,其11月交付量有望突破5万辆,这一数字不仅印证了市场对品牌的认可,更折射出其在产能爬坡与供应链整合上的显著成效。数据显示,第42周(10月
Servo浏览器引擎发布首个官方版本:Rust编写的新里程碑
感谢热心网友孟起就是神提供的线索10月22日,有科技博客发布文章指出,采用Rust语言开发的浏览器引擎Servo于10月20日推出了首个手机游戏本0 0 1。该项目团队表示,未来将按月更新版本,现阶
热门推荐
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















