OCR
OCR(光学字符识别)技术是实现图像文字到数字文本转换的核心工具。本专题汇总OCR最新动态、实用教程与行业深度解析,涵盖文档扫描、车牌识别、手写体处理等多场景应用,并提供优化识别率技巧和高效工具推荐。无论新手入门还是专业人士进阶,这里将帮助您掌握OCR前沿趋势,提升信息处理效率,探索智能自动化新方案。
2026-03-30 07:20
730
百度千帆OCR:4B参数革新文档理解技术
这项由百度千帆团队主导的研究发表于2026年3月17日的arXiv预印本平台(论文编号:arXiv:2603 13398v1),该研究推出了一个名为Qianfan-OCR的革命性文档智能模型,这个拥
MinerU全面适配国产算力,已支持10余款国产AI芯片
2月12消息,上海人工智能实验室 OpenDataLab 团队、 DeepLink 团队及国产芯片厂家携手,于日前先后完成了昇腾、平头哥、沐曦、海光、燧原、摩尔线程、天数智芯、寒武纪、昆仑芯、太初元
智谱开源GLM-OCR模型:多领域性能对标Gemini Pro,小尺寸高精度
2月3日,智谱(02513 HK)官微宣布正式发布并开源GLM-OCR。据介绍,作为一款轻量的专业级OCR模型,该模型仅0 9B参数规模,支持vLLM、SGLang和Ollama部署。公司表示,尽管
DeepSeek-OCR 2正式上线:即刻免费体验最新图文识别技术
北京商报讯(记者 陶凤 王天逸)1月28日,优刻得云计算宣布,DeepSeek重磅升级DeepSeek-OCR-2后,优刻得已经完成接入,并限时免费。
谷歌Gemini像素操控解析:DeepSeek-OCR2技术回应
新智元报道编辑:定慧【新智元导读】谷歌Google DeepMind刚刚推出新能力,用代码赋予Gemini 3 Flash「法眼」。没想到吧,Google DeepMind刚刚为Gemini 3 F
DeepSeek-V4最后拼图:全新OCR框架革新视觉压缩
1 月 27 日,DeepSeek 发布了《DeepSeek-OCR 2: Visual Causal Flow》论文,并同步开源新一代文档理解模型。这是该公司在 2026 年 1 月的第三次技术更
DeepSeek-OCR+2发布:识别精度提升3.73%,高效解析复杂文档
IT之家 1 月 27 日消息,DeepSeek 今日公布了其最新一代文档识别模型 DeepSeek-OCR 2。很显然,该模型是在 DeepSeek-OCR 的基础上升级而来,核心变化集中在视觉编
DeepSeek发布开源OCR新架构:技术探索与核心优势解析
机器之心编辑部嘿!刚刚,DeepSeek 又更新了!这次是更新了十月份推出的 DeepSeek-OCR 模型(参见:太强了!DeepSeek 刚刚开源新模型,用视觉方式压缩一切)。当时 DeepSe
DeepSeek-OCR如何用长文本理解引领未来?中科院VTCBench详解
DeepSeek-OCR 的视觉文本压缩(VTC)技术通过将文本编码为视觉 Token,实现高达 10 倍的压缩率,大幅降低大模型处理长文本的成本。但是,视觉语言模型能否理解压缩后的高密度信息?中科
DeepSeek-OCR长文本理解分析,中科院新基准揭示技术方向
新智元报道编辑:LRST【新智元导读】DeepSeek-OCR的视觉文本压缩(VTC)技术通过将文本编码为视觉Token,实现高达10倍的压缩率,大幅降低大模型处理长文本的成本。但是,视觉语言模型能
华为开源7B多模态模型:视觉定位与OCR能力出众升腾新亮点
允中 发自 凹非寺量子位 | 公众号 QbitAI7B量级模型,向来是端侧部署与个人开发者的心头好。轻量化特性让它能灵活适配各类终端场景,而强劲性能又能覆盖图像信息抽取、文档理解、视频解析、物体定位
国家安全部警示:手机OCR拍照上传涉密文件至朋友圈构成泄密
11 月 5 日消息,国家安全部今日发布三起典型案例,提醒公众警惕利用手机等设备处理敏感信息可能带来的泄处理敏感信息可能带来的泄密风险。案例一某县教体局收到省委一份秘密级文件后,局长批示传达到各学
DeepSeek-OCR技术横空出世:这项AI如何引领科技创新浪潮?
DeepSeek OCR的爆红,本质上是“创新范式”对“传统路径”的突破。它不只是一个更高效的OCR工具,更是AI行业重新思考“信息载体”的起点——当视觉成为连接文本与复杂结构的桥梁,LLM和多模态
【2024最新】DeepSeek-OCR技术突破:重新定义文字识别精准度
DeepSeek 近日发布了DeepSeek-OCR。这不仅仅是一个 OCR 模型,而是一个概念验证,它可能会从根本上改变我们在大型语言模型中对上下文的理解。 DeepSeek 近日发布了DeepS
DeepSeek开源OCR模型:少量视觉token高效压缩文本
10 月 20 日消息,今天上午,DeepSeek-AI 团队发布《DeepSeek-OCR:Contexts Optical Compression》论文,提出利用视觉模态压缩长文本上下文的新方
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
最新文章
