AgentOCR:一个多语言支持、易于使用的 OCR 项目
AgentOCR 是基于 PaddleOCR 和 ONNXRuntime 开发的 OCR 项目,含 Python 包和标注软件。其 API 与 PPOCR 基本一致,易切换,依赖少
AgentOCR 是基于 PaddleOCR 和 ONNXRuntime 开发的 OCR 项目,含 Python 包和标注软件。其 API 与 PPOCR 基本一致,易切换,依赖少、易打包。可通过 pip 安装,需手动装 ONNXRuntime。支持多语言识别,通过配置文件快速切换,调用简单,能输出识别文本及位置、置信度等信息。

引入
AgentOCR 是一个基于 PaddleOCR 和 ONNXRuntime 项目开发的一个使用简单、调用方便的 OCR 项目本项目目前包含 Python Package 【AgentOCR】 和 OCR 标注软件 【AgentOCRLabeling】项目细节
Github:AgentMaker/AgentOCR使用指南:AgentOCR Package 使用说明特性
API 基本与 PPOCR Package 保持一致,只需简单改动模型加载代码即可直接切换基于 ONNXRuntime 开发,剔除无用依赖,易于 Python 程序打包安装
AgentOCR 可直接通过 pip 进行下载安装Package 依赖 ONNXRuntime,不过由于 ONNXRuntime 的版本过多,安装 AgentOCR 不会自动安装该依赖需要根据 ONNX 正式安装提示,手动选择合适的平台版本进行安装In [1]# 安装 AgentOCR!pip install agentocr# 安装 CPU 版本 ONNXRuntime!pip install onnxruntime# 安装 GPU 版本 ONNXRuntime# !pip install onnxruntime-gpu登录后复制
使用
支持多语言识别模型,可通过内置的配置文件进行快速切换中/英文识别

from agentocr import OCRSystem# 通过 config 参数来进行模型配置,内置多国语言的配置文件ocr = OCRSystem(config='ch')# 设置测试图片路径img_path = 'images/ch.webp'# 调用 OCR API 进行全流程识别result = ocr.ocr(img_path)# 打印结果for line in result: print(line)登录后复制
[2024/08/20 17:30:08] root INFO: All available providers: ['CPU'][2024/08/20 17:30:08] root INFO: Using providers: ['CPU'][2024/08/20 17:30:08] root INFO: Using providers: ['CPU'][2024/08/20 17:30:08] root INFO: Using providers: ['CPU'][2024/08/20 17:30:09] root DEBUG: dt_boxes num : 16, elapse : 0.13202476501464844[2024/08/20 17:30:09] root DEBUG: rec_res num : 16, elapse : 0.590078592300415[[[26.0, 37.0], [301.0, 39.0], [301.0, 72.0], [25.0, 70.0]], ['纯臻营养护发素', 0.9713771]][[[27.0, 82.0], [172.0, 82.0], [172.0, 103.0], [27.0, 103.0]], ['产品信息/参数', 0.99220806]][[[28.0, 113.0], [330.0, 113.0], [330.0, 133.0], [28.0, 133.0]], ['45元/每公斤,100公斤起订)', 0.961909]][[[25.0, 143.0], [283.0, 144.0], [283.0, 164.0], [25.0, 163.0]], ['每瓶22元,1000瓶起订)', 0.99086225]][[[24.0, 177.0], [301.0, 176.0], [301.0, 195.0], [24.0, 196.0]], ['【品牌】:代加工方式/OEMODM', 0.9834662]][[[26.0, 210.0], [232.0, 210.0], [232.0, 227.0], [26.0, 227.0]], ['【品名】:纯臻营养护发素', 0.9786148]][[[24.0, 239.0], [241.0, 237.0], [241.0, 257.0], [25.0, 259.0]], ['【产品编号】:YM-X-3011', 0.98218465]][[[415.0, 241.0], [429.0, 241.0], [429.0, 300.0], [415.0, 300.0]], ['DMOEM', 0.88782406]][[[25.0, 272.0], [180.0, 270.0], [180.0, 288.0], [25.0, 289.0]], ['【净含量】:220ml', 0.9954411]][[[26.0, 304.0], [251.0, 304.0], [251.0, 320.0], [26.0, 320.0]], ['【适用人群】:适合所有肤质', 0.9606319]][[[25.0, 334.0], [342.0, 335.0], [342.0, 352.0], [25.0, 351.0]], ['【主要成分】:鲸蜡硬脂醇、燕麦-葡聚', 0.9720796]][[[27.0, 367.0], [279.0, 367.0], [279.0, 381.0], [27.0, 381.0]], ['糖、椰油xian胺内基甜菜碱、泛醇', 0.8544037]][[[368.0, 370.0], [474.0, 370.0], [474.0, 384.0], [368.0, 384.0]], ['(成品包材)', 0.9908909]][[[27.0, 398.0], [360.0, 398.0], [360.0, 412.0], [27.0, 412.0]], ['(主要功能】:可紧致头发磷层,从而达到', 0.9463466]][[[28.0, 431.0], [369.0, 431.0], [369.0, 444.0], [28.0, 444.0]], ['即时持久改善头发光泽的效果,给十燥的头', 0.94709635]][[[28.0, 460.0], [135.0, 460.0], [135.0, 477.0], [28.0, 477.0]], ['发足够的滋养', 0.99771744]]登录后复制
英文识别

from agentocr import OCRSystem# 通过 config 参数来进行模型配置,内置多国语言的配置文件ocr = OCRSystem(config='en')# 设置测试图片路径img_path = 'images/en.webp'# 调用 OCR API 进行全流程识别result = ocr.ocr(img_path)# 打印结果for line in result: print(line)登录后复制
[2024/08/20 17:30:13] root INFO: All available providers: ['CPU'][2024/08/20 17:30:13] root INFO: Using providers: ['CPU'][2024/08/20 17:30:13] root INFO: Using providers: ['CPU'][2024/08/20 17:30:13] root INFO: Using providers: ['CPU'][2024/08/20 17:30:13] root DEBUG: dt_boxes num : 3, elapse : 0.030713796615600586[2024/08/20 17:30:13] root DEBUG: rec_res num : 3, elapse : 0.027882814407348633[[[77.0, 121.0], [268.0, 124.0], [268.0, 164.0], [77.0, 161.0]], ['EPPING', 0.9977331]][[[100.0, 182.0], [247.0, 185.0], [246.0, 206.0], [100.0, 203.0]], ['Twinned with', 0.997261]][[[67.0, 204.0], [275.0, 209.0], [275.0, 231.0], [66.0, 227.0]], ['EppingenGermany', 0.9897056]]登录后复制
韩文识别

from agentocr import OCRSystem# 通过 config 参数来进行模型配置,内置多国语言的配置文件ocr = OCRSystem(config='korean')# 设置测试图片路径img_path = 'images/korean.webp'# 调用 OCR API 进行全流程识别result = ocr.ocr(img_path)# 打印结果for line in result: print(line)登录后复制
[2024/08/20 17:30:16] root INFO: All available providers: ['CPU'][2024/08/20 17:30:16] root INFO: Using providers: ['CPU'][2024/08/20 17:30:16] root INFO: Using providers: ['CPU'][2024/08/20 17:30:16] root INFO: Using providers: ['CPU'][2024/08/20 17:30:17] root DEBUG: dt_boxes num : 5, elapse : 0.3222081661224365[2024/08/20 17:30:17] root DEBUG: rec_res num : 5, elapse : 0.06328773498535156[[[400.0, 518.0], [502.0, 513.0], [504.0, 550.0], [402.0, 555.0]], ['오야야', 0.758096]][[[156.0, 576.0], [760.0, 559.0], [761.0, 594.0], [157.0, 610.0]], ['내가간차좋아하는사양이성서서호과공증', 0.60792387]][[[203.0, 636.0], [718.0, 625.0], [718.0, 662.0], [203.0, 672.0]], ['않다가죽어어킬것만갈하서어기를한다', 0.7302016]][[[178.0, 691.0], [709.0, 683.0], [709.0, 717.0], [178.0, 724.0]], ['눈앞에아른아른거리는잘생긴열굴가푸', 0.6773213]][[[225.0, 739.0], [658.0, 738.0], [658.0, 770.0], [225.0, 771.0]], ['귀에명도는 그의촉촉한 옥소리예', 0.8373457]]登录后复制
热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:AgentOCR:一个多语言支持、易于使用的 OCR 项目要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点AI热点2026-07-04 19:00
Daetama数据科学完整准备工作系统指南与精选学习资源汇总
Daetama是面向数据科学面试和SQL能力提升的练习平台,已收录超100个覆盖基础到进阶的SQL题目,求职板块与课程模块在开发中,团队保持每周更新节奏,提供系统性刷题与模拟面试场景。
AI热点2026-07-04 19:00
AI驱动配音平台 Speakmulti
SpeakMulti是一款AI驱动的配音平台,可将YouTube视频翻译成多种语言,保留原始说话者的音色和语调,降低本地化成本。用户提交视频并选择目标语言后,AI自动完成配音,并由专家团队审核,确保准确自然。
AI热点2026-07-04 18:59
Umi-OCR图片转文字识别软件
需求人群 如果你经常需要从图片中提取文字——例如整理截图内容、翻译图片里的外语文本、识别带有水印的图片信息——那么 Umi-OCR 无疑是一款相当实用的工具。它完全在本地运行,无需联网,对隐私保护极为友好。 产品特色 这款工具的核心亮点都集中在实用性上。截屏识别操作非常顺手,按下快捷键即可框选区域,
AI热点2026-07-04 18:59
用AI生成你最爱的画家或艺术运动风格绘画
艺术创作与人工智能的融合,正在开启一个全新的创作时代。moonlightai 正是这样一款AI绘画工具,能够帮助用户通过人工智能快速生成不同风格的绘画作品——无论你想复刻文艺复兴时期的古典优雅,还是为画作注入梵高般炽热的笔触,甚至从艾沃佐夫斯基的海浪星空中汲取灵感,它都能轻松实现。 需求人群 简单来
- 日榜
- 周榜
- 月榜
热点快看
