当前位置: 首页
AI
AgentOCR:一个多语言支持、易于使用的 OCR 项目

AgentOCR:一个多语言支持、易于使用的 OCR 项目

热心网友 时间:2025-07-18
转载
AgentOCR 是基于 PaddleOCR 和 ONNXRuntime 开发的 OCR 项目,含 Python 包和标注软件。其 API 与 PPOCR 基本一致,易切换,依赖少、易打包。可通过 pip 安装,需手动装 ONNXRuntime。支持多语言识别,通过配置文件快速切换,调用简单,能输出识别文本及位置、置信度等信息。

agentocr:一个多语言支持、易于使用的 ocr 项目 - 游乐网

引入

AgentOCR 是一个基于 PaddleOCR 和 ONNXRuntime 项目开发的一个使用简单、调用方便的 OCR 项目本项目目前包含 Python Package 【AgentOCR】 和 OCR 标注软件 【AgentOCRLabeling】

项目细节

Github:AgentMaker/AgentOCR使用指南:AgentOCR Package 使用说明

特性

API 基本与 PPOCR Package 保持一致,只需简单改动模型加载代码即可直接切换基于 ONNXRuntime 开发,剔除无用依赖,易于 Python 程序打包

安装

AgentOCR 可直接通过 pip 进行下载安装Package 依赖 ONNXRuntime,不过由于 ONNXRuntime 的版本过多,安装 AgentOCR 不会自动安装该依赖需要根据 ONNX 正式安装提示,手动选择合适的平台版本进行安装In [1]
# 安装 AgentOCR!pip install agentocr# 安装 CPU 版本 ONNXRuntime!pip install onnxruntime# 安装 GPU 版本 ONNXRuntime# !pip install onnxruntime-gpu
登录后复制

使用

支持多语言识别模型,可通过内置的配置文件进行快速切换

中/英文识别

AgentOCR:一个多语言支持、易于使用的 OCR 项目 - 游乐网

In [2]
from agentocr import OCRSystem# 通过 config 参数来进行模型配置,内置多国语言的配置文件ocr = OCRSystem(config='ch')# 设置测试图片路径img_path = 'images/ch.webp'# 调用 OCR API 进行全流程识别result = ocr.ocr(img_path)# 打印结果for line in result:    print(line)
登录后复制
[2024/08/20 17:30:08] root INFO: All available providers: ['CPU'][2024/08/20 17:30:08] root INFO: Using providers: ['CPU'][2024/08/20 17:30:08] root INFO: Using providers: ['CPU'][2024/08/20 17:30:08] root INFO: Using providers: ['CPU'][2024/08/20 17:30:09] root DEBUG: dt_boxes num : 16, elapse : 0.13202476501464844[2024/08/20 17:30:09] root DEBUG: rec_res num  : 16, elapse : 0.590078592300415[[[26.0, 37.0], [301.0, 39.0], [301.0, 72.0], [25.0, 70.0]], ['纯臻营养护发素', 0.9713771]][[[27.0, 82.0], [172.0, 82.0], [172.0, 103.0], [27.0, 103.0]], ['产品信息/参数', 0.99220806]][[[28.0, 113.0], [330.0, 113.0], [330.0, 133.0], [28.0, 133.0]], ['45元/每公斤,100公斤起订)', 0.961909]][[[25.0, 143.0], [283.0, 144.0], [283.0, 164.0], [25.0, 163.0]], ['每瓶22元,1000瓶起订)', 0.99086225]][[[24.0, 177.0], [301.0, 176.0], [301.0, 195.0], [24.0, 196.0]], ['【品牌】:代加工方式/OEMODM', 0.9834662]][[[26.0, 210.0], [232.0, 210.0], [232.0, 227.0], [26.0, 227.0]], ['【品名】:纯臻营养护发素', 0.9786148]][[[24.0, 239.0], [241.0, 237.0], [241.0, 257.0], [25.0, 259.0]], ['【产品编号】:YM-X-3011', 0.98218465]][[[415.0, 241.0], [429.0, 241.0], [429.0, 300.0], [415.0, 300.0]], ['DMOEM', 0.88782406]][[[25.0, 272.0], [180.0, 270.0], [180.0, 288.0], [25.0, 289.0]], ['【净含量】:220ml', 0.9954411]][[[26.0, 304.0], [251.0, 304.0], [251.0, 320.0], [26.0, 320.0]], ['【适用人群】:适合所有肤质', 0.9606319]][[[25.0, 334.0], [342.0, 335.0], [342.0, 352.0], [25.0, 351.0]], ['【主要成分】:鲸蜡硬脂醇、燕麦-葡聚', 0.9720796]][[[27.0, 367.0], [279.0, 367.0], [279.0, 381.0], [27.0, 381.0]], ['糖、椰油xian胺内基甜菜碱、泛醇', 0.8544037]][[[368.0, 370.0], [474.0, 370.0], [474.0, 384.0], [368.0, 384.0]], ['(成品包材)', 0.9908909]][[[27.0, 398.0], [360.0, 398.0], [360.0, 412.0], [27.0, 412.0]], ['(主要功能】:可紧致头发磷层,从而达到', 0.9463466]][[[28.0, 431.0], [369.0, 431.0], [369.0, 444.0], [28.0, 444.0]], ['即时持久改善头发光泽的效果,给十燥的头', 0.94709635]][[[28.0, 460.0], [135.0, 460.0], [135.0, 477.0], [28.0, 477.0]], ['发足够的滋养', 0.99771744]]
登录后复制

英文识别

AgentOCR:一个多语言支持、易于使用的 OCR 项目 - 游乐网

In [3]
from agentocr import OCRSystem# 通过 config 参数来进行模型配置,内置多国语言的配置文件ocr = OCRSystem(config='en')# 设置测试图片路径img_path = 'images/en.webp'# 调用 OCR API 进行全流程识别result = ocr.ocr(img_path)# 打印结果for line in result:    print(line)
登录后复制
[2024/08/20 17:30:13] root INFO: All available providers: ['CPU'][2024/08/20 17:30:13] root INFO: Using providers: ['CPU'][2024/08/20 17:30:13] root INFO: Using providers: ['CPU'][2024/08/20 17:30:13] root INFO: Using providers: ['CPU'][2024/08/20 17:30:13] root DEBUG: dt_boxes num : 3, elapse : 0.030713796615600586[2024/08/20 17:30:13] root DEBUG: rec_res num  : 3, elapse : 0.027882814407348633[[[77.0, 121.0], [268.0, 124.0], [268.0, 164.0], [77.0, 161.0]], ['EPPING', 0.9977331]][[[100.0, 182.0], [247.0, 185.0], [246.0, 206.0], [100.0, 203.0]], ['Twinned with', 0.997261]][[[67.0, 204.0], [275.0, 209.0], [275.0, 231.0], [66.0, 227.0]], ['EppingenGermany', 0.9897056]]
登录后复制

韩文识别

AgentOCR:一个多语言支持、易于使用的 OCR 项目 - 游乐网

In [4]
from agentocr import OCRSystem# 通过 config 参数来进行模型配置,内置多国语言的配置文件ocr = OCRSystem(config='korean')# 设置测试图片路径img_path = 'images/korean.webp'# 调用 OCR API 进行全流程识别result = ocr.ocr(img_path)# 打印结果for line in result:    print(line)
登录后复制
[2024/08/20 17:30:16] root INFO: All available providers: ['CPU'][2024/08/20 17:30:16] root INFO: Using providers: ['CPU'][2024/08/20 17:30:16] root INFO: Using providers: ['CPU'][2024/08/20 17:30:16] root INFO: Using providers: ['CPU'][2024/08/20 17:30:17] root DEBUG: dt_boxes num : 5, elapse : 0.3222081661224365[2024/08/20 17:30:17] root DEBUG: rec_res num  : 5, elapse : 0.06328773498535156[[[400.0, 518.0], [502.0, 513.0], [504.0, 550.0], [402.0, 555.0]], ['오야야', 0.758096]][[[156.0, 576.0], [760.0, 559.0], [761.0, 594.0], [157.0, 610.0]], ['내가간차좋아하는사양이성서서호과공증', 0.60792387]][[[203.0, 636.0], [718.0, 625.0], [718.0, 662.0], [203.0, 672.0]], ['않다가죽어어킬것만갈하서어기를한다', 0.7302016]][[[178.0, 691.0], [709.0, 683.0], [709.0, 717.0], [178.0, 724.0]], ['눈앞에아른아른거리는잘생긴열굴가푸', 0.6773213]][[[225.0, 739.0], [658.0, 738.0], [658.0, 770.0], [225.0, 771.0]], ['귀에명도는 그의촉촉한 옥소리예', 0.8373457]]
登录后复制
来源:https://www.php.cn/faq/1413679.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
极豆科技携手银联等四方 全球首秀车载智能体“一句话下单”支付场景

极豆科技携手银联等四方 全球首秀车载智能体“一句话下单”支付场景

中国银联近日在上海正式推出《智能体支付开放协议框架》(Agentic Payment Open Protocol,简称APOP框架),并顺利完成首批生产系统验证交易。这一框架的发布标志着智能支付领域

时间:2026-04-07 09:13
极豆科技携手银联等四方 全球首发车载智能体支付场景新体验

极豆科技携手银联等四方 全球首发车载智能体支付场景新体验

4月2日,中国银联在上海正式推出《智能体支付开放协议框架》(Agentic Payment Open Protocol,简称APOP框架),并顺利完成首批生产环境下的系统验证交易。这一创新协议旨在推

时间:2026-04-07 09:07
全新揽巡震撼上市,智驾安全双在线,七重礼遇助力开启精彩旅程

全新揽巡震撼上市,智驾安全双在线,七重礼遇助力开启精彩旅程

一汽-大众近日推出全新揽巡SUV,以“硬核澎湃大五座”定位强势进军市场,最新指导价24 69万元起。这款车型专为追求自由、注重品质且不愿妥协的新生活“探险家”打造,通过力量感与未来感融合的设计语言、

时间:2026-04-07 09:01
OpenClaw如何自定义SKILL

OpenClaw如何自定义SKILL

1 Skills机制概述 提起OpenClaw的Skills机制,不少人可能会把它想象成传统意义上的可执行插件。其实,它的内涵要更精妙一些。 简单说,Skills本质上是一套基于提示驱动的能力扩展机制。它并不是一个可以独立“跑”起来的程序模块,而是通过一份结构化描述文件(核心就是那个SKILL m

时间:2026-04-07 08:53
OpenClaw 是什么?OpenClaw 详细使用教程及中转 API 优缺点

OpenClaw 是什么?OpenClaw 详细使用教程及中转 API 优缺点

OpenClaw 是什么?OpenClaw 详细使用教程及中转 API 优缺点分析 最近,圈子里的讨论热度明显聚焦在一个词上:OpenClaw。无论是开发者,还是正在推进AI项目的团队,都在打听它。这工具到底是什么?能解决什么问题?配上那些中转Token,真的就高枕无忧了吗?今天,我们就来把这事儿掰

时间:2026-04-07 08:02
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程