English | 简体中文
PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力使用者训练出更好的模型,并应用落地。
PaddleOCR同时支持动态图与静态图两种编程范式
近期更新
上图是通用ppocr_server模型效果展示,更多效果图请见效果展示页面。
PC端:超轻量级中文OCR在线体验地址:https://www.paddlepaddle.org.cn/hub/scene/ocr
移动端:安装包DEMO下载地址(基于EasyEdge和Paddle-Lite, 支持iOS和Android系统),Android手机也可以直接扫描下面二维码安装体验。
说明 :2.0版模型和1.1版模型的主要区别在于动态图训练vs.静态图训练,模型性能上无明显差距。 | 模型简介 | 模型名称 |推荐场景 | 检测模型 | 方向分类器 | 识别模型 | | ------------ | --------------- | ----------------|---- | ---------- | -------- | | 中英文超轻量OCR模型(9.4M) | ch_ppocr_mobile_v2.0_xx |移动端&服务器端|推理模型 / 预训练模型|推理模型 / 预训练模型 |推理模型 / 预训练模型 | | 中英文通用OCR模型(143.4M) |ch_ppocr_server_v2.0_xx|服务器端 |推理模型 / 预训练模型 |推理模型 / 预训练模型 |推理模型 / 预训练模型 |
更多模型下载(包括多语言),可以参考PP-OCR v2.0 系列模型下载
PP-OCR是一个实用的超轻量OCR系统。主要由DB文本检测[2]、检测框矫正和CRNN文本识别三部分组成[7]。该系统从骨干网络选择和调整、预测头部的设计、数据增强、学习率变换策略、正则化参数选择、预训练模型使用以及模型自动裁剪量化8个方面,采用19个有效策略,对各个模块的模型进行效果调优和瘦身,最终得到整体大小为3.5M的超轻量中英文OCR和2.8M的英文数字OCR。更多细节请参考PP-OCR技术方案 https://arxiv.org/abs/2009.09941 。其中FPGM裁剪器[8]和PACT量化[9]的实现可以参考PaddleSlim。
中文模型
英文模型
其他语言模型
本项目的发布受Apache 2.0 license许可认证。
我们非常欢迎你为PaddleOCR贡献代码,也十分感谢你的反馈。