Github标星3400+！3.5M超超轻量中英文OCR模型开源，火了！

先看下飞桨文字识别套件 PaddleOCR 自今年年中开源以来，短短几个月在 GitHub 上的表现：

7月，8.6M 超轻量模型发布，GitHub Trending 全球日榜榜单第一！8月，开源 CVPR 2020顶会 SOTA 算法，再上 GitHub 趋势榜单！9月，GitHub Star 数量已超过 3.4K，近期又带来哪些重磅更新？

果然，看9月最新更新，PaddleOCR 再次诚意满满为大家带来真干货，直接看官方介绍：

数量上，这次 PaddleOCR 一口气发布了三个系列模型，满足移动端、服务器端各种场景需求。而且，多语言也妥妥安排上了，全部训练代码和模型毫无保留开源。其中 3.5M 超轻量文字识别模型，堪称目前业界开源的最轻量 OCR 模型了。

质量上，如此轻量的模型，效果有保障吗？不看广告，直接看疗效。

先看几个常见的通用场景识别效果：

3.5M 的模型能达到这个识别精度，绝对是良心之作了！

传送门：

github.com/PaddlePaddle/PaddleOCR

论文下载链接：

arxiv.org/abs/2009.09941

快速体验 PaddleOCR 的3.5M 超轻量 OCR 模型

PC 端快速尝试：（打开网页，选一张图片，即可实时看到结果）

www.paddlepaddle.org.cn/hub/scene/ocr

手机端 App 安装体验

PaddleOCR 在百度大脑 EasyEdge 上开放了文字识别 APP demo。

示例效果如下（可以在 github 首页找到下载二维码）：

多个开源 repo 测试对比

简单对比一下目前主流 OCR 方向开源 repo 的核心能力：

从性能指标来看：

针对 OCR 实际应用场景，包括合同、车牌、铭牌、火车票、化验单、表格，证书，街景文字，名片，数码显示屏等，收集的300张图像，每张图平均有17个文本框，PaddleOCR 的 F1-Score 超过0.5，这个性能已经很不错了。

从功能完备来看：

预训练模型大小：EasyOCR 目前暂无超轻量模型，chineseocr_lite 最新的模型是 4.7M 左右，而 PaddleOCR 提供的 3.5M 无疑是目前业界已知最轻量的。PIP 安装：目前仅 PaddleOCR 和 EasyOCR 支持。自定义训练：实际业务场景中，预训练模型往往不能满足需求，对于自定义训练和模型 Finetuning，目前只有 PaddleOCR 支持。部署方面：EasyOCR 模型较大不适合端侧部署，Chineseocr_lite 和 PaddleOCR 都具备端侧部署能力。

开发者可以根据自己的实际需求，选择适合自己的开源方案。

对于 PaddleOCR 3.5MB 的超轻量模型，是如何做到的，repo 中也给出了解释。

3.5M 超轻量模型应用了一套超轻量 OCR 系统 PP-OCR，主要由DB 文本检测、检测框矫正和 CRNN 文本识别三部分组成。该系统从骨干网络选择和调整、预测头部的设计、数据增强、学习率变换策略、正则化参数选择、预训练模型使用以及模型自动裁剪量化8个方面，采用19个有效策略，对各个模块的模型进行效果调优和瘦身。

其中，飞桨模型压缩库 PaddleSlim 为 PaddleOCR 超轻量化模型的实现提供了核心的技术支撑。从超轻量模型 8.1M 的压缩到 3.5M，模型大小降低了56.79%，其中检测模型速度提升21%，而且整体模型精度还有一定提升。

除了 3.5M 超轻量 OCR 模型，PaddleOCR 提供了多语言预训练模型（英、德、法、韩、日），支持自定义训练和丰富的部署方式。

招募活动预告

9月26日，飞桨将举办 OCR 方向的线下沙龙活动，欢迎北京 OCR 方向的开发者们，我们相聚中关村。

更多飞桨的相关内容，请参阅以下文档。

官网地址

www.paddlepaddle.org.cn飞桨 PaddleOCR 项目地址

GitHub: github.com/PaddlePaddle/PaddleOCR Gitee: gitee.com/paddlepaddle/PaddleOCR

飞桨 PaddleSlim 项目地址

GitHub: github.com/PaddlePaddle/PaddleSlim Gitee: gitee.com/paddlepaddle/PaddleSlim

PP-OCR 技术文章

arxiv.org/abs/2009.09941

也可以点击加入交流群。

ks.wjx.top/jq/92105169.aspx?udsid=256588

Github标星3400+！3.5M超超轻量中英文OCR模型开源，火了！

热门新闻

周热门

Github标星3400+！3.5M超超轻量中英文OCR模型开源，火了！

禾赛科技李一帆：激光雷达应该是商品，不能卖一台亏一台｜36氪专访

推行动物实验替代计划，临床前CRO巨头的“阳谋”

人工智能在教育中的43种用途

何为数据化运营？

酒店新零售和酒店机器人……

小米汽车将推出纯电SUV，同时规划更低价车型｜独家

AI搞砸工作谁“抗雷”

8点1氪丨斗鱼主播小团团被捕，或面临3至5年刑期；于东来称去年计划挣2000万结果赚了1.4亿；苹果将于5月7日举行发布会

应避免的八个数据战略错误

从张文宏，聊聊普通人的逆袭之路

医疗健康行业周报 | 「中科新生命」获数亿元C轮融资；「联影智元」打造医疗领域“App Store”

中国拿什么重现“互联网三十年”

打造高效生产：解码按订单与按库存生产的优势及策略

8点1氪丨钟薛高创始人称卖红薯也要还债；华为智界S7：用小米SU7订单可减5000元；12306称任何加速包都不能优先购票

资本市场全方位支持科技创新

热门新闻

周热门