PaddleOCR 数据标注

发表于2025-08-27|更新于2025-09-24|PaddleOCR 数据标注

|总字数:547|阅读时长:1分钟|浏览量:

PaddleOCR 数据标注

概述

PaddleOCR 训练数据标注

先说一下我的环境：

cuda 12.6 cudnn 8.9.7 GPU 4070ti

详细步骤

步骤一：安装cuda cudnn 英伟达软件包

这个网上已经有太多教程了这里就不再赘述了

步骤二：安装anaconda

没啥好说的，官网下载一直下一步就行了

步骤三：安装paddlepaddle

打开anaconda 新建环境

1	conda create -n paddle_ocr3.02 python=3.12

2. 创建环境后激活环境

1	activate paddle_ocr3.02

安装paddlepaddle 我们根据官方给的安装步骤来
1. PaddleOCR/readme/README_cn.md at main · PaddlePaddle/PaddleOCR · GitHub
2. 开始使用_飞桨-源于产业实践的开源深度学习平台
  我们从github的页面上可以找到安装文档
  
  复制安装指令

1 2	python -m pip install paddlepaddle-gpu==3.1.1 -i https://www.paddlepaddle.org.cn/packages/stable/cu126/

这一步下载会非常慢推荐挂梯子

步骤三：安装ppocrlabel

打开ppocrlabel github页面GitHub - PFCCLab/PPOCRLabel: PPOCRLabelv2 is a semi-automatic graphic annotation tool suitable for OCR field, with built-in PP-OCR model to automatically detect and re-recognize data.
根据文档来，因为我们已经安装了paddlepaddle 可以省略1.1 直接1.2：
安装ppocrlabel 这里用清华源

1	pip install PPOCRLabel -i https://pypi.tuna.tsinghua.edu.cn/simple

步骤三：安装完之后并不能启动，往往运行启动没反应

可以运行试一下是没反应的。但是实际上后台在运行，因为它需要下载各种模型

但没有打印日志给我们看

我们把ppocrlabel源码下载下来

1	cd E:\PaddleOCR\PPOCRLabel-3.1.2

然后运行他的PPOCRLabel.py 文件就能看到运行进程

1	python PPOCRLabel.py

这样运行就可以看到他后台在下载各种各样的模型，并且往往因为下载速度慢报错。这里同样要挂梯子下载

下载完再次运行会有文件检查速度也很慢，但要等一等

再之后就可以直接输入 ppocrlabel 运行软件了。不过很有可能会卡住，因为加载模型也很慢

大概打开之后这样，然后就是常规的标标标了。牛马开始干活吧

文章作者: 你喔

文章链接: https://upoorcake.cn/PaddleOCR%20%E6%95%B0%E6%8D%AE%E6%A0%87%E6%B3%A8/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源这烦躁的秋天飘在我的头上！

PaddleOCR 数据标注

相关推荐

合成OCR数据

合成OCR数据概述PaddleOCR 进行训练的时候2000张标注数据泛化差，非常容易过拟合。即使增加数据增强也于事无补。因此需要合成数据增加训练数据量。也可以分成两步走，用合成数据进行模型场景迁移。后面再用标注的真实数据进行微调训练。因此数据合成就必不可少了这里使用TextRecognitionDataGenerator进行数据合成原因嘛因为他的github星标比较多。看起来好用一些详细步骤步骤一：使用anaconda 下载TextRecognitionDataGenerator直接安装似乎有点问题我推荐下载源码然后我用的是python3.9 1pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple some-package 即使是这样也是有版本问题修改 requirements.txt 内容因为我安装过了，时间有点久忘记是哪个组件版本有问题...

好无聊，还是写博客吧关于Padd了OCR的训练

好无聊，还是写博客吧关于Padd了OCR的训练概述好久没写了，写一下。上周终于把这个OCR的项目大概是结束了。后面可能还有乱七八糟的根据意见改的环节。但是主体是结束了。记录一下训练的过程：一、环境准备上一篇博客有写到安装标注工具，那时候环境就已经装完了。二、数据准备数据分为两部分：合成数据和真实数据合成数据以真实场景为背景，以真实的目标字符序列规则和相似的字体生成无序的裁切训练图片和标签。详情参照合成数据那篇博客，我大概合成了6W张图作。真实数据比较少，只有9000张，但实际上的目标字符只占2000。真实数据获取参考数据标注那篇文章。三、训练计划多次尝试以官方模型作为预训练模型。直接用真实数据微调训练都是早早过拟合...

评论

数据加载中