File tree Expand file tree Collapse file tree 5 files changed +8
-9
lines changed Expand file tree Collapse file tree 5 files changed +8
-9
lines changed Original file line number Diff line number Diff line change @@ -33,7 +33,7 @@ PaddleOCR 由 [PMC](https://github.com/PaddlePaddle/PaddleOCR/issues/12122) 监
33
33
34
34
- ** 🔥2024.10.1 添加OCR领域低代码全流程开发能力** :
35
35
* 飞桨低代码开发工具PaddleX,依托于PaddleOCR的先进技术,支持了OCR领域的低代码全流程开发能力:
36
- * 🎨 [ ** 模型丰富一键调用** ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/quick_start.html ) :将文本图像智能分析、通用OCR、通用版面解析、通用表格识别、公式识别、印章识别涉及的 ** 17个模型** 整合为6条模型产线,通过极简的** Python API一键调用** ,快速体验模型效果。此外,同一套API,也支持图像分类、目标检测、图像分割、时序预测等共计** 200+模型** ,形成20+单功能模块,方便开发者进行** 模型组合** 使用。
36
+ * 🎨 [ ** 模型丰富一键调用** ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/quick_start.html ) :将文本图像智能分析、通用OCR、通用版面解析、通用表格识别、公式识别、印章文本识别涉及的 ** 17个模型** 整合为6条模型产线,通过极简的** Python API一键调用** ,快速体验模型效果。此外,同一套API,也支持图像分类、目标检测、图像分割、时序预测等共计** 200+模型** ,形成20+单功能模块,方便开发者进行** 模型组合** 使用。
37
37
* 🚀[ ** 提高效率降低门槛** ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.html ) :提供基于** 统一命令** 和** 图形界面** 两种方式,实现模型简洁高效的使用、组合与定制。支持** 高性能推理、服务化部署和端侧部署** 等多种部署方式。此外,对于各种主流硬件如** 英伟达GPU、昆仑芯、昇腾、寒武纪和海光** 等,进行模型开发时,都可以** 无缝切换** 。
38
38
39
39
* 支持文档场景信息抽取v3([PP-ChatOCRv3-doc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/information_extration_pipelines/document_scene_information_extraction.md))、基于RT-DETR的[高精度版面区域检测模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)和PicoDet的[高效率版面区域检测模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)、高精度表格结构识别模型[SLANet_Plus](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/table_structure_recognition.md)、文本图像矫正模型[UVDoc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/text_image_unwarping.md)、公式识别模型[LatexOCR](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/formula_recognition.md)、基于PP-LCNet的[文档图像方向分类模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/doc_img_orientation_classification.md)
Original file line number Diff line number Diff line change @@ -33,7 +33,7 @@ PaddleOCR 由 [PMC](https://github.com/PaddlePaddle/PaddleOCR/issues/12122) 监
33
33
34
34
- ** 🔥2024.10.1 添加OCR领域低代码全流程开发能力** :
35
35
* 飞桨低代码开发工具PaddleX,依托于PaddleOCR的先进技术,支持了OCR领域的低代码全流程开发能力:
36
- * 🎨 [ ** 模型丰富一键调用** ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/quick_start.html ) :将文本图像智能分析、通用OCR、通用版面解析、通用表格识别、公式识别、印章识别涉及的 ** 17个模型** 整合为6条模型产线,通过极简的** Python API一键调用** ,快速体验模型效果。此外,同一套API,也支持图像分类、目标检测、图像分割、时序预测等共计** 200+模型** ,形成20+单功能模块,方便开发者进行** 模型组合** 使用。
36
+ * 🎨 [ ** 模型丰富一键调用** ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/quick_start.html ) :将文本图像智能分析、通用OCR、通用版面解析、通用表格识别、公式识别、印章文本识别涉及的 ** 17个模型** 整合为6条模型产线,通过极简的** Python API一键调用** ,快速体验模型效果。此外,同一套API,也支持图像分类、目标检测、图像分割、时序预测等共计** 200+模型** ,形成20+单功能模块,方便开发者进行** 模型组合** 使用。
37
37
* 🚀[ ** 提高效率降低门槛** ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.html ) :提供基于** 统一命令** 和** 图形界面** 两种方式,实现模型简洁高效的使用、组合与定制。支持** 高性能推理、服务化部署和端侧部署** 等多种部署方式。此外,对于各种主流硬件如** 英伟达GPU、昆仑芯、昇腾、寒武纪和海光** 等,进行模型开发时,都可以** 无缝切换** 。
38
38
39
39
* 支持文档场景信息抽取v3([PP-ChatOCRv3-doc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/information_extration_pipelines/document_scene_information_extraction.md))、基于RT-DETR的[高精度版面区域检测模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)和PicoDet的[高效率版面区域检测模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)、高精度表格结构识别模型[SLANet_Plus](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/table_structure_recognition.md)、文本图像矫正模型[UVDoc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/text_image_unwarping.md)、公式识别模型[LatexOCR](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/formula_recognition.md)、基于PP-LCNet的[文档图像方向分类模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/doc_img_orientation_classification.md)
Original file line number Diff line number Diff line change 3
3
4
4
飞桨低代码开发工具[ PaddleX] ( https://github.com/PaddlePaddle/PaddleX/tree/release/3.0-beta1 ) ,依托于PaddleOCR的先进技术,支持了OCR领域的** 低代码全流程** 开发能力。通过低代码开发,可实现简单且高效的模型使用、组合与定制。这将显著** 减少模型开发的时间消耗** ,** 降低其开发难度** ,大大加快模型在行业中的应用和推广速度。特色如下:
5
5
6
- * 🎨 ** 模型丰富一键调用** :将文本图像智能分析、通用OCR、通用版面解析、通用表格识别、公式识别、印章识别涉及的 ** 17个模型** 整合为6条模型产线,通过极简的** Python API一键调用** ,快速体验模型效果。此外,同一套API,也支持图像分类、目标检测、图像分割、时序预测等共计** 200+模型** ,形成20+单功能模块,方便开发者进行** 模型组合** 使用。
6
+ * 🎨 ** 模型丰富一键调用** :将文本图像智能分析、通用OCR、通用版面解析、通用表格识别、公式识别、印章文本识别涉及的 ** 17个模型** 整合为6条模型产线,通过极简的** Python API一键调用** ,快速体验模型效果。此外,同一套API,也支持图像分类、目标检测、图像分割、时序预测等共计** 200+模型** ,形成20+单功能模块,方便开发者进行** 模型组合** 使用。
7
7
8
8
* 🚀 ** 提高效率降低门槛** :提供基于** 统一命令** 和** 图形界面** 两种方式,实现模型简洁高效的使用、组合与定制。支持** 高性能推理、服务化部署和端侧部署** 等多种部署方式。此外,对于各种主流硬件如** 英伟达GPU、昆仑芯、昇腾、寒武纪和海光** 等,进行模型开发时,都可以** 无缝切换** 。
9
9
@@ -78,7 +78,7 @@ PaddleX中OCR相关的6条产线均支持本地**快速推理**,部分产线
78
78
<td>🚧</td>
79
79
</tr>
80
80
<tr>
81
- <td>印章识别 </td>
81
+ <td>印章文本识别 </td>
82
82
<td>🚧</td>
83
83
<td>✅</td>
84
84
<td>✅</td>
@@ -126,7 +126,7 @@ PaddleX中OCR相关的6条产线均支持本地**快速推理**,部分产线
126
126
- ** 文档场景信息抽取v3产线** : [ 使用教程] ( https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/information_extration_pipelines/document_scene_information_extraction.md )
127
127
- ** 通用版面解析** : [ 使用教程] ( https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/ocr_pipelines/layout_parsing.md )
128
128
- ** 公式识别** : [ 使用教程] ( https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/ocr_pipelines/formula_recognition.md )
129
- - ** 印章识别 ** : [ 使用教程] ( https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/ocr_pipelines/seal_recognition.md )
129
+ - ** 印章文本识别 ** : [ 使用教程] ( https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/ocr_pipelines/seal_recognition.md )
130
130
131
131
132
132
## 4. OCR相关单功能模块列表和教程
Original file line number Diff line number Diff line change @@ -62,7 +62,7 @@ for res in output:
62
62
| 通用表格识别 | ` table_recognition ` | [ 通用表格识别产线Python脚本使用说明] ( https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/ocr_pipelines/table_recognition.md#22-python脚本方式集成 ) |
63
63
| 通用版面解析 | ` layout_parsing ` | [ 通用版面解析产线Python脚本使用说明] ( ./docs/pipeline_usage/tutorials/ocr_pipelines/layout_parsing.md#22-python脚本方式集成 ) |
64
64
| 公式识别 | ` formula_recognition ` | [ 公式识别产线Python脚本使用说明] ( ./docs/pipeline_usage/tutorials/ocr_pipelines/formula_recognition.md#22-python脚本方式集成 ) |
65
- | 印章识别 | ` seal_recognition ` | [ 印章识别产线Python脚本使用说明 ] ( ./docs/pipeline_usage/tutorials/ocr_pipelines/seal_recognition.md#22-python脚本方式集成 ) |
65
+ | 印章文本识别 | ` seal_recognition ` | [ 印章文本识别产线Python脚本使用说明 ] ( ./docs/pipeline_usage/tutorials/ocr_pipelines/seal_recognition.md#22-python脚本方式集成 ) |
66
66
67
67
### 💻 命令行使用
68
68
@@ -102,7 +102,6 @@ paddlex --pipeline OCR --input https://paddle-model-ecology.bj.bcebos.com/paddle
102
102
| 产线名称 | 使用命令 |
103
103
| -----------| --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
104
104
| 通用表格识别 | ` paddlex --pipeline table_recognition --input https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/table_recognition.jpg --device gpu:0 ` |
105
- | 文档场景信息抽取v3 | coming soon |
106
105
| 通用版面解析 | ` paddlex --pipeline layout_parsing --input https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/demo_paper.png --device gpu:0 ` |
107
106
| 公式识别 | ` paddlex --pipeline formula_recognition --input https://paddle-model-ecology.bj.bcebos.com/paddlex/demo_image/general_formula_recognition.png --device gpu:0 ` |
108
- | 印章识别 | ` paddlex --pipeline seal_recognition --input https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/seal_text_det.png --device gpu:0 ` |
107
+ | 印章文本识别 | ` paddlex --pipeline seal_recognition --input https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/seal_text_det.png --device gpu:0 ` |
Original file line number Diff line number Diff line change 9
9
10
10
#### ** 🔥2024.10.1 添加OCR领域低代码全流程开发能力**
11
11
* 飞桨低代码开发工具PaddleX,依托于PaddleOCR的先进技术,支持了OCR领域的低代码全流程开发能力:
12
- * 🎨 [ ** 模型丰富一键调用** ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/quick_start.html ) :将文本图像智能分析、通用OCR、通用版面解析、通用表格识别、公式识别、印章识别涉及的 ** 17个模型** 整合为6条模型产线,通过极简的** Python API一键调用** ,快速体验模型效果。此外,同一套API,也支持图像分类、目标检测、图像分割、时序预测等共计** 200+模型** ,形成20+单功能模块,方便开发者进行** 模型组合** 使用。
12
+ * 🎨 [ ** 模型丰富一键调用** ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/quick_start.html ) :将文本图像智能分析、通用OCR、通用版面解析、通用表格识别、公式识别、印章文本识别涉及的 ** 17个模型** 整合为6条模型产线,通过极简的** Python API一键调用** ,快速体验模型效果。此外,同一套API,也支持图像分类、目标检测、图像分割、时序预测等共计** 200+模型** ,形成20+单功能模块,方便开发者进行** 模型组合** 使用。
13
13
* 🚀[ ** 提高效率降低门槛** ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.html ) :提供基于** 统一命令** 和** 图形界面** 两种方式,实现模型简洁高效的使用、组合与定制。支持** 高性能推理、服务化部署和端侧部署** 等多种部署方式。此外,对于各种主流硬件如** 英伟达GPU、昆仑芯、昇腾、寒武纪和海光** 等,进行模型开发时,都可以** 无缝切换** 。
14
14
15
15
* 支持文档场景信息抽取v3([PP-ChatOCRv3-doc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/information_extration_pipelines/document_scene_information_extraction.md))、基于RT-DETR的[高精度版面区域检测模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)和PicoDet的[高效率版面区域检测模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)、高精度表格结构识别模型[SLANet_Plus](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/table_structure_recognition.md)、文本图像矫正模型[UVDoc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/text_image_unwarping.md)、公式识别模型[LatexOCR](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/formula_recognition.md)、基于PP-LCNet的[文档图像方向分类模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/doc_img_orientation_classification.md)
You can’t perform that action at this time.
0 commit comments