图像文字识别流程介绍【查看ppt介绍】
使用演示【查看文章】
该项目是一个用python实现的截图文字识别的工具,实现流程代码并不多;其包含两个模块,打包模块、应用模块;
打包模块介绍:一键制作安装程序exe流程模块,该模块使用Inno Setup 6实现。(但因为文件上传限制未将该应用相关文件上传)
打包模块流程:1.开发环境commit代码;2.生产环境执行脚本一键打包;(拉取最新代码->执行打包命令->生产工具安装程序exe)3.用户下载安装程序,执行并安装;
应用模块介绍:识别用户截图中的文字,供用户复制粘贴;
应用模块流程:1.用户打开应用;2.选择识别方式(百度api\本地OCR);3.通过应用截取包含文字的图片;4.应用根据选择的方式最图片进行处理;
windows10 Python 3.6.0 pip 20.2.4 svn 1.13.0
altgraph 0.17 baidu-aip 2.2.18.0 certifi 2020.11.8 cffi 1.14.3 chardet 3.0.4 cryptography 3.2.1 cycler 0.10.0 future 0.18.2 idna 2.10 kiwisolver 1.3.1 matplotlib 3.3.2 numpy 1.19.4 opencv-python 4.4.0.46 pefile 2019.4.18 Pillow 8.0.1 pip 20.2.4 pycparser 2.20 pyinstaller 4.0 pyinstaller-hooks-contrib 2020.10 pyparsing 2.4.7 pyperclip 1.8.1 pypiwin32 223 pytesseract 0.3.6 python-dateutil 2.8.1 pywin32 228 pywin32-ctypes 0.2.0 requests 2.25.0 scipy 1.5.4 setuptools 28.8.0 six 1.15.0 tesserocr 2.4.0 urllib3 1.26.2 win32core 221.36 win32gui 221.6
Inno Setup 6.1.2 tesseract v5.0.0-alpha.20200328
+---Inno Setup 6 :打包应用目录
| +---ISCC.exe :主程序
+---log :打包日志输出目录
+---src :源码目录
| +---build :编译目录
| +---dist :exe生成目录
| +---pytesseract :修改后的python模块
| +---setup :安装包生成目录
| | +---keyi-rtis-setup.exe :安装包
| +---Tesseract-OCR :OCR应用目录
| | +---tessdata :语言数据文件
| | +---tesseract.exe :主程序
| +---config.ini :百度OCR配置文件
| +---logo.ico :logo图片
| +---noteshrink.py :图像中间处理
| +---screen_ocr.py :程序执行目录
+---config.ini :百度OCR配置文件
+---installer.bat :打包脚本
+---KEYI-RTIS.iss :Inno打包应用配置脚本
+---setup.bat :打包脚本启动
+---start-svnserver.bat :svn server启动脚本
- 运行start-svnserver.bat脚本启动svn服务器
- 开发提交更新代码
- 运行setup.bat脚本执行打包过程,等待打包完成
- 打包成功,通知开发
- 开发拉取安装程序src\setup\keyi-rtis-setup.exe
- 运行安装程序生产测试生产安装包
- 更新源码文件src
- 删除上次打包文件目录dist\KEYI-RTIS
- 执行exe打包命令pyinstaller
- 删除上次安装包
- 运行iscc执行KEYI-RTIS.iss脚本文件
- 提交打包好的安装包keyi-rtis-setup.exe
打包工具:https://www.pyinstaller.org
Tesseract应用文档:https://tesseract-ocr.github.io
窗口程序文档:https://www.runoob.com/python/python-gui-tkinter.html
Opencv文档:https://docs.opencv.org/master/d6/d00/tutorial_py_root.html
https://www.mayi888.com/archives/60604
https://www.python-course.eu/tkinter_canvas.php
百度通用文字识别:https://ai.baidu.com/tech/ocr/general(找到快速学习文档)
innosetup应用下载:https://mlaan2.home.xs4all.nl/ispack/innosetup-6.1.2.exe
tesseract-ocr下载:https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-v5.0.0-alpha.20200328.exe
tessdata下载:https://codeload.github.com/tesseract-ocr/tessdata/zip/master
-
将"发布环境"目录放到E:\repos下
-
下载Tesseract-ocr安装程序,安装之后将应用目录"Tesseract-OCR"放到src目录下
-
下载innosetup安装程序,安装之后将应用目录放到"发布环境"目录下
-
pip install pyinstaller
-
pip install baidu-aip
-
进入src目录执行screen_ocr.py(python screen_ocr.py),如果报缺少模块,则按照提示安装模块
例如:
PIL=>pip install Pillow
pip install pyperclip
win32*=>pip install pypiwin32
-
成功执行screen_ocr.py之后,开始测试打包,进入"发布环境"目录执行setup.bat,执行失败检查以上步骤(报"xxx路径不存在"错误可忽略)
-
安装svn
-
在reops下创建keyi-rtis目录
-
在keyi-rtis下右键将建库
-
在src目录下checkout