这款工具专门为需要耗费大量时间校对PDF文件内容的人而设计,它能够高效地比对不同PDF文件之间的差异。通过此工具生成的比对结果,可以迅速识别PDF文件之间的像素和文字差异。
对比结果样例:
工具会根据两份PDF像素差异而生成对比结果,其中包含四张图片。上方两张图片中红色遮罩表示对应区域有像素差异。为了让差异更加清晰,同时提供下方两张图片,如果左下图片为纯白或右下图片为纯黑则代表两份PDF没有差异。
工具会将PDF中所有能够识别到的文字使用带颜色的遮罩进行标识,其中不同颜色有不同的含义。
- 绿色:该字未改变
- 橙色:该字字号、字色改变
- 红色:该字为增改字。
请按照以下步骤操作:
- 克隆GitHub存储库: 使用以下命令克隆存储库:
git clone https://github.com/VintLin/pdf-comparator.git
- 设置Python环境: 打开“pdf-comparator”项目目录,确保您具有3.8或更高版本的Python环境。您可以使用以下命令创建并激活此环境,将“venv”替换为您喜欢的环境名称:
cd pdf-comparator
python3 -m venv venv
- 安装依赖项: 通过运行以下命令安装所需的依赖项:
pip3 install -r requirements.txt
- 直接运行代码: 通过运行以下命令对比PDF文件:
python3 -m pdfcomparator "/compare_file_1.pdf" "/compare_file_2.pdf" "/result_folder/"
- 构建可执行文件: 你也可以根据需要通过cx-Freeze构建可执行文件 (执行成功后可以在“/build/”找到可执行文件):
python3 setup.py build
- 运行可执行文件: 通过运行以下命令比对PDF文件:
../pdfcomparator.exe "/compare_file_1.pdf" "/compare_file_2.pdf" "/result_folder/"
这个程序接受以下命令行参数:
-
file1
(必需):输入文件1的路径。请提供您要比较的第一个文件的路径。 -
file2
(必需):输入文件2的路径。请提供您要比较的第二个文件的路径。 -
output_folder
(必需):输出文件夹的路径。比较结果将会被保存在这个文件夹中。 -
--cache
或-c
:可选参数,用于指定缓存路径。如果指定了缓存路径,程序将会使用缓存来加速比较过程。默认情况下不启用缓存。
以下是一些使用示例:
# 执行比较
python3 -m pdfcomparator file1.pdf file2.pdf output_folder/
# 执行比较,并启用缓存
python3 -m pdfcomparator file1.pdf file2.pdf output_folder/ --cache /path/to/cache
使用contrib.rocks制作。
- 源代码许可证:我们的项目源代码根据MIT许可证授权。该许可证允许使用、修改和分发代码,但受到MIT许可证中概述的某些条件的限制。
- 项目开源状态:该项目确实是开源的,但主要用于非商业目的。虽然我们鼓励社区合作和贡献,用于商业目的的项目组件的任何使用都需要单独的许可协议。
如果您有任何问题、反馈或想与我们联系,请随时通过电子邮件vintonlin@gmail.com与我们联系。