- 2024-05-22 通知:估计CSDN加入了反爬虫机制,代码已无法请求CSDN网页,因此本项目已凉~
CSDN 博客导出工具, 用于将 CSDN 博客导出为 Markdown / PDF 格式. 比较赞的地方在于, 它 不仅支持一篇博文的导出, 还支持将某个类目下的博文批量导出, 以及将导出的多篇博文汇总为 一篇, 以便用于全局搜索, 具体效果可以查看 导出 CSDN 博客至 Markdown 或 PDF 格式 (近乎完美).
另外要说明的是:
-
安装必要的 Python 库, 如
httpx
,requests
,BeautifulSoup
, 直接运行pip install -r requirements.txt
即可;- 2024-04-24 更新:
BeautifulSoup
升级为beautifulsoup4
,已在 Ubuntu 和 Windows 系统测试过没啥问题;
- 2024-04-24 更新:
-
为了解析图片链接, 需要安装 aria2, 并保证能在命令行启动;
- 将软件的安装目录加入到环境变量中即可, 加入后最好重启或刷新终端, 如 Bash、Zsh、Terminal、Powershell 等等,如果运行命令
aria2c --verison
不报错,说明成功;
- 将软件的安装目录加入到环境变量中即可, 加入后最好重启或刷新终端, 如 Bash、Zsh、Terminal、Powershell 等等,如果运行命令
-
为了转换为 PDF, 需要安装 Pandoc
- 有同学反映转换 pdf 时,遇到 pandoc 的报错
pandoc: unrecognized option '--pdf-engine=xelatex'
, 因此还需要安装 xelatex, 具体查阅下 pandoc 的安装说明吧。- Ubuntu 上可以使用
sudo apt-get install texlive-xetex
+sudo apt install latex-cjk-all
安装 texlive 相关的内容 (注意 LaTeX Error: File `ctex.sty' not found ) - Pandoc 使用
sudo apt-get install pandoc
安装 - 代码中使用了 'Source Code Pro' 字体,是我个人很喜欢的编程字体,可以参考 Source Code Pro Font 中 edwin 的回答,从 Google Font 获取该字体,并按回答中的方法安装到系统中。当然,如果不想使用该字体,只需要将
main.py
中关于 'Source Code Pro' 的两行代码给注释掉即可。
- Ubuntu 上可以使用
- 有同学反映转换 pdf 时,遇到 pandoc 的报错
此外, 正如博客标题 导出 CSDN 博客至 Markdown 或 PDF 格式 (近乎完美) 中说的, "近乎完美", 是因为该博客导出工具还有一些细节没有考虑, 没有需求就没有动力去改代码, 精力有限, 目前该工具让我满意 😂😂😂.
- Linux系统运行
启动脚本为
./run.sh
, 使用chmod +x run.sh
增加其可执行权限; - Windows系统启动
启动脚本为
run.bat
, 双击打开或者在cmd中运行run.bat
- 2024-04-26: 增加对表格解析的支持
- 2024-04-25: 修复 Windows 下使用绝对路径报错的问题
因个人原因,仓库疏于维护,非常感谢社区成员的关注与支持,尤其感谢如下成员的付出: