Skip to content

Releases: dylanyang17/TsinghuaBookCrawler

v2.1.3

17 Nov 03:58
Compare
Choose a tag to compare
  • 增加了 -r/--auto-resize 参数,可以自动统一页面尺寸。

v2.1.2

18 Sep 09:28
Compare
Choose a tag to compare

修复了下载部分书籍时存在的 bug,包括:

  • 部分书籍网页信息中不存在 book_name,导致无法下载;
  • 部分书籍章节序号不连续。

v2.1.1

22 Jan 03:31
Compare
Choose a tag to compare
  • 更新 PyMyPDF 版本

v2.1

04 Mar 03:38
Compare
Choose a tag to compare
  • 大幅优化了几乎同等质量下生成的 PDF 文件大小;
  • 支持质量选项 -q [3~10],默认为 10 (最高质量),调小该值可以在降低清晰度的前提下降低 PDF 文件大小,若需多次测试合适清晰度建议开启 -p 选项以避免多次下载图片文件。

v2.0

21 Feb 09:33
Compare
Choose a tag to compare

由于教参平台接口更新,于是该脚本也迎来了 v2.0 版本,目前测试中发现影响不大,受到影响的特性有:

  • 书名提取可能失效,此时按照旧版本习惯会使用数字串进行代替;
  • 由于新接口似乎只提供了唯一清晰度,于是清晰度选择被取消。

如果遇到问题,请及时联系作者,谢谢。

v1.2.2

02 Mar 09:53
Compare
Choose a tag to compare
  • 对于多章节最高清晰度不同的少数情况进行了处理,将对每个章节链接都进行一遍最高清晰度和图片格式的确定;
  • 改进异常处理,修复网络状况不稳定时进程阻塞的bug。

v1.2.1

24 Feb 16:21
Compare
Choose a tag to compare
  • 修复v1.2中默认清晰度的设置,当不显式指定清晰度时,将自动地对三种清晰度进行确认,并选择最高清晰度。

v1.2

24 Feb 09:08
Compare
Choose a tag to compare
  • 加入多章节书籍的一键下载和自动合并,使用更加方便;
  • 加入-s {1, 2, 3}清晰度选择,且提高默认清晰度
  • 加入链接正则化统一处理,既可打开阅读页面再复制链接,也可以在进入阅读页面前用右键复制链接。

v1.1

23 Feb 19:53
Compare
Choose a tag to compare
  • 更改参数输入方式,提高安全性;
  • 教参平台url支持 https。

版本 v1.0 中对于教参平台url不支持使用https,是因为教参平台的证书已经过期,会导致验证出错。考虑之后还是将 get 的 verify 关掉了,这会导致在使用https的时候产生很多警告(而不是直接抛出异常)。不过身份认证平台的证书并未过期,故该脚本对于涉及学号和密码的请求一直都使用更加安全的 https。

v1.0

24 Feb 09:09
Compare
Choose a tag to compare
  • 支持自动认证清华身份,使用简单;
  • 支持多进程快速下载;
  • 支持"断点续传",不会重复下载已经下载完成的部分;
  • 支持自动识别书名和页数(书名也可能得到一串数字)。