diff --git a/2023/07/05/zhihu-aac-old/index.html b/2023/07/04/zhihu-aac-old/index.html similarity index 96% rename from 2023/07/05/zhihu-aac-old/index.html rename to 2023/07/04/zhihu-aac-old/index.html index ca72712..6ac7919 100644 --- a/2023/07/05/zhihu-aac-old/index.html +++ b/2023/07/04/zhihu-aac-old/index.html @@ -7,8 +7,8 @@ - - + + @@ -19,18 +19,18 @@ - + - - - + + + - + @@ -288,7 +288,7 @@

聊聊知乎盐选反爬 (回答页篇)

近些阵子,知乎上线了针对专栏[1]中盐选文章的反爬系统,随后该系统也被运用在知乎回答页面中的盐选文章上。具体表现为爬取的文章内容中出现大量的错乱词汇。而在本篇文章中,我们将一步步带领各位解开这些乱码。在这个过程中,我们将对字体反爬有更深入的认识,并学到运用字体反爬时需要注意的问题。

一、知乎反爬效果

来自知乎回答不被爱是一种什么样的感受? - 知乎

-

乱码示意图

+

乱码示意图

如图所示,在页面源码中出现了大量乱码,例如(原字,错字):[2]