Skip to content

Latest commit

 

History

History
26 lines (14 loc) · 648 Bytes

README.md

File metadata and controls

26 lines (14 loc) · 648 Bytes

Python-spider-final

北邮20级信息工程“python编程与实践”期末大作业

基于requests实现的网络爬虫,并使用BeautifulSoup进行信息筛选

最终将处理结果用xlwings输出Excel文件,输出词频统计结果为txt文件,并使用wordcloud生成云图

示例云图:

wordcloud.png

依赖:

requests, bs4, xlwings, wordcloud

同时提供jupyter notebook和导出的py文件

用法:

更换main()中keyword为目标关键词后运行,即可得到titles.xlsx, stat.txt, wordcloud.png

(ppt和视频咱就没有办法了捏x