WikiCrawler

This project is a crawler for Wikipedia pages.

Setting up enviroment

Install the required modules found in requirements.pip file.

How to use

You can run the script using the follow command:

python wikicrawler.py --start-url=<wiki_url> --total-files=<num>

Where wiki_url is wikipedia page URL to starting crawler and num is the number of files to be saved(every files correspond to one wikipedia crawled page).

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
README.md		README.md
requirements.pip		requirements.pip
wikicrawler.py		wikicrawler.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

WikiCrawler

Setting up enviroment

How to use

About

Releases

Packages

Languages

zehpatricio/WikiCrawler

Folders and files

Latest commit

History

Repository files navigation

WikiCrawler

Setting up enviroment

How to use

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages