Data Mining / Scraping ~ HEZARTECH.AI

A data mining / scraping repository for our TDDI Model. (HEZARTECH.AI) This files used for data mining/scraping scripts for preparing and synthesizing dataset.

Table of Concepts

Installation
Websites that we scraped data
Synthesizing dataset.
Folder Structure

Installation

$ pip3 install -r requirements.txt

Websites that we scraped data

X (formerly Twitter): For getting customer service conversations etc.
Amazon: 1, 4 and 5 star comments of best seller products to analyze sentiments.
ŞikayetVar: articles
Synthesizing Dataset: via Generative AI.

Synthesizing dataset

We synthesis dataset with manually labelled

Folder Structure

.
|   .gitignore
|   LICENSE.md
|   README.md
|   requirements.txt
|
+---Amazon
|   |   b0.txt
|   |   fetchAmazonData.py
|   |   pattern_finder.py
|   |   url_otomation.py
|   |   urunid.txt
|   |
|   \---results
|           amazon_dataset.txt
|           besyildizurl.txt
|           biryildizurl.txt
|           dortyildizurl.txt
|
+---Dataset Optimization
|       csv_validator.py
|       dataset_cleaner.py
|       Data_Visulator.ipynb
|       delete_dup.py
|       delete_short_sentences.py
|       json_to_csv.py
|
+---SikayetVar
|       sikayetvar.py
|
\---X
        headers.json
        twitter_search_engine.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Data Mining / Scraping ~ HEZARTECH.AI

Table of Concepts

Installation

Websites that we scraped data

Synthesizing dataset

Folder Structure

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
Amazon		Amazon
Dataset Optimization		Dataset Optimization
SikayetVar		SikayetVar
X		X
.gitignore		.gitignore
LICENSE.md		LICENSE.md
README.md		README.md
requirements.txt		requirements.txt

License

HEZARTECH/data-mining

Folders and files

Latest commit

History

Repository files navigation

Data Mining / Scraping ~ HEZARTECH.AI

Table of Concepts

Installation

Websites that we scraped data

Synthesizing dataset

Folder Structure

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages