Подготовка данных для проведения анализа тональности. Preparing Data for Sentiment Analysis.

Данные: Имеется текстовый файл со списком статей. Каждая новая статья начинается с новой строки и представляет собой словарь, содержащий 3 значения:

url
title
article

Задача: Подготовить данные для sentiment analysis.

Подготовка включает в себя:

чистка данных, без потери самого текста статьи
нормализация данных
обработка данных

Data: There is a text file with a list of articles. Each new entry starts on a new line and is a dictionary containing 3 values:

url
title
article

A task: Prepare data for sentiment analysis.

Preparation includes:

data cleaning, without losing the text of the article itself
data normalization
data processing

Результаты (results):

File Name	Description
NLP_test2.ipynb	Предобработка и подготовка данных в виде векторного представления с применением TF-IDF. Preprocessing and preparation of data as a vector representation using TF-IDF.
sentiment_analysis.ipynb	Анализ тональности для каждой из статей с использованием библиотеки dostoevsky. Sentiment analysis for each of the articles using the dostoevsky library.

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
.gitignore		.gitignore
NLP_test2.ipynb		NLP_test2.ipynb
README.md		README.md
sentiment_analysis.ipynb		sentiment_analysis.ipynb
test_margarita.json		test_margarita.json
test_margaryta.txt		test_margaryta.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Подготовка данных для проведения анализа тональности. Preparing Data for Sentiment Analysis.

About

Releases

Packages

Languages

MYkosareva/Data-preparation-for-sentiment-analysis-

Folders and files

Latest commit

History

Repository files navigation

Подготовка данных для проведения анализа тональности. Preparing Data for Sentiment Analysis.

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages