STOCK DATA STREAMING AND ANALYSIS

DESCRIPTION

This project is basically for collecting enormous data and analysing it.
It includes live streaming of data from FOREX trading API and Electric Vehicle stocks API.
The data is fetched and processed using Kafka Streaming and Spark streaming.
Throughout this project stocks of Forex data and Electric Vehicle parts making companies data were analyzed and business use case is implemented.
The analyzed data is then visualized by plotting different graphs using python libraries.

STREAMING TOOLS

Websocket,
Requests library,
Pandas datareader library,
Netcat,
API : Tiingo API,Alpha Vantage API.
data visualization tool: matplotlib,Seaborn

TECHNOLOGIES USED:

Spark
Kafka
Pyspark

GETTING STARTED

GitHub clone URL: https://github.com/rajib1007/Project_3.git

STEP: - 1

INSTALL REQUIRED TOOLS TO PROCEED WORK & SET PATH

sudo apt-get install openjdk-8-jdk

wget https://dlcdn.apache.org/spark/spark-3.1.2/spark-3.1.2-bin-hadoop3.2.tgz

tar xvzf spark-3.1.2-bin-hadoop3.2.tgz

wget https://archive.apache.org/dist/kafka/2.0.0/kafka_2.11-2.0.0.tgz

tar xvzf kafka_2.11-2.0.0.tgz

STEP: - 2

FOLLOW THIS LINK INSTALL JUPYTER NOTEBOOK ON UBUNTU

https://www.digitalocean.com/community/tutorials/how-to-set-up-jupyter-notebook-with-python-3-on-ubuntu-20-04-and-connect-via-ssh-tunneling

STEP: - 3

GOTO KAFKA DIRECTORY AND RUN ZOOKEEPER AND KAFKA SERVER

cd kafka_2.11-2.0.0/

bin/zookeeper-server-start.sh config/zookeeper.properties

bin/kafka-server-start.sh config/server.properties

STEP: - 4

CREATE A TOPIC project3 WITH REPLICATION FACTOR 1 AND PARTITION 1

bin/kafka-topics.sh --create --zookeeper localhost:2181 --topic --replication-factor 1 --partitions 1

STEP: - 5

CREATE A producer.py FILE TO FETCH DATA FROM API AND PASS TO TOPIC

CREATE ACCOUNT ON api.tiingo.com

https://api.tiingo.com/

run producer.py file

STEP: - 6

START CONSUMER API IN NEW TERMINAL

bin/kafka-console-consumer.sh --topic <topic_name> --bootstrap-server localhost:9092

STEP: - 7

CREATE ANOTHER .py FILE TO STRUCTURE THE JSON DATA INTO SPARK DATAFRAME AND DO SOME OPERATION OR A USECASE

CREATE TOPIC askPriceOutput

bin/kafka-console-consumer.sh –topic <output_topic_file> --bootstrap-server localhost:9092

usecase2.py

STEP: - 8

GOTO SPARK BIN FOLDER

cd /spark-3.1.2-bin-hadoop3.2/bin/

RUN SPARK-SUBMIT JOB WITH usecase.py FILE AND STORE THE OUTPUT ON askPriceOutput TOPIC

spark-submit --packages org.apache.spark:spark-sql-kafka-0-10_2.12:3.1.2 <file_path.py>

STEP: - 9

OUTPUT WILL BE SHOWING ON askPriceOutput TOPIC’S CONSUMER

STEP: - 10

OPEN JUPYTER NOTEBOOK AND INSTALL matplotlib library and kafka-python ON IT

ROLES AND RESPONSIBILITIES

DATA STREAMING AND SPARK submit job- Rajib’s team
Use cases- Eshwar’s team
Visualization- Karan’s team
EV stock use case-Kareem's team
Deployment-Trupti’s Team

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
EV		EV
FOREX		FOREX
LAB SETUP		LAB SETUP
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

STOCK DATA STREAMING AND ANALYSIS

DESCRIPTION

STREAMING TOOLS

TECHNOLOGIES USED:

GETTING STARTED

STEP: - 1

STEP: - 2

STEP: - 3

STEP: - 4

STEP: - 5

STEP: - 6

STEP: - 7

STEP: - 8

STEP: - 9

STEP: - 10

ROLES AND RESPONSIBILITIES

About

Releases

Packages

Contributors 2

Languages

License

kanand2306/P3-Stock-Market-Analysis

Folders and files

Latest commit

History

Repository files navigation

STOCK DATA STREAMING AND ANALYSIS

DESCRIPTION

STREAMING TOOLS

TECHNOLOGIES USED:

GETTING STARTED

STEP: - 1

STEP: - 2

STEP: - 3

STEP: - 4

STEP: - 5

STEP: - 6

STEP: - 7

STEP: - 8

STEP: - 9

STEP: - 10

ROLES AND RESPONSIBILITIES

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages