Statistical Thinking for Data Science

Data speaks the language of probability and statistics. It is humanely not possible to perform all calculations and predictions on millions of real data points. This is when probabilistic thinking comes into play. The idea of being able to answer for uncertainity by calculating (mathematically) what could happen when an event is repeated again and again and again.

This repository is aimed to be a guide and a tutorial of any one learning Python implementation of general statistical analysis and focuses mainly on data visualization for running through probability and statistics.

Univariate Data Analysis

We start in the order of a typical Data Analysis framework and move forward. The first notebook deals with some basic data visualizations that would help in getting a grasp of the data we are dealing with (Univariate)

Multivariate Data Analysis

Statistical Thinking Part - 1

ECDF
Variance, Covariance and Standard Deviations
Pearson Coefficient of Correlation

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
A:B Testing		A:B Testing
Multivariate Data Analysis		Multivariate Data Analysis
Univariate Data Analysis		Univariate Data Analysis
Visulization Basics		Visulization Basics
datsets		datsets
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Statistical Thinking for Data Science

Univariate Data Analysis

Multivariate Data Analysis

Statistical Thinking Part - 1

Statistical Thinking Part - 2

About

Releases

Packages

Languages

rjrahul24/statistics_with_python

Folders and files

Latest commit

History

Repository files navigation

Statistical Thinking for Data Science

Univariate Data Analysis

Multivariate Data Analysis

Statistical Thinking Part - 1

Statistical Thinking Part - 2

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages