Skip to content

Latest commit

 

History

History
47 lines (25 loc) · 2.22 KB

README.md

File metadata and controls

47 lines (25 loc) · 2.22 KB

Материаллы специализированного курса по основам языка Python3 и анализу данных.

Финальное задание

Провести кластеризацию многомерных данных из полученного csv файла. Оценить количество кластеров и качество полученной кластеризации. Провести сокращение размерности и визуализировать результат кластеризации.

Программа курса

Ввод-вывод, арифметические операции. Условная инструкция

Операции с целыми и вещественными числами. Цикл for, while

Строки. Списки. Функции и рекурсия

Библиотеки для научных вычислений: numpy, pandas.

Работа с дискретными случайными величинами. Основные характеристики (моменты, функции вероятности) Основные типы распределений. numpy.random

Многомерные случайные величины.

Условные характеристики. Формула Байеса. Наивный байесовский классификатор sklearn.naive_bayes

Методы сокращения размерности данных. Метод главных компонент.

Двумерные массивы

Файловый ввод-вывод. Очередь. Множества. Словари

Ввод-вывод в реляционную базу данных

Классификация, кластеризация, регрессия.

Библиотеки машинного обучения и графики sklearn, matplotlib.

Выполнение проекта для оценки успеваемости

Дополнительные источники информации:

https://www.coursera.org/learn/mathematics-and-python

http://pythontutor.ru

Используемые технологии

ОС Window, Python3, Anaconda3, PyСharm CE, Oracle Database 11g EE