Провести кластеризацию многомерных данных из полученного csv файла. Оценить количество кластеров и качество полученной кластеризации. Провести сокращение размерности и визуализировать результат кластеризации.
Ввод-вывод, арифметические операции. Условная инструкция
Операции с целыми и вещественными числами. Цикл for, while
Строки. Списки. Функции и рекурсия
Библиотеки для научных вычислений: numpy, pandas.
Работа с дискретными случайными величинами. Основные характеристики (моменты, функции вероятности) Основные типы распределений. numpy.random
Многомерные случайные величины.
Условные характеристики. Формула Байеса. Наивный байесовский классификатор sklearn.naive_bayes
Методы сокращения размерности данных. Метод главных компонент.
Двумерные массивы
Файловый ввод-вывод. Очередь. Множества. Словари
Ввод-вывод в реляционную базу данных
Классификация, кластеризация, регрессия.
Библиотеки машинного обучения и графики sklearn, matplotlib.
Выполнение проекта для оценки успеваемости
https://www.coursera.org/learn/mathematics-and-python
ОС Window, Python3, Anaconda3, PyСharm CE, Oracle Database 11g EE