-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathmlp.py
54 lines (42 loc) · 2.73 KB
/
mlp.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
##########################################################################################################################################
# Trabalho FIA - Rede Neural Artificial #
# Redes Neurais Multiplayer Perception capaz de classificar corretamente casos de cancer de mama #
# Grupo: Gabriella Selbach, Geovana Silveira, Luiza Cruz #
##########################################################################################################################################
# importa classe MLPClassifier que implementa o algoritmo de multiplayer perceptron que realiza o treinamento usando backpropagation
from sklearn.neural_network import MLPClassifier
# importa e retorna o dataset do breast cancer wisconsin
from sklearn.datasets import load_breast_cancer
# importa modelo train_test_split para realizar a divisao do dataset em conjuntos de treino e teste
from sklearn.model_selection import train_test_split
# importa classe StandardScaler para realizar a normalização dos dados
from sklearn.preprocessing import StandardScaler
# importa metrica para a criacao da matriz de confusao e para o calculo do erro medio quadratico
from sklearn.metrics import confusion_matrix,mean_squared_error
# importa biblioteca pandas para utilizacao do metodo crosstab
import pandas as pd
# carrega o dataset
dados = load_breast_cancer()
# organiza os dados
x = dados['data'] # armazena os valores referentes as caracteristicas dos tumores
y = dados['target'] # armazena o mapeamento para binario das classificacao dos casos representando tumores malignos como 0 e tumores benignos como 1
# divide os dados para treino e teste utilizando uma porcentagem de 34% para teste e 66% para treinamento
x_treino,x_teste,y_treino,y_teste = train_test_split(x, y, test_size = 0.34)
escala = StandardScaler()
# treina os dados normalizados
escala.fit(x_treino)
x_teste = escala.transform(x_teste)
x_treino = escala.transform(x_treino)
# inicializa a classificacao passando uma tupla com numero de neuronios em cada camada e o numero maximo de iteracoes/epocas
mlp = MLPClassifier(hidden_layer_sizes = (20,20,20), max_iter = 300)
# treina a classificacao
mlp.fit(x_treino, y_treino)
# realiza a previsao
previsao = mlp.predict(x_teste)
# calcula erro medio quadratico
emq = mean_squared_error(y_teste,mlp.predict(x_teste))
print("Erro Medio:\n", emq)
#imprime crosstab
print(pd.crosstab(y_teste,mlp.predict(x_teste),rownames=['Real'],colnames=['Predito'],margins=True))
#imprime matriz de confusao
#print(confusion_matrix(y_teste,mlp.predict(x_teste)))