From 56c00dd3f3d004b8cdf01c71be9aa3d8f6585c93 Mon Sep 17 00:00:00 2001 From: "Leandro A. Medeiros" Date: Tue, 26 Nov 2024 12:54:04 -0300 Subject: [PATCH] Delete Rede_Neural_Avaliacao.ipynb --- Rede_Neural_Avaliacao.ipynb | 525 ------------------------------------ 1 file changed, 525 deletions(-) delete mode 100644 Rede_Neural_Avaliacao.ipynb diff --git a/Rede_Neural_Avaliacao.ipynb b/Rede_Neural_Avaliacao.ipynb deleted file mode 100644 index 74dc2fc..0000000 --- a/Rede_Neural_Avaliacao.ipynb +++ /dev/null @@ -1,525 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": { - "id": "view-in-github", - "colab_type": "text" - }, - "source": [ - "\"Open" - ] - }, - { - "cell_type": "markdown", - "id": "f151b7dd", - "metadata": { - "id": "f151b7dd" - }, - "source": [ - "# Avaliação de Redes Neurais\n", - "Este notebook implementa o desenvolvimento de uma Rede Neural de acordo com os critérios estabelecidos:\n", - "- Preparação dos dados\n", - "- Escolha da arquitetura\n", - "- Seleção de hiperparâmetros\n", - "- Divisão de dados\n", - "- Métricas de avaliação\n", - "- Análise crítica e conclusões\n", - "\n", - "O dataset utilizado é o Iris Dataset, um problema clássico de classificação multiclasse." - ] - }, - { - "cell_type": "code", - "execution_count": 54, - "id": "40696229", - "metadata": { - "id": "40696229" - }, - "outputs": [], - "source": [ - "#O classificador sobre flores é carregado diretamente da biblioteca sklearn. Ele é um conjunto de dados clássico em aprendizado de máquina que contém informações\n", - "#sobre três classes de flores (Iris-setosa, Iris-versicolor, Iris-virginica) com características como comprimento e largura das sépalas e pétalas.\n", - "\n", - "#import keras: A biblioteca principal para construir redes neurais com Keras.\n", - "#from sklearn.model_selection import train_test_split: Utilizada para dividir os dados em conjuntos de treinamento e teste.\n", - "#import matplotlib.pyplot as plt: Para visualização das métricas de treinamento e teste.\n", - "#from keras.models import Sequential: O modelo usado é o Sequential, que é adequado para redes neurais simples.\n", - "#from keras.layers import Dense: Usada para adicionar camadas densas ao modelo, a principal camada da rede neural.\n", - "\n", - "# Importando bibliotecas necessárias\n", - "import numpy as np\n", - "import pandas as pd\n", - "import matplotlib.pyplot as plt\n", - "import seaborn as sns\n", - "from sklearn.model_selection import train_test_split\n", - "from sklearn.preprocessing import StandardScaler\n", - "from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score" - ] - }, - { - "cell_type": "code", - "execution_count": 55, - "id": "73dd53b3", - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 1000 - }, - "id": "73dd53b3", - "outputId": "ebba37ec-52dd-4feb-d4b6-f0d8f1d6984a" - }, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Informações do dataset:\n", - "\n", - "RangeIndex: 150 entries, 0 to 149\n", - "Data columns (total 5 columns):\n", - " # Column Non-Null Count Dtype \n", - "--- ------ -------------- ----- \n", - " 0 sepal length (cm) 150 non-null float64\n", - " 1 sepal width (cm) 150 non-null float64\n", - " 2 petal length (cm) 150 non-null float64\n", - " 3 petal width (cm) 150 non-null float64\n", - " 4 target 150 non-null int64 \n", - "dtypes: float64(4), int64(1)\n", - "memory usage: 6.0 KB\n", - "None\n", - "\n", - "Primeiros registros:\n", - " sepal length (cm) sepal width (cm) petal length (cm) petal width (cm) \\\n", - "0 5.1 3.5 1.4 0.2 \n", - "1 4.9 3.0 1.4 0.2 \n", - "2 4.7 3.2 1.3 0.2 \n", - "3 4.6 3.1 1.5 0.2 \n", - "4 5.0 3.6 1.4 0.2 \n", - "\n", - " target \n", - "0 0 \n", - "1 0 \n", - "2 0 \n", - "3 0 \n", - "4 0 \n", - "\n", - "Valores ausentes por coluna:\n", - "sepal length (cm) 0\n", - "sepal width (cm) 0\n", - "petal length (cm) 0\n", - "petal width (cm) 0\n", - "target 0\n", - "dtype: int64\n", - "\n", - "Estatísticas descritivas:\n", - " sepal length (cm) sepal width (cm) petal length (cm) \\\n", - "count 150.000000 150.000000 150.000000 \n", - "mean 5.843333 3.057333 3.758000 \n", - "std 0.828066 0.435866 1.765298 \n", - "min 4.300000 2.000000 1.000000 \n", - "25% 5.100000 2.800000 1.600000 \n", - "50% 5.800000 3.000000 4.350000 \n", - "75% 6.400000 3.300000 5.100000 \n", - "max 7.900000 4.400000 6.900000 \n", - "\n", - " petal width (cm) target \n", - "count 150.000000 150.000000 \n", - "mean 1.199333 1.000000 \n", - "std 0.762238 0.819232 \n", - "min 0.100000 0.000000 \n", - "25% 0.300000 0.000000 \n", - "50% 1.300000 1.000000 \n", - "75% 1.800000 2.000000 \n", - "max 2.500000 2.000000 \n" - ] - }, - { - "output_type": "display_data", - "data": { - "text/plain": [ - "
" - ], - "image/png": "\n" - }, - "metadata": {} - } - ], - "source": [ - "\n", - "# Carregando o dataset Iris\n", - "from sklearn.datasets import load_iris\n", - "iris = load_iris()\n", - "data = pd.DataFrame(data=iris.data, columns=iris.feature_names)\n", - "data['target'] = iris.target\n", - "\n", - "# Exibindo informações básicas sobre o dataset\n", - "print(\"Informações do dataset:\")\n", - "print(data.info())\n", - "print(\"\\nPrimeiros registros:\")\n", - "print(data.head())\n", - "\n", - "# Verificando valores ausentes e estatísticas descritivas\n", - "print(\"\\nValores ausentes por coluna:\")\n", - "print(data.isnull().sum())\n", - "print(\"\\nEstatísticas descritivas:\")\n", - "print(data.describe())\n", - "\n", - "# Explorando a distribuição das classes\n", - "sns.countplot(x='target', data=data)\n", - "plt.title(\"Distribuição das classes\")\n", - "plt.show()\n" - ] - }, - { - "cell_type": "code", - "execution_count": 56, - "id": "b53b2759", - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "b53b2759", - "outputId": "091ba38f-9bc0-4171-da93-b26c00c569d9" - }, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Tamanhos dos conjuntos:\n", - "Treino: (105, 4), Validação: (22, 4), Teste: (23, 4)\n" - ] - } - ], - "source": [ - "#O código assume que os dados foram carregados e que as variáveis X (entradas) e y (saídas) já estão definidas.\n", - "\n", - "#X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2): A divisão dos dados é feita corretamente para separar 80% para treino e 20% para teste, o que é uma prática comum.\n", - "# Divisão dos Dados em Treinamento, Validação e Teste\n", - "#Após a normalização, os dados são divididos em três partes: treinamento, validação e teste.\n", - "#Primeira divisão (70% para Treinamento, 30% para Temporário):\n", - "#Aqui, 30% dos dados são reservados para os conjuntos temporários X_temp e y_temp (que incluirão os dados de validação e teste).\n", - "#70% dos dados são usados para o conjunto de treinamento (X_train, y_train), que será usado para treinar o modelo.\n", - "#Segunda divisão (50% dos dados temporários para Validação e 50% para Teste):\n", - "#X_temp e y_temp representam os dados restantes (30% do total).\n", - "#A divisão posterior separa esse conjunto em 50% para validação e 50% para teste, ou seja, 15% do total dos dados originais para validação e 15% para teste.\n", - "#X_val e y_val são usados para validação, enquanto X_test e y_test são usados para testar o modelo depois do treinamento.\n", - "#Divisão dos Dados: Após a normalização, os dados são divididos em três conjuntos:\n", - "#70% para treino: Usado para treinar o modelo.\n", - "#15% para validação: Usado para ajustar os parâmetros do modelo e monitorar o overfitting.\n", - "#15% para teste: Usado para avaliar a performance final do modelo em dados não vistos.\n", - "#Escolhi esse processo pois foi o mais satisfatório em termos de resultados visando garantir que o modelo seja bem treinado, validado e testado de maneira eficiente, sem usar os dados de teste durante o treinamento ou ajuste.\n", - "\n", - "\n", - "# Normalizando os dados\n", - "scaler = StandardScaler()\n", - "X = scaler.fit_transform(data.iloc[:, :-1])\n", - "y = data['target']\n", - "\n", - "# Dividindo os dados em treino, validação e teste (70%, 15%, 15%)\n", - "X_train, X_temp, y_train, y_temp = train_test_split(X, y, test_size=0.3, random_state=42)\n", - "X_val, X_test, y_val, y_test = train_test_split(X_temp, y_temp, test_size=0.5, random_state=42)\n", - "\n", - "print(\"Tamanhos dos conjuntos:\")\n", - "print(f\"Treino: {X_train.shape}, Validação: {X_val.shape}, Teste: {X_test.shape}\")\n" - ] - }, - { - "cell_type": "code", - "execution_count": 57, - "id": "0eb895b2", - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "0eb895b2", - "outputId": "cfc6e413-4caf-4abc-fc7b-814f485cc3e9" - }, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Epoch 1/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m2s\u001b[0m 39ms/step - accuracy: 0.2766 - loss: 1.1313 - val_accuracy: 0.2273 - val_loss: 1.1071\n", - "Epoch 2/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 9ms/step - accuracy: 0.4300 - loss: 1.0671 - val_accuracy: 0.5455 - val_loss: 1.0304\n", - "Epoch 3/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 11ms/step - accuracy: 0.5151 - loss: 1.0118 - val_accuracy: 0.7273 - val_loss: 0.9627\n", - "Epoch 4/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 10ms/step - accuracy: 0.6453 - loss: 0.9549 - val_accuracy: 0.7727 - val_loss: 0.9003\n", - "Epoch 5/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 10ms/step - accuracy: 0.7397 - loss: 0.9182 - val_accuracy: 0.8182 - val_loss: 0.8412\n", - "Epoch 6/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 11ms/step - accuracy: 0.8178 - loss: 0.8526 - val_accuracy: 0.9091 - val_loss: 0.7823\n", - "Epoch 7/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 11ms/step - accuracy: 0.8318 - loss: 0.8015 - val_accuracy: 0.9091 - val_loss: 0.7207\n", - "Epoch 8/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 7ms/step - accuracy: 0.8392 - loss: 0.7571 - val_accuracy: 0.9091 - val_loss: 0.6587\n", - "Epoch 9/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 8ms/step - accuracy: 0.8166 - loss: 0.7175 - val_accuracy: 0.9091 - val_loss: 0.5987\n", - "Epoch 10/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 14ms/step - accuracy: 0.8472 - loss: 0.6566 - val_accuracy: 0.9091 - val_loss: 0.5396\n", - "Epoch 11/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 9ms/step - accuracy: 0.8731 - loss: 0.6026 - val_accuracy: 0.9091 - val_loss: 0.4835\n", - "Epoch 12/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 8ms/step - accuracy: 0.8542 - loss: 0.5546 - val_accuracy: 0.9545 - val_loss: 0.4318\n", - "Epoch 13/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 8ms/step - accuracy: 0.8305 - loss: 0.5495 - val_accuracy: 0.9545 - val_loss: 0.3877\n", - "Epoch 14/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 10ms/step - accuracy: 0.8314 - loss: 0.5168 - val_accuracy: 0.9545 - val_loss: 0.3499\n", - "Epoch 15/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 11ms/step - accuracy: 0.8344 - loss: 0.4726 - val_accuracy: 0.9545 - val_loss: 0.3169\n", - "Epoch 16/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 10ms/step - accuracy: 0.8593 - loss: 0.4371 - val_accuracy: 0.9545 - val_loss: 0.2890\n", - "Epoch 17/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 13ms/step - accuracy: 0.8510 - loss: 0.4183 - val_accuracy: 0.9545 - val_loss: 0.2657\n", - "Epoch 18/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 10ms/step - accuracy: 0.8577 - loss: 0.4095 - val_accuracy: 0.9545 - val_loss: 0.2469\n", - "Epoch 19/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 8ms/step - accuracy: 0.8705 - loss: 0.4031 - val_accuracy: 0.9545 - val_loss: 0.2313\n", - "Epoch 20/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 11ms/step - accuracy: 0.8790 - loss: 0.3488 - val_accuracy: 0.9545 - val_loss: 0.2185\n", - "Epoch 21/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 11ms/step - accuracy: 0.8783 - loss: 0.3660 - val_accuracy: 0.9545 - val_loss: 0.2080\n", - "Epoch 22/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 11ms/step - accuracy: 0.9220 - loss: 0.3159 - val_accuracy: 0.9545 - val_loss: 0.1975\n", - "Epoch 23/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 12ms/step - accuracy: 0.8890 - loss: 0.3287 - val_accuracy: 0.9545 - val_loss: 0.1890\n", - "Epoch 24/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 15ms/step - accuracy: 0.9098 - loss: 0.3164 - val_accuracy: 0.9545 - val_loss: 0.1810\n", - "Epoch 25/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 8ms/step - accuracy: 0.8879 - loss: 0.3159 - val_accuracy: 0.9545 - val_loss: 0.1734\n", - "Epoch 26/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 11ms/step - accuracy: 0.8891 - loss: 0.2737 - val_accuracy: 0.9545 - val_loss: 0.1664\n", - "Epoch 27/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 8ms/step - accuracy: 0.8689 - loss: 0.3202 - val_accuracy: 0.9545 - val_loss: 0.1593\n", - "Epoch 28/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 9ms/step - accuracy: 0.8848 - loss: 0.2891 - val_accuracy: 0.9545 - val_loss: 0.1528\n", - "Epoch 29/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 10ms/step - accuracy: 0.9035 - loss: 0.2786 - val_accuracy: 0.9545 - val_loss: 0.1468\n", - "Epoch 30/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 9ms/step - accuracy: 0.9509 - loss: 0.2158 - val_accuracy: 0.9545 - val_loss: 0.1412\n", - "Epoch 31/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 10ms/step - accuracy: 0.9068 - loss: 0.2769 - val_accuracy: 0.9545 - val_loss: 0.1357\n", - "Epoch 32/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 12ms/step - accuracy: 0.9017 - loss: 0.2645 - val_accuracy: 0.9545 - val_loss: 0.1308\n", - "Epoch 33/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 11ms/step - accuracy: 0.9188 - loss: 0.2577 - val_accuracy: 0.9545 - val_loss: 0.1259\n", - "Epoch 34/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 7ms/step - accuracy: 0.9185 - loss: 0.2595 - val_accuracy: 0.9545 - val_loss: 0.1212\n", - "Epoch 35/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 8ms/step - accuracy: 0.9202 - loss: 0.2555 - val_accuracy: 0.9545 - val_loss: 0.1167\n", - "Epoch 36/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 8ms/step - accuracy: 0.9245 - loss: 0.2480 - val_accuracy: 0.9545 - val_loss: 0.1119\n", - "Epoch 37/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 7ms/step - accuracy: 0.9177 - loss: 0.2568 - val_accuracy: 0.9545 - val_loss: 0.1074\n", - "Epoch 38/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 7ms/step - accuracy: 0.9342 - loss: 0.2259 - val_accuracy: 0.9545 - val_loss: 0.1032\n", - "Epoch 39/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 8ms/step - accuracy: 0.9288 - loss: 0.2303 - val_accuracy: 1.0000 - val_loss: 0.0991\n", - "Epoch 40/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 10ms/step - accuracy: 0.9525 - loss: 0.2153 - val_accuracy: 1.0000 - val_loss: 0.0953\n", - "Epoch 41/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 8ms/step - accuracy: 0.9427 - loss: 0.1916 - val_accuracy: 1.0000 - val_loss: 0.0916\n", - "Epoch 42/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 10ms/step - accuracy: 0.9728 - loss: 0.1727 - val_accuracy: 1.0000 - val_loss: 0.0880\n", - "Epoch 43/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 12ms/step - accuracy: 0.9558 - loss: 0.1790 - val_accuracy: 1.0000 - val_loss: 0.0848\n", - "Epoch 44/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 8ms/step - accuracy: 0.9437 - loss: 0.1760 - val_accuracy: 1.0000 - val_loss: 0.0819\n", - "Epoch 45/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 7ms/step - accuracy: 0.9502 - loss: 0.1785 - val_accuracy: 1.0000 - val_loss: 0.0789\n", - "Epoch 46/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 11ms/step - accuracy: 0.9161 - loss: 0.2040 - val_accuracy: 1.0000 - val_loss: 0.0764\n", - "Epoch 47/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 9ms/step - accuracy: 0.9650 - loss: 0.1712 - val_accuracy: 1.0000 - val_loss: 0.0736\n", - "Epoch 48/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 8ms/step - accuracy: 0.9280 - loss: 0.1859 - val_accuracy: 1.0000 - val_loss: 0.0707\n", - "Epoch 49/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 9ms/step - accuracy: 0.9556 - loss: 0.1380 - val_accuracy: 1.0000 - val_loss: 0.0682\n", - "Epoch 50/50\n", - "\u001b[1m7/7\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 10ms/step - accuracy: 0.9332 - loss: 0.1761 - val_accuracy: 1.0000 - val_loss: 0.0659\n" - ] - } - ], - "source": [ - "#O modelo é construído com três camadas densas, sendo a primeira camada com 32 neurônios, a segunda com 16 e a última com uma única saída (para problemas de classificação binária).\n", - "#model = Sequential(): Criação de um modelo sequencial, o que é adequado para redes neurais simples.\n", - "#model.add(Dense(32, activation='relu', input_dim=X_train.shape[1])): A primeira camada densa com 32 unidades e a função de ativação ReLU. É importante observar que o código usa input_dim=X_train.shape[1] para definir o número de entradas da rede, o que está correto. No entanto, se fosse utilizada a camada Input, o parâmetro input_dim não seria necessário.\n", - "#Melhoria: Considerar o uso de Input(shape=(n_features,)) para maior clareza e evitar a redundância do input_dim.\n", - "#model.add(Dense(16, activation='relu')): A segunda camada densa tem 16 unidades. A escolha dessa quantidade de unidades é razoável, mas pode ser ajustada dependendo do desempenho desejado.\n", - "#model.add(Dense(1, activation='sigmoid')): A camada final com 1 unidade e a ativação sigmoid é adequada para problemas de classificação binária.\n", - "\n", - "# Uso dos Hiperparâmetros\n", - "#Taxa de Aprendizado (learning_rate=0.001): Definindo o quanto a rede deve ajustar os pesos a cada iteração.\n", - "#Funções de Ativação (ReLU e Softmax): Garantem que a rede aprenda padrões complexos e forneça uma saída probabilística para classificação.\n", - "#Número de Épocas (epochs=50): Determina o número de vezes que o modelo passa por todo o conjunto de treinamento, controlando o risco de overfitting e underfitting.\n", - "#Tamanho do Lote (batch_size=16): Controla a quantidade de exemplos usados para cada atualização dos pesos, afetando a eficiência e a estabilidade do treinamento.\n", - "\n", - "# Definindo e compilando o modelo MLP\n", - "model = Sequential([\n", - " Input(shape=(X_train.shape[1],)), # Define a forma da entrada\n", - " Dense(32, activation='relu'),\n", - " Dense(16, activation='relu'),\n", - " Dense(3, activation='softmax') # Saída com 3 classes\n", - "])\n", - "optimizer = Adam(learning_rate=0.0001)\n", - "model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])\n", - "\n", - "# Treinando o modelo\n", - "history = model.fit(X_train, y_train, validation_data=(X_val, y_val), epochs=50, batch_size=16, verbose=1)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 58, - "id": "49f31d25", - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "49f31d25", - "outputId": "d26e4918-8359-429b-852a-00997f52e599" - }, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "\u001b[1m1/1\u001b[0m \u001b[32m━━━━━━━━━━━━━━━━━━━━\u001b[0m\u001b[37m\u001b[0m \u001b[1m0s\u001b[0m 68ms/step\n", - "Resultados no conjunto de teste:\n", - "Acurácia: 1.0000\n", - "Precisão: 1.0000\n", - "Recall: 1.0000\n", - "F1-Score: 1.0000\n" - ] - } - ], - "source": [ - "#O modelo é compilado com um otimizador adam e a função de perda binary_crossentropy, o que é adequado para problemas de classificação binária.\n", - "#model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy']): A escolha do otimizador adam e da função de perda binary_crossentropy são padrão para problemas de classificação binária. A métrica de avaliação é accuracy, o que é apropriado.\n", - "#Embora a acurácia seja uma métrica relevante, é interessante também monitorar o precision, recall e f1-score, especialmente em conjuntos de dados desbalanceados.\n", - "\n", - "#As métricas utilizadas para comparar o desempenho do modelo no conjunto de teste foram:\n", - "#Acurácia (Accuracy): Mede a proporção de previsões corretas no total de amostras. A acurácia obtida foi 1.0000, o que significa que o modelo acertou todas as previsões.\n", - "#Precisão (Precision): Mede a proporção de predições positivas corretas entre todas as predições positivas feitas pelo modelo. A precisão foi 1.0000, indicando que todas as previsões positivas feitas pelo modelo estavam corretas.\n", - "#Revocação (Recall): Mede a proporção de predições positivas corretas entre todas as amostras reais positivas. A revocação foi 1.0000, indicando que o modelo identificou corretamente todas as instâncias positivas.\n", - "#F1-Score: A média harmônica entre precisão e revocação, que oferece um equilíbrio entre essas duas métricas. O F1-Score foi 1.0000, indicando um equilíbrio perfeito entre precisão e revocação.\n", - "\n", - "# Avaliando o modelo no conjunto de teste\n", - "y_pred = np.argmax(model.predict(X_test), axis=1)\n", - "accuracy = accuracy_score(y_test, y_pred)\n", - "precision = precision_score(y_test, y_pred, average='weighted')\n", - "recall = recall_score(y_test, y_pred, average='weighted')\n", - "f1 = f1_score(y_test, y_pred, average='weighted')\n", - "\n", - "print(\"Resultados no conjunto de teste:\")\n", - "print(f\"Acurácia: {accuracy:.4f}\")\n", - "print(f\"Precisão: {precision:.4f}\")\n", - "print(f\"Recall: {recall:.4f}\")\n", - "print(f\"F1-Score: {f1:.4f}\")\n" - ] - }, - { - "cell_type": "code", - "execution_count": 59, - "id": "9aba9e97", - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 507 - }, - "id": "9aba9e97", - "outputId": "f64559a3-a4d0-4098-f4d5-fb233402a813" - }, - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": [ - "
" - ], - "image/png": "\n" - }, - "metadata": {} - } - ], - "source": [ - "#O modelo é treinado por 50 épocas com um batch_size de 32. O uso de validation_split permite monitorar o desempenho do modelo durante o treinamento.\n", - "#history = model.fit(X_train, y_train, epochs=50, batch_size=32, validation_split=0.2): O modelo é treinado por 50 épocas com validação. Essa configuração é padrão e bastante eficaz para evitar overfitting.\n", - "#Embora a divisão para validação (validation_split) seja útil, ao trabalhar com dados em que a validação cruzada é necessária, pode ser interessante usar KFold ou StratifiedKFold do scikit-learn.\n", - "\n", - "# Perdas e acurácia durante o treinamento\n", - "training_loss = history.history['loss']\n", - "validation_loss = history.history['val_loss']\n", - "training_accuracy = history.history['accuracy']\n", - "validation_accuracy = history.history['val_accuracy']\n", - "\n", - "#O código gera gráficos de perda e acurácia durante o treinamento.\n", - "#plt.subplot(1, 2, 1), plt.subplot(1, 2, 2): A utilização de subgráficos permite que as duas métricas (perda e acurácia) sejam visualizadas lado a lado, o que facilita a comparação e a análise.\n", - "\n", - "# Gráficos\n", - "plt.figure(figsize=(12, 5))\n", - "plt.subplot(1, 2, 1)\n", - "plt.plot(training_loss, label='Treino')\n", - "plt.plot(validation_loss, label='Validação')\n", - "plt.title('Perda durante o treinamento')\n", - "plt.xlabel('Épocas')\n", - "plt.ylabel('Perda')\n", - "plt.legend()\n", - "\n", - "plt.subplot(1, 2, 2)\n", - "plt.plot(training_accuracy, label='Treino')\n", - "plt.plot(validation_accuracy, label='Validação')\n", - "plt.title('Acurácia durante o treinamento')\n", - "plt.xlabel('Épocas')\n", - "plt.ylabel('Acurácia')\n", - "plt.legend()\n", - "\n", - "plt.tight_layout()\n", - "plt.show()\n", - "\n", - "#Após o treinamento, o modelo é avaliado no conjunto de teste, e as métricas de desempenho são calculadas.\n", - "#loss, accuracy = model.evaluate(X_test, y_test): O modelo é avaliado com base na perda e acurácia. Embora a acurácia seja importante, é bom observar que, dependendo da distribuição das classes, outras métricas também são essenciais para uma avaliação completa.\n", - "#O modelo gera as métricas de precisão, recall, e F1-Score no conjunto de teste, refletindo o desempenho em termos de classes positivas e negativas.\n", - "#As métricas apresentadas no conjunto de teste indicam um ótimo desempenho, com F1-Score muito próximo da acurácia, o que sugere que o modelo está equilibrado em relação a precisão e recall.\n", - "#A análise das métricas de desempenho pode ser acompanhada de uma matriz de confusão para uma visualização mais clara dos falsos positivos e falsos negativos." - ] - }, - { - "cell_type": "markdown", - "id": "5e7b87be", - "metadata": { - "id": "5e7b87be" - }, - "source": [ - "\n", - "## Análise Crítica e Conclusão\n", - "\n", - "O modelo MLP apresentou boa performance no problema de classificação multiclasse, com métricas elevadas no conjunto de teste. Algumas melhorias que pensei em fazer para melhorá-lo:\n", - "- Realizar um ajuste fino dos hiperparâmetros usando técnicas como busca em grade.\n", - "- Testar arquiteturas alternativas, como redes mais profundas ou com regularização.\n", - "- Explorar técnicas de aumento de dados para evitar overfitting.\n", - "\n", - "\n" - ] - } - ], - "metadata": { - "colab": { - "provenance": [], - "include_colab_link": true - }, - "language_info": { - "name": "python" - }, - "kernelspec": { - "name": "python3", - "display_name": "Python 3" - } - }, - "nbformat": 4, - "nbformat_minor": 5 -} \ No newline at end of file