Nesse repositório é um estudo de automl para como processamento de linguagem natural, classificação, regressão, cluster, é um estudo como automl pode ajudar no dia a dia de um cientista de dados. Nesse repositório afins de estudo sobe automl com pycaret, autokeras, autosklearn.
| Nome | Versão |
|---|---|
| PyCaret | Versão 3.0.0 |
| Auto Keras | Versão 1.0.20 |
| Auto Sklearn | Versão 0.15.0 |
PyCaret Documentação
Instalação dos pacotes automl
# Criar um ambiente conda
conda create --name yourenvname python=3.8
# Ativar ambiente conda
conda activate yourenvname
# Instalar pycaret
pip install pycaret
pip install auto-sklearn
pip install autokeras
# Criar kernel do notebook
python -m ipykernel install --user --name yourenvname --display-name "display-name"| Nome projeto | Link |
|---|---|
| Heart analysis | https://github.com/Delta357/AutoML---Machine-learning/blob/main/notebook/AutoML%20-%20Classificao%20Heart.ipynb |
| The Heart Failure Prediction | https://github.com/Delta357/AutoML---Machine-learning/blob/main/notebook/AutoML_Heart.ipynb |
| Breast Cancer | https://github.com/Delta357/AutoML---Machine-learning/blob/main/notebook/Model%20AutoML%20Breast%20Cancer.ipynb |
| Covid19 - Provide Insights Clinical Trials | https://github.com/Delta357/AutoML---Machine-learning/blob/main/notebook/Automl_nlp_Covid19.ipynb |
| Stooke prediction | https://github.com/Delta357/AutoML---Machine-learning/blob/main/notebook/Automl%20-%20Previs%C3%A3o%20AVC.ipynb |
| Tweets nlp | https://github.com/Delta357/AutoML---Machine-learning/blob/main/notebook/AutoML_NLP_Tweets_.ipynb |
| Email - AutoML Benchmark - v1 | |
| Reddit Machine Learning Posts | |
| Wine Reviews |
Instalação das bibliotecas do AutoML. Pode usar o comando pip para instalar as bibliotecas o pacote oficial do PyPi
AutoKeras
pip install autokerasH20
pip install h2oAuto-Sklearn
pip install auto-sklearnAdaNet
pip install adanetExemplo simples como é AutoML para modelos de classificação e regressão linear.
# Carregando as bibliotecas
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
# Carregando o dataset
data = pd.read_csv("data.csv")
# Visualizando os 5 primeiros itens
data.head()
# visualizando linhas e colunas com shape
data.shape
# Informações das variaveis
data.info()
# Treino e teste da base de dados para x e y
x = df_train.iloc[:, 0: 10]
y = df_train.iloc[:, 10]
# Visualizando o shape da variavel x
x.shape
# Visualizando o shape da variavel y
y.shape
# Treinando modelo de machine learning
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.3, random_state = 0)
# Visualizando linhas e colunas do dado de treino x_train
x_train.shape
# Visualizando linhas e colunas do dado de treino y_train
y_train.shape
# Modelo AutoML - AutoKeras
# Modelo classificação com autokeras
# Importando a biblioteca
import autokeras as ak
# Modelo de classificação - max_trials tempo que vai ser treinado
model = ak.StructuredDataClassifier(max_trials = 10)
# Modelo vai treino - epochs sera as epocas do modelo
model_fit = model.fit(x = x_train, y = y_train, epochs = 100)
# Valição do modelo foi preparado
model_automl_eval = model.evaluate(x = x_test, y = y_test)
# Previsão do modelo
predict = model.predict(model_predict)
predict
