Sobre mim

Meu nome é Ricardo Amaral...

Atualmente estudante da Comunidade DS com o objetivo de desenvolver meus conhecimentos em Ciências de Dados, como por exemplo: python, SQL, Machine Learning, dentre outras ferramentas e conceitos para solucionar problemas de negócios de empresas.

Relacionado a área de dados, meu último trabalho foi acompanhar e garantir a confiabilidade de informações utilizando Excel, SQL e o Microsoft Power BI como suporte.

Durante meu estágio na área de Smart Manufacturing participei de projetos para implementação de novas tecnologias da indústria 4.0 que facilitariam correções nos problemas no processo produtivo. A principal atividade que exerci foi na criação de um Dashboard para acompanhamento de falhas. As principais ferramentas foram o Microsoft Power bi e o Power app.

Durante a formação em engenharia elétrica participei da Empresa júnior nos cargos de RH e como presidente. Meu TCC foi voltado para o tema de tecnologia cujo título foi "Protótipo de um sistema de iluminação e tomada inteligente com o uso da plataforma Arduino e internet das coisas". Este artigo foi publicada em uma revista online.

Habilidades

Linguagens de Programação

  • Python com foco em análise de dados.
  • Linguagem SQL.
  • Conceitos de ETL.
  • Pensamento Estratégico.

Estatística e Machine Learning

  • Estatística Descritiva.
  • Algoritmos de Regressão, Classificação e Clusterização.
  • Métricas de Performance de algortimos ( RMSE, MSE, MAE, MAPE, Confusion Matrix, Precision, Recall, ROC Curve, Silhouette Score e R2 ).
  • Sklearn.

Visualização de Dados

  • Power BI.
  • Matplotlib, Seaborn e Plotly.
  • Streamlit.

Engenharia de Software

  • Github.
  • Streamlit Cloud.
  • SQLite3 Database.

Trabalho de Conclusão de Curso

Protótipo de um sistema de iluminação e tomada inteligente com o uso da plataforma Arduino e internet das coisas

A proposta deste trabalho foi a de pesquisar e compreender os conceitos de Internet das coisas, Domótica, microcontroladores e plataforma Arduino para desenvolver uma maquete para simular uma residência e ser um sistema de baixo custo para o controle de um circuito de iluminação e uma tomada.

Este trabalho foi publicado na revista "brazilian journals". Para ver o trabalho completo, basta acessar o link em "saiba mais" abaixo.

  • Saiba Mais...
  • Projetos em Ciência de Dados

    Foto de Christian Wiediger na Unsplash

    Processamento de Linguagem Natural (PLN) para extrair recomendações a partir das descrições textuais dos produtos

    Este projeto é um sistema de recomendação de produtos utilizando um dataset da Amazon, baseado em técnicas de ciência de dados e aprendizado de máquina. O foco principal está na utilização de Processamento de Linguagem Natural (PLN) para extrair recomendações a partir das descrições textuais dos produtos.

    • Python: Pandas, Scikit-learn, Streamlit.
    • Processamento de Texto: Tokenização, Stemming
    • Criação do modelo: Vetorização, Cálculo de Similaridade
    • Visualização no streamlit.io

    Foto de Nasa na Unsplash

    Utilizando Machine Learning para clusterizar(agrupar) clientes de um Ecommerce

    Utilizando algoritmos de Machine Learning para categorizar os clientes com base em padrões de comportamento de compra. Essa abordagem permitirá uma personalização mais eficaz das estratégias de marketing e um atendimento mais direcionado, contribuindo para a otimização da experiência do cliente e o aumento da eficiência operacional.

    • Python: Pandas, Numpy, Seaborn.
    • Algoritmos de clusterização: K-means, GMM, Hierarchical Clustering e DBSCAN
    • Embedding com Decision Tree
    • Visualização e métrica de silhueta
    • Github

    Foto de Alexander Sinn na Unsplash

    Utilizando Machine Learning para Identificar Clientes de Alto Potencial Para Seguro de Saúde

    O principal objetivo desse projeto é direcionar os esforços de vendas da empresa para os clientes mais propensos a comprar um seguro, eliminando chamadas desnecessárias e melhorando a lucratividade geral. Para alcançar esse objetivo, o modelo foi treinado com dados coletados de clientes existentes que já possuem seguro de saúde, o que proporciona insights valiosos sobre o comportamento dos consumidores.

    • Python: Pandas, Numpy, Seaborn.
    • Algoritmos de machine learning: Logistic Regression, Random Forest Regressor
    • Análise de dados e Visualização
    • Github

    Foto de Stephen Dawson na Unsplash

    Previsão de Vendas com algortmos de Machine Learning

    o objetivo de realizar uma previsão de vendas das lojas Rossmann para as próximos 6 semanas.

    Para realizar essa previsão, o projeto utiliza algoritmos de machine learning. Esses algoritmos são treinados com os dados históricos de vendas, buscando identificar relações e tendências que possam ajudar a prever as vendas futuras.

    • Python: Pandas, Numpy, Seaborn.
    • Algoritmos de machine learning: Linear Regression, Random Forest Regressor, XGBoost Regressor
    • Analise de dado e Visualização
    • Github

    Foto de Kevin Ku na Unsplash

    Ensaio de Machine Learning

    Nesse projeto, foram explorados os principais conceitos do treinamento, ajuste de parâmetros e limiares entre overfitting e underfitting de vários algoritmos de Machine Learning dentro das tarefas de classificação,regressão e agrupamento, através de um ensaio de Machine Learning.

    • Python e Scikit-learn.
    • Algoritmos de classificação: KNN, Decision Tree, Random Forest e Logistic Regression.
    • Métricas de performance: Accuracy, Precision, Recall e F1-Score.
    • Algoritmos de regressão: Linear Regression, Decision Tree Regressor, Random Forest Regressor, Polinomial Regression, Linear Regression Lasso, Linear Regression Ridge, Linear Regression Elastic Net, Polinomial Regression Lasso, Polinomial Regression Ridge e Polinomial Regression Elastic Net.
    • Métricas de performance: R2, MSE, RMSE, MAE e MAPE.
    • Algoritmos de agrupamento: K-Means e Affinity Propagation.
    • Métricas de performance: Silhouette Score.

    Contatos