Comparação de modelos de análise de sentimentos a partir de dados coletados na rede Twitter : um estudo de caso a partir de mensagens a respeito de um modelo de smartphone
Autor: Giovanna de Oliveira Moreira (Currículo Lattes)
Resumo
A análise de sentimentos é um campo de estudo com potencial crescente de informação devido ao aumento na utilização das redes sociais, o que tem gerado uma quantidade enorme de dados disponíveis para análise em tempo real. Atualmente o Twitter (twitter.com) está entre as redes sociais mais utilizadas no mundo, sendo esta uma plataforma de grande interesse para pesquisadores e empresas no que diz respeito à análise de sentimentos. O Twitter permite ao usuário publicar mensagens em até 280 caracteres, links de vídeos e fotos, entre outros, além de permitir a obtenção destes dados. A análise de sentimentos proporciona feedbacks da opinião do público sobre vários tópicos, tais como a imagem de uma empresa e a aceitação de determinado produto, entre tantos outros. Na era computacional a análise de sentimentos é realizada com a utilização de algoritmos computacionais, existindo vários deles disponíveis na literatura para a aplicação da análise de sentimentos. Apesar disso, ainda há a necessidade da avaliação do emprego destes algoritmos quando se trata da análise de sentimentos de clientes. Todo o conjunto de dados presente no trabalho, passou pelas etapas de coleta, limpeza, pré-processamento e treinamento. Dessa forma, esta proposta de trabalho avaliou a utilização dos algoritmos Naive Bayes, Support Vector Machine e Regressão Logística para a análise de sentimentos sobre o smartphone iPhone a partir de mensagens coletadas na rede social Twitter. A partir das métricas de validação o Modelo Naive Bayes apresentou uma precisão de 75%, acurácia de 72% e F1-score de 75%. O modelo Regressão Logística apresentou uma precisão de 74%, acurácia de 71% e F1-score de 72%. Por fim, o modelo Support Vector Machine apresentou uma precisão de 74%, acurácia de 68% e F1-score de 71%. Mesmo utilizando a validação cruzada e um classificador de votação não houve aumento nas métricas dos modelos.