???jsp.display-item.social.title??? |
![]() ![]() |
Please use this identifier to cite or link to this item:
https://tede.ufam.edu.br/handle/tede/7232
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.creator | Souza, Bruno Ábia | - |
dc.creator.Lattes | http://lattes.cnpq.br/8539800386696490 | por |
dc.contributor.advisor1 | Nakamura, Eduardo Freire | - |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/1448696292042915 | por |
dc.contributor.advisor-co1 | Nakamura, Fabiola Guerra | - |
dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/9615041048900531 | por |
dc.contributor.referee1 | Figueiredo, Carlos Maurício Seródio | - |
dc.contributor.referee1Lattes | http://lattes.cnpq.br/9060002746939878 | por |
dc.contributor.referee2 | Costa, Elloá Barreto Guedes da | - |
dc.contributor.referee2Lattes | http://lattes.cnpq.br/6466781778573760 | por |
dc.date.issued | 2017-03-24 | - |
dc.identifier.citation | SOUZA, Bruno Ábia. Uma abordagem para seleção de tópicos relevantes em redes sociais online. 2017. 81 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2017. | por |
dc.identifier.uri | https://tede.ufam.edu.br/handle/tede/7232 | - |
dc.description.resumo | O crescente uso das redes sociais fez com que a quantidade de informações que são compartilhadas diariamente (opiniões pessoais, notícias e eventos do tipo natural ou social) aumentasse, tornando estas redes uma fonte de informaç cãoo sobre eventos. No Brasil, acontecimentos recentes, como a Operação Lava Jato conduzida pela polícia Federal e o processo de impeachment da Presidente são exemplos de eventos que geraram repercussões nos meios de comunicação. Esses fatos marcantes, podem ser utilizados para caracterizar quais são os acontecimentos relevantes de um determinado evento. Nas redes sociais, esses acontecimentos geram discussões, compartilhamentos e novas notícias, onde informações relevantes acabam tendo mais repercussões. Contudo, processar uma elevada massa de dados a fim de eliminar ruídos e reconhecer informações torna-se muito custoso. Neste contexto, este trabalho tem como objetivo demonstrar uma abordagem para caracterização de informações relevantes de eventos, através da extração de tópicos em dados compartilhados no Twitter, onde avaliamos o desempenho de três métodos de aprendizagem de máquina (K-means, Latent Dirichlet Allocation - LDA e Non-Negative Matrix Factorization - NMF) usados para extrair tópicos sobre as bases de dados da Operação Lava Jato e do processo de impeachment da presidente do Brasil em duas arquiteturas de pré-processamento diferentes (tradicional e com reconhecimento de entidade), demonstrando que é possível utilizar uma rede social como fonte de dados para descobrir os tópicos relevantes através do sensoriamento de usuários que observam um evento. Em nossos experimentos, observamos que as técnicas de pré-processamento têm influência direta sobre o resultado da extração de tópicos. Além disso, observamos que a técnica Silhouette nos ajudou a encontrar o melhor valor de clusters para uma determinada amostra de dados. Nos resultados o NMF apresentou o melhor desempenho nas duas bases de dados, tanto na tarefa de extração de tópicos quanto no tempo de execução. | por |
dc.description.abstract | The increasing use of social networks has made the amount of information that is shared daily (personal opinions, news and events of the natural or social type) increasing significantly, making social networks a source of information about events. In Brazil, recent events such as Lava Jato Operation conducted by the Federal Police and the impeachment process of the Brazil President are examples of events that have had repercussions in the traditional medias. These facts can be used to characterize the relevant informations of an event. In social networks, the events generate discussions, sharings and news posts, where relevant information have more repercussions. However, processing a large mass of data to eliminate noise and recognize the information becomes costly. In this context, this work aims to show an approach to the characterization of relevant information by extracting topics in shared data on Twitter, where we evaluate the performance of three methods of machine learning (K-means, Latent Dirichlet Allocation (LDA) and Non-Negative Matrix Factorization (NMF)) used to extract topics on Lava Jato's databases and the impeachment process of the Brazilian president in two different preprocessing architectures (traditional and with entity recognition), demonstrating that it is possible to use the social networks as a data source to discover the relevant topics through the sensing of users that observe an event. In our experiments, we observed that the preprocessing techniques have a direct influence on the result of the topics extraction. In addition, we observed that the Silhouette technique helped us to find the best value of clusters for a given data sample. In the results the NMF presented the best performance in both databases, both in the topic extraction task and in the execution time | eng |
dc.description.sponsorship | CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior | por |
dc.format | application/pdf | * |
dc.thumbnail.url | https://tede.ufam.edu.br//retrieve/31837/Disserta%c3%a7%c3%a3o_BrunoSouza_PPGI.pdf.jpg | * |
dc.language | por | por |
dc.publisher | Universidade Federal do Amazonas | por |
dc.publisher.department | Instituto de Computação | por |
dc.publisher.country | Brasil | por |
dc.publisher.initials | UFAM | por |
dc.publisher.program | Programa de Pós-graduação em Informática | por |
dc.rights | Acesso Aberto | por |
dc.subject | Aprendizado do computador | por |
dc.subject | Redes sociais on-line | por |
dc.subject | Twitter (Rede social on-line) | por |
dc.subject.cnpq | CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO | por |
dc.title | Uma abordagem para seleção de tópicos relevantes em redes sociais online | por |
dc.type | Dissertação | por |
Appears in Collections: | Mestrado em Informática |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Dissertação_BrunoSouza_PPGI.pdf | 4.89 MB | Adobe PDF | ![]() Download/Open Preview |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.