Um arcabouço de processamento de textos informais em português brasileiro para aplicações de mineração de dados.
dc.contributor.advisor | Merschmann, Luiz Henrique de Campos | pt_BR |
dc.contributor.author | Stiilpen Júnior, Milton | |
dc.contributor.referee | Merschmann, Luiz Henrique de Campos | pt_BR |
dc.contributor.referee | Ferreira, Anderson Almeida | pt_BR |
dc.contributor.referee | Souza, Fabrício Benevenuto de | pt_BR |
dc.date.accessioned | 2017-03-13T12:24:38Z | |
dc.date.available | 2017-03-13T12:24:38Z | |
dc.date.issued | 2016 | |
dc.description | Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. | pt_BR |
dc.description.abstract | Redes Sociais online (RSO) surgiram no início do século XXI e dão indícios de que terão vida longa. Cerca de 64% dos usuários de mídias sociais dizem acessar ao menos uma rede social todos os dias. Desse modo, é imensa a quantidade de dados gerados por esses canais de comunicação. O Processamento de Linguagem Natural em textos de redes sociais é um tema de pesquisa recente que vem atraindo um número cada vez maior de pesquisadores. Portanto, neste trabalho, é proposta um arcabouço capaz de lidar com a diversidade do português brasileiro, com o informalismo, com a natureza de tempo real e com a falta de contextualização de textos publicados em redes sociais. O arcabouço proposto foi avaliado em duas tarefas (Categorização de Texto e Mineração de Opinião) e os resultados experimentais mostraram que os mecanismos de pré-processamento existentes no arcabouço foram importantes para obtenção de bons resultados. | pt_BR |
dc.description.abstracten | Social Networks emerged at the beginning of 21st century and give us evidence that they are going to have a long life. Almost two-thirds of overall social media users affirm an everyday usage of a social media website and, therefore, the data volume across this platforms is huge. Natural language processing of social media texts is an attractive topic among researchers of this area. While there are many studies about natural language processing of social media texts for some languages (e.g., English), the researches for Brazilian Portuguese language are still limited. Then, in this work, a framework is proposed to deal with peculiarities of the Brazilian Portuguese language in informal, short and noisy texts, where the lack of context poses obstacles in text mining. The proposed framework has been evaluated in two tasks (Text Categorization and Opinion Mining) and experiments showed that the preprocessing mechanisms included in this framework were important to achieve better results. | pt_BR |
dc.identifier.citation | STIILPEN JÚNIOR, Milton. Um arcabouço de processamento de textos informais em português brasileiro para aplicações de mineração de dados. 2016. 41 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2016. | pt_BR |
dc.identifier.uri | http://www.repositorio.ufop.br/handle/123456789/7360 | |
dc.language.iso | pt_BR | pt_BR |
dc.rights | aberto | pt_BR |
dc.rights.license | Autorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 09/03/2017 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais nem a adaptação. | pt_BR |
dc.subject | Mineração de dados - computação | pt_BR |
dc.subject | Redes sociais on-line | pt_BR |
dc.subject | Processamento da linguagem natural - computação | pt_BR |
dc.title | Um arcabouço de processamento de textos informais em português brasileiro para aplicações de mineração de dados. | pt_BR |
dc.type | Dissertacao | pt_BR |
Files
Original bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- DISSERTAÇÃO_ArcabouçoProcessamentoTextos.pdf
- Size:
- 3.3 MB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 924 B
- Format:
- Item-specific license agreed upon to submission
- Description: