Estratégias para redução da fragmentação em métodos incrementais para desambiguação de nomes de autores.

dc.contributor.advisorFerreira, Anderson Almeidapt_BR
dc.contributor.authorEspiridião, Luciano Vilas Boas
dc.date.accessioned2014-12-14T12:48:39Z
dc.date.available2014-12-14T12:48:39Z
dc.date.issued2014
dc.descriptionPrograma de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.pt_BR
dc.description.abstractAmbiguidade de nomes de autores é um grande problema enfrentado pela comunidade científica. Este problema ocorre quando vários autores publicam artigos usando nomes similares, ou quando um mesmo autor publica seus artigos com variações do seu nome. Tradicionalmente, existem métodos de desambiguação automáticos que são aplicadas a todos os registros de citação que estão no repositório de uma biblioteca digital. Mas existem métodos incrementais, que apenas desambiguam os nomes dos autores durante a inserção de um registro de citação no repositório. Estes métodos foram propostos com o objetivo de se obter uma maior eficiência.Porém, como efeito colateral, vários registros de um mesmo autor podem ser considerados como pertencentes a diferentes autores, causando o que é chamado fragmentação. Neste trabalho, é realizado um estudo para comparar várias estratégias visando reduzir a fragmentação dos registros sem comprometer a pureza, ou seja, mantendo os grupos de registros atribuídos a um autor com registros somente de um autor.As estratégias avaliadas foram baseadas em técnicas capazes de isolar os registros de citação possivelmente atribuídos incorretamente durante o processo de desambiguação.A avaliação experimental mostra que algumas estratégias conseguiram produzir melhorias significativas em relação a uma abordagem incremental e mostraram-se muito competitivas em relação a alguns métodos tradicionais.pt_BR
dc.description.abstractenAmbiguity in author names is a hard problem faced by the scientific community. This problem occurs when multiple authors publish their articles using similar names, or when the same author publishes their articles with variations in their name. Traditionally, automatic disambiguation methods perform on all citation records in a digital library repository. On the other hand, incremental methods only disambiguate author names when a citation record is inserted into the repository. These methods have been proposed aiming to improve the efficiency. However, as a side effect, several records from the same author may be considered as belonging to different authors, fragmenting the citation list of a same author into several citation lists. In this work, we conduct a study to compare several strategies, in order to reduce this fragmentation without compromising purity, i.e., keeping the groups of records assigned to an author with records from only one author. The evaluated strategies were based on techniques able to isolate citation records possibly incorrectly attributed during the disambiguation process. The experimental evaluation shows that some strategies produce significant improvements against an incremental method and are very competitive compared with some traditional methods.
dc.identifier.citationESPIRIDIÃO, L. V. B. Estratégias para redução da fragmentação em métodos incrementais para desambiguação de nomes de autores. 2014. 71 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2014.pt_BR
dc.identifier.urihttp://www.repositorio.ufop.br/handle/123456789/4164
dc.language.isopt_BRpt_BR
dc.rights.licenseAutorização concedida ao Repositório Institucional da UFOP pelo autor, 04/12/2014, com as seguintes condições: disponível sob Licença Creative Commons 3.0, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.pt_BR
dc.subjectAmbiguidadept_BR
dc.subjectBibliotecas digitaispt_BR
dc.subjectSimilaridadept_BR
dc.titleEstratégias para redução da fragmentação em métodos incrementais para desambiguação de nomes de autores.pt_BR
dc.typeDissertacaopt_BR
Files
Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
DISSERTAÇÃO_EstratégiasReduçãoFragmentação.pdf
Size:
3.51 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
2.57 KB
Format:
Item-specific license agreed upon to submission
Description: