Uma proposta para identificação de outliers multivariados.

dc.contributor.authorBarbosa, Josino José
dc.contributor.authorPereira, Tiago Martins
dc.contributor.authorOliveira, Fernando Luiz Pereira de
dc.date.accessioned2019-06-06T15:09:01Z
dc.date.available2019-06-06T15:09:01Z
dc.date.issued2018
dc.description.abstractA identificação de outliers desempenha um papel importante na análise estatística, pois tais observações podem conter informações importantes em relação às hipóteses do estudo. Se modelos estatísticos clássicos são cegamente aplicados a dados contendo valores atípicos, os resultados podem ser enganosos e decisões equivocadas podem ser tomadas. Além disso, em situações práticas, os próprios outliers são muitas vezes os pontos especiais de interesse e sua identificação pode ser o principal objetivo da investigação. Desta forma, objetivou-se propor uma técnica de detecção de outliers multivariados, baseada em análise agrupamento e comparar essa técnica com o método de identificação de outliers via Distância de Mahalanobis. Para geração dos dados utilizou-se simulação via método de Monte Carlo e a técnica de mistura de distribuições normais multivariadas. Os resultados apresentados nas simulações mostraram que o método proposto foi superior ao método de Mahalanobis tanto para sensibilidade quanto para especificidade, ou seja, ele apresentou maior capacidade de diagnosticar corretamente os indivíduos outliers e os não outliers. Além disso, a metodologia proposta foi ilustrada com uma aplicação em dados reais provenientes da área de saúde.pt_BR
dc.description.abstractenThe identification of outliers plays an important role in the statistical analysis, since such observations may contain important information regarding the hypotheses of the study. If classical statistical models are blindly applied to data containing atypical values, the results may be misleading and mistaken decisions can be made. Moreover, in practical situations, the outliers themselves are often the special points of interest and their identification may be the main objective of the investigation. In this way, it was proposed to propose a technique of detection of multivariate outliers, based on cluster analysis and to compare this technique with the method of identification of outliers via Mahalanobis Distance. For data generation, Monte Carlo method simulation and the mixed multivariate normal distribution technique were used. The results presented in the simulations showed that the proposed method was superior to the Mahalanobis method for both sensitivity and specificity, that is, it presented greater ability to correctly diagnose outliers and non-outliers individuals. In addition, the proposed methodology was illustrated with an application in real data from the health area.pt_BR
dc.identifier.citationBARBOSA, J. J.; PEREIRA, T. M.; OLIVEIRA, F. L. P. de. Uma proposta para identificação de outliers multivariados. Ciência e Natura, Santa Maria, v. 40, p. 40, 2018. Disponível em: <https://periodicos.ufsm.br/cienciaenatura/article/view/29535/pdf>. Acesso em: 19 mar. 2019.pt_BR
dc.identifier.doihttp://dx.doi.org/10.5902/2179460X29535pt_BR
dc.identifier.issn2179-460X
dc.identifier.urihttp://www.repositorio.ufop.br/handle/123456789/11454
dc.language.isopt_BRpt_BR
dc.rightsabertopt_BR
dc.rights.licenseOs trabalhos publicados na Ciência e Natura estão sob licença Creative Commons que permite copiar, distribuir, transmitir e adaptar o trabalho, desde que sejam citados o autor e licenciante. Fonte: Ciência e Natura <https://periodicos.ufsm.br/cienciaenatura/about/submissions#copyrightNotice>. Acesso em: 25 out. 2016.pt_BR
dc.subjectAnálise de agrupamentopt_BR
dc.subjectMétodo de Monte Carlopt_BR
dc.subjectGrouping analysispt_BR
dc.subjectMonte Carlo methodpt_BR
dc.titleUma proposta para identificação de outliers multivariados.pt_BR
dc.title.alternativeA proposal for identifying multivariate outliers.pt_BR
dc.typeArtigo publicado em periodicopt_BR
Files
Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
ARTIGO_PropostaIdentificaçãoOutliers.pdf
Size:
1.17 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
924 B
Format:
Item-specific license agreed upon to submission
Description: