DEEST - Departamento de Estatística
Permanent URI for this community
Browse
Browsing DEEST - Departamento de Estatística by Issue Date
Now showing 1 - 20 of 110
Results Per Page
Sort Options
Item Crime e estratégias de policiamento em espaços urbanos.(2008) Beato, Claudio Chaves; Silva, Bráulio Figueiredo Alves da; Tavares, RicardoItem Surveillance to detect emerging space time clusters.(2009) Assunção, Renato Martins; Correa, Thais RotsenThe interest is on monitoring incoming space time events to detect an emergent space time cluster as early as possible. Assume that point process events are continuously recorded in space and time. In a certain unknown moment, a small localized cluster of increased intensity starts to emerge. Its location is also unknown. The aim is to let an alarm to go off as soon as possible after its emergence, but avoiding that it goes off unnecessarily. The alarm system should also provide an estimate of the cluster location. In addition to that, the alarm system should take into account the purely spatial and the purely temporal heterogeneity, which are not specified by the user. A space time surveillance system with these characteristics using a martingale approach to derive the surveillance system properties is proposed. The average run length for the situation when there are clusters present in the data is appropriately defined and the method is illustrated in practice. The algorithm is implemented in a freely available stand-alone software and it is also a feature in a freely available GIS system.Item Testing spatial cluster occurrence in maps equipped with environmentally defined structures.(2010) Duczmal, Luiz Henrique; Tavares, Ricardo; Patil, Ganapati; Cançado, André Luiz FernandesWe propose a novel tool for testing hypotheses concerning the adequacy of environmentally defined factors for local clustering of diseases, through the comparative evaluation of the significance of the most likely clusters detected under maps whose neighborhood structures were modified according to those factors. A multiobjective genetic algorithm scan statistic is employed for finding spatial clusters in a map divided in a finite number of regions, whose adjacency is defined by a graph structure. This cluster finder maximizes two objectives, the spatial scan statistic and the regularity of cluster shape. Instead of specifying locations for the possible clusters a priori, as is currently done for cluster finders based on focused algorithms, we alter the usual adjacency induced by the common geographical boundary between regions. In our approach, the connectivity between regions is reinforced or weakened, according to certain environmental features of interest associated with the map. We build various plausible scenarios, each time modifying the adjacency structure on specific geographic areas in the map, and run the multi-objective genetic algorithm for selecting the best cluster solutions for each one of the selected scenarios. The statistical significances of the most likely clusters are estimated through Monte Carlo simulations. The clusters with the lowest estimated p-values, along with their corresponding maps of enhanced environmental features, are displayed for comparative analysis. Therefore the probability of cluster detection is increased or decreased, according to changes made in the adjacency graph structure, related to the selection of environmental features. The eventual identification of the specific environmental conditions which induce the most significant clusters enables the practitioner to accept or reject different hypotheses concerning the relevance of geographical factors. Numerical simulation studies and an application for malaria clusters in Brazil are presented.Item Internal cohesion and geometric shape of spatial clusters.(2010) Duarte, Anderson Ribeiro; Duczmal, Luiz Henrique; Ferreira, Sabino José; Cançado, André Luiz FernandesThe geographic delineation of irregularly shaped spatial clusters is an ill defined problem. Whenever the spatial scan statistic is used, some kind of penalty correction needs to be used to avoid clusters’ excessive irregularity and consequent reduction of power of detection. Geometric compactness and non-connectivity regularity functions have been recently proposed as corrections. We present a novel internal cohesion regularity function based on the graph topology to penalize the presence of weak links in candidate clusters. Weak links are defined as relatively unpopulated regions within a cluster, such that their removal disconnects it. By applying this weak link cohesion function, the most geographically meaningful clusters are sifted through the immense set of possible irregularly shaped candidate cluster solutions. A multiobjective genetic algorithm (MGA) has been proposed recently to compute the Paretosets of clusters solutions, employing Kulldorff’s spatial scan statistic and the geometric correction as objective functions. We propose novel MGAs to maximize the spatial scan, the cohesion function and the geometric function, or combinations of these functions. Numerical tests show that our proposed MGAs has high power to detect elongated clusters, and present good sensitivity and positive predictive value. The statistical significance of the clusters in the Pareto-set are estimated through Monte Carlo simulations. Our method distinguishes clearly those geographically inadequate clusters which are worse from both geometric and internal cohesion viewpoints. Besides, a certain degree of irregularity of shape is allowed provided that it does not impact internal cohesion. Our method has better power of detection for clusters satisfying those requirements. We propose a more robust definition of spatial cluster using these concepts.Item Utilização do procedimento inferência Data-driven para a estatística Espacial Scan em casos do diabetes no estado de Minas Gerais.(2011) Andrade, Gilberto de; Duarte, Anderson RibeiroO método de detecção e inferência de conglomerados (clusters) Scan Circular para mapas de dados agregados, procura por clusters de casos sem especificar o tamanho (número de áreas) ou localização geográfica antecipadamente. Existe ainda, uma proposta de modificação para o teste inferencial usual da estatística Scan, denominada inferência Data-Driven, incorporando informações adicionais sobre o tamanho do cluster mais provável encontrado. Será apresentada a estrutura das duas técnicas inferenciais, e ainda, será proposta uma avaliação através do procedimento clássico e também do novo procedimento Data-Driven avaliando um conjunto de dados reais para ocorrência de casos do Diabetes no estado de Minas Gerais. As conclusões mostram que realmente o novo procedimento pode propiciar novas conclusões acerca da significância de eventuais conglomerados existentes nos conjuntos de dados em estudo.Item Uma revisão sobre métodos para a detecção de períodos de aquecimento em modelos de simulação a eventos discretos.(2011) Norato, Hélida Mara Gomes; Duarte, Anderson RibeiroA seleção de um período de aquecimento adequado para uma simulação de eventos discretos ainda é uma escolha de difícil determinação. Alguns métodos já foram desenvolvidos e serão brevemente revistos aqui. Ainda não existem critérios definitivos para a escolha de um método específico dentre os existentes. Buscamos discutir alguns dos métodos existentes e sua adaptação à estrutura de um modelo experimental em estudo. Analisaremos o desempenho dos métodos expostos através de um procedimento avaliativo para comparação. Os métodos serão aplicados para as saídas geradas por um modelo simples de trabalho com diferentes níveis de utilização. Algumas métricas serão utilizadas para averiguação da eficiência de cada um dos métodos em comparação.Item Penalização por não-conectividade ponderada de grafos.(2011) Silva, Spencer Barbosa da; Duarte, Anderson RibeiroO problema de detecção e inferência de clusters vem sendo recentemente tratado em muitos trabalhos através de técnicas de otimização. Recentes medidas de penalização são associadas à Estatístitica Scan Espacial para a detecção de clusters irregulares. Uma destas medidas é a de Não Conectividade, que se mostra bastante eficaz no auxílio para a detecção. Entretanto tal medida apresenta dificuldades para interpretar as diferenças existentes quanto a importância de cada conexão dentro de um possível cluster. Será proposta uma estratégia de ponderação para os termos associados à medida de Não conectividade visando aumentar a eficiência da medida anterior para detecção de clusters irregulares.Item Utilização do algoritmo Simulated Annealing em problemas de otimização.(2011) Silva, Victor Ferreira da; Duarte, Anderson RibeiroEste trabalho tem um caráter bastante introdutório. Não sendo de interesse um estudo profundo a cerca dos itens que serão mencionados. Os objetivos principais giram em torno de apresentar os detalhes básicos da utilização do algoritmo Simulated Annealing e sugerir um problema real para sua utilização. Inicialmente é apresentada a idéia central que permeia a proposta do algoritmo. Posteriormente são citados alguns detalhes básicos sobre a sua formulação. Sua implementação é discutida na seção metodológica. Uma instância pequena do clássico problema do caixeiro viajante é mencionada a título de exemplo e o algoritmo é implementado para solucionar tal exemplo. É proposto um problema aplicado em Teoria das Filas para ser solucionado através do algoritmo proposto e Conclusões Finais são expostas.Item Experimento fatorial blocado para determinação de diferenças entre tempo de queima de velas de parafina.(2011) Barbosa, Helinton André Lopes; Santos, Thiago Rezende dos; Oliveira, Fernando Luiz Pereira deA prefeitura de uma pequena cidade do estado de Minas Gerais vai implantar um programa social que distribuirá velas de parafina aos moradores da zona rural, onde ainda não há energia elétrica, enquanto o programa de eletrificação rural não é implantado. A licitação pública determina, como critério técnico, aos participantes do trâmite possuidores dos menores preços com variação máxima de 10% entre o menor e o maior, que forneçam material para ser testado em um experimento estatístico e, assim, verificada qual marca possui maior tempo de queima. O processo licitatório mostrou que 4 fornecedores possuem preços com as características desejadas do tipo de vela que a prefeitura deseja comprar, ou seja, velas de 35 gramas, entre 15 e 16 centímetros de comprimento.Item Um olhar cuidadoso sobre o modelo espacial de decaimento exponencial.(2012) Rodrigues, Erica Castilho; Assunção, RenataUm dos pontos cruciais em modelos espaciais paradados de área está na forma de modelar a estrutura de dependência.Modelos como, por exemplo, aqueles propostos por [2] e [4] têm sido utilizados em diversos tipos de aplicação. Alguns desses modelos, porém, apresentam aspectos não intuitivos, como aqueles apontados por [5]. O nosso objetivo nesse trabalho é identificar e analisar as causas de certos de certos resultados não razoáveis do modelo proposto por [4].Item Bayesian spatial models with a mixture neighborhood structure.(2012) Rodrigues, Erica Castilho; Assunção, Renato MartinsIn Bayesian disease mapping, one needs to specify a neighborhood structure to make inference about the underlying geographical relative risks. We propose a model in which the neighborhood structure is part of the parameter space. We retain the Markov property of the typical Bayesian spatial models: given the neighborhood graph, disease rates follow a conditional autoregressive model. However, the neighborhood graph itself is a parameter that also needs to be estimated. We investigate the theoretical properties of our model. In particular, we investigate carefully the prior and posterior covariance matrix induced by this random neighborhood structure, providing interpretation for each element of these matrices.Item Abordagem multiobjetivo para otimização de redes de filas finitas.(2012) Cruz, Frederico Rodrigues Borges da; Oliveira, Fernando Luiz Pereira de; Ferreira, José Hissa; Magela Neto, OrianeEste artigo apresenta uma discussão sobre os resultados obtidos por meio de um algoritmo multiobjetivo recentemente desenvolvido para otimizar, simultaneamente, o tamanho total das áreas de espera, a taxa total de serviço e a taxa de saída de uma rede de filas finitas com serviço geral. Como tais objetivos eram conflitantes, utilizou-se uma versão de um algoritmo genético projetado para encontrar soluções ótimas a mais de um deles. Foram obtidas algumas propriedades que podem auxiliar na análise e no projeto de tais importantes sistemas estocásticos.Item Extensão da inferência data-driven ao Scan Elíptico para avaliação de clusters irregulares.(2012) Camêlo, Gabriel Juliano; Andrade, Gilberto de; Alves, Henrique José de Paula; Lobo, Telma de Souza; Duarte, Anderson Ribeiro; Silva, Spencer Barbosa daA estatística Scan Espacial é comumente usada para detecção de clusters geográficos, vigilância sindrômica e monitoramento de doenças. A forma de utilização mais difundida é o Scan Circular, entretanto se mostra ineficaz para problemas envolvendo clusters de formato irregular. Uma das soluções propostas neste cenário é o Scan Elíptico. Nos dois formatos (circular ou elíptico), o procedimento inferencial para determinar a significância estatística de um possível cluster se baseia em simulações de Monte Carlo. Uma vasta discussão existe sobre a validade do procedimento inferencial usual para o Scan Circular, tal discussão levou a proposição da metodologia de inferência denominada Data-driven. Não existem estudos sobre a aplicabilidade dessa metodologia para o Scan Elíptico. Neste trabalho explora-se a versão elíptica do Scan associada ao procedimento de inferência Data-driven com o intuito de verificar se existem diferenças evidentes entre as duas técnicas inferenciais. As avaliações são realizadas através de um benchmark de dados reais de casos de câncer no nordeste dos Estados Unidos.Item Avaliação de impactos ambientais na rodovia MG - 010 : estudo de caso no vetor norte de Belo Horizonte (MG).(2013) Brito, Tiago Silva Alves de; Vasconcellos, Fernanda Carla Wasner; Oliveira, Fernando Luiz Pereira deO presente trabalho tem por objetivo avaliar os impactos ambientais da Rodovia MG – 010 no trecho entre Hospital Risoleta Neves até o Viaduto Avenida Senhor do Bonfim (início da MG – 424), localizada no município de Belo Horizonte (MG), no período de 1989 e 2010. Para dar base aos estudos utilizaram-se os softawares Global Mapper e ArcGis para confecção dos mapas temáticos da área, e, ainda, registro fotográfico in loco dos principais impactos as margens da rodovia. Os resultados demonstraram que em um período de 20 anos a MG – 010 sofreu alterações em todos os compartimentos ambientais: físico (surgimento de ravinas e voçorocas), biótico (introdução de espécies exóticas e aumento das áreas de mata) e socioeconômico (aumento da circulação de veículos, atração de comércios e serviços e alargamento das autovias). Dentre os fatores que contribuíram para o desencadeamento deste processo está a expansão urbana-industrial direcionada ao Vetor Norte de Belo Horizonte.Item Tests for mean vectors in high dimension(2013) Maboudou-Tchao, Edgard M.; Silva, Ivair RamosTraditional multivariate tests, Hotelling’s T 2 or Wilks , are designed for a test of the mean vector under the condition that the number of observations is larger than the number of variables. For high-dimensional data, where the number of features is nearly as large as or larger than the number of observations, the existing tests do not provide a satisfactory solution because of the singularity of the estimated covariance matrix. In this article, we consider a test for the mean vector of independent and identically distributed multivariate normal random vectors where the dimension is larger than or equal to the number of observations. To solve this problem, we propose a modified Hotelling statistic. Simulation results show that the proposed test is superior to other tests available in the literature. However, because we do not know the theoretical distribution of this modified statistic, Monte Carlo methods were used to reach this conclusion. Instead of using conventional Monte Carlo methods, which perform a fixed-number of simulations, we suggest using the sequential Monte Carlo test in order to decrease the number of simulations needed to reach a decision. Simulation results show that the sequential Monte Carlo test is preferable to a fixed-sample test, especially when using computationally intensive statistical methods.Item Optimal generalized truncated sequential Monte Carlo test.(2013) Silva, Ivair Ramos; Assunção, Renato MartinsWhen it is not possible to obtain the analytical null distribution of a test statistic U, Monte Carlo hypothesis tests can be used to perform the test. Monte Carlo tests are commonly used in a wide variety of applications, including spatial statistics, and biostatistics. Conventional Monte Carlo tests require the simulation of m independent copies from U under the null hypothesis, what is computationally intensive for large data sets. Truncated sequential Monte Carlo designs can be performed to reduce computational effort in such situations. Different truncated sequential procedures have been proposed. They work under restrictive assumptions on the distribution of U aiming to bound the power loss and to reduce execution time. Since the use of Monte Carlo tests are based on the situations where the null distribution of U is unknown, their results are not valid for the general case of any test statistic. In this paper, we derive an optimal scheme for truncated sequential Monte Carlo hypothesis tests. This scheme minimizes the expected number of simulations under any alternative hypothesis, and bounds the power loss in arbitrarily small values. The first advantage from this scheme is that the results concerning the power and the expected time are valid for any test statistic. Also, we present practical examples of optimal procedures for which the expected number of simulations are reduced by 60% in comparison with some of the best procedures in the literature.Item Using the flow of people in cluster detection and inference.(2013) Ferreira, Sabino José; Oliveira, Francisco S.; Tavares, Ricardo; Moura, Flávio dos ReisThis work proposes a cluster detection method that adapts the traditional circular scan method, in the snese the proposed method uses the flow of people as a measure of proximity, interaction between regions of a map to identify a set of regions with a high risk of occurrence of some specific event. The flow of people between two regions is estimated by the gravitational method as proportional to the product of their gross domestic product and inversely proportional to the square of the distance between them. The performance of the proposed method was compared with the traditional circular scan simulating clusters from a database of real cases of homicides and also analyzing the real picture. In all simulated cases the proposed techniques overcame the circular scan with better results of detection power, sensibility and positive predictive value, except for regular shaped simulated clusters. When applied to the real situation of homicides cases the spatial flow scan algorithm presented results quite similar to original spatial scan since the detected cluster was regular. In conclusion we consider that the proposed method is a good alternative for detection of irregular and or non-connected clusters.Item Métodos não-paramétricos em análise de sobrevivência - uma aplicação a dados de evasão.(2014) Gonçalves, Ana Carolina Andrade; Gouvêa, Graziela Dutra RochaItem Self-oriented control charts for efficient monitoring of mean vectors.(2014) Moraes, D. A. O.; Oliveira, Fernando Luiz Pereira de; Quinino, Roberto da Costa; Duczmal, Luiz HenriqueThis work presents a procedure for monitoring the centre of multivariate processes by optimising the noncentrality parameter with respect to the maximum separability between the in- and out-of-control states. Similarly to the Principal Component Analysis, this procedure is a linear transformation but using a different criterion which maximises the trace of two scatter matrices. The proposed linear statistic is self-oriented in the sense that no prior information is given, then it is monitored by two types of control charts aiming to identify small and intermediate shifts. As the control charts performances depend only on the noncentrality parameter, comparisons are made with traditional quadratic approaches, such as the Multivariate Cumulative Sum (MCUSUM), the Multivariate Exponentially Weighted Moving Average (MEWMA) and Hotelling’s T2 control chart. The results show that the proposed statistic is a solution for the problem of finding directions to be monitored without the need of selecting eigenvectors, maximising efficiency with respect to the average run length.Item Busca local para pós-processamento em resultados de otimização multi-objetivo em redes de filas gerais.(2014) Souza, Gabriel Lima de; Cruz, Frederico Rodrigues Borges da; Duarte, Anderson RibeiroNo desafiador problema de otimização de redes de filas finitas, a capacidade total do sistema em áreas de espera deve ser a menor possível, enquanto o número de usuários atendidos por unidade de tempo deve ser o maior possível. Soluções para estes objetivos conflitantes já existem, porém podem ser melhoradas através da redistribuição de áreas de circulação entre as filas, preservando fixa a capacidade total do sistema. Um algoritmo simulated annealing foi desenvolvido, especialmente para redes de filas finitas, produzindo soluções eficientes para o problema. Um conjunto de experimentos computacionais foi conduzido, para determinar a eficiência da abordagem proposta. As conclusões apresentadas podem auxiliar aos profissionais da área no planejamento de redes de filas gerais.