Browsing by Author "Schwartz, William Robson"
Now showing 1 - 8 of 8
Results Per Page
Sort Options
Item Brazilian license plate detection using histogram of oriented gradients and sliding windows.(2013) Prates, Raphael Felipe de Carvalho; Cámara Chávez, Guillermo; Schwartz, William Robson; Gomes, David MenottiDue to the increasingly need for automatic traffic monitoring, vehicle license plate detection is of high interest to perform automatic toll collection, traffic law enforcement, parking lot access control, among others. In this paper, a sliding window approach based on Histogram of Oriented Gradients (HOG) features is used for Brazilian license plate detection. This approach consists in scanning the whole image in a multiscale fashion such that the license plate is located precisely. The main contribution of this work consists in a deep study of the best setup for HOG descriptors on the detection of Brazilian license plates, in which HOG have never been applied before. We also demonstrate the reliability of this method ensured by a recall higher than 98% (with a precision higher than 78%) in a publicly available data set.Item Desenvolvimento de uma abordagem para reconhecimento contínuo da Língua Brasileira de Sinais utilizando imagens dinâmicas e técnicas de aprendizagem profunda.(2020) Escobedo Cárdenas, Edwin Jonathan; Cámara Chávez, Guillermo; Cámara Chávez, Guillermo; Ferreira, Anderson Almeida; Gomes, David Menotti; Luz, Eduardo José da Silva; Schwartz, William RobsonDurante os últimos anos, têm sido desenvolvidas diversas abordagens para o reconhecimento contínuo de línguas de sinais para melhorar a qualidade de vida das pessoas surdas e diminuir a barreira de comunicação entre elas e a sociedade. Analogamente, a incorporação do dispositivo Microsoft Kinect gerou uma revolução na área de visão computacional, fornecendo novas informações multimodais (dados RGB-D e do esqueleto) que podem ser utilizadas para gerar ou aprender novos descritores robustos e melhorar as taxas de reconhecimento em diversos problemas. Assim, nessa pesquisa de doutorado, apresenta-se uma metodologia para o reconhecimento de sinais contínuos da Língua Brasileira de Sinais (LIBRAS) utilizando como dados de entrada de um sinal as informações fornecidas pelo dispositivo Kinect. Diferentemente dos outros trabalhos na literatura, que utilizam arquiteturas de redes mais complexas (como as 3DCNN e BLSTM), o método proposto utiliza janelas deslizantes para procurar segmentos candidatos de serem sinais dentro de um fluxo continuo de video. Do mesmo modo, propõe-se o uso de imagens dinâmicas para codificar as informações espaço-temporais fornecidas pelo Kinect. Assim, pode-se reduzir a complexidade da arquitetura CNN proposta para o reconhecimento dos sinais. Finalmente, baseado no conceito de pares mínimos, um novo banco de dados da Língua Brasileira de Sinais chamado LIBRAS-UFOP é proposto. A base LIBRAS-UFOP possui tanto sinais isolados (56 classes de sinais) como sinais contínuos (37 classes); nós avaliamos nosso método usando essa base e o comparamos com os métodos propostos na literatura. Os resultados experimentais nos datasets LIBRAS-UFOP e LSA64 demostraram a validade do método proposto baseado em imagens dinâmicas como uma alternativa para o reconhecimento de língua de sinais.Item Detecção de placas veiculares : uma abordagem adaptativa para a localização de placas utilizando descritores HOG.(2014) Prates, Raphael Felipe de Carvalho; Cámara Chávez, Guillermo; Gomes, David Menotti; Cámara Chávez, Guillermo; Gomes, David Menotti; Nascimento, Erickson Rangel do; Schwartz, William RobsonUm sistema de reconhecimento de placas veiculares é responsável por extrair informações visuais que possibilitem a identificação automática de veículos a partir de uma imagem ou sequência de imagens. Trata-se de uma área com muitos trabalhos publicados recentemente devido a sua aplicação em situações cotidianas como no pagamento automático de pedágios e no monitoramento do tráfego de veículos. Uma das etapas para a identificação dos veículos é a detecção das placas veiculares na imagem. Essa é considera a fase mais crítica do sistema devido às dificuldades decorrentes de variações ambientais (dia, noite, sol e chuva) e entre diferentes placas (sujeiras, cores, fontes e oclusão). Uma abordagem comum na detecção de placas veiculares é varrer a imagem usando uma janela deslizante com uma proporção entre a largura e a altura semelhante a da placa veicular. No entanto, para lidar com diferentes escalas é necessário fazer esse processo não em uma escala, mas em uma pirâmide de diferentes escalas. Esse método se opõe às exigências de desempenho do sistema que deve ser tempo-real. Assim, neste trabalho é proposto um método de detecção de placas veiculares utilizando janelas deslizantes que visa uma detecção eficaz analisando um número bem inferior de janelas na imagem quando comparado a abordagem em pirâmide. Com esse objetivo, dividimos o processo em duas etapas principais: (1) busca em uma quantidade mínima de escalas utilizando janelas deslizantes de forma a obter uma estimativa inicial da posição da placa e (2) a partir de cada estimativa inicial ´e realizada uma decomposição em mais escalas localmente, buscando um melhor casamento entre a janela de detecção e a placa real. Os resultados encontrados comprovam as vantagens do método proposto, são obtidas detecções mais precisas analisando 25% e 75% menos janelas que um método multiescalas convencional para as bases brasileira e grega, respectivamente. A confiabilidade do método é garantida por uma revocação de 98% para coeficiente de Jaccard de 50% em duas bases de imagens de diferentes nacionalidades.Item ECG-based heartbeat classification for arrhythmia detection : a survey.(2016) Luz, Eduardo José da Silva; Schwartz, William Robson; Cámara Chávez, Guillermo; Gomes, David MenottiAn electrocardiogram (ECG) measures the electric activity of the heart and has been widelyused for detecting heart diseases due to its simplicity and non-invasive nature. By analyzingthe electrical signal of each heartbeat, i.e., the combination of action impulse waveformsproduced by different specialized cardiac tissues found in the heart, it is possible to detectsome of its abnormalities. In the last decades, several works were developed to produceautomatic ECG-based heartbeat classification methods. In this work, we survey the currentstate-of-the-art methods of ECG-based automated abnormalities heartbeat classificationby presenting the ECG signal preprocessing, the heartbeat segmentation techniques, thefeature description methods and the learning algorithms used. In addition, we describesome of the databases used for evaluation of methods indicated by a well-known standarddeveloped by the Association for the Advancement of Medical Instrumentation (AAMI) anddescribed in ANSI/AAMI EC57:1998/(R)2008 (ANSI/AAMI, 2008). Finally, we discuss limitationsand drawbacks of the methods in the literature presenting concluding remarks and futurechallenges, and also we propose an evaluation process workflow to guide authors in futureworks.Item Evaluating the use of ECG signal in low frequencies as a biometry.(2014) Luz, Eduardo José da Silva; Menotti, David; Schwartz, William RobsonTraditional strategies, such as fingerprinting and face recognition, are becoming more and more fraud susceptible. As a consequence, new and more fraud proof biometrics modalities have been considered, one of them being the heartbeat pattern acquired by an electrocardiogram (ECG). While methods for subject identification based on ECG signal work with signals sampled in high frequencies (>100 Hz), the main goal of this work is to evaluate the use of ECG signal in low frequencies for such aim. In this work, the ECG signal is sampled in low frequencies (30 Hz and 60 Hz) and represented by four feature extraction methods available in the literature, which are then feed to a Support Vector Machines (SVM) classifier to perform the identification. In addition, a classification approach based on majority voting using multiple samples per subject is employed and compared to the traditional classification based on the presentation of single samples per subject each time. Considering a database composed of 193 subjects, results show identification accuracies higher than 95% and near to optimality (i.e., 100%) when the ECG signal is sampled in 30 Hz and 60 Hz, respectively, being the last one very close to the ones obtained when the signal is sampled in 360 Hz (the maximum frequency existing in our database). We also evaluate the impact of: (1) the number of training and testing samples for learning and identification, respectively; (2) the scalability of the biometry (i.e., increment on the number of subjects); and (3) the use of multiple samples for person identification.Item Fusão de características na re-identificação de pessoas.(2018) Sales, Anderson Luís Cavalcanti; Cámara Chávez, Guillermo; Cámara Chávez, Guillermo; Ferreira, Anderson Almeida; Bianchi, Andrea Gomes Campos; Schwartz, William RobsonRe-Identi cação de pessoas é um problema de correspondência entre identidades capturadas por câmeras de vigilância não sobrepostas. Essa correspondência, também conhecida como rastreamento multi-câmeras é uma tarefa da área de visão computacional. Tem grande foco por se tratar, principalmente, de demandas nas esferas de segurança pública e/ou pessoal. Esse foco se dá em vista das possíveis incapacidades humanas na realização de tarefas repetitivas por um tempo prolongado, por exemplo. Intenciona-se com essa abordagem suavizar, quão possível, os custos inerentes ao processo computacional tradicional. A abordagem proposta é fracionada em duas partes: aprendizado de um espaço métrico de baixa dimensionalidade (denominado fase inicial) e reorganização de rank de amostras a partir de uma classi cação binária ponderada, a m de reduzir a incompatibilidade entre várias câmeras. Usa-se handcrafted image descriptors como ferramentas. Adicionalmente, emprega-se na abordagem proposta, um modelo de aprendizado métrico discriminante para representar features em uma nova dimensão; aprendizado métrico de similaridade em larga escala e distância métrica para construção dos ranks primários entre amostras de teste e imagens da galeria. Em todo o trabalho as imagens amostrais foram divididas a partir da imagem original em secções, a m de aumentar a discriminação entre as amostras.Item Learning deep off-the-person heart biometrics representations.(2018) Luz, Eduardo José da Silva; Moreira, Gladston Juliano Prates; Oliveira, Luiz Eduardo Soares de; Schwartz, William Robson; Gomes, David MenottiSince the beginning of the new millennium, the electrocardiogram (ECG) has been studied as a biometric trait for security systems and other applications. Recently, with devices such as smartphones and tablets, the acquisition of ECG signal in the off-the-person category has made this biometric signal suitable for real scenarios. In this paper, we introduce the usage of deep learning techniques, specifically convolutional networks, for extracting useful representation for heart biometrics recognition. Particularly, we investigate the learning of feature representations for heart biometrics through two sources: on the raw heartbeat signal and on the heartbeat spectrogram. We also introduce heartbeat data augmentation techniques, which are very important to generalization in the context of deep learning approaches. Using the same experimental setup for six methods in the literature, we show that our proposal achieves state-of-the-art results in the two off-the-person publicly available databases.Item Logo detection with second judge single shot multibox.(2017) Coelho, Leonardo Bombonato Simões; Cámara Chávez, Guillermo; Bianchi, Andrea Gomes Campos; Cámara Chávez, Guillermo; Ferreira, Anderson Almeida; Bianchi, Andrea Gomes Campos; Schwartz, William RobsonWith the increasing popularity of Social Networks, the way people interact has changed and the huge amount of data generated open doors to new strategies and marketing analysis. According to Instagram 1 and Tumblr2 an average of 95 and 35 million photos, respectively, are published every day. These pictures contain several implicit or explicit brand logos, this allows us to research how can a brand be better widespread based in regional, temporal and cultural criteria. Using advanced computer vision techniques for object detection and recognition, we can extract information from these images, making possible to understand the impact and the comprehensiveness of a specific brand. This thesis proposes a logo detection technique based on a Convolutional Neural Network (CNN), also used as a second judge. Our proposal is built on the Single Shot Multibox (SSD). In our research, we explored several approaches of the second judge and managed to reduce significantly the number of false positives in comparison with the original approach. Our research outperformed all the others researches on two different datasets: FlickrLogos-32 and Logos-32plus. On the FlickrLogos-32, we surpass the actual state-of-the-art method by 5.2% of F-score and for the Logos-32Plus by 3.0% of F-score.