Aumento da Eficiência das Estruturas de Indexação Métricas com Uso de Conceitos da Lógica Nebulosa - Citegraph

Paper Info

Title
Aumento da Eficiência das Estruturas de Indexação Métricas com Uso de Conceitos da Lógica Nebulosa

Abstract
The retrieval of complex data e.g. image, audio, video, genomic sequences etc. in Database Management Systems (DBMSs) has been in the focus of the academic community and of DBMSs developers. The most promising technique is the content-based search, in which a set of descriptors with high discrimination power is extracted from each data element, and a feature vector is obtained and used to index the data to fasten the search operations. The feature vectors are data in high dimensional spatial domains or metric domains, and its indexing requires the use of appropriate indexing structures. The most promising structures are the ones for metric domains, e.g. the M-tree, the Slim-tree, the OMNI-Family and the DF-tree. This paper shows that it is possible to enhance the performance of these structures by using Fuzzy Logic concepts, through an algorithm that uses more than one parameter to define how the most appropriate subtree must be chosen in insertion operations. Doing so, the construction of these structures is more "intelligent", in other words, closer to human analysis and perception. Experiments with the proposed algorithm show that its performance is noticeably better than other existing structures found in literature at structure construction and performing of similarity queries. 1. Introdução Com o aumento do uso de bancos de dados para armazenamento de dados não-tradicionais, ou dados complexos, por exemplo, dados para Sistemas de Informações Geográficas (SIGs ou GIS - Geographic Information Systems), dados multimídia (imagem, texto, som, vídeo etc.), dados genômicos (cadeias de nucleotídeos) etc., os pesquisadores têm trabalhado ativamente sobre maneiras eficientes de indexá-los. O principal objetivo da indexação é agilizar as operações de busca e recuperação de dados sobre grandes conjuntos de dados armazenados, pré-processando esse conjunto de maneira a deixar os dados organizados de uma forma que, no instante da busca, essa possa ser feita mais rapidamente. Isso é feito dividindo o espaço de busca em blocos de tamanho fixo, armazenados em páginas de memória ou de disco, e mantendo uma descrição sobre o conteúdo de cada bloco (estruturados em geral de forma hierárquica), para que a pesquisa em muitos dos blocos possa ser descartada ("podada") apenas considerando sua descrição. São duas as categorias mais importantes de métodos de indexação de dados complexos. São elas: os métodos de indexação para domínios espaciais, como por exemplo, o espaço Euclidiano, e os métodos de indexação para domínios métricos, como

Year	Venue	Keywords
2003	SBBD	database management system,complex data,geographic information system,indexation,feature vector,fuzzy logic,genome sequence
Field	DocType	Citations
Data mining,Nebulosa,Computer science	Conference	0
PageRank	References	Authors
0.34	15	3

Authors (3 rows)

Cited by (0 rows)

References (15 rows)

Name	Order	Citations	PageRank
claudio haruo yamamoto	1	5	1.18
Mauro Biajiz	2	45	7.73
Caetano Traina Jr.	3	1052	137.26

1