Publicação: Clusterização hierárquica espacial
Carregando...
Arquivos
Paginação
Primeira página
Última página
Data
Data de publicação
Data da Série
Data do evento
Data
Data de defesa
Data
Edição
Idioma
por
Cobertura espacial
Brasil
Cobertura temporal
País
BR
organization.page.location.country
Tipo de evento
Tipo
Grau Acadêmico
Fonte original
ISBN
ISSN
DOI
dARK
item.page.project.ID
item.page.project.productID
Detentor dos direitos autorais
Instituto de Pesquisa Econômica Aplicada (Ipea)
Acesso à informação
Acesso Aberto
Termos de uso
É permitida a reprodução deste texto, desde que obrigatoriamente citada a fonte. Reproduções para fins comerciais são rigorosamente proibidas.
Titulo alternativo
Texto para Discussão (TD) 1427: Clusterização hierárquica espacial, Hierarchical spatial clustering
item.page.organization.alternative
Variações no nome completo
Orientador(a)
Editor(a)
Organizador(a)
Coordenador(a)
item.page.organization.manager
Outras autorias
Palestrante/Mediador(a)/Debatedor(a)
Coodenador do Projeto
Resumo
Este estudo apresenta uma nova metodologia para clusterização hierárquica espacial de polígonos contíguos, com base em um sistema de coordenadas georreferenciadas. O algoritmo proposto é construído a partir de uma modificação do algoritmo de clusterização hierárquica tradicional, comumente utilizado na literatura de análise multivariada. De acordo com o método proposto neste trabalho, a cada passo do processo sequencial de junção de clusters, impõe-se que somente conglomerados (grupos de polígonos originais, como municípios, estados ou setores censitários) vizinhos possam ser unidos para formar um novo cluster maior. Neste caso, foram definidos como vizinhos polígonos que possuem um vértice em comum (vizinhança do tipo queen) ou uma aresta em comum (vizinhança do tipo rook). O estudo apresenta aplicações da nova metodologia para clusterização dos municípios brasileiros, no ano de 2000, com base em um conjunto de variáveis socioeconômicas. Diversos métodos de clusterização são estudados, assim como diferentes tipos de distâncias entre vetores. Os métodos estudados foram: centroid, single linkage, complete linkage, average linkage e average linkage weighted, Ward’s minimum variance e método da mediana. As distâncias utilizadas foram: norma Lp (em particular, as normas L1 e L2), Mahalanobis e distância euclidiana corrigida pela variância (variance corrected) – caso particular da distância de Mahalanobis. Finalmente, apresenta-se uma discussão sobre alguns métodos comumente utilizados para seleção do número de clusters.
Resumo traduzido
This paper presents a new methodology for hierarchical spatial clustering of contiguous polygons, based on a geographic coordinate system. The proposed algorithm is built upon a modification of traditional hierarchical clustering algorithm, commonly used in the multivariate analysis literature. According to the proposed method in this paper, at each step of the sequential process of collapsing clusters, only neighbor clusters (groups of original polygons, i.e. municipalities, census tracts, states) are allowed to be collapsed to form a bigger cluster. Two types of neighborhood are used: polygons with one edge in common (rook neighborhood) or polygons with only one point in common (queen neighborhood). In this paper, the methodology is employed to create clusters of Brazilian municipalities, for the year 2000, based on a group of socio-economic variables. Several clustering methods are investigated, as well as several types of vector distances. The studied methods were: centroid method, single linkage, complete linkage, average linkage, average linkage weighted, Ward minimum variance e median method. The studied distances were: Lp norm (particularly, L1 e L2 norms), Mahalanobis distance and variance corrected Euclidian distance. Finally, a discussion on selection of the number of clusters is presented.
