Please use this identifier to cite or link to this item:
https://repositorio.ipea.gov.br/handle/11058/2585
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
TD_1428.pdf | 437.88 kB | Adobe PDF | View/Open |
Title: | Clusterização hierárquica espacial com atributos binários |
Other Titles: | Texto para Discussão (TD) 1428: Clusterização hierárquica espacial com atributos binários Hierarchical spatial clustering with binary attributes |
Authors: | Carvalho, Alexandre Xavier Ywata de Albuquerque, Pedro Henrique Melo Almeida Junior, Gilberto Rezende de Guimarães, Rafael Dantas Laureto, Camilo Rey |
Abstract: | Este trabalho discute uma metodologia para clusterização hierárquica espacial de polígonos contíguos e homogêneos de acordo com um conjunto de variáveis binárias. O algoritmo proposto é construído a partir de uma modificação do algoritmo aglomerativo de clusterização hierárquica tradicional, comumente utilizado na literatura de análise multivariada. De acordo com o método proposto neste estudo, a cada passo do processo sequencial de junção de clusters, impõe-se que somente conglomerados – grupos de polígonos originais, como municípios, estados ou setores censitários – vizinhos possam ser unidos para formar um novo cluster maior. Neste caso, foram definidos enquanto vizinhos polígonos que possuem um vértice em comum (vizinhança do tipo queen) ou uma aresta em comum (vizinhança do tipo rook). O texto apresenta aplicações da nova metodologia para clusterização dos municípios brasileiros, com base nas variações do número de empregos formais entre os anos de 1997 e 2007. Diversos métodos de clusterização são estudados, assim como diferentes tipos de distâncias entre vetores de variáveis binárias. Os métodos estudados foram: centroid, single linkage, complete linkage, average linkage e average linkage weighted, Ward minimum variance e método da mediana. As distâncias utilizadas foram: Jaccard, Tanimoto, simple matching, Russel e Rao, Dice, Kulczynski. Apresenta-se uma discussão sobre alguns métodos comumente aplicados para seleção do número de clusters. Finalmente, estudos de casos são apresentados para: i) comparar a formação dos algoritmos espaciais versus agrupamentos políticos existentes (microrregiões, mesorregiões e Unidades da Federação); e ii) identificar áreas no território brasileiro onde se verificou crescimento diversificado, em termos de atividades econômicas. |
metadata.dc.rights.holder: | Instituto de Pesquisa Econômica Aplicada (Ipea) |
metadata.dc.rights.license: | É permitida a reprodução deste texto, desde que obrigatoriamente citada a fonte. Reproduções para fins comerciais são rigorosamente proibidas. |
metadata.dc.type: | Texto para Discussão (TD) |
Appears in Collections: | Ciência. Pesquisa. Metodologia. Análise Estatística: Livros |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.