Please use this identifier to cite or link to this item: https://repositorio.ipea.gov.br/handle/11058/7019
Full metadata record
DC FieldValueLanguage
dc.contributor.authorMonasterio, Leonardo Monteiro-
dc.coverage.spatialBrasilpt_BR
dc.date.accessioned2016-09-02T19:42:30Z-
dc.date.available2016-09-02T19:42:30Z-
dc.date.issued2016-09-
dc.identifier.urihttp://repositorio.ipea.gov.br/handle/11058/7019-
dc.description.abstractEste trabalho apresenta um método de classificação da ancestralidade dos sobrenomes dos brasileiros nas seguintes classes: ibérica, italiana, japonesa, alemã e leste europeia. A partir de fontes históricas diversas, montou-se uma base de dados da ancestralidade dos sobrenomes. Essas informações formam a base para a aplicação de algoritmos de classificação de fuzzy matching e de machine learning nos mais de 46 milhões de trabalhadores da Relação Anual de Informações Sociais (Rais) Migra de 2013. A imensa maioria (96,4%) dos sobrenomes únicos da Rais foi identificada com o processo de fuzzy matching e os demais com o método proposto por Cavnar e Trenkle (1994). A comparação dos resultados do procedimento com dados sobre estrangeiros no Censo Demográfico de 1920 e a distribuição geográfica dos sobrenomes não ibéricos reforçam a acurácia do procedimento.pt_BR
dc.language.isopt-BRpt_BR
dc.publisherInstituto de Pesquisa Econômica Aplicada (Ipea)pt_BR
dc.titleSobrenomes e ancestralidade no Brasilpt_BR
dc.title.alternativeTexto para Discussão (TD) 2229 : Sobrenomes e ancestralidade no Brasilpt_BR
dc.typeTexto para Discussão (TD)pt_BR
dc.rights.holderInstituto de Pesquisa Econômica Aplicada (Ipea)pt_BR
dc.source.urlsourcehttp://www.ipea.gov.brpt_BR
dc.location.countryBRpt_BR
dc.description.physical25 p. : il.pt_BR
dc.subject.vcipeaIPEA::Demografia. População::Migração::Migração::Imigraçãopt_BR
dc.subject.vcipeaIPEA::Demografia. População::Dinâmica Populacional::Populaçãopt_BR
dc.rights.licenseÉ permitida a reprodução deste texto e dos dados nele contidos, desde que citada a fonte. Reproduções para fins comerciais são proibidas.pt_BR
dc.subject.keywordImigraçãopt_BR
dc.subject.keywordAncestralidadept_BR
dc.subject.keywordSobrenomespt_BR
ipea.description.objectiveClassificar a ancestralidade dos sobrenomes dos brasileiros.pt_BR
ipea.description.methodologyFuzzy matching; Algoritmos de machine learningpt_BR
ipea.description.additionalinformationSérie monográfica: Texto para Discussão ; 2229pt_BR
ipea.description.additionalinformationPossui referências bibliográficaspt_BR
ipea.description.additionalinformationPossui apêndicept_BR
ipea.access.typeAcesso Abertopt_BR
ipea.rights.typeLicença Comumpt_BR
ipea.englishdescription.abstractThis paper presents a method for classifying the ancestry of Brazilian surnames based on historical sources. The information obtained forms the basis for applying fuzzy matching and machine learning classification algorithms to more than 46 million workers in five categories: Iberian, Italian, Japanese, German and East European. The vast majority (96.4%) of the single surnames were identified using a fuzzy matching and the rest using a method proposed by Cavnar and Trenkle (1994). A comparison of the results of the procedures with data on foreigners in the 1920 Census and with the geographic distribution of non-Iberian surnames underscores the accuracy of the procedure.pt_BR
ipea.researchfieldsN/Apt_BR
ipea.classificationDemografia. Populaçãopt_BR
Appears in Collections:Demografia. População: Livros

Files in This Item:
File Description SizeFormat 
td_2229.pdf2.07 MBAdobe PDFThumbnail
View/Open
td_2229_sumex.pdf42.17 kBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.