Archive for the 'Programas' Category

Como importar apenas algumas variáveis de microdados no SPSS

Recebemos a seguinte pergunta:
É possível importar apenas algumas variáveis de um microdados em TXT para uma nova base do SPSS?

Resposta:
É possível. Para tanto será necessário rodar a syntax GET DATA e indicar quais variáveis deseja importar.

A Syntax GET DATA é a seguinte:

GET DATA /TYPE=TXT
/FILE="C:\Users\Thiago3\Desktop\pns_2013_microdados_2015_08_21\Dados\DOMPNS2013.txt"
/ENCODING='Locale'
/FIXCASE=1
/ARRANGEMENT=FIXED
/FIRSTCASE=1
/IMPORTCASE=ALL
/VARIABLES=
/1 V1 10-12 F2.0
V2 1-1 F1.0
V3 33-36 F4.0
V4 55-59 F9.0.
DATASET NAME Conjunto_de_dados1 WINDOW=FRONT.

Se você não tem muita familiaridade com a linguagem do SPSS é preciso verificar a imagem abaixo:
12242260_10153248275723443_911915363_n

 

 

 

 

 

 

Thiago Sampaio

Encontrando variáveis repetidas em múltiplas bases de dados

MultiplosEm meu último texto  comentei sobre como automatizar a importação de várias bases de dados de um diretório diretamente para o R. Hoje, eu quero esticar essa conversa adicionando outros desafios: agora eu quero de saber quais variáveis existem nas bases de dados antes mesmo de começar a trabalhar nelas. Evidentemente, eu não gostaria de obter essa informação lendo todos os livros de códigos, caso haja algum.

Continue lendo... “Encontrando variáveis repetidas em múltiplas bases de dados” »

Importando múltiplas bases de dados com R

arquivosem um sóQuem nunca enfrentou aquela pasta em seu computador cheia de arquivos de texto para serem transformadas em uma só base de dados? Sim. Todo mundo por aqui já teve esse dilema ou é muito provável que um dia vá enfrentar algo semelhante.

Durante os dias de festa eu finalmente achei inspiração para lidar com todas aquelas bases de dados sobre do Tribunal Superior Eleitoral. A causa de minha relutância em por minhas mãos em tais  bases era simplesmente o de evitar problemas com arquivos grandes e mal-arranjados de puro "txt". De fato, parece que não tem como escapar de problemas de codificação e malformação de arquivos de textos. Quanto maior o arquivo, maiores as chances de conter problemas com caracteres, delimitação dos campos e etc.

Continue lendo... “Importando múltiplas bases de dados com R” »

Como importar os microdados do Censo da Educação Superior no R

ineprTentando solucionar a dúvida de um leitor que postou um comentário aqui no Metodologia Política, me deparei com uma situação nova, de fácil solução, mas que pode dar um pouco de dor de cabeça até descobrir o caminho das pedras. Trata-se de um problema de encode com os dados do Censo da Educação Superior.

Como o INEP disponibiliza os dados do Censo da Educação Superior com dicionários para o SPSS e para o SAS, tentei importar esses dados utilizando as funções; fwf2csv() desenvolvida por Marcos F. Silva, parse.SAScii() e read.SAScii.sqlite() desenvolvidas por Anthony Damico, e todas retornavam uma mensagem de erro.

Continue lendo... “Como importar os microdados do Censo da Educação Superior no R” »

Microdados no R - Parte 2

Dando continuidade na análise de grandes bases de dados, este post utilizará os conhecimentos obtidos no post Microdados no R - parte 1 para criar tabelas com os dados do censo demográfico para os anos de 2000 e 2010. A maior curva de aprendizado que deve ser superada para trabalhar com os dados do censo esta relacionada a capacidade computacional de trabalhar com milhões de linhas. Acreditamos que a partir do primeiro post e desdequalquer pessoa com conhecimento mínimo em R pode trabalhar com bases de dados de milhões de linhas, utilizando seu computador pessoal.

Veja o vídeo Trabalhar com Microdados usando o R - parte 6

Baixe o código script.R.importar.microdados.v2.R

Dúvidas? Comentários?

 

Um abraço e até a próxima!

Roney Fraga

Mendeley: organização de PDFs, leitura de textos, citações e bibliografia

logo-mendeleyLer no papel pode ser bem mais confortável.  Mas não adianta, tenho certeza que cada vez mais, boa parte das publicações que você leu no papel você as achou em um formato virtual e as imprimiu. E o problema que fica é: após acumular dezenas ou mesmo centenas de artigos científicos ou e-books, como encontrá-los?  Cada arquivo possui uma nomenclatura distinta: uns aparecem com nome do autor e título, outros só com o título, outros só com o autor, outros com o nome da revista e edição, outros com uns números mágicos... o céu é o limite. Pesquisar por palavras? Não ajuda muito: várias respostas. Pesquisar por autor? Ele é citado em vários outros artigos. Organizar por pastas? Em que pasta eu guardei mesmo aquele texto do ano passado...?

Seus problemas acabaram! Como? Gerenciadores de bibliografia! Eles resolvem muito bem esse tipo de problema. Nesse post, apresentaremos algumas das funcionalidades do Mendeley.

Continue lendo... “Mendeley: organização de PDFs, leitura de textos, citações e bibliografia” »

Microdados no R

microdadosrA disponibilidade de bases de dados cresce exponencialmente, enquanto a capacidade dos pesquisadores em Ciência Política em trata-las não acompanha o mesmo ritmo. Isso fez e tem feito com que muitos estudos e pesquisas sejam feitas com dados de outras pesquisas, que muitas vezes são de outras áreas. Afinal, quem nunca “pegou emprestado” uma tabela com alguns dados de um artigo interessante?  Pois bem, mas que tal aprender a trabalhar e a tratar as bases na sua origem? Ter a confiança, riqueza e a precisão que sua pesquisa merece?

O processo de entender e acessar essas bases de dados não é trivial, demanda um conhecimento mínimo de software estatístico e da organização dos arquivos que compõem as bases de dados. Este post é para aqueles que já conhecem o R (entenda) e pretende ajudar o leitor a acessar os microdados do IBGE e INEP. Se você está acostumado a trabalhar com o SPSS, clique aqui.

Continue lendo... “Microdados no R” »

A evolução na Ciência Política e na análise de dados: R

Para quase todo estudante de Ciência Política aprender a operar um software estatístico é quase por acaso. O primeiro professor de metodologia de pesquisa simplesmente aborda um software específico em aula e pronto. Se o contato com o software não foi traumático – o evolucaorque é para muita gente – o estudante aprenderá os fundamentos mínimos e eventualmente estudará mais sobre o software.  Dificilmente, contudo, se arriscará a mudar. Afinal, qualquer mudança exigirá mais tempo de dedicação.

Mas a realidade muda. Aquela ferramenta que você aprendeu a usar pode se tornar obsoleta. Na área de tecnologia as mudanças sã o muito rápidas. Pensando nisso, o Metodologia Política vai iniciar uma série de artigos, vídeo aulas e disponibilizará uma biblioteca gratuita sobre aquilo que consideramos um bom investimento intelectual para qualquer estudante com olhos no futuro: o R.

Acalme-se. O R não é um bicho papão, tampouco uma coisa de nerds ultra-mega-aficionados em estatística e análise de dados. Tenho certeza que, em breve, o R se tornará o seu melhor amigo.

Continue lendo... “A evolução na Ciência Política e na análise de dados: R” »

Leitura dos Microdados do IBGE no SPSS

Preparei dois scripts para SPSS para a leitura dos Microdados do IBGE no SPSS.

Leitura SPSS Censo 2010 - pessoas

Leitura SPSS Censo 2010 - domicílios

OBS: deve ser feito UF por UF e depois ir adicionando um a um para formar um arquivo do Brasil.

Dica: Para fazer o download clique com o botão direito do mouse e selecione "salvar link como..."

 

Thiago Sampaio

Como Gerar Mapas Utilizando o R e Maptools

Há alguma vantagem em trocar as tradicionais tabelas por gráficos? Eu diria que sim. Percebe-se uma tímida—mas gradativa—mudança no modelo de apresentação de resultados de pesquisa na Ciência Política. Muitos cientistas políticos estão priorizando gráficos às já obsoletas tabelas. Exemplos dessa tendência podem ser vistos em vários trabalhosrecentes, como em Terron e Soares (2010)[1] e Marcelino (2010)[2].Se você quiser ver mais argumentos sobre isso, veja em Kastellec e Leoni (2007)[3] e também em Brady (2011)[4].

De forma ainda mais contundente, o tema é abordado em “Ways of Knowing” por Moses e Knutsen (2007), os quais introduzem na discussão o argumento de que as ciências sociais por serem uma ciência  dividida também diverge na forma de apresentar os resultados. Estes autores, fazem opapel de "advogado do diabo" quando mostram que a Estatística não é uma ciência tão perversa assim como os construtivistas afirmam, e que os gráficos podem ser uma poderosa ferramenta para contextualizar a frieza dos números e aproximar ambos naturalistas e contrutivistas.

Continue lendo... “Como Gerar Mapas Utilizando o R e Maptools” »