Como importar apenas algumas variáveis de microdados no SPSS

Recebemos a seguinte pergunta:
É possível importar apenas algumas variáveis de um microdados em TXT para uma nova base do SPSS?

Resposta:
É possível. Para tanto será necessário rodar a syntax GET DATA e indicar quais variáveis deseja importar.

A Syntax GET DATA é a seguinte:

GET DATA /TYPE=TXT
/FILE="C:\Users\Thiago3\Desktop\pns_2013_microdados_2015_08_21\Dados\DOMPNS2013.txt"
/ENCODING='Locale'
/FIXCASE=1
/ARRANGEMENT=FIXED
/FIRSTCASE=1
/IMPORTCASE=ALL
/VARIABLES=
/1 V1 10-12 F2.0
V2 1-1 F1.0
V3 33-36 F4.0
V4 55-59 F9.0.
DATASET NAME Conjunto_de_dados1 WINDOW=FRONT.

Se você não tem muita familiaridade com a linguagem do SPSS é preciso verificar a imagem abaixo:
12242260_10153248275723443_911915363_n

 

 

 

 

 

 

Thiago Sampaio

Às margens da margem: Afinal, quem está a frente na corrida presidencial?

foto-corrida-cavalo-01Eu estava ansioso para ver o resultado dos levantamentos realizados
pelo Ibope e Datafolha divulgados nesta semana. A notícia veio meio
confusa, como quase sempre, os apresentadores tentando explicar o que
o intervalo de 95% de confiança significa etc, mas a parte mais
importante anunciada veio mais ou memos assim:
"Ibope/Datafolha divulgou uma nova pesquisa sobre a corrida
presidencial. O levantamento foi encomendado por [...]. Marina está
agora empatada (no limite da margem de erro) com a candidata Dilma
Rousseff do PT. [...] Vamos aos resultados."

Continue lendo... “Às margens da margem: Afinal, quem está a frente na corrida presidencial?” »

Comparando a confiança em TV, Rádio e Jornal a partir do uso dos resíduos padronizados

Por Emerson Cervi*

categoricos2A Secretaria de Comunicação Social da Presidência da República divulgou a primeira pesquisa brasileira de hábitos de mídia no Brasil. A pesquisa tem uma grande e boa vantagem: seu banco de dados é aberto. Então, nada melhor do que utilizar “dados frescos” para um exemplo de análise, não acham?

A questão que nos move aqui é a seguinte: Há diferenças entre os níveis de confiança em TV, Rádio e Jornal? As respostas são distribuídas nas seguintes categorias: "confio sempre", "confio muitas vezes", "confio poucas vezes" e "nunca confio". Então, nosso objetivo é identificar não apenas quais as frequências de nível de confiança em cada veículo separadamente, mas comparando os níveis de confiança entre os três tipos de veículos de comunicação.

Continue lendo... “Comparando a confiança em TV, Rádio e Jornal a partir do uso dos resíduos padronizados” »

Encontrando variáveis repetidas em múltiplas bases de dados

MultiplosEm meu último texto  comentei sobre como automatizar a importação de várias bases de dados de um diretório diretamente para o R. Hoje, eu quero esticar essa conversa adicionando outros desafios: agora eu quero de saber quais variáveis existem nas bases de dados antes mesmo de começar a trabalhar nelas. Evidentemente, eu não gostaria de obter essa informação lendo todos os livros de códigos, caso haja algum.

Continue lendo... “Encontrando variáveis repetidas em múltiplas bases de dados” »

Oportunidade! Google lança curso de análise de dados!

Aproveitem! O Curso on-line do Google começa dia 18 e vai até dia 4 de abril! GRATUITO!

Mais informações:

https://datasense.withgoogle.com/preview

 

 

 

Pesquisas da Presidência da República

secom

Vocês sabiam que a Secretaria de Comunicação Social da Presidência da República realiza periodicamente pesquisas de avaliação do Governo? O melhor de tudo é que os relatórios já estão disponíveis para consulta.

No site da SECOM já estão disponíveis alguns relatórios das pesquisas quantitativas (CATI e face a face) e das pesquisas qualitativas (grupos focais). Destaco o excelente nível e detalhamento dos relatórios.

O que vocês acharam? Que tal escrever alguns bons artigos ?

Abraços e até a próxima!

Max Stabile

Políticas públicas, categorias estatísticas e seus perigos: um exemplo.

tylenolstatsDois artigos de pesquisa foram publicados na revista ProPublica que, juntamente com o número de setembro de 2013 da This American Life, advertiam sobre os possíveis danos de analgésicos cujo ingrediente ativo é a acetaminofena (também chamada de paracetamol). É o caso do conhecido Tylenol.

O que descobriram? Que 150 americanos morrem, anualmente, em função de problemas provocados por esses medicamentos que, nos Estados Unidos como aqui, não precisam de receita. “Matariam” mais do que qualquer outro remédio sem receita.

Porém....

 

Continue lendo... “Políticas públicas, categorias estatísticas e seus perigos: um exemplo.” »

Importando múltiplas bases de dados com R

arquivosem um sóQuem nunca enfrentou aquela pasta em seu computador cheia de arquivos de texto para serem transformadas em uma só base de dados? Sim. Todo mundo por aqui já teve esse dilema ou é muito provável que um dia vá enfrentar algo semelhante.

Durante os dias de festa eu finalmente achei inspiração para lidar com todas aquelas bases de dados sobre do Tribunal Superior Eleitoral. A causa de minha relutância em por minhas mãos em tais  bases era simplesmente o de evitar problemas com arquivos grandes e mal-arranjados de puro "txt". De fato, parece que não tem como escapar de problemas de codificação e malformação de arquivos de textos. Quanto maior o arquivo, maiores as chances de conter problemas com caracteres, delimitação dos campos e etc.

Continue lendo... “Importando múltiplas bases de dados com R” »

Como importar os microdados do Censo da Educação Superior no R

ineprTentando solucionar a dúvida de um leitor que postou um comentário aqui no Metodologia Política, me deparei com uma situação nova, de fácil solução, mas que pode dar um pouco de dor de cabeça até descobrir o caminho das pedras. Trata-se de um problema de encode com os dados do Censo da Educação Superior.

Como o INEP disponibiliza os dados do Censo da Educação Superior com dicionários para o SPSS e para o SAS, tentei importar esses dados utilizando as funções; fwf2csv() desenvolvida por Marcos F. Silva, parse.SAScii() e read.SAScii.sqlite() desenvolvidas por Anthony Damico, e todas retornavam uma mensagem de erro.

Continue lendo... “Como importar os microdados do Censo da Educação Superior no R” »

Microdados no R - Parte 2

Dando continuidade na análise de grandes bases de dados, este post utilizará os conhecimentos obtidos no post Microdados no R - parte 1 para criar tabelas com os dados do censo demográfico para os anos de 2000 e 2010. A maior curva de aprendizado que deve ser superada para trabalhar com os dados do censo esta relacionada a capacidade computacional de trabalhar com milhões de linhas. Acreditamos que a partir do primeiro post e desdequalquer pessoa com conhecimento mínimo em R pode trabalhar com bases de dados de milhões de linhas, utilizando seu computador pessoal.

Veja o vídeo Trabalhar com Microdados usando o R - parte 6

Baixe o código script.R.importar.microdados.v2.R

Dúvidas? Comentários?

 

Um abraço e até a próxima!

Roney Fraga

Correlação não significa necessariamente causalidade

Por Gláucio Soares

Cuidado! Partir de uma correlação bivariada para concluir causalidade pode levar a erros graves, ainda que alguns sejam hilários. Por exemplo:

Usar o Internet Explorer aumenta a taxa de homicídios.

iemurderrate

 

 

 

 

 

 

 

Continue lendo... “Correlação não significa necessariamente causalidade” »

Maratona Hacker na Câmara dos Deputados. Sim, hacker!

Maratona HackerVocê já ouviu falar de uma Maratona Hacker? Não? Maratona Hacker é uma reunião de várias pessoas durante alguns dias, normalmente um final de semana, com um objetivo na cabeça: fazer os dados falarem. Não importa quais dados e como, mas normalmente os objetivos são nobres: transformar dados públicos obscuros em dados públicos claros; incentivar a fiscalização por parte da sociedade; buscar soluções em políticas públicas; transformar arquivos confusos que estão em várias páginas diferentes ou em PDFs em arquivos pesquisáveis. É mais ou menos essa a ideia. (Tenho certeza que você não imaginou vários nerds correndo com seus computadores...)

Continue lendo... “Maratona Hacker na Câmara dos Deputados. Sim, hacker!” »

Citações com Google Acadêmico

norma-brasileira-abnt-nbr-9050-envio-imediato_MLB-F-201243433_199Você baixou um artigo da internet ou recebeu por e-mail de alguém e não faz a menor ideia de como citá-lo? Resolver esse problema pode ser mais simples do que você imagina.

Em artigos anteriores, abordamos algumas das dificuldades que todos jovens pesquisadores possuem em "vencer" a tortura das regras da ABNT. A pequena dica que postaremos aqui, vai economizar muito do seu tempo, caso você não utilize (ainda) nenhum software para automatizar suas citações.

Continue lendo... “Citações com Google Acadêmico” »

Analisando as Redes Sociais

Um dos melhores trabalhos que eu já vi sobre Análise de Redes: Prof. Fábio Malini do LABIC

Nunca se falou tanto em redes sociais como nestas últimas semanas de protestos em todo o Brasil. Jornalistas, cientistas políticos, juristas e palpiteiros de plantão disseram que o Brasil está vivendo uma onda de protestos organizados pelas redes sociais. Mas... será que é isso mesmo? Quais são as evidências empíricas? Será que os analistas e palpiteiros não confundiram sua timeline ou o que leem em seus perfis e já saem dizendo que “todo mundo está comentando sobre isso e aquilo”? Parece que a “amostra” dos posts (que no Facebook são selecionados) e do Twitter são representativos do universo das redes sociais. Acho que não é bem isso.

Continue lendo... “Analisando as Redes Sociais” »

O que esperar e o que não esperar de um orientador

Texto do site: Pesquisatec de Adrian Sgarbi

Quem é o seu orientador? Darth Vader ou o Mr. Miyagi?

Quem é o seu orientador? Darth Vader ou o Mr. Miyagi?

Já sei. Você gostaria que o seu orientador fosse como Mr. Miyagi, mas em sua opinião ele está mais para Darth Vader. Pelo visto, você não está sozinho. Na última vez em que busquei no Google Brasil pela frase "Eu odeio o meu orientador", encontrei quase 10.000 entradas. Isso faz alguns dias, mas não creio que essa realidade tenha melhorado.1

Talvez seja ingenuidade. Mas em minha opinião, saber o que é razoável esperar de um orientador e o que não é pode ajudar a melhorar o cenário. E quem sabe? É possível que de 10.000 o número chegue algum dia ao redor de 7.000 casos de puro ódio. Um começo, não?A relação entre orientador e orientando pode ser disfuncional de muitas formas. Por isso, ao tratar do tema, deixemos de complicá-lo com grandes expectativas. Caso estejamos de acordo nisso, já podemos passar às listas.

Continue lendo... “O que esperar e o que não esperar de um orientador” »