Média | Desvio padrão |
---|---|
81376.68 | 89960.68 |
2023-11-17
Criado em 2005 para auxiliar senadores e comissões nas duas principais atividades do Senado Federal: legislar e fiscalizar o Poder Executivo.
Mais de 4,7 milhões de entrevistas
128 pesquisas nacionais probabilísticas
Levantamentos on-line (público interno e enquetes)
Pesquisas qualitativas - grupos focais e entrevistas em profundidade
Exemplo: Pesquisa Nacional sobre Violência contra a Mulher: primeira edição (2005) auxiliou a criação da Lei Maria da Penha. Em 2023, 10ª edição, maior e mais longa série histórica sobre o tema
O Senado Federal disponibiliza publicamente relatórios, dados e descrição detalhada do método: www.senado.leg.br/datasenado
Painéis interativos para consulta, cruzamentos e download de microdados das principais pesquisas:
Método original, criado pelos estatísticos do DataSenado
Características usuais das pesquisas DataSenado:
População-alvo: residentes no Brasil com 16 anos ou mais de idade
Amostragem Aleatória Estratificada por estados e DF, com alocação proporcional à população-alvo
Coleta de dados via CATI (Computer-Assisted Telephone Interviewing)
Seleção aleatória de números discados - RDD (Random digit dialing)
Protocolos rígidos de qualidade e auditoria das entrevistas
Exemplo: pesquisa “Violência nas Escolas”
Exemplo: pesquisa “Violência nas Escolas”
ANATEL regulamenta a numeração de telefonia fixa e móvel no Brasil e disponibiliza os números liberados para uso pelas operadora. Consulta em 27/4/2023:
585.333.050 números móveis possíveis
229.151.319 números fixos possíveis
ANATEL também informa quantidade de linhas ativas por tipo de telefonia. Consulta em abril, com dados referentes a fevereiro de 2023:
250.644.275 linhas ativas de telefonia móvel
26.644.230 linhas ativas de telefonia fixa
Dados por estados e DF
Amostra divida em dois grupo: números de telefones fixos e móveis
Probalidade de seleção de um número fixo válido igual à probabilidade de seleção de número móvel válido.
Procedimento aplicado a cada um dos 26 estados e o Distrito Federal (UFs)
Seja \(i\) a UF e \(j\) o tipo de telefonia, \(j=\{fixo,móvel\}\). O tamanho de amostra \(n_{ij}\) é dada pela proporção entre a quantidade de linhas ativas:
\[ n_{ij} = \frac{linhas.ativas_{ij}}{\sum_j(linhas.ativas_{ij})} \times \sum_jn_{ij} \]
A quantidade de números selecionados a partir da lista de números autorizados pela ANATEL (\(Lista_{ij}\)) é calculada de maneira a preservar a igualdade de chances de seleção entre telefones fixos e móveis:
\[ Lista_{ij}=\frac{Números.possíveis_{ij}}{\sum_jlinhas.ativas_{ij}} \times \sum_jn_{ij} \]
A taxa de sucessos no uso da lista é influenciada por: números inválidos, de empresas, usados apenas para internet, ….
Grande maioria: números inválidos
Últimos 3 anos:
a cada mil números, cerca de 6 “alôs”
após “alô”: em média 20% de entrevistas concluídas
A lista final efetivamente usada em campo é inflada por esses resultados segundo a UF:
\[ Lista_{ij}^*=\frac{Números.possíveis_j}{\sum_jlinhas.ativas_j} \times \sum_jn_{ij} \times \frac{histórico.discados_{i}}{histórico.concluídos_{i}} \]
Exemplo: pesquisa “Violência nas Escolas”
Lista de 2.557.007 números aleatórios, 73% móveis
Coleta de dados - campo: 9 e 10 de maio de 2023
655.202 ligações para 386.023 números distintos (renitência média de 1,7)
11.673 “alôs”
2.068 entrevistas concluídas
O delineamento amostral DataSenado é incorporado às análises considerando:
A chance de um número habilitado qualquer ser selecionado é conhecida e dada pela razão entre a quantidade de linhas ativas detectadas no processo de discagem e a quantidade de linhas ativas total na UF \(i\), tipo \(j\), informada pela Anatel:
\[ \pi_{ij}=\frac{linhas.ativas.discadas_{ij}}{linhas.ativas.Anatel_{ij}} \]
Já a chance de uma pessoa \(k\) qualquer ser selecionada (\(f_{ijk}\)) depende, além de \(\pi_{ij}\), da quantidade de pessoas que compartilham a mesma linha de telefone (\(\delta_k\))1:
\[ f_{ijk} = \pi_{ij} \times \frac{1}{\delta_k} \]
Computada a probabilidade de seleção, o peso associado a essa informação é dado por
\[ w_{sel,ijk}=\frac{1}{f_{ijk}} \]
Exemplo: pesquisa “Violência nas Escolas”
\[ \bar{f} = 0.000739 \] \[ \overline{w_{sel}} = 1956.7 \]
Ligações para linhas ativas, com números válidos, podem resultar em: entrevistas concluídas, interrompidas, agendadas e não finalizadas, recusadas, ligações não atendidas, linhas ocupadas, caixas postais, telefones desligados, pessoas fora da amostra, linhas não particulares, dentre outros
A taxa de resposta é calculada considerando essas classificações e a RR1 da AAPOR:
\[ RR1 = \frac{Entrevistas.completas}{Linhas.ativas+Linhas.potencialmente.ativas-Inelegíveis} \]
Onde linhas potencialmente ativas são aquelas em que não é possível afirmar que a linha está inativa, e inelegíveis são empresas e pessoas fora da população-alvo.
Problema: em amostras com alocação proporcional, algumas UFs tem poucas entrevistas alocadas e o estrato é finalizado apenas com telefonia móvel.
Solução: agrupar por Grande Região e tipo de telefonia:
\[ RR1_{região,j} = \frac{Entrevistas.completas_{região,j}}{Linhas.ativas_{região,j}+Linhas.potencialmente.ativas_{região,j}-Inelegíveis_{região,j}} \]
Dado por
\[ w_{RR_{região,j}} = \frac{1}{RR1_{região,j}} \]
No exemplo da pesquisa ‘Violência nas Escolas’:
RR1 varia de 0.001260 (fixo, Norte) a 0.013355 (móvel, Sul).
Os pesos variam de 74.87832 a 793.6508.
População-alvo: residentes no Brasil com 16 anos ou mais de idade.
População amostrada: residentes no Brasil com 16 anos ou mais e acesso à telefonia. Em 2022 apenas 1,7% de moradores não tinham acesso a telefonia:
Raking: ajuste das distribuições marginais por região das características sociodemográficas da população-alvo: sexo, raça/cor (PPI e não PPI), faixa etária, escolaridade, situação de domicílio, porte do município
Dados de referência para o raking: PNAD Contínua 1º/2023 e Estimativa Populacional 2021 para porte do município
Peso por respondente pré-raking:
\[ w_k^* = w_{sel,ijk} \times w_{RR1_{região,j}} \]
Peso por repondente pós-raking: \(w_k^{**}\)
Resultados - pesos após raking:
Média | Desvio padrão |
---|---|
81376.68 | 89960.68 |
Estimativa de pessoas com 16 anos ou mais que já sofreram violência na escola em algum momento da vida:
Estimativa | E.P. | |
---|---|---|
Sim | 0.22 | 0.0123 |
Não | 0.78 | 0.0124 |
2.5 % | 97.5 % | |
---|---|---|
Sim | 0.19 | 0.24 |
Não | 0.75 | 0.80 |
Total | E.P. | |
---|---|---|
Sim | 36496528 | 2056404 |
Não | 129782744 | 2108468 |
Na pesquisa ‘Violência nas escolas’ foi feita, adicionalmente, a pergunta ‘outros moradores do domicílio são estudante e sofreram alguma violência nos últimos 12 meses’
Obteve-se, assim, informação do DOMICÍLIO
Com o objetivo de estimar a quantidade de pessoas que sofreram violência na escola nos últimos 12 meses no Brasil, independente da idade, aplicou-se o raking para domicílio por região usando as variáveis
Checagem das estimativas: comparativo do total de alunos matriculados em 2022 a partir da pesquisa DataSenado x dados PNAD Contínua x INEP 2022:
INEP 2022 (mil) | PnadC Educação (mil) | DataSenado mai/2023 | DataSenado Lim.Inf.(95%) |
---|---|---|---|
56.826 | 58.246 | 59.752 | 57.753 |
Resultados DataSenado acertam o quantitativo populacional, considerada a margem de erro
Outras pesquisas, sobre temas diversos, também ‘acertaram’ o quantitativo populacional, quando checável (Auxílio Emergencial, pesquisa com candidatos, …)
datasenado@senado.leg.br
Delineamento DataSenado