l3p

Estudando métodos analíticos e a ferramenta SPSS.

Por Arlon da Silva Moreira. Em 23/03/15 17:30. Atualizada em 08/04/15 17:05.

1. O SPSS.

O estudo estatístico descrito neste tópico será aplicado no contexto da ferramenta SPSS (Statistical Package for Social Sciences) desenvolvida pela IBM. Primeiramente, é necessário compreendermos a respeito de suas funcionalidades, tratando-se de um software eficiente para a aplicabilidade da estatística descritiva e inferencial, além disso, umas de suas melhores aplicações é capacidade de gerar relatórios completos e sucintos.

2. A Estatística.

A estatística pode ser compreendida como a ciência que tem por objetivo a coleção, a análise e a interpretação de dados qualitativos ou numéricos a respeito de fenômenos coletivos ou de massa. Nesse sentido, variáveis qualitativas são aquelas que não podem ser operadas matematicamente, e quantitativas, aquelas que abordam valores numéricos. 

No SPSS será preciso declarar as variáveis definindo suas características, deste modo, será necessário definir a escala de mensuração da variável. Diante de dados qualitativos, pode-se defini-los como nominal, aqueles que não permitem comparações, ocorrendo a utilização de nomes, e também ordinais, permitindo comparações e fornecendo o uso de escalas de intensidade, por outro lado, variáveis quantitativas podem ser diferenciadas em discretas, aquelas utilizadas para contabilizar frequências, e contínuas aquelas que podem apresentar resultados inteiros como flutuantes.

3. Conhecendo o SPSS.

No SPSS existe um espaço destinado para inserir os dados denominado de "Visualização de dados" e outro denominado de "Visualização da variável", local reservado para definir as variáveis, incluindo o tipo de variável (Numérico, data, moeda personalizada etc.), rótulo de valor (definir valores reservados), escala mensural e alinhamento.

3.1. Ordenamento

Em uma base de dados é possível investigar os extremos superiores e inferiores da base de dados com o uso  dessa ferramenta. Para isso, os dados podem ser ordenados realizando a seguinte operação:

Dados > Classificar casos > Classificar em ordem crescente ou decrescente.

3.2. Frequência

Na estatística é fundamental o cálculo de frequência, o SPSS pode tabular as frequências de dados da seguinte forma:

Analisar > Estatísticas descritivas > Frequências.

Além disso, clicando na opção estatística será possível solicitar tendências centrais (média, mediana, moda, soma), valores percentil (quartil, percentil etc.), dispersão (desvio padrão, variância, máximo, mínimo), distribuição (assimetria, curtose). No mesmo menu, também exibirá gráficos, ou seja, através de uma simples ação, a ferramenta fornecerá um relatório contendo informações cruciais para uma análise estatística.

3.3 Cruzando frequências de variáveis diferentes.

Quando for necessário cruzar base de dados para gerar informações o SPSS será uma boa opção. Pode-se calcular a frequência relativa em relação ao total geral, em relação ao total da coluna ou em relação ao total da linha, a ferramenta irá gerar  um relatório contendo todos os dados cruzados, para realizar esta operação será necessário:

Analisar > Estatística descritivas > Tabela de referência cruzada

Vejamos um exemplo prático de como isso poderia ser feito, considerando o banco de dados da "plataforma cultura digital", através do SPSS buscaremos identificar a porcentagem de tópicos que se encontram relacionado com determinado fórum, mediante a isso através das seguinte consulta SQL obteremos a base de dados necessária. 

SELECT `bb_forums`.forum_id AS IDForum, `bb_forums`.forum_name AS NomeForum, `bb_forums`.forum_desc AS DescricaoForum, `bb_posts`.post_id AS IDPosts FROM `bb_forums` INNER JOIN `bb_posts` ON `bb_forums`.forum_id=`bb_posts`.forum_id;

 Após isso, será necessário importar os dados para o SPSS, executando a função de frequência cruzada. Deste modo, a ferramenta retornará um relatório contendo a porcentagem de posts que cada fórum possui.

4. Medida de posição central (Centro de dados).

Consiste do ponto central no conjunto de dados, ou seja, aquele valor que se encontra no centro do conjunto de dados, na qual este valor central irá representar os dados como um todo, sendo medidos através, da média, mediana ou moda.

4.1 Média

Consiste na divisão da soma pela contagem de elementos, dados ou eventos, resultando em um valor único que representa o conjunto de valores. 

É influenciado por valores discrepantes.

  • Média populacional, todos os do conjunto são considerados.

  • Média amostral, parte de um conjunto (amostra) são considerados.

4.2 Mediana

Utiliza-se para representar o conjunto de dados, justamente o valor que localiza-se no centro exato do conjunto. Deste modo, se a mediana for ímpar será considerado o elemento que encontrar-se exatamente no centro do conjunto, caso seja par, realiza-se a média dos dois elementos centrais.

A vantagem em relação à média é que a mediana desconsidera os valores extremos.

4.3 Moda

Consiste no valor que aparece com mais frequência no conjunto de dados.

  • Amodal quando não possui moda.

  • Multimodal quando possui mais de uma moda.

 5. Medidas de dispersão.

Buscam mediar a dispersão de um conjunto de dados, ou seja, a distância existente entre determinado valor e a média, quando maior a dispersão maior a discrepância naquele conjunto de dados.

5.1 Amplitude total

Consiste na diferença entre o maior valor e o menor valor do conjunto de dados.

Para isso é necessário colocar os dados em ordem crescente e diminuir o maior valor pelo menor valor.

Amplitude total também será conhecida como intervalo total.

5.2 Desvio Padrão

Será utilizado para calcular a dispersão, sendo este método o mais indicado, deste modo, realizará o calculo da distância de determinado valor até o centro dos dados, sendo assim, vale ressaltar, se o desvio padrão for maior que a média, significa que existe uma discrepância entre os valores, pois quanto maior o valor do desvio padrão, maior o afastamento dos dados.

Para calcular o desvio padrão através do SPSS utiliza-se:

Analisar > Frequência > Estatística > marque a opção desvio padrão

 5.3. Desvio Padrão Amostral.

Será calculado quando a amostra possuir menos de 30 elementos, ou caso a amostra seja de uma população extraordinariamente grande utiliza-se 5% a 20% da população.

 6. Medidas de ordenamento.

Utilizadas para distribuição, já falamos da mediana em que se trata de uma medida de ordenamento, na qual não são afetadas por valores discrepantes, diferente da média.

A mediana apresenta apenas um único valor central, porém pra aumentar a precisão e obter mais informações, será necessário o uso quartis, decis, percentis e assim por diante.

Por exemplo, os quartis dividem a distribuição, que se encontra em ordem crescente, em quatro partes iguais.

Calculando quartis.

Amostra: 6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36

Amostra ordenada: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49

Q1/4 = 15

Q2/4 = 40 

Q3/4 = 43

Amostra ordenada: 7, 15, 36, 39, 40, 41

Q1/4 = 15

Q2/4 = (39+36)/2 = 37.5

Q3/4 = 40

7. Medidas de forma de distribuição

Consiste na visualização das frequências de um determinado conjunto de dados, para isso utiliza-se visualizações.

Uns dos mecanismos mais utilizados são os histogramas e os gráficos de dispersão, na qual analisasse o formato da curva de distribuição.

7.1 Distribuição Normal

Possui forma de sino, na qual a maior concentração de valores encontra-se no centro, à medida que se afasta do centro ocorre à diminuição desta frequência. Em resumo, a média encontra-se no centro da normal local de maior frequência, a medida que se afasta desta região reduz a frequência.

 7.2 Curtose

Analisa o grau de achatamento ou alongamento da distribuição, sendo divididas em:

 

  • Leptocúrtica, k<0,263

  • Mesocúrtica, k=0,263

  • Platicúrtica, k>0,263

 

O valor “k” consiste no grau de curtose, sendo calculado:

K = (Q3 – Q4)/2(P90-P10)  

Analisar> Relatórios> Frequências> Estatísticas> Marque a opção curtose

Porém, o que significa dizer que uma curva é uma curtose? E que interpretação podemos ter? Bem, no centro da normal local de maior frequência e onde se localiza a média, à medida que se afasta a frequência vai diminuindo, deste modo, quanto maior for à curtose, maior será a frequência de valores em torno da média, deste modo, podemos concluir que existe uma menor dispersão.

7.3 Assimetria

Mede o grau de afastamento em relação ao eixo central, deste modo podendo haver três variações, sendo elas:

 

  • Assimetria à direita, ocorre quando existe uma grande quantidade de valores baixos em relação a poucos com valores altos, como por exemplo, distribuição de renda. A média > mediana > moda.
  • Assimetria à esquerda, ocorre quando existe uma grande quantidade de valores pequenos em relação a grande quantidade de valores altos. A média<mediana<moda.

 8. Medidas estatísticas no SPSS

 Para calcular as tendências centrais, dispersões e distribuições no SPSS realiza-se o seguinte comando.

Analisar > Estatística Descritivas > Frequências > Estatísticas

Após isso apenas selecione as opções desejadas.

 

 

 

 

Categorias: SPSS ANÁLISE DE DADOS