SPSS: PROGRAMAS E ROTINAS COMPLEMENTARES (SYNTAX FILES)

 

Proporções

 

Teste para a diferença entre duas proporções independentes
[Nível de significação, intervalo de confiança e poder observado]

Esta sintaxe efectua o teste da diferença entre duas proporções independentes, calculando, igualmente, o intervalo de confiança da diferença e o poder observado.

Para além do número total da casos (N1 e N2) e das proporções observadas (P1 e P2) nas duas amostras, o utilizador deve especificar o nível de confiança (NC), para a determinação dos limites inferior (LIM_INF) e superior (LIM_SUP) do intervalo de confiança da diferença, e o nível de significação (ALFA), a adoptar no cálculo do poder observado (PODER).

A sintaxe utiliza a aproximação normal (rigorosamente equivalente à utilização do Teste do Qui-quadrado) ao Teste Exacto de Fisher (que fornece as probabilidades exactas com base na distribuição hipergeométrica – cf. Nota 1), sendo o valor de zobs corrigido para a continuidade. O output divide-se em quatro partes:

1) P1 e P2 (proporções observadas nas duas amostras, introduzidas pelo utilizador – cf. Nota 2), N1 e N2 (total de casos nas duas amostras, introduzidos pelo utilizador), Z (z observado) e probabilidades bilateral (P_BI) e unilateral (P_UNI);

2) Z_C, P_BI_C e P_UNI_C (valor de z corrigido para a continuidade e respectivas probabilidade bilateral e unilateral; são estes os valores a reter no teste de significação – cf. Nota 1);

3) NC (nível de confiança, introduzido pelo utilizador) e limites inferior (LIM_INF) e superior (LIM_SUP) do intervalo de confiança da diferença entre as proporções;

4) ALFA (nível de significação para a determinação do poder, introduzido pelo utilizador) e PODER (poder observado; cf. Cohen, 1988; Borenstein, Rothstein & Cohen, 2001).

No exemplo (Guilford & Fruchter, 1978, p. 159), pretende saber-se se duas amostras de estudantes diferem no modo como avaliaram o desempenho do presidente de uma dada reunião. No primeiro grupo, 60% dos 100 estudantes aprovaram o comportamento do presidente; no segundo grupo, 70% dos 50 estudantes tiveram a mesma posição.

*** Teste da diferença entre duas proporções independentes.

*** [Teste z, Intervalo de Confiança da Diferença e Poder Observado]

*** Valentim Rodrigues Alferes (Universidade de Coimbra, 2003)

*** valferes@fpce.uc.pt

INPUT PROGRAM.

LOOP X=1 TO 1.

END CASE.

END LOOP.

END FILE.

END INPUT PROGRAM.

 

* Introduza a primeira proporção independente.

COMPUTE P1 = 0.60.

* Introduza o N total para a primeira proporção indepedente.

COMPUTE N1 = 100.

* Introduza a segunda proporção independente.

COMPUTE P2 = 0.70.

* Introduza o N total para a segunda proporção indepedente.

COMPUTE N2 = 50.

* Introduza o nível de confiança (em percentagem) para a determinação

* do intervalo de confiança (por defeito, NC = 95).

COMPUTE NC = 95.

* Introduza o alfa para o cálculo do poder (por defeito, ALFA = 0.05).

COMPUTE ALFA = 0.05.

COMPUTE P=(N1*P1+N2*P2)/(N1+N2).

COMPUTE Z=(P1-P2)/SQR(P*(1-P)*((N1+N2)/(N1*N2))).

COMPUTE ZABS=ABS(Z).

COMPUTE P_BI=(1-CDFNORM (ZABS))*2.

COMPUTE P_UNI=1-CDFNORM (ZABS).

COMPUTE Z_C=(ABS(P1-P2)-(0.5*(1/N1+1/N2)))/SQR(P*(1-P)*((N1+N2)/(N1*N2))).

COMPUTE ZABS_C=ABS(Z_C).

COMPUTE P_BI_C=(1-CDFNORM (ZABS_C))*2.

COMPUTE P_UNI_C=1-CDFNORM (ZABS_C).

IF (Z<0) Z_C=-1*Z_C.

COMPUTE DIF=P1-P2.

COMPUTE EP_DIF=SQR((P1*(1-P1)/N1)+(P2*(1-P2)/N2)).

COMPUTE Z_NC=IDF.NORMAL(1-((100-NC)/100)/2,0,1).

COMPUTE LIM_INF=DIF-Z_NC*EP_DIF.

COMPUTE LIM_SUP=DIF+Z_NC*EP_DIF.

COMPUTE X1=SQR(P1).

COMPUTE H1=2*ARTAN(X1/SQR(-X1*X1+1)).

COMPUTE X2=SQR(P2).

COMPUTE H2=2*ARTAN(X2/SQR(-X2*X2+1)).

COMPUTE HDIF=H1-H2.

COMPUTE Z_ALFA=IDF.NORMAL(1-ALFA/2,0,1).

COMPUTE N=(2*(N1*N2))/(N1+N2).

COMPUTE ZPODER1=ABS(HDIF)*SQR(N/2)-Z_ALFA.

COMPUTE ZPODER2=-ABS(HDIF)*SQR(N/2)-Z_ALFA.

COMPUTE PODER1=CDF.NORMAL(ZPODER1,0,1).

COMPUTE PODER2=CDF.NORMAL(ZPODER2,0,1).

COMPUTE PODER=PODER1+PODER2.

EXECUTE.

FORMATS N1 N2 NC(F8.0) P1 P2 Z P_BI P_UNI z_c P_BI_c P_UNI_c

DIF EP_DIF LIM_INF LIM_SUP ALFA PODER (F8.4).

LIST P1 P2 N1 N2 Z P_BI P_UNI.

LIST Z_C P_BI_C P_UNI_C.

LIST NC DIF EP_DIF LIM_INF LIM_SUP.

LIST ALFA PODER.

Output (exemplo)

*** Teste da diferença entre duas proporções independentes.

*** [Teste z, Intervalo de Confiança da Diferença e Poder Observado]

*** Valentim Rodrigues Alferes (Universidade de Coimbra, 2003)

*** valferes@fpce.uc.pt

 

NEW FILE.

INPUT PROGRAM.

 

[...]

 

LIST P1 P2 N1 N2 Z P_BI P_UNI.

List

 

      P1       P2       N1       N2        Z     P_BI    P_UNI

 

   ,6000    ,7000      100       50  -1,1981    ,2309    ,1154

 

Number of cases read:  1    Number of cases listed:  1

 

 

LIST Z_C P_BI_C P_UNI_C.

List

 

     Z_C   P_BI_C  P_UNI_C

 

 -1,0184    ,3085    ,1543

 

Number of cases read:  1    Number of cases listed:  1

 

 

LIST NC DIF EP_DIF LIM_INF LIM_SUP.

List

 

      NC      DIF   EP_DIF  LIM_INF  LIM_SUP

 

      95   -,1000    ,0812   -,2592    ,0592

 

Number of cases read:  1    Number of cases listed:  1

 

 

LIST ALFA PODER.

List

 

    ALFA    PODER

 

   ,0500    ,2284

 

Number of cases read:  1    Number of cases listed:  1

Nota 1

A aproximação ao problema via Teste z é rigorosamente idêntica à aproximação via Teste do Qui-Quadrado, que pode obter através da sintaxe que se segue.

NEW FILE.
INPUT PROGRAM.
LOOP X=1 TO 1.
END CASE.
END LOOP.
END FILE.
END INPUT PROGRAM.
 
* Introduza a primeira proporção independente.
COMPUTE P1 = 0.60.
* Introduza o N total para a primeira proporção indepedente.
COMPUTE N1 = 100.
* Introduza a segunda proporção independente.
COMPUTE P2 = 0.70.
* Introduza o N total para a segunda proporção indepedente.
COMPUTE N2 = 50.
COMPUTE X1Y1=RND(P1*N1).
COMPUTE X1Y2=N1-X1Y1.
COMPUTE X2Y1=RND(P2*N2).
COMPUTE X2Y2=N2-X2Y1.
EXECUTE.
FLIP VARIABLES=X1Y1 X1Y2 X2Y1 X2Y2.
COMPUTE X=2.
IF (CASE_LBL='X1Y1' OR CASE_LBL='X1Y2') X=1.
COMPUTE Y=2.
IF (CASE_LBL='X1Y1' OR CASE_LBL='X2Y1') Y=1.
COMPUTE FREQ=VAR001.
EXECUTE.
WEIGHT BY FREQ.
CROSSTABS/TABLES=X BY Y/FORMAT=AVALUE TABLES
/STATISTIC=CHISQ/CELLS=COUNT EXPECTED ROW/METHOD=EXACT TIMER(5).

 

Output

Crosstabs

 

 

 

 

Como se pode observar no output principal e no output desta nota, tanto o Teste z como o Teste do Qui-Quadrado, sem (p = 0.2309) ou com (p = 0.3085) correcção para a continuidade, conduzem à não rejeição da hipótese nula, i.e., apontam para a não existência de diferenças entre os dois grupos no modo como avaliaram o comportamento do presidente (note que z2 = c2). No exemplo, os autores formulam uma hipótese não direccional, pelo que deve reter as probabilidades bilaterais; mesmo que a hipótese inicial tivesse sido direccional, as probabilidades unilaterias (p  = 0.1154, sem correcção e p = 0.1543, com correcção) conduziriam a igual decisão.

Em todo o caso, opte sempre pela solução mais rigorosa, ainda que mais conservadora, da correcção para a continuidade. Note que neste exemplo, tais probabilidades constituem uma boa aproximação às probabilidades exactas dadas pelo Teste de Fisher: p = 0.2820 (bilateral) e p= 0.1542 (unilateral).

Historicamente, o recurso ao Teste z ou ao Teste do Qui-Quadrado encontra justificação na dificuldade em calcular as probabilidades exactas para valores elevados de N. Como o SPSS faz essa tarefa em poucos segundos, recomendamos ao utilizador que indique sempre a probabilidade exacta dada pelo Teste de Fisher.  Caso os Ns sejam demasiado elevados,  pode obter a seguinte mensagem ao correr a sintaxe desta nota:

There is insufficient special working memory to process all the cases. Break up the request, rerun with more workspace, or use the SAMPLE subcommand. You can increase workspace with the SET WORKSPACE command, or change the Special Working Memory Limit in the Preferences Dialog Box.

Siga estas instruções, por exemplo:

SET WORKSPACE=15000.

* O valor por defeito é de 512.

ou, pura e simplemente, indique a probabilidade do Teste z ou do Teste do Qui-Quadrado, que, nesta situação, não difere da probabilidade exacta.

Nota 2

Para evitar erros de arredondamento [o que não é aqui o caso, uma vez que 60/100 (0.60%) e 35/50 (70%) são  dízimas finitas], é preferível exprimir a proporção nas amostras sob a forma de fracção. Por exemplo, nas  sintaxes desta página, as linhas:

COMPUTE P1 = 0.60.

[...]

COMPUTE P2 = 0.70.

seriam substituídas pelas linhas:

COMPUTE P1 = 60/100.

[...]

COMPUTE P2 = 35/50.

Se, por exemplo, num artigo publicado, o autor nos diz que 36.4% dos 107 sujeitos responderam correctamente a um item, é preferível calcular retrospectivamente os efectivos, arredondando o resultado para o inteiro mais próximo:

0.364 x 107 = 38.948 @ 39

e escrever:

COMPUTE Px = 39/107.

em vez de:

COMPUTE Px = 0.364.

Referências

Borenstein, M., Rothstein, H., & Cohen, J. (2001). SamplePower 2.0 [Computer Manual]. Chicago: SPSS Inc.

Guilford, J. P., & Fruchter, B. (1978). Fundamental statistics in psychology and education (6th ed.). New York: McGraw-Hill.

 

NIIPS / CSEO

SYNTAX FILES

valferes@fpce.uc.pt

Última actualização: 2003-04-09