Seminário de Análise Mulitinível

Valentim Rodrigues Alferes

Doc.Net 4 – Regressão Múltipla

Regressão Multipla: Equações fundamentais

Variáveis não estandardizadas

Variáveis estandardizadas

 

 

[SALARIO’] = $20137,7690 + $479,2049 [anosdout] + $87,8330 [publi]

 

[z’SALARIO] = ,5696 [zanosdout] + ,0715 [zpubli]

 

 

Quantidade

VI 1
ANOSDOUT

VI 2
PUBLI

Coeficiente de determinação

Quadrado do coeficiente de correlação semi-parcial

Quadrado do coeficiente de correlação parcial

Coeficiente de determinação múltipla

a + b + c + d = 1.0000

=  ,3852

= ,6148

=  ,1730

=  ,0027

 

= ,2196

 

= ,0044

 

 

Exercício 14 – 2ª Parte (Ref. 6: Alferes, 1997, pp. 116-117 e 158-160)

• Segunda parte: Regressão múltipla

3. Suponha que quer estudar simultaneamente os efeitos das variáveis ANOSDOUT e PUBLI nos salários.

3.1. Proceda à análise de regressão múltipla e diga qual é o significado de todos os termos e números do output.

3.2. Qual é a percentagem de variabilidade dos salários explicada conjuntamente pelos dois preditores?

3.3. Escreva e interprete a equação de regressão múltipla:

a) utilizando os coeficientes de regressão;

b) utilizando os coeficientes de regressão estandardizados.

3.4. Calcule os coeficientes de correlação semiparcial e os coeficientes de correlação parcial e eleve ao quadrado os valores encontrados. Compare os contributos individuais de cada preditor para a variabilidade explicada pelo modelo. Quais as conclusões a que chegou?

 
 

Quadro E14 - Salário (em dólares), anos decorridos desde o doutoramento, número de publicações,
sexo e número de citações [Fonte: Cohen & Cohen, 1983, p. 99]

NI

Salário ($)

Anos/Doutoramento

Publicações

Sexo

Citações

1

18000

1

2

0

1

2

19961

2

4

0

0

3

19828

5

5

1

1

4

17030

7

12

1

0

5

19925

10

5

0

0

6

19041

4

9

0

1

7

27132

3

3

1

0

8

27268

8

1

0

1

9

32483

4

8

0

0

10

27029

16

12

1

4

11

25362

15

9

0

0

12

28463

19

4

0

3

13

32931

8

8

0

5

14

28270

14

11

0

0

15

38362

28

21

0

3

 

Resposta 3.2

A percentagem da variabilidade dos salários explicada pelos dois preditores (anos decorridos depois do doutoramento e número de publicações) é de 38.5% [R2 = .385] para a amostra em causa e de 28.3% ajustada para a população [R2ajut = 0.283] [cf. OUTPUT 25X].

Resposta 3.3a

[SALARIO] = $479.21[ANOSDOUT] + $87.83[PUBLI] + $20137.77 [cf. OUTPUT 25X]

(Obs.: O símbolo $ equivale a dólares)

Resposta 3.3a

[SALARIO] = 0.57[ANOSDOUT] + 0.07[PUBLI]  [cf. OUTPUT 25X]

Resposta 3.4

O coeficiente de correlação semiparcial é a correlação entre a variável critério e um preditor parcializado do(s) restante(s) preditor(es). O quadrado desta quantidade dá-nos a proporção da variabilidade do critério explicada exclusivamente pelo preditor em causa. Para a variável anos depois do doutoramento, sr = .4159 [cf. Output 26A] e sr2 = .1730. Para a variável número de publicações, sr = .0522 [cf. Output 26B] e sr2 = .0027. Em conclusão, 17.3% da variabilidade dos salários deve-se exclusivamente aos anos depois do doutoramento e 0.3% exclusivamente ao número de publicações.

O coeficiente de correlação parcial é a correlação entre duas variáveis quando ambas foram parcializadas de terceiras variáveis. No exemplo em análise, o quadrado desta quantidade dá-nos a proporção da variabilidade do critério não associada a um preditor que está associada ao outro preditor. Por outras palavras, responde à questão: “quanto da variância de Y que não é estimada  pelas outras VIs na equação é estimada por esta variável” (Cohen & Cohen, 1983, p. 91). Para a variável anos depois do doutoramento, pr = .4686 [cf. Output 26C] e pr2 = .2196. Para a variável número de publicações, pr = .0665 [cf. Output 26D] e pr2 = .0044. Em conclusão, da variabilidade dos salários não explicada pelo número publicações, os anos depois do doutoramento explicam 22.0%; da variabilidade dos salários não explicada pelos anos de doutoramento, o número de publicações explica 0.4%.

 
GET
  FILE='C:\Documents and Settings\user\Desktop\E14_DATA.sav'.
REGRESSION
  /MISSING LISTWISE
  /STATISTICS COEFF OUTS R ANOVA ZPP
  /CRITERIA=PIN(.05) POUT(.10)
  /NOORIGIN
  /DEPENDENT salario
  /METHOD=ENTER anosdout publi
  /SAVE PRED ZPRED RESID ZRESID .

Regression

Variables Entered/Removed(b)

Model

Variables Entered

Variables Removed

Method

1

publi, anosdout(a)

.

Enter

a All requested variables entered.

b Dependent Variable: salario

 

Model Summary(b)

Model

R

R Square

Adjusted R Square

Std. Error of the Estimate

1

,6206(a)

,3852

,2827

5344,6071

a Predictors: (Constant), publi, anosdout

b Dependent Variable: salario

 

ANOVA(b)

Model

 

Sum of Squares

df

Mean Square

F

Sig.

1

Regression

214742423,7402

2,0000

107371211,8701

3,7589

,0540(a)

Residual

342777901,5932

12,0000

28564825,1328

 

 

Total

557520325,3334

14,0000

 

 

 

a Predictors: (Constant), publi, anosdout

b Dependent Variable: salario

 

Coefficients(a)

Model

 

Unstandardized Coefficients

Standardized Coefficients

t

Sig.

Correlations

 

B

Std. Error

Beta (b)

Zero-order

Partial

Part

 

1

(Constant)

20137,7690

2577,9874

 

7,8114

,0000

r

pr

sr

 

anosdout

479,2049

260,7910

,5696

1,8375

,0910

,6184

,4686

,4159

 

publi

87,8330

380,6970

,0715

,2307

,8214

,4606

,0665

,0522

 

a Dependent Variable: salario

 

 

Residuals Statistics(a)

 

Minimum

Maximum

Mean

Std. Deviation

N

Predicted Value

20792,6406

35400,0000

25405,6667

3916,4709

15,0000

Residual

-7516,1992

9725,7471

,0000

4948,1447

15,0000

Std. Predicted Value

-1,1779

2,5519

,0000

1,0000

15,0000

Std. Residual

-1,4063

1,8197

,0000

,9258

15,0000

a Dependent Variable: salario



 

Link à base de dados: E14_DATA