SPSS: PROGRAMAS E ROTINAS COMPLEMENTARES (SYNTAX FILES)

 

Experiências Aleatórias: Lançamento de dois dados um milhão de vezes
Valentim Rodrigues Alferes
Universidade de Coimbra, 2003
valferes@fpce.uc.pt

 

Experiências aleatórias - Uma experiência aleatória é um processo cujo resultado depende do acaso, ou, se se quiser, cujo resultado não é antecipadamente conhecido. Numa tal experiência, designa-se por espaço amostral o conjunto de todos os possíveis resultados e por acontecimento qualquer subconjunto do espaço amostral.

Imagine uma situação em que o leque de possíveis resultados é conhecido a priori. Por exemplo, ao lançar uma moeda ao ar apenas um de dois possíveis resultados pode acontecer: cara ou coroa. O espaço amostral é:

S = {Cara, Coroa}

Um acontecimento possível é a saída de coroa:

E = {Coroa}

Ao lançar um dado de seis faces, o espaço amostral é:

S = {1, 2, 3, 4, 5, 6}

Um acontecimento possível é a saída de um 5:

E = {5}

Outro acontecimento é a saída de uma face com um número par:

E = {2, 4, 6}

Se lançar simultaneamnete dois dados de seis faces, o espaço amostral comporta 36 resultados possíveis:

S = {(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6),
(3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, 1),
(5, 2), (5, 3), (5, 4), (5, 5), (5, 6), (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)}

Um acontecimento possível é a soma dos dois dados igual a 2:

E = {(1, 1)}

Outro acontecimento possível é a soma dos dois dados igual a 7:

E = {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)}

Ainda outro acontecimento possível é a soma dos dois dados igual a 2 ou a 3:

S = {(1, 1), (1, 2), (2, 1)}

Admitindo que os dados não estão viciados (ver teste estatístico para determinar se um dado está viciado), a probabilidade de um dado acontecimento é a razão entre o número de resultados favoráveis a esse acontecimento e o número de resultados possíveis. Nos três exemplos dados (soma igual a 2, soma igual a 7 e soma igual a 2 ou a 3), as probabilidades dos acontecimentos são, respectivamente, 1/36, 6/36 e 3/36.

Variáveis aleatórias – Uma variável aleatória é uma variável cujos valores são determinados pelos resultados de experiências aleatórias. As variáveis aleatórias dizem-se discretas, quando assumem um número determinado de valores contáveis, ou contínuas, quando assumem qualquer valor num dado intervalo.

Ao repetirmos as experiências aleatórias de lançamento de moedas ou de dados, originamos variáveis aleatórias discretas, cujos valores são definidos no respectivo espaço amostral. Assim, por exemplo, se a variável aleatória for a face de uma moeda ela pode assumir dois valores: cara ou coroa (0 ou 1, se quisermos). Se for a face de um dado, a variável pode assumir seis valores: 1, 2, 3, 4, 5 ou 6. Se for a soma das faces de dois dados, temos uma variável com onze valores possíveis: 2, 3, 4, 5 ,6 ,7, 8, 9, 10, 11 ou 12.

Sintaxe SPSS – A presente sintaxe do SPSS simula, precisamente, o lançamento de dois dados um milhão de vezes. Dito de outra forma, gera a variável aleatória SOMA com 1000000 casos, cujos valores são os onze acontecimentos acima referidos.

O propósito é a ilustração de uma célebre lei estatística, a lei dos grandes números ou lei empírica do acaso, formulada inicialmente por Jacques Bernoulli (1713): “É muito pouco provável que, se fizer um número suficientemente grande de experiências, a frequência de um acontecimento se afaste notavelmente da sua probabilidade” (para a formulação matemática desta lei, também conhecida por Teorema de Bernoulli, cf.  Eric Weisstein’s World of Mathematics). Na parte do output Frequency Table, pode ver as frequências e as percentagens das três variáveis aleatórias geradas pela sintaxe: D1 (Primeiro dado), D2 (Segundo dado) e SOMA dos dois dados. Nos Quadros 1 e 2, pode comparar as probabilidades teóricas com as proporções observadas.

Note, igualmente, que, de acordo com o Teorema do Limite Central, para um número suficientemente grande de experiências, dadas n variáveis aleatórias independentes com uma qualquer distribuição, a soma dessas variáveis é uma variável aleatória com uma distribuição normal. Como pode observar nos Gráficos D1 e D2, a distribuição  de frequências de cada um dos dados tomado isoladamente é uma distribuição uniforme. Contudo, a distribuição da variável SOMA é uma distribuição normal.

Caso o deseje, pode refazer a simulação, com o mesmo ou com outro número de experiências, mantendo ou alterando o valor a vermelho na sintaxe (ver, também, Nota).

 

Comandos (Syntax)

NEW FILE.

INPUT PROGRAM.

* Introduza o número de vezes que pretende lançar os dados.

+LOOP EXPERI_N=1 TO 1000000.

+DO REPEAT DADO=D1 TO D2.

+SET SEED RANDOM.

+COMPUTE DADO=RND(RV.UNIFORM(0.5,6.5)).

+END REPEAT.

+END CASE.

+END LOOP.

+END FILE.

END INPUT PROGRAM.

COMPUTE SOMA=D1+D2.

FORMATS ALL(F8.0).

EXECUTE.

FREQUENCIES VARIABLES=D1 D2 SOMA.

GRAPH/BAR(SIMPLE)=PCT BY D1.

GRAPH/BAR(SIMPLE)=PCT BY D2.

GRAPH/BAR(SIMPLE)=PCT BY SOMA.

 

 

Output

NEW FILE.

[...]

FREQUENCIES VARIABLES=D1 D2 SOMA.

 

Frequencies

 

Frequency Table

 

GRAPH/BAR(SIMPLE)=PCT BY D1.

 

Graph

 

GRAPH/BAR(SIMPLE)=PCT BY D2.

 

Graph

 

GRAPH/BAR(SIMPLE)=PCT BY SOMA.

 

Graph

 

 

 

 

Probabilidades teóricas e proporções observadas

 

Quadro 1 – Probabilidades teóricas e proporções observadas
no lançamento de um dado um milhão de vezes

Resultado
[Acontecimento]

Probabilidade teórica

Proporção observada

Dado 1

Dado 2

Œ

1/6 = 0.16667

0.16643

0.16686

1/6 = 0.16667

0.16681

0.16645

Ž

1/6 = 0.16667

0.16667

0.16684

1/6 = 0.16667

0.16671

0.16682

1/6 = 0.16667

0.16676

0.16636

1/6 = 0.16667

0.16662

0.16667

6

6/6 = 1.00000

1.00000

1.00000

 

 

Quadro 2 – Probabilidades teóricas e proporções observadas
no lançamento simultâneo de dois dados um milhão de vezes

Soma
[Acontecimento]

Resultado

Probabilidade teórica

Proporção observada

2

Œ Œ

1/36 = 0.02778

0.02757

3

Œ

2/36 = 0.05556

0.05609

Œ

4

Œ Ž

3/36 = 0.08333

0.08307

Ž Œ

5

Œ

4/36 = 0.11111

0.11126

Ž

Ž

Œ

6

Œ

5/36 = 0.13889

0.13886

Ž Ž

Œ

7

Œ

6/36 = 0.16667

0.16634

Ž

Ž

Œ

8

5/36 = 0.13889

0.13909

Ž

Ž

9

Ž

4/36 = 0.11111

0.11068

Ž

10

3/36 = 0.08333

0.08362

11

2/36 = 0.05556

0.05586

12

1/36 = 0.02778

0.02757

11

6 x 6 = 36

36/36 = 1.00000

1.00000

 

 

Nota

Para um Applet que ilusta o Teorema do Limite Central com o lançamento de 1 a 5 dados (1 a 10000 experiências), veja o site de R. Todd Ogden (veja, também, o diagrama deste outro Applet com dois dados).

Se quiser fazer a mesma simulação no SPSS (podendo, igualmente, utilizar mais de 5 dados e/ou mais de 10000 experiências), corra a seguinte sintaxe, depois de ter especificado os valores pretendidos nos três locais assinalados a vermelho.

NEW FILE.

INPUT PROGRAM.

* Introduza o número de vezes que pretende lançar os dados.

+LOOP EXPERI_N=1 TO 10000.

* Introduza o número de dados (5 no exemplo).

+DO REPEAT DADO=D1 TO D5.

+SET SEED RANDOM.

+COMPUTE DADO=RND(RV.UNIFORM(0.5,6.5)).

+END REPEAT.

+END CASE.

+END LOOP.

+END FILE.

END INPUT PROGRAM.

* Introduza de novo o número de dados (5 no exemplo).

COMPUTE SOMA=SUM(D1 TO D5).

FORMATS ALL(F8.0).

EXECUTE.

FREQUENCIES VARIABLES=SOMA.

GRAPH/BAR(SIMPLE)=PCT BY SOMA.

Se, para além do número de experiências e de dados, deseja alterar o número de faces dos dados a utilizar, corra a seguinte sintaxe, depois de ter especificado os valores pretendidos nos quatro locais assinalados a vermelho (no exemplo, lançam-se 100000 vezes 12 dados de 8 faces).

NEW FILE.

INPUT PROGRAM.

* Introduza o número de vezes que pretende lançar os dados.

+LOOP EXPERI_N=1 TO 100000.

* Introduza o número de faces dos dados que pretende lançar.

+COMPUTE FACES = 8.

* Introduza o número de dados.

+DO REPEAT DADO=D1 TO D12.

+SET SEED RANDOM.

+COMPUTE DADO=RND(RV.UNIFORM(0.5,FACES+0.5)).

+END REPEAT.

+END CASE.

+END LOOP.

+END FILE.

END INPUT PROGRAM.

* Introduza de novo o número de dados.

COMPUTE SOMA=SUM(D1 TO D12).

FORMATS ALL(F8.0).

EXECUTE.

FREQUENCIES VARIABLES=SOMA.

GRAPH/BAR(SIMPLE)=PCT BY SOMA.

 

 

NIIPS / CSEO

SYNTAX FILES

valferes@fpce.uc.pt

Última actualização: 2003-04-06