ANEXA 2.  Studiul  unui  exemplu  de așteptare

            Am aruncat un zar de câteva mii de ori urmărind să observ de câte aruncări este nevoie pentru a obține un „6”. Variabila aleatoare studiată a fost timpul de așteptare până la apariția unui „6”. Calcule elementare arată că dacă  sunt independente și având aceeași probabilitate p, , unde  și T este timpul de așteptare până la realizarea unuia din evenimentele . În cazul zarului perfect ar trebui, deci, ca .

            Experimentele au fost împărțite în serii de câte 200 de experiențe. Rezultatele sunt prezentate în tabelele de mai jos.

            Tabelul 1. Frecvențe brute în serii de 200 de probe

Nr.

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

1

55

46

38

48

34

54

38

37

40

35

42

36

35

34

45

38

2

22

29

22

36

33

32

28

35

30

36

29

27

33

40

36

42

3

20

33

31

31

35

24

25

32

24

21

17

32

26

34

17

24

4

16

19

27

21

25

19

24

21

17

28

23

23

14

24

15

20

5

19

19

18

18

16

16

15

16

20

12

18

18

25

11

20

14

6

17

9

17

9

12

10

11

17

12

17

16

13

11

12

12

9

7

11

12

10

7

8

5

15

13

11

11

9

10

10

4

9

12

8

9

7

9

8

5

11

10

5

9

9

12

9

6

6

11

4

9

8

3

5

4

5

7

5

4

10

4

5

6

7

7

5

9

10

3

6

4

6

7

5

7

4

10

5

5

6

7

7

7

7

11

6

4

5

2

3

5

7

6

4

4

8

2

6

4

8

4

12

5

3

2

3

6

2

5

1

2

5

2

5

2

2

2

3

13

2

1

2

2

1

1

2

2

3

0

3

1

3

3

5

0

14

4

0

2

1

2

3

2

3

2

2

1

1

5

2

0

1

15

4

2

2

0

3

1

1

1

1

2

2

1

1

4

3

0

16

2

2

2

0

3

2

2

3

0

1

1

4

4

1

1

0

17

2

1

2

1

1

1

0

1

0

1

1

0

1

0

1

2

18

0

0

1

2

0

2

0

0

1

2

0

1

1

0

0

3

19

0

0

0

1

1

0

1

0

0

0

0

0

1

0

0

1

20

5

4

0

1

2

3

5

4

2

2

5

5

2

5

2

7

și peste

Tabelul 2. Frecvențe cumulate; primul rând arată la câte probe sunt calculate frecvențele.

Nr.

200

400

600

800

1000

1200

1600

2000

2400

2800

3200

frecv. teoretice pt.

1

55

101

139

188

222

276

351

428

506

575

658

672

2

22

51

73

109

142

174

237

303

359

432

510

531

3

20

53

84

115

150

174

231

276

325

385

426

419

4

16

35

62

83

108

127

172

217

263

301

336

331

5

19

38

56

74

90

106

137

169

205

241

275

262

6

17

26

43

52

64

74

102

131

160

183

204

206

7

11

23

33

40

48

53

81

103

122

136

157

163

8

9

16

25

33

38

49

64

82

103

115

130

129

9

8

11

16

20

25

32

41

55

66

80

94

102

10

3

9

13

19

26

31

42

57

68

82

96

81

11

6

10

15

17

20

25

38

46

56

66

78

64

12

5

8

10

13

19

21

27

34

41

45

50

50

13

2

3

5

7

8

9

13

16

20

26

31

40

14

4

4

6

7

9

12

17

21

23

30

31

31

15

4

6

8

8

11

12

14

18

21

26

29

25

16

2

4

6

6

9

11

16

17

22

26

27

20

17

2

3

5

6

7

8

9

11

12

13

16

15

18

0

0

2

4

4

6

6

9

10

11

14

12

19

0

0

0

2

2

2

3

7

7

8

10

10

20

5

9

9

9

11

14

23

27

37

44

53

49

și peste

            Notând  frecvențele relative cumulate (la n probe) ca timpul de așteptare să fie exact i, atunci este clar că  este un estimator pentru p = probabilitatea apariției unui 6. Iată evoluția acestei frecvențe relative pentru n dat în tabelul 2 (adică n = 200, 400,…,3200):

.275, .252, .232, .235, .222, .230, .219, .214, .211, .205, .2056.

            Am preferat  și nu .205 deoarece frecvențele au fost toate deasupra lui .205; trebuie aleasă ca probabilitate o frecvență în jurul căreia oscilează celelalte.

            Calculând testul  a rezultat un  calculat de 14.7 care nu este suficient pentru a infirma ipoteza că  (la 19 grade de libertate câte avem, ar trebui un  

mai mare decât 30.1 pentru a respinge ipoteza cu probabilitate de eroare mai mică decât 5%.

            Dacă am fi ales , abaterea de la curba teoretică ar fi fost și mai mică ( =12.83) dar am preferat  din motive empirice: o valoare „mai de mijloc” a frecven’ei relative este, probabil, mai apropiată de adevărata probabilitate (!).

            În figura de pe pagina [134???] este arătată evoluția frecvențelor relative cumulate după 400, 800, 1600 și 3200 de experimente. Am putea decide de aici că modelul teoretic „evenimente independente cu ” se potrivește aproape perfect. Lucrurile nu stau chiar așa de simplu.

            Am încercat să varific ipoteza independenței (de fapt, aici ar fi mai adecvată noțiunea lui Popper de „falsificare”). Din cele 16365 de aruncări cu zarul efectuate (pentru a obține 3200 de experimente) am reținut ultima serie de 3065 (din motive „tehnice”: numărătorile au fost făcute manual; altfel aș fi putut studia întreaga serie) pe care am studiat-o mai amănunțit. Am calculat frecvențele

, ,

pe care le-am trecut în tabelul 3.

TABELUL 3. Frecvențele  și

 

1

2

3

4

5

6

 

1

117

-8      125

103

11     92

123

24       93

79

12       87

78

-16      94

118

-3       121

618

2

100

8         92

67

-11       68

82

9         73

54

-10       64

75

  6       69

78

-12       90

456

3

97

-2        99

87

6        73

67

-12      79

67

-2        69

74

-1        75

101

4         97

493

4

80

-7        87

53

-11       64

53

-16       69

74

14        60

71

6         65

99

8          91

430

5

101

7          94

70

1          69

75

0          75

67

2         65

78

7          71

74

-17       91

465

6

123

2        121

76

-14      90

93

-4        97

89

-2         91

89

-2         91

132

14      118

602

618

456

493

430

465

602

3064 (total)

Să notăm  și  (rotunjit la parte întreagă). Atunci, dacă probele ar fi independente, ar trebui ca  aproximativ; dacă în loc de frecvențe am fi lucrat cu probabilități, ar fi trebuit ca  ???. În colțul din dreapta jos al celulelor (i, j) am notat valoarea lui , iar în colțul din stânga jos, abaterea de la aceste valori „semiteoretice”, .

            Deși la o simplă inspectare a acestor valori s-ar părea că abaterile nu sunt prea mari, și că nu avem motive serioase să respingem ipoteza independenței, valoarea indicatorului

            Valoarea tabelată a aceluiași indicator pentru respingerea ipotezei la nivel de semnificație 5% și 30 grade de libertate ( : avem 36 de căsuțe și 5 legături independente între ele de tipul ) este ceva mai mare 43.773, dar la nivel 10% .

            Înseamnă că ipoteza independenței trebuie respinsă (cu risc între 5% și 10% de a comite o eroare). Există o „explicație” intuitivă a faptului că aruncările nu au fost independente: la ultimele probe, nu mai amestecam zarul în mână, ci îl luam de pe masă și îl lăsam să se rostogolească din palmă în cădere liberă de la o înălțime de 10 – 15 centimetri. De aceea probabil că a apărut o dependență markoviană între aruncări.

            Se știe că numerele  reprezintă o estimare a probabilităților de trecere ale lanțului. În cazul de față

            Se observă că dependența markoviană este destul de slabă: doar cinci dintre numerele  se abat de la  cu mai mult de .05 ( , , și ). Este de așteptat, deci, ca rezltatul comportării acestui lanț Markov să nu difere prea mult de cazul în care variabilele  ar fi independente și identic repartizate. Acest lucru ar explica de ce modelul inițial s-a potrivit așa de bine.

            În matricea din Tabelul 3, să considerăm că nu ne interesează decât dacă rezultatul aruncării a fost „6” sau „non-6”. Pe „6” să îl renotăm cu „1” (succes) și pe „non-6” cu „0” (eșec). Atunci tabelul frecvențelor devine:

Tabelul 4. Același ca Tabelul 3, dar rezultatele 1, 2, 3, 4, 5, 6 se cumulează sub eticheta „0” iar „6” este renotat „1”.

 

0

1

 

0

1992

14    1978

470

14     484

2462

1

470

-14     484

132

14      118

602

Total

2462

602

3084

            Convențiile sunt aceleași ca în Tabelul 3: în stânga jos sunt abaterile de la valorile  care apar în colțul din dreapta jos.

            Acum , adică insuficient pentru a respinge ipoteza că probele sunt independente. Ori, în cazul experimentului de așteptare efectuat nu interesează decât „6” și „non-6”, adică 0 și 1. De aceea ipoteza independenței a fost, totuși, adecvată.

            Un interval de încredere de nivel 95% pentru adevărata probabilitate a apariției feței 6 este . Atât valorile .21 și .205 gasite prin metoda cealaltă, de la pag. 133 ( ) sunt acceptabile.

            Să luăm acum în considerație modelul markovian. Lucrurile nu se complică prea mult. Considerăm că noile variabile aleatoare  și  în rest, formează un lanț Markov omogen și staționar (adică  nu depinde de n). Matricea de trecere  o estimăm din Tabelul 4. Atunci . Trebuie să calculăm . Din ipoteza de staționaritate,  sau ,de unde se scoate imediat  sau, în cazul nostru .

            Introducem acum variabila aleatoare T = timpul de așteptare până la apariția succesului, . Un calcul elementar (condiționări repetate) arată că  dacă  și . La 3200 de probe, frecvențele apropiate vor fi:

T

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

f

629

491

397

321

260

210

170

138

111

90

73

59

48

39

31

25

20

f (real)

658

510

426

336

275

204

157

130

94

96

78

50

31

31

29

27

16

Care, în mod paradoxal, sunt mai proaste decât cele obținute prin modelul naiv i.i.d !