1

ANEXA 2. Studiul unui exemplu de aşteptare

Am aruncat un zar de câteva mii de ori urmărind să observ de câte aruncări este nevoie pentru a obţine un „6”. Variabila aleatoare studiată a fost timpul de aşteptare până la apariţia unui „6”. Calcule elementare arată că dacă sunt independente şi având aceeaşi probabilitate p, , unde şi T este timpul de aşteptare până la realizarea unuia din evenimentele . În cazul zarului perfect ar trebui, deci, ca .

Experimentele au fost împărţite în serii de câte 200 de experienţe. Rezultatele sunt prezentate în tabelele de mai jos.

Tabelul 1. Frecvenţe brute în serii de 200 de probe

Nr.	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16
1	55	46	38	48	34	54	38	37	40	35	42	36	35	34	45	38
2	22	29	22	36	33	32	28	35	30	36	29	27	33	40	36	42
3	20	33	31	31	35	24	25	32	24	21	17	32	26	34	17	24
4	16	19	27	21	25	19	24	21	17	28	23	23	14	24	15	20
5	19	19	18	18	16	16	15	16	20	12	18	18	25	11	20	14
6	17	9	17	9	12	10	11	17	12	17	16	13	11	12	12	9
7	11	12	10	7	8	5	15	13	11	11	9	10	10	4	9	12
8	9	7	9	8	5	11	10	5	9	9	12	9	6	6	11	4
9	8	3	5	4	5	7	5	4	10	4	5	6	7	7	5	9
10	3	6	4	6	7	5	7	4	10	5	5	6	7	7	7	7
11	6	4	5	2	3	5	7	6	4	4	8	2	6	4	8	4
12	5	3	2	3	6	2	5	1	2	5	2	5	2	2	2	3
13	2	1	2	2	1	1	2	2	3	0	3	1	3	3	5	0
14	4	0	2	1	2	3	2	3	2	2	1	1	5	2	0	1
15	4	2	2	0	3	1	1	1	1	2	2	1	1	4	3	0
16	2	2	2	0	3	2	2	3	0	1	1	4	4	1	1	0
17	2	1	2	1	1	1	0	1	0	1	1	0	1	0	1	2
18	0	0	1	2	0	2	0	0	1	2	0	1	1	0	0	3
19	0	0	0	1	1	0	1	0	0	0	0	0	1	0	0	1
20	5	4	0	1	2	3	5	4	2	2	5	5	2	5	2	7

şi peste

Tabelul 2. Frecvenţe cumulate; primul rând arată la câte probe sunt calculate frecvenţele.

Nr.	200	400	600	800	1000	1200	1600	2000	2400	2800	3200	frecv. teoretice pt.
1	55	101	139	188	222	276	351	428	506	575	658	672
2	22	51	73	109	142	174	237	303	359	432	510	531
3	20	53	84	115	150	174	231	276	325	385	426	419
4	16	35	62	83	108	127	172	217	263	301	336	331
5	19	38	56	74	90	106	137	169	205	241	275	262
6	17	26	43	52	64	74	102	131	160	183	204	206
7	11	23	33	40	48	53	81	103	122	136	157	163
8	9	16	25	33	38	49	64	82	103	115	130	129
9	8	11	16	20	25	32	41	55	66	80	94	102
10	3	9	13	19	26	31	42	57	68	82	96	81
11	6	10	15	17	20	25	38	46	56	66	78	64
12	5	8	10	13	19	21	27	34	41	45	50	50
13	2	3	5	7	8	9	13	16	20	26	31	40
14	4	4	6	7	9	12	17	21	23	30	31	31
15	4	6	8	8	11	12	14	18	21	26	29	25
16	2	4	6	6	9	11	16	17	22	26	27	20
17	2	3	5	6	7	8	9	11	12	13	16	15
18	0	0	2	4	4	6	6	9	10	11	14	12
19	0	0	0	2	2	2	3	7	7	8	10	10
20	5	9	9	9	11	14	23	27	37	44	53	49

şi peste

Notând frecvenţele relative cumulate (la n probe) ca timpul de aşteptare să fie exact i, atunci este clar că este un estimator pentru p = probabilitatea apariţiei unui 6. Iată evoluţia acestei frecvenţe relative pentru n dat în tabelul 2 (adică n = 200, 400,…,3200):

.275, .252, .232, .235, .222, .230, .219, .214, .211, .205, .2056.

Am preferat şi nu .205 deoarece frecvenţele au fost toate deasupra lui .205; trebuie aleasă ca probabilitate o frecvenţă în jurul căreia oscilează celelalte.

Calculând testul a rezultat un calculat de 14.7 care nu este suficient pentru a infirma ipoteza că (la 19 grade de libertate câte avem, ar trebui un

mai mare decât 30.1 pentru a respinge ipoteza cu probabilitate de eroare mai mică decât 5%.

Dacă am fi ales , abaterea de la curba teoretică ar fi fost şi mai mică ( =12.83) dar am preferat din motive empirice: o valoare „mai de mijloc” a frecven’ei relative este, probabil, mai apropiată de adevărata probabilitate (!).

În figura de pe pagina [134???] este arătată evoluţia frecvenţelor relative cumulate după 400, 800, 1600 şi 3200 de experimente. Am putea decide de aici că modelul teoretic „evenimente independente cu ” se potriveşte aproape perfect. Lucrurile nu stau chiar aşa de simplu.

Am încercat să varific ipoteza independenţei (de fapt, aici ar fi mai adecvată noţiunea lui Popper de „falsificare”). Din cele 16365 de aruncări cu zarul efectuate (pentru a obţine 3200 de experimente) am reţinut ultima serie de 3065 (din motive „tehnice”: numărătorile au fost făcute manual; altfel aş fi putut studia întreaga serie) pe care am studiat-o mai amănunţit. Am calculat frecvenţele

, ,

pe care le-am trecut în tabelul 3.

TABELUL 3. Frecvenţele şi

117

-8 125

103

11 92

123

24 93

12 87

-16 94

118

-3 121

618

100

8 92

-11 68

9 73

-10 64

6 69

-12 90

456

-2 99

6 73

-12 79

-2 69

-1 75

101

4 97

493

-7 87

-11 64

-16 69

14 60

6 65

8 91

430

101

7 94

1 69

0 75

2 65

7 71

-17 91

465

123

2 121

-14 90

-4 97

-2 91

132

14 118

602

618

456

493

430

465

602

3064 (total)

Să notăm şi (rotunjit la parte întreagă). Atunci, dacă probele ar fi independente, ar trebui ca aproximativ; dacă în loc de frecvenţe am fi lucrat cu probabilităţi, ar fi trebuit ca ???. În colţul din dreapta jos al celulelor (i, j) am notat valoarea lui , iar în colţul din stânga jos, abaterea de la aceste valori „semiteoretice”, .

Deşi la o simplă inspectare a acestor valori s-ar părea că abaterile nu sunt prea mari, şi că nu avem motive serioase să respingem ipoteza independenţei, valoarea indicatorului

Valoarea tabelată a aceluiaşi indicator pentru respingerea ipotezei la nivel de semnificaţie 5% şi 30 grade de libertate ( : avem 36 de căsuţe şi 5 legături independente între ele de tipul ) este ceva mai mare 43.773, dar la nivel 10% .

Înseamnă că ipoteza independenţei trebuie respinsă (cu risc între 5% şi 10% de a comite o eroare). Există o „explicaţie” intuitivă a faptului că aruncările nu au fost independente: la ultimele probe, nu mai amestecam zarul în mână, ci îl luam de pe masă şi îl lăsam să se rostogolească din palmă în cădere liberă de la o înălţime de 10 – 15 centimetri. De aceea probabil că a apărut o dependenţă markoviană între aruncări.

Se ştie că numerele reprezintă o estimare a probabilităţilor de trecere ale lanţului. În cazul de faţă

Se observă că dependenţa markoviană este destul de slabă: doar cinci dintre numerele se abat de la cu mai mult de .05 ( , , şi ). Este de aşteptat, deci, ca rezltatul comportării acestui lanţ Markov să nu difere prea mult de cazul în care variabilele ar fi independente şi identic repartizate. Acest lucru ar explica de ce modelul iniţial s-a potrivit aşa de bine.

În matricea din Tabelul 3, să considerăm că nu ne interesează decât dacă rezultatul aruncării a fost „6” sau „non-6”. Pe „6” să îl renotăm cu „1” (succes) şi pe „non-6” cu „0” (eşec). Atunci tabelul frecvenţelor devine:

Tabelul 4. Acelaşi ca Tabelul 3, dar rezultatele 1, 2, 3, 4, 5, 6 se cumulează sub eticheta „0” iar „6” este renotat „1”.

	0	1
0	1992 14 1978	470 14 484	2462
1	470 -14 484	132 14 118	602
Total	2462	602	3084

Convenţiile sunt aceleaşi ca în Tabelul 3: în stânga jos sunt abaterile de la valorile care apar în colţul din dreapta jos.

Acum , adică insuficient pentru a respinge ipoteza că probele sunt independente. Ori, în cazul experimentului de aşteptare efectuat nu interesează decât „6” şi „non-6”, adică 0 şi 1. De aceea ipoteza independenţei a fost, totuşi, adecvată.

Un interval de încredere de nivel 95% pentru adevărata probabilitate a apariţiei feţei 6 este . Atât valorile .21 şi .205 gasite prin metoda cealaltă, de la pag. 133 ( ) sunt acceptabile.

Să luăm acum în consideraţie modelul markovian. Lucrurile nu se complică prea mult. Considerăm că noile variabile aleatoare şi în rest, formează un lanţ Markov omogen şi staţionar (adică nu depinde de n). Matricea de trecere o estimăm din Tabelul 4. Atunci . Trebuie să calculăm . Din ipoteza de staţionaritate, sau ,de unde se scoate imediat sau, în cazul nostru .

Introducem acum variabila aleatoare T = timpul de aşteptare până la apariţia succesului, . Un calcul elementar (condiţionări repetate) arată că dacă şi . La 3200 de probe, frecvenţele apropiate vor fi:

T	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17
f	629	491	397	321	260	210	170	138	111	90	73	59	48	39	31	25	20
f (real)	658	510	426	336	275	204	157	130	94	96	78	50	31	31	29	27	16

Care, în mod paradoxal, sunt mai proaste decât cele obţinute prin modelul naiv i.i.d !

Nr.	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16
1	55	46	38	48	34	54	38	37	40	35	42	36	35	34	45	38
2	22	29	22	36	33	32	28	35	30	36	29	27	33	40	36	42
3	20	33	31	31	35	24	25	32	24	21	17	32	26	34	17	24
4	16	19	27	21	25	19	24	21	17	28	23	23	14	24	15	20
5	19	19	18	18	16	16	15	16	20	12	18	18	25	11	20	14
6	17	9	17	9	12	10	11	17	12	17	16	13	11	12	12	9
7	11	12	10	7	8	5	15	13	11	11	9	10	10	4	9	12
8	9	7	9	8	5	11	10	5	9	9	12	9	6	6	11	4
9	8	3	5	4	5	7	5	4	10	4	5	6	7	7	5	9
10	3	6	4	6	7	5	7	4	10	5	5	6	7	7	7	7
11	6	4	5	2	3	5	7	6	4	4	8	2	6	4	8	4
12	5	3	2	3	6	2	5	1	2	5	2	5	2	2	2	3
13	2	1	2	2	1	1	2	2	3	0	3	1	3	3	5	0
14	4	0	2	1	2	3	2	3	2	2	1	1	5	2	0	1
15	4	2	2	0	3	1	1	1	1	2	2	1	1	4	3	0
16	2	2	2	0	3	2	2	3	0	1	1	4	4	1	1	0
17	2	1	2	1	1	1	0	1	0	1	1	0	1	0	1	2
18	0	0	1	2	0	2	0	0	1	2	0	1	1	0	0	3
19	0	0	0	1	1	0	1	0	0	0	0	0	1	0	0	1
20	5	4	0	1	2	3	5	4	2	2	5	5	2	5	2	7

Nr.	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16
1	55	46	38	48	34	54	38	37	40	35	42	36	35	34	45	38
2	22	29	22	36	33	32	28	35	30	36	29	27	33	40	36	42
3	20	33	31	31	35	24	25	32	24	21	17	32	26	34	17	24
4	16	19	27	21	25	19	24	21	17	28	23	23	14	24	15	20
5	19	19	18	18	16	16	15	16	20	12	18	18	25	11	20	14
6	17	9	17	9	12	10	11	17	12	17	16	13	11	12	12	9
7	11	12	10	7	8	5	15	13	11	11	9	10	10	4	9	12
8	9	7	9	8	5	11	10	5	9	9	12	9	6	6	11	4
9	8	3	5	4	5	7	5	4	10	4	5	6	7	7	5	9
10	3	6	4	6	7	5	7	4	10	5	5	6	7	7	7	7
11	6	4	5	2	3	5	7	6	4	4	8	2	6	4	8	4
12	5	3	2	3	6	2	5	1	2	5	2	5	2	2	2	3
13	2	1	2	2	1	1	2	2	3	0	3	1	3	3	5	0
14	4	0	2	1	2	3	2	3	2	2	1	1	5	2	0	1
15	4	2	2	0	3	1	1	1	1	2	2	1	1	4	3	0
16	2	2	2	0	3	2	2	3	0	1	1	4	4	1	1	0
17	2	1	2	1	1	1	0	1	0	1	1	0	1	0	1	2
18	0	0	1	2	0	2	0	0	1	2	0	1	1	0	0	3
19	0	0	0	1	1	0	1	0	0	0	0	0	1	0	0	1
20	5	4	0	1	2	3	5	4	2	2	5	5	2	5	2	7

Nr.	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16
1	55	46	38	48	34	54	38	37	40	35	42	36	35	34	45	38
2	22	29	22	36	33	32	28	35	30	36	29	27	33	40	36	42
3	20	33	31	31	35	24	25	32	24	21	17	32	26	34	17	24
4	16	19	27	21	25	19	24	21	17	28	23	23	14	24	15	20
5	19	19	18	18	16	16	15	16	20	12	18	18	25	11	20	14
6	17	9	17	9	12	10	11	17	12	17	16	13	11	12	12	9
7	11	12	10	7	8	5	15	13	11	11	9	10	10	4	9	12
8	9	7	9	8	5	11	10	5	9	9	12	9	6	6	11	4
9	8	3	5	4	5	7	5	4	10	4	5	6	7	7	5	9
10	3	6	4	6	7	5	7	4	10	5	5	6	7	7	7	7
11	6	4	5	2	3	5	7	6	4	4	8	2	6	4	8	4
12	5	3	2	3	6	2	5	1	2	5	2	5	2	2	2	3
13	2	1	2	2	1	1	2	2	3	0	3	1	3	3	5	0
14	4	0	2	1	2	3	2	3	2	2	1	1	5	2	0	1
15	4	2	2	0	3	1	1	1	1	2	2	1	1	4	3	0
16	2	2	2	0	3	2	2	3	0	1	1	4	4	1	1	0
17	2	1	2	1	1	1	0	1	0	1	1	0	1	0	1	2
18	0	0	1	2	0	2	0	0	1	2	0	1	1	0	0	3
19	0	0	0	1	1	0	1	0	0	0	0	0	1	0	0	1
20	5	4	0	1	2	3	5	4	2	2	5	5	2	5	2	7