Laimėti pralaimint: sprendžiamas „dviejų vokų“ paradoksas

Vieno voko turinio sužinojimas gali pasakyti daugiau, nei galima pagalvoti. Atsitiktinis pasirinkimas, priklausomai nuo jame esančios sumos, gali žaidėjui padėti laimėti daugiau. M. McDonnel ir D. Abbott iš Australijos sukūrė naują strategiją, kuri yra naujas žingsnis sprendžiant, atrodytų, paprastą, tačiau dar neišspręstą vadinamąjį „dviejų vokų“ paradoksą.
D. Abbott
D. Abbott
M. McDonnel
M. McDonnel

Nors žaidėjas, atsitiktinai keičiantis strategiją, gali žinoti ankstesnių žaidimų statistiką apie sumas vokuose, ši informacija nėra būtina. Analizė rodo, kad visada galima padidinti laimėjimą panaudojant Cover‘io metodą, nežinant „namų ribos“ (didžiausios laimėjimo sumos) ir statistinio skaičių pasiskirstymo. Tai panašu į tai, ką inžinieriai vadina „aklu optimizavimu“.

„Dviejų vokų“ paradokse žaidėjas turi rinktis tarp dviejų vokų, kurių viename yra dvigubai didesnė suma nei kitame. Žaidėjas, pasižiūrėjęs vieno voko turinį, gali nuspręsti imti kitą. Kaip elgtis? Atrodytų, kad tikimybė yra vienoda: 1/2. Tačiau kažkodėl tikimybių teorija tikina, kad visada verta pakeisti voką.

Tarkim, pirmame voke yra 10 lt. Tada antrame gali būti 20 arba 5. Laikydami tikimybę vienoda (1/2), galima paskaičiuoti laukiamą sumą: 0,5 * 5 + 0,5 * 20 = 12.5. Kadangi 12,5 daugiau nei 10, labiau apsimoka rinktis antrą voką – ir tada, atseit, ilgai žaidžiant bendras laimėjimas būtų 12,5 Lt. Ir tai visiškai nepriklauso nuo pradinės sumos – imant antrą voką visada laimima 5/4 daugiau nei yra pirmajame voke.

Tačiau intuicija sako ką kitą – apie principinę lygybę abiejų vokų atžvilgiu; juk sukeitus voką samprotauti galima lygiai taip pat. Tame ir glūdi paradokso esmė. Šį paradoksą išspręsti matematikai bando nuo pat 20 a. 4-o dešimtm., nors “dviejų vokų” formuluotę tik 1988 m. jam suteikė Harvardo prof. Sandy Zabell. Nors keletas mokslininkų paskelbė radę sprendimą, konsensusas nėra priimtas ir problema tebelaikoma neišspręsta.

Matyt „dviejų vokų“ paradokso esmė tame, kad, kai žaidėjas pažiūri į pirmą voką, simetrija pažeidžiama, nes vokai tampa nelygiaverčiais. Australų mokslininkai savo metodą pavadino Cover‘io strategija, nes jį 2003 m. pietų metu pasiūlė Stanfordo prof. Tom Cover‘is. Žaidėjas atsitiktinai keičia voko pasirinkimo strategiją priklausomai nuo pirmame voke esančios sumos. Kuo didesnė suma, tuo su mažesne tikimybe jis ima kitą voką (net nežinodamas, kokios yra sumų ribos). Simuliacija rodo tokios strategijos efektyvumą. Įdomiausia, kad toji strategija veikia ir tada, kai žaidėjas nusprendžia nekeisti vokų, kai pirmo voko sumą didesnė už kažkokią paties žaidėjo nusistatytą sumą (o šios, savaime aišku, žaidimo organizatoriai nežino).

Brownian ratchet D. Abbott'as aiškina, kad jam padėjo patirti dirbant su Brauno reketu (sumąstytu R. Feinmano ir esantis atskiru „Maksvelo demono“ atveju – juos siekiama paneigti antrąjį termodinamikos dėsnį, t.y., atlikti naudingą darbą nesant temperatūrų skirtumo ir tik vidinės energijos pagalba). Reketas veikia taip: yra dvi kameros su dujomis, kurias jungia miniatiūrinis velenas (dirbantis be trinties, kurio viename gale yra ratas su mentėmis (dešinėje), o kitame dantratis su stabdžiu. Tarp kamerų ant veleno pakabintas svoris. Stabdis leidžia velenui suktis tik viena kryptimi – tai ir yra simetrijos pažeidimas. Kairės kameros dujos chaotiškai atsitrenkia į mentes, tačiau pasukti veleną gali tik viena kryptimi – ir jis ima lėtai kelti svorį vien tik pirmos kameros molekulių šiluminės energijos dėka.

Tiesa, fiziškai tokio reketo sukurti neįmanoma, - ir tai paaiškino pats R. Feinmanas. Mat stabdis turi būti pakankamai mažas, kad sureaguotų į atskirų molekulių smūgius į mentes. Todėl jis sėkmingai svyruos ir nuo „savojo“ Brauno judesio, laikas nuo laiko atsidarydamas ir leisdamas pasisukti velenui atgal. Feinmanas paskaičiavo, kad kamerose esant vienodoms temperatūroms, judesiai pirmyn ir atgal vieni kitus anuliuos, t.y. velenas nesisuks.

Įdomus „dviejų vokų“ paradokso palyginimas su Parondo paradoksu: paėmus du atsitiktinius žaidimus, kurių kiekvieną atskirai galima lengviau pralaimėti, nei laimėti, galima sukurti laiminčiąją strategiją, kai žaidimai žaidžiami pakaitomis.

Tarkim, turime pradinį kapitalą. Tada kaskart jį papildome arba sumažiname 1 Lt, priklausomai nuo monetos mėtymo. Tik visa gudrybė tame, kad moneta nėra simetrinė (t.y., jos vienos pusės atsivertimo tikimybė nėra 1/2). Iš tikrųjų žaidžiami du žaidimai. Žaidime B turime dvi monetas (M1 ir M2), kurios skiriasi tik pusių atsivertimo tikimybėmis. Ir pasirenkamas kažkoks skaičius K bei įvedama taisyklė: jei kapitalas yra kartotinis K, tai metam monetą M1, o jei nekartotinis – M2.
T. Cover
T. Cover

Pasirenkame tokias tikimybes, kad abu žaidimai mums būtų pralošiami. Abotas parodė, kad taip yra, pvz., kai žaidime A mums palankios pusės tikimybė 0,5-E (kai E=0,005), o M1 ir M2 mums palankios tikimybės yra 1/10-E ir ¾-E (ir K = 3). Tačiau žaidimų kaitaliojimas leidžia laimėti – tiesa, ne bet kokie kaitaliojimai, o tik tam tikri, pvz., ABBABB...

Šis paradoksas paneigiamas tuo, kad abu žaidimai tarpusavyje susiję – ir būtent per vos ne mistinį skaičių K. Juk jį įvedus B žaidimas tampa priklausomas nuo žaidimo A. O toliau viskas griežtai pagal tikimybių teorijos dėsningumus.

Panašus optimizavimo metodas sutinkamas investavime į akcijų rinką. Pvz., „lakių skysčių pumpavimas“. Jei turima kokia nors informacija apie rinkas (kompanijų finansinė būklė, teismai, apelsinų derlius, naftos telkinio atradimas). O jei nežinoma niekas?
Tada geriausia prekiauti akcijomis chaotiškai siekiant nedidelio prieaugio (pirkau pigiau-pardaviau brangiau) – visiškai nesirūpinant, ar tuo momentu gavote didžiausią pelną ar praleidote šansą dar labiau praturtėti.

Šios naujos įžvalgos gali paveikti daugelį teorinių ir praktinių sričių: termodinamikos, technologinių sistemų optimizavimo, elektroninių schemų tobulinimo, finansų ir kt. Nenuostabu, kad Abotas žinomas ir kaip stochastinio rezonanso (naudingo periodinio signalo sustiprinimas netiesinėse sistemose papildžius signalą „baltuoju“ triukšmu) tyrinėtojas.

Kartu šio paradokso nagrinėjimo įžvalgos iškėlė ir naujų klausimų: pvz., žaisdamas keletą žaidimų iš eilės, žaidėjas turėtų nuolat tikslinti strategiją atnaujindamas tikėtiną sumų pasiskirstymą vokuose. Ir kažkuo visai tai ima priminti „Šrėdingerio katino“ situaciją (žr. >>>> ), - ar tik neprisikasame prie gamtos dėsnių pagrindų?!

Žr. M.D. McDonnell, D. Abbott. Randomized switching in the two-envelope problem// Proceedings of the Royal Society Australia

Sandy L. Zabell Priedai

Sandy L. Zabell

Sandy L. Zabell - matematikos profesorius Harvardo universitete. Daktarinę disertaciją apsigynė 1974 m. Pagrindinė tyrimų sritis - tikimybių teorija (atskiru atvedu, didelių nuokrypių teorija) ir Bajeso statistika (atskiru atveju, sukeičiamumo (exchangeability) tyrinėjimai). Domisi istorija, matematine logika, DNR identifikavimu, filosofiniu pagrindimu, komunikacijų saugumu ir tikimybių bei statistinių metodų taikymu teisėje.

Naujesnės publikacijos:

  1. Richard von Mises and the "Problem of Two Races": a statistical satire in 1934// Historia Mathematica 34, 2007, (with R. Siegmund-Schultze)
  2. Carnap on probability and induction. Chapter, The Cambridge Companion to Carnap (R. Creath and M. Freedman, eds.), 2007
  3. On Student's 1908 paper "The probable error of the mean"//J. of the American Statistical Association 103, 2008

Numerologija
Nešo pusiausvyra
Zenono paradoksai
Matematiniai anekdotai
Didžioji Ferma teorema
Iniciatyva: Matematikos keliu
Kada statistika gali meluoti?
A. Puankarė. Mokslas ir hipotezė
Kaip supakuoti standžiau?
Puankarė problemos įrodymas
Kombinatorika, polinomai, tikimybės>
P-NP: Ant sveiko proto svarstyklių
Paradoksai sulig dirbtiniu intelektu
Netiesinis mąstymas: išspręsti neišsprendžiamą
Semantinės derybos: Dviprasmybių modeliavimas
Intuicijos ribojimas matematikoje 19-me amžiuje
Algoritmų pirmeivis laimėjo Kyoto premiją
Matematika prieš eismo spūstis
Da Vinči matematinė klaidelė
Naujienos: Matematika ir biologija
Senovės Graikijos skaičiuotuvas
Įvairiapusis Ričardas Feinmanas
Nauji picos pjaustymo būdai
Diagramos, pakeitusios pasaulį
Paviliota senovinio žaidimo
Scenoje - paprastos grupės
Skaičių simbolika Vedose
Matematikai: Pjeras Ferma
Kokiu greičiu skriejame?
Žvejybos matematika
Vartiklio naujienos