Kot Tichy i książki (spojrzenie probabilistyczne)

Pojawiły się pewne wątpliwości co do rzetelności mojego niedawnego wywodu na temat motywacji pozowania do zdjęć na tle książek przez kota Tichego, który to obyczaj dzieli on z niektórymi zaawansowanymi, początkującymi i pretendującymi intelektualistami, a także innymi osobami publicznymi. Przedstawione zostały wówczas trzy hipotezy ("motywacja szlachetna", "motywacja mniej szlachetna" i "motywacja nieszlachetna"), z których pierwsze dwie zostały w przypadku kota Tichego natychmiast odrzucone jako w oczywisty sposób nieprawdziwe, gdyż zakładały posiadanie umiejętności i upodobania do czytania, których tenże dotąd w żadnym stopniu nie ujawnił. Jednak sugestia zawarta w poście (rzekomo) wyrażającym opinię kota, jakoby mógł on w swoim sekretnym życiu poza zasięgiem ludzkich spojrzeń czytać o solaryjskim oceanie i magdalenkowych wspomnieniach Marcela ze strony Swanna i ze strony Guermantes, jakkolwiek wydaje się zupełnie nieprzekonująca, z naukowego punktu widzenia powinna zostać rozpatrzona. Zresztą już zakończenie tamtego wywodu konstatowało lukę (dotyczącą zbyt arbitralnie przyjętego założenia, że rozważane hipotezy wyczerpują całą przestrzeń możliwości) i zapowiadało możliwość kontynuacji analizy. Otóż i ona.

Nazwijmy dla wygody sformułowane wcześniej hipotezy h1, h2, h3, odpowiednio w kolejności, w jakiej zostały wymienione. Załóżmy także, że być może pozostają jeszcze inne możliwe wyjaśnienia, które -- jako całkowicie nam nieznane -- nie muszą być rozróżniane i mogą być zbiorowo oznaczone jako h4. Z kolei przez f oznaczmy fakt posiadania zwyczaju pozowania na tle książek, przez c -- fakt posiadania umiejętności i upodobania do czytania, zaś przez k -- fakt bycia kotem. Przez f', c' i k' będziemy oznaczać negacje tych faktów, odpowiednio.

Rozważymy obecnie, co na temat naszych hipotez można wywieść korzystając z narzędzi rachunku prawdopdobieństwa, ograniczając się przy tym do zbioru "osób" obejmującego ludzi i koty.

1. Naturalnie mamy P(h1 lub h2 lub h3 lub h4) = 1 oraz P(hi, hj) = 0 dla dowolnych róźnych i, j, tzn. hipotezy h1, h2, h3, h4 obejmują już tym razem naprawdę wszystkie możliwości oraz wzajemnie się parami wykluczają.

2. Odrzucając uprzedzenia załóżmy, że na prawdopodobieństwo hipotez h1, h2, h3, h4 bezpośrednio wpływają tylko c i f, nie zaś k (zależność od którego jest pośrednia przez c). W ten sposób zapewniamy, że inne cechy niż posiadanie bądź brak umiejętności i upodobania do czytania, które ludzi i koty różnicują, nie będą zmniejszały szans kotów w tej dyskusji. Mamy zatem: P(hi | f, c, k) = P(hi | f, c), a także P(hi | f, c, k') = P(hi | f, c) itd. -- dla każdej kombinacji faktów niezanegowanych i zanegowanych.

3. Dla uproszczenia zawęzimy dalej rozważaną dziedzinę do "osób", o których wiadomo, że mają zwyczaj pozowania na tle książek, co pozwoli nam dalej pominąć f.

4. Dla dowolnej hipotezy hi mamy pozostaje nam zatem określić:

P(hi | k) = P(hi | c) * P(c | k) + P(hi | c') * P(c' | k)

5. Prawdopodobieństwa a posteriori hipotezy hi pod warunkiem posiadania i nieposiadania umiejętnosci i upodobania do czytania, P(hi | c) i P(hi | c'), można obliczyć korzystając ze wzoru Bayesa w następujący sposób:

P(hi | c) = P(hi) * P(c | hi) / P(c)

P(hi | c') = P(hi) * P(c' | hi) / P(c')

6. Z kolei korzystając ze wzoru na prawdopodobieństwo całkowite otrzymujemy P(c) = P(k)*P(c | k) + P(k')*P(c | k') oraz analogicznie P(c') = P(k)*P(c' | k) + P(k')*P(c' | k'), co po wstawieniu do powyższych wyrażeń daje:

P(hi | c) = P(hi) * P(c | hi) / (P(k)*P(c | k) + P(k')*P(c | k'))

P(hi | c') = P(hi) * P(c' | hi) / (P(k)*P(c' | k) + P(k')*P(c' | k'))

7. Ostatecznie zatem wstawiając, powyższe do wyrażenia z punktu 4, prawdopodobieństwo każdej hipotezy hi dla pozującego do zdjęć na tle książek kota daje się wyznaczyć jako:

P(hi | k) = (P(hi) * P(c | hi) / (P(k)*P(c | k) + P(k')*P(c | k'))) * P(c | k)

+ (P(hi) * P(c' | hi) / (P(k)*P(c' | k) + P(k')*P(c' | k')))*P(c' | k)

8. W ten sposób docieramy do miejsca, w którym nasz schemat wnioskowania można już zasilić dostępną wiedzą o świecie.

8a. Prawdopodobieństwa a priori poszczególnych hipotez wyznaczymy przyjmując, że hipoteza h4 jest bardzo mało prawdopodobna, jako reprezentująca jakieś trudno nawet wyobrażalne inne ewentualności niż pierwsze trzy hipotezy, one zaś -- są jednakowo prawdopodobne. Niech więc:

P(h1) = 0.33

P(h2) = 0.33

P(h2) = 0.33

P(h4) = 0.01

8b. Prawdopodobieństwo posiadania umiejętności i upodobania do czytania jest oczywiście maksymalne w przypadku hipotez h1 i h2, zerowe w przypadku hipotezy h3 oraz -- załóżmy z maksymalną korzyścią dla kota Tichego -- równe 1/2 w przypadku bliżej nieokreślonej hipotezy h4, a więc:

P(c | h1) = 1 i P(c' | h1) = 0

P(c | h2) = 1 i P(c' | h2) = 0

P(c | h3) = 0 i P(c' | h3) = 1

P(c | h4) = 0.5 i P(c' | h4) = 0.5

8c. Prawdopodobieństwo bycia kotem uzyskamy dzieląc wielkość światowej populacji kotów, którą ustalimy w zaniżającym nieco zaokrągleniu na 200000000 (200 milionów) przez łączną liczbę kotów i ludzi, przy czym wielkość populacji tych ostatnich przyjmiemy jako równą 7000000000 (7 miliardów). Stąd:

P(k) = 200000000/7200000000 = 0.028 i P(k') = 0.972

8d. Prawdopodobieństwo posiadania umiejętności i upodobania do czytania pod warunkiem niebycia kotem (tzn., w naszym przypadku, bycia człowiekiem) ustalmy bardzo ostrożnie i bez przesadnej wiary w naturę ludzką na 1/10, tj.:

P(c | k') = 0.1 i P(c' | k') = 0.9

8e. Wreszcie, pozostaje nam kwestia najbardziej delikatna i zapewne z punktu widzenia kota Tichego drażliwa: określenia prawdopodobieństwa posiadania umiejętności i upodobania do czytania pod warunkiem bycia kotem. Narazilibyśmy się z pewnością na ostrą krytykę przyjmując narzucającą się wartość 0. Zastosujemy zatem do jego obliczenia estymator Laplace'a -- bezpieczniejszy w przypadku używania częstościowych prawdopodobieństw do wnioskowania indukcyjnego -- w następujący sposób:

P(c | k) = (N(c,k) + 1) / (N(k) + 2)

gdzie N(c,k) oznacza liczbę zabserwowanych przypadków kotów posiadających umiejętność i upodobanie do czytania, zaś N(k) -- liczbę wszystkich kotów, o których istnieniu nam wiadomo (tzn. wielkość światowej populacji kotów). Naturalnie N(c,k) = 0, zaś N(k) przyjmiemy, jak wyżej, równe 200000000 (200 milionów). Interesujące nas prawdopodobieństwo wyznaczymy więc nie jako 0, lecz:

P(c | k) = 1/(200000001) = 0.000000004999999975

a dla wygody zaokrąglając powyższą liczbę do jednej cyfry znaczącej:

P(c | k) = 0.000000005 i P(c' | k) = 0.999999995

Stosowanie estymatora Laplace'a można w tym przypadku intepretować jako dołączenie do zbioru naprawdę istniejących kotów dwóch kotów fikcyjnych (stąd + 2 w mianownku), z których jeden posiada umiejętność i upodobanie do czytania (stąd + 1 w liczniku). Taki fikcyjny czytający kot pokazany jest jako ilustracja urozmaicająca te rozważania.

9. W ten sposób dysponujemy już wszystkimi prawdopodobieństwami, których wartości ustalamy na podstawie naszej wiedzy o świecie. Wystarczy je odpowiednio wstawić do wyrażenia z punktu 7 aby obliczyć, dla każdego i = 1, 2, 3, 4, prawdopodobieństwo P(hi | k) i w ten sposób przekonać się, jak prawdopodobne są poszczególne hipotezy na temat motywacji kota pozującego do zdjęć na tle książek.

Przyjemność powstawiania liczb do wzoru i wykonania końcowych obliczeń zostawiam sobie na inną okazję. Zresztą będę spokojniejszy, jeśli przedtem przejrzę całe rozumowanie i upewnię się, że do wzorów przez pośpiech lub nieuwagę (wirtualna klawiatura na ekranie urządzenia przenośnego zamiast prawdziwej też nie ułatwia sytuacji) nie wkradły się jakieś błędy. Niecierpliwi czytelnicy, obdarzeni zdolnościami rachunkowymi lub sprawnością w posługiwaniu się urządzeniami liczącymi, zapewne przeprowadzą obliczenia we własnym zakresie.

Niezależnie od technicznych pomyłek, które -- jeśli gdzieś są -- dadzą się zapewne łatwo wyeliminować, przedstawione wnioskowanie ma wciąż pewne bardziej ogólne niedostatki, które mogłyby się stać dla stronników kota Tichego podstawą do jego podważania. Nie sądzę, aby udało się im zachwiać jego konstrukcją na tyle, aby osłabić wymowę wyniku (którego wpradzie nie obliczyłem, ale który przeczuwam). Wolałbym na tym poprzestać i nie komplikować nadmiernie aparatu używanego do rozstrzygnięcia tak prostej kwestii. Jeśli jednak taka potrzeba powstanie, wrócę być może do jej roztrząsania w pogłębiony sposób, aby załatać niektóre dziury i wzmocnić słabości.

Na koniec uwaga do kota Tichego (a raczej jego samozwańczego blogowego reprezentanta). Być może kocie nie będziesz całkiem pewny, czy powinieneś być obrażony. Otóż zapewniam, że nie powinieneś. W razie wątpliwości najlepiej zrobisz traktując to jako przesadnie rozbudowany i niezbyt zabawny żart. W dowód mojej dobrej woli zdradzę Ci zresztą kiedyś na ucho największą słabość tego rozumowania (tylko nie zapomnij, to będzie tajemnica).

TichoBlog - Blog o kocie Tichym

Pages

Ogłoszenia

Archiwum

20.04.2012

Kot Tichy i książki (spojrzenie probabilistyczne)

1 komentarz: