יום שבת, 29 באוקטובר 2011

בייסיאניזם: סבירויות מורכבות


[רשומה זו היא חלק מסדרה על תורת הידיעה הבייסיאנית; ראה אינדקס כאן.]

ההנחה האחרונה של ליבת הבייסיאניזם היא שהסבירות של טענות מורכבות (לוגית) תלויה, בצורה מאוד מסוימת, בסבירויות של הטענות המרכיבות אותן. אני אכתוב אותה בצורה הבאה*:

הנחה 3: סבירות מורכבת: הסבירות של האיחוד הלוגי ("A וגם B" או "AB") ושל הבידול הלוגי ("A או B" או "A+B") היא פונקציה אוניברסלית של הסבירויות המרכיבות אותה, ושל המשלימים שלהן, תחת כל תנאי הידע הרלוונטיים.
(A+B|X)=F[(A|X),(B|X),(A|X),(B|X),(A|B,X),(B|A,X),(A|B,X),(B|A,X),(A|B,X),(B|A,X),(A|B,X),(B|A,X)]
(AB|X)=G[(A|X),(B|X),(A|X),(B|X),(A|B,X),(B|A,X),(A|B,X),(B|A,X),(A|B,X),(B|A,X),(A|B,X),(B|A,X)]
הפונקציות הן "אוניברסליות" במובן שהן לא תלויות בתוכן הטענות או תחום הדיון. הטענה היא שהסבירות של האיחוד או הבידול הלוגי תלויה בסבירויות הטענות, לא במה שהן מדברות עליו.

הנחת האוניברסליות בבירור נכונה במקרים של וודאות או דחייה מוחלטת. אם A נכון ו-B שגוי, למשל, אנחנו יודעים ש A+B הוא אמת - בלי קשר לתוכן של הטענות A ו-B, הנושא שהן מדברות עליו, וכן הלאה. פחות ברור מדוע האוניברסליות צריכה להתקיים בדרגות ביניים של וודאות. יש המציעים** לקחת את זה כהיפותזה - נניח שיש כללים כלליים לחשיבה, ובואו נראה מהם.

עוד היבט של הנחה 3 הוא שהפונקציות האוניברסליות תלויות רק במרכיביהן. אך בהנחה שהן אכן אוניברסליות - במה עוד הן יכולות להיות תלויות? הן יכולות להיות תלויות רק בסבירויות כלשהן. הן לא יכולות להיות תלויות בסבירות של טענה שלא קשורה בכלל, שכן אז לא ניתן יהיה לזהות אותה בתחומי דיון שונים. הן חייבות להיות תלויות לפחות בערכי הסבירויות של מרכיביהן כי כאמור זה המצב תחת וודאות וחוסר-אפשרות מוחלטות. ניתן אולי לשער שבנוסף הן יהיו תלויות באיזו טענה מורכבת אחרת שמורכבת מתוך הטענות הבסיסיות שדנים בהן, ובדרך שלא תשפיע על מקרי הקיצון של וודאות ודחייה. אני לא יכול לראות מדוע זה אינו אפשרי, אבל זה לבטח מוזר מאוד. אם כך לכל הפחות הפירוק נראה פשוט ו"הגיוני" - אני לא מכיר התנגדות לו.

הבה נמשיך, אם כך, תחת הנחה 3.

זוהי הנחה מסורבלת, שכן כל פונקציה תלויה בהמון משתנים. למרבה המזל, אנחנו יכולים להוריד את מספרם. שקול את המרה בו B היא שלילת A, כלומר  B=A. במקרה זה
(A+B|X)=F[(A|X),(A|X),(A|X),(A|X),F,F,T,(A|X),T,T,F,F]
כך ש-F תלויה רק בשני משתנים, (A|X) ו-(A|X). מצד שני, ההגיון מחייב שלסבירות זו יהיה ערך קבוע,
(A+B|X)=(A+A|X)=(T|X)=vT
בהנחה שהפונקציה האוניברסלית F אינה קבוע, הדרך היחידה שבה נוכל לשמור על ערך קבוע כאשר אנחנו משנים את (A|X) היא לשנות את (A|X) במקביל. אנו נאלצים להסיק שהסבירות של טענה קשורה לזו של המשלימה לה על ידי פונקציה אוניברסלית,

משפט 3.1: הסבירות של טענה A קשורה לסבירות של שלילתה על ידי פונקציה אוניברסלית, (A|X)=S(A|X).

אנו נקבע את S מפורשות מאוחר יותר, אבל כרגע די לנו בכך שהיא קיימת.

קרה כאן משהו מאוד חשוב - מתוך ההנחה שקיימים חוקים כלליים למחשבה, קיבלנו את העובדה שהסבירות של שלילת הטענה (A|X) נמדדת על ידי הסבירות של הטענה עצמה (A|X). לכן, מספיק להתעסק רק במידה אחת לשם הערכת הסבירות של טענות. כפי שכבר אמרנו, זהו חלק מהותי מהמבנה הבייסיאני, ואנו רואים כאן שהוא נובע ישירות מהנחת האוניברסליות. התורה החלופית העיקרית, תאוריית דמפסטר-שייפר, מדברת על מידת התמיכה בטענות ודורשת מידה נוספת לתמיכה בשלילת הטענה. קיומה של S אומר שדמפסטר-שייפר חייבים לדחות את האוניברסליות של התורה שלהם-עצמם! לא יכולה להיות דרך אוניברסלית לשקול את התמיכה בטענות מורכבות מתוך התמיכה בטענות בסיסיות, ואפילו בתוך תחום מסוים אם ניתן לעשות כן הרי שהתאוריה שלהם תתנוון לכדי התאוריה הבייסיאנית. לא במפתיע, שייפר אכן מטיל ספק בקיומם של כללי היסק אוניברסליים.

נמשיך הלאה. קיומה של S מאפשר לנו להעיף את המשלימים A ו-B מהפרמטרים של הפונקציות האוניברסליות, שכן בין כה וכה הם בעצמם פונקציה של הטענות שהן משלימות A ו-B.

משפט 3.2: צורות פשוטות: הפונקציות האונברסליות F ו-G ניתנות לכתיבה בלי תלות מפורשת בסבירויות המשלימים.
(A+B|X)=F[(A|X),(B|X),(A|B,X),(B|A,X),(A|B,X),(B|A,X)]
(AB|X)=G[(A|X),(B|X),(A|B,X),(B|A,X),(A|B,X),(B|A,X)]

זה עדיין קצת מסובך, ואפשר לפשט יותר. שקול את המקרה שבו A היא טאוטולוגיה. במקרה זה אין שום משמעות לכתוב (B|A,X) - אין שום אינפורמציה שיכולה לשכנע אותנו שטאוטולוגיה אינה נכונה. הביטוי הזה פשוט לא מוגדר. אבל הסבירות של (AB|X)=(B|X) עדיין צריכה להיות מוגדרת! אם כך, חייבת להיות דרך לכתוב את הפונקציה G בדרך שאינה תלויה במשתנה הבלתי מוגדר (B|A,X). נשים לב שהמשתנה המקביל לו (B|A,X) דווקא מוגדר במקרה זה, ולכן אולי G עדיין תלויה בו. המצב דומה עבור צמד המשתנים (A|B,X) ו-(A|B,X). נוכל לפיכך להסיק שאפשר לכתוב את הפונקציות האוניברסליות ללא תלות בחצי מכל זוג.

משפט 3.3: צורות פשוטות יותר: ניתן לכתוב את הפונקציות האוניברסליות F ו-G ללא תלות באינפורמציה ש-A או B שגויות.
(A+B|X)=F[(A|X),(B|X),(A|B,X),(B|A,X)]
(AB|X)=G[(A|X),(B|X),(A|B,X),(B|A,X)]

לא ניתן להשתמש בצורות אלו כאשר A או B הן סתירה, אבל מעבר לכך הן צריכות להיות ישימות. עם רק ארבעה משתנים, הן פשוטות מספיק כדי שנוכל להסיק מהן את בסיס הבייסיאניזם - משפט קוקס.

* ההנחה שאני מניח מעט כללית יותר מזו המונחת בדרך כלל. הניסוח שלה מבוסס על אלגברה בוליאנית; ראה ניספח.

** למשל ואן הורן.

אין תגובות:

הוסף רשומת תגובה