באוקטובר 2010 הארץ הודהמה על ידי הופעתם של שני רצפי מספרי לוטו זהים ( 13, 14, 26, 32, 33, ו-36 ) בהפרש של כשלושה שבועות. האם זהו מעשה רמאות או צירוף מקרים בלתי סביר. ובכן, אין דרך לקבוע זאת באופן ודאי בלי חקירה פלילית (!) אבל ע"י שימוש בסטטיסטיקה ניתן לנסות להעריך מה הסבירות למקרה כזה, בהנחה ולא היה זיוף תוצאות (כי הרי אם היה,ניתן לזרוק את כל החישובים לפח).
ובכן, משחק הלוטו בנוי כך: יש לנחש 6 מספרים מתוך 37. בנוסף יש לנחש גם את "המספר החזק" - מספר אחד מתוך 8 על מנת להכפיל את הפרס. לצורכי החישוב נתעלם מהמספר החזק (שבמילא לא חזר על עצמו במקרה שפורסם בעיתונות). הסיכוי לניחוש של רצף נתון של 6 מספרים מתוך 37 הוא 37/(!6*!31) או בתוצאה סופית, בערך 1 ל- 2.33 מליון. לצורך הנוחיות בהמשך נכנה סיכוי זה בשם α. הסיכוי לקבלת 2 רצפים זהים בתאריכים ספציפים היא זהה – הסיכוי לקבלת הרצף הראשון הוא 1 ל-1 (כי הרי זה לא חשוב איזה רצף יצא וחייב לצאת איזשהו רצף) והסיכוי לקבלת הרצף השני זהה לניחוש של רצף ספציפי, קרי – גם 1 ל- 2.33 מיליון. לא סיכוי כזה להיט...
דוכן לוטו ביפן (התמונה באדיבות ויקיפדיה)
אבל... זהו סיכוי שמתייחס לאירוע מאוד ספציפי. בפועל, אם ההפרש בין שני הרצפים היה חודשיים גם אז הייתה העיתונאות יוצאת בכותרות. אם המקרה היה קורה בשנת 2003 גם אז הטוקבקיסטים היו צועקים "מושחתים נמאסתם". זאת אומרת שעלינו לקחת בחשבון עוד שני משתנים – ההפרש בין ההגרלות שיראה לאדם מהישוב כמוזר והסיכוי שעל פני תקופה ארוכה נראה מקרה שכזה.
ראשית, מהו הפרש שיראה מוזר? שימו לב, זוהי איננה שאלה סטטיסטית כלל! הסיכוי ל-2 רצפים זהים בהפרש של שבוע זהה לסיכוי לקבלת 2 רצפים זהים בהפרש של 37 שנים. אלא מה? הפסיכולוגיה האנושית גורמת לאדם הממוצע לחשוד במפעל הפיס במקרה הראשון ולפטור את המקרה השני כקוריוז מוזר. השאלה (הפסיכולוגית בעיקרה) כאן היא: כמה קצר הפרש הזמנים בין 2 הרצפים צריך להיות על מנת האדם הממוצע יחשוב שאין סיכוי שדבר כזה יקרה באופן טבעי. ההימור שלי הוא על שנתיים, אבל זו רק תחושה לא מבוססת. לצורך השאלה, נשתמש במספר זה - שנתיים מינוס חגים ללא הגרלות – נניח 100 שבועות, או 200 הגרלות (יש שתי הגרלות בשבוע).
שנית, כאשר אנשים מנסים לחשב מה הסיכוי שמאורע נדיר כזה יקרה, הם נוטים להזניח את כל הזמן לפני המאורע בו לא קרה דבר שכזה. מפעל הפיס קיים משנת '51, זאת אומרת שישנם כמעט 60 שנה של הגרלות ללא רצפים חוזרים בזמן קצר. כאשר מחשבים את ההסתברות למאורע ללא הזמן שקדם לו, אנו עושים עוול סטטיסטי גדול מאוד. אם כך, על פני איזו תקופת זמן עלינו לבדוק את הסיכוי למאורע? לצורך הבדיקה שלנו נבדוק מה הסיכוי למאורע כזה במהלך חייו של אדם ממוצע (78 שנים, או 3,900 שבועות או 7,800 הגרלות).
סיכום לפני החישוב הסופי:
נבצע את המדידה על פני 7,800 הגרלות
לכל הגרלה יוצמד כעין "חלון" של פלוס/מינוס שנתיים עליו תבוצע מדידה אחת. ההפרש בין 2 רצפים זהים יהיה 199 הגרלות קדימה או אחורה (סה"כ 398 הגרלות). כדי להקל על החישוב נתיר להגרלות בקצוות (ההגרלות הראשונה עד ה-200 וההגרלות ה-7,600 עד 7,800) להיות משוות גם להגרלות שחורגות ממספרים אלו (מתחת ל-0 או מעל ל-7,800). אפקטיבית, זה יגדיל את אורך החיים של האדם ההיפוטתי שלנו בשנתיים.
נבדוק את הסיכוי לשתי רצפים זהים בלבד ונזניח את הסיכויים הקלושים למספר גבוה יותר של רצפים זהים. אם כך, הבה נבדוק מה הסיכוי לרצף זהה בחלון של הגרלה מס' 1 ובהגרלה נוספת בטווח המותר (198- ועד 200). הגרלה 1 יכולה לקבל α רצפים והגרלה נוספת מתוך ה-398 חייבת לקבל את אותו רצף. שאר 397 ההגרלות יקבלו רצפים שונים זאת מזאת ומהרצף הכפול. את כל ההכפלה הזאת יש לחלק בכלל מרחב המדגם – סך כל הרצפים בכל ההגרלות:
[389 * α *(α-1) * (α - 2) * (α - 3)...(α - 397)] / α^399
זהו למעשה הסיכוי לקבל 2 רצפים זהים (בלבד) בהפרש של עד שנתיים אחד מהשני. סיכוי זה שווה לבערך 0.000165478 או קצת יותר מאלפית אחוז. לא משהו בכלל, נכון?
אבל אין אנו בוחנים רק הגרלה מס' 1 אלא גם את 7,799 אחיותיה. מכיוון שלכל אחת מההגרלות התנאים דומים הסיכוי בכל אחת לקבלת 2 רצפים הוא זהה לחישוב הקודם. אלא מה, שבחישוב זה הכללנו כל צירוף של הגרלות פעמיים, קרי – כאשר בדקנו את החלון של הגרלה מס' 1,500 והצמדנו לה בחישוב את הגרלה מס' 1,675, עשינו את אותו הדבר שבדקנו את החלון של הגרלה מס' 1,675 והצמדנו לה את הגרלה מס' 1,500. לכן את כל ההסתברויות יש לחתוך בחצי על מנת לפצות על הכפילות הזאת (יש את ההגרלות במספרי קצה אשר לחלקם לא תהיה את הבעיה הזו, אבל מדובר במספרים קטנים ולצורך החישוב נזניחם).
אם כך, הסיכוי לכל חלון להוציא 2 הגרלות זהות הוא 0.000082739 לשם הנוחות, נכנה מספר זה בשם β. אם כך הסיכוי שבחלון אחד כל ההגרלות זרות זו לזו הוא 1-β. ולכן הסיכוי שבכל החלונות כל הגרלות יהיו זרות זו לזו הוא הכפלת הסיכויים זה בזה או 7800^(1-β) = כ-52% סיכוי שאין 2 רצפים בהפרש של שנתיים ומטה מה שאומר שהסיכוי שבמהלך חייו של אדם ממוצע הוא יזכה לראות שני רצפים זהים בהפרש של שנתיים או פחות, הוא 48% - הרבה יותר מכל מיני מספרים שנזרקו באויר. כאמור החישוב הזה קצת גס ומספר מצומצם של חישובים לא נכללו בו לשם הנוחות, אבל התשובה האמיתית תהיה רחוקה כאחוזים בודדים מהאחוז האמור.
באפריל 2015 עלו בגורל בהגרלת הלוטו בארץ 5 מספרים עוקבים (32, 33, 34, 35, 36) - האם לדעתכם זה דבר הגיוני או רמאות?
שלומי דגן
דוקטורנט, המחלקה לכימיה ביולוגית
מכון ויצמן למדע
הערה לגולשים
אם אתם חושבים שההסברים אינם ברורים מספיק או אם יש לכם שאלות הקשורות לנושא, אתם מוזמנים לכתוב על כך בפורום. אנו נתייחס להערותיכם. הצעות לשיפור וביקורת בונה יתקבלו תמיד בברכה.