למה מתכוונים הסוקרים כשהם מדברים על דגימה? מה ההבדל בין ממוצע לחציון? ומה הן סטיית תקן והתפלגות נורמלית? מורה נבוכים

הסטטיסטיקה מקיפה אותנו מכל עבר. באמצעותה אנחנו יכולים לחשב את הסיכוי לזכות בלוטו, לפרש נכון סקרים (שלפעמים טועים בגדול) ולהבין תוצאות ניסויים בפיזיקה, ביולוגיה ורפואה. הכנו למענכם על קצה המזלג מדריך קצר למושגים מעולם הסטטיסטיקה.

דגימה

סטטיסטיקה היא תחום של איסוף נתונים וחקירתם, שפותח לראשונה כבר במאה ה-17. מאז נוספו תיאוריות ונוסחאות רבות בניסיון לשפר את האופן שבו אנו מבינים משתנים אקראיים ואת התפלגותם בניסוי או בסקר.

יש שאלות שאיננו יכולים למדוד בוודאות, למשל כמה זמן דרוש לכל תא בגופנו להתחלק או מה הדעה הפוליטית של כל אזרחי המדינה. כדי להתגבר על המכשול הזה אנו יכולים לדגום בצורה אקראית חלק קטן יותר מהאוכלוסייה, וכך להעריך את התנהגות האוכלוסייה כולה. כדי לעשות את זה נכון עלינו לדעת איך לדגום חלק קטן מהאוכלוסייה בצורה הוגנת וללא הטיות, כך שאכן ישקף בצורה המדויקת ביותר את כלל האוכלוסייה. לדוגמא, אם נרצה להעריך את הגובה של אנשים מבוגרים באוכלוסייה כולה על ידי דגימה של חלק קטן ממנה, עלינו לוודא שדגמנו את אותם אחוזים של נשים וגברים כפי שהם בקרב האוכלוסייה כולה. בנוסף, אם רוב הגברים בקבוצת המדגם שבחרנו הם שחקני כדורסל, כנראה שלא נעריך בצורה נכונה את הגובה באוכלוסייה כולה. לאחר שצלחנו לדגום בצורה נכונה, חשוב לדעת איך לפרש נכון את התוצאות, עד כמה הן מדויקות ומה אפשר ללמוד מהן.

ממוצע וחציון

נניח שאנחנו כבר יודעים לדגום אקראית תאים או אנשים ורוצים לתאר את התוצאות במספר אחד בלבד. כנראה נבקש לחשב ממוצע, סכום כל התוצאות שנדגמו מחולק בגודל הקבוצה. הממוצע משקף את התרומה של כל פרט לתוצאה הכללית, אם לכולם יש תרומה שווה. במקרים רבים, הממוצע אכן שימושי מאוד, אך לפעמים הוא עלול להטעות ולא לשקף נכון את התפלגות המשתנה שדגמנו. במקרים כאלה עדיף להיעזר בגודל אחר שנקרא חציון – הערך שנמצא בדיוק באמצע רשימת התוצאות, ומספר הערכים הגבוהים ממנו שווה בדיוק למספר הערכים הנמוכים ממנו.

כדי להמחיש מתי מוטב להתחשב בחציון ולא בממוצע ניעזר בדוגמה. נניח שבמדינה מסוימת 10 אחוזים מהאזרחים עשירים מאוד ומרוויחים 100 אלף שקל בחודש, 10 אחוזים עניים מאוד ומרוויחים 2,000 שקל בחודש בלבד, ושאר האוכלוסייה משתכרת 10,000 שקל בחודש. אם נחשב ממוצע נמצא שההכנסה הממוצעת היא 18.2 אלף שקל בחודש. אבל למעשה, המספר הזה גדול בהרבה מהשכר החודשי של 90 אחוז מהאזרחים. זה יוצא כך משום שהשכר של העשירים קיצוני כלפי מעלה ומושך את הממוצע לכיוונו. לעומת זאת, החציון יהיה 10,000 שקל וישקף טוב יותר את ההכנסה של מרבית האוכלוסייה.

התפלגות

אם מספר אחד לא מספק אותנו ואנחנו רוצים מידע נוסף, נוכל לתאר איך המשתנה שדגמנו מתפלג. יש סוגים שונים של התפלגויות, חלקן סימטריות ביחס לממוצע, למשל התפלגות האינטליגנציה באוכלוסייה, וחלקן לא סימטריות כמו רמת ההכנסה שהזכרנו לפני רגע.

ההתפלגות הסימטרית השכיחה ביותר  נקראת התפלגות נורמלית. הפונקציה שלה מתארת עבור כל ערך של המשתנה שאנו מעוניינים לדגום מה אחוז הפעמים שנדגום אותו, כלומר מה ההסתברות שהוא יתקבל. כל התפלגות נורמלית מתוארת  על ידי שני משתנים – הממוצע והשונות.

גרף של התפלגות נורמלית וטווחי סטיית התקן

כפי שאפשר לראות באיור, ההתפלגות הנורמלית היא סימטרית ונראית קצת כמו פעמון, עם שיא אחד שמייצג את הממוצע (ששווה במקרה הזה לחציון). המשמעות היא שהכי סביר שערך אקראי יימצא בדיוק על הממוצע, וככל שמתרחקים ממנו ההסתברות יורדת.

לשם המחשה אפשר לחשוב על התפלגות הסכום של הטלת שתי קוביות משחק תקינות. הערכים האפשריים נעים בין 2 ל- 12. מכיוון ש- 2 מתקבל רק אם שתי הקוביות יתנו 1, ו-12 מתקבל רק אם נקבל פעמיים 6, נצפה ששתי התוצאות האלה יהיו הכי נדירות. לעומת זאת 7 (הממוצע של 2 ו-12) מתקבל בהכי הרבה צירופי הטלות אפשריים, ולכן ההסתברות שהוא יתקבל היא הגבוהה ביותר.

שונות וסטיית תקן

השוֹנוּת וסטיית התקן של ההתפלגות מתארות עד כמה האוכלוסייה קרובה לממוצע שלה או רחוקה ממנו. השונות מוגדרת כמרחק הריבועי הממוצע של כל תוצאה במדגם מממוצע ההתפלגות. שורש השונות נקרא סטיית התקן של האוכלוסייה, והוא הגודל שמאפשר לנו להעריך את טעות הדגימה שלנו, כלומר עד כמה הערכים שדגמנו מייצגים את האוכלוסייה האמיתית. סטיית התקן מתארת את הטווח שבו יימצאו 68 אחוז מתוצאות המדגם. לדוגמה, התפלגות נורמלית עם ממוצע 7 וסטיית תקן 3 משמעותה שב-68 אחוז מהמקרים יתקבל ערך בין 4 ל-10. אם נתרחק מהממוצע לטווח של פעמיים סטיית התקן, נכלול כבר 95 אחוז מההתפלגות. לשם המחשה, אפשר לחשוב על בעלים של חנות בגדים שרוצה להעריך את גובה העסקה של כל לקוח שקונה בחנות. לשם כך, הוא דגם יום מסויים ורשם כמה כסף כל לקוח שילם. נניח שהוא חישב ממוצע של 200 שקלים וסטיית תקן של 50 שקלים. המשמעות היא שב-95 אחוז מהמקרים, הלקוחות בחנות שלו משלמים בין 100 ל-300 שקלים. בצורה כזו בעל העסק יכול ללמוד האם רוב הלקוחות קונים בסכום הקרוב לממוצע או שמא חלק משמעותי קונים בסכומים קטנים וגדולים ממנו.

בסקרים פוליטיים, באותו אופן, אם מניחים שתוצאת הסקר (למשל שיעור המצביעים למועמד מסוים) מתפלגת בצורה נורמלית, אפשר לחשב את השונות וסטיית התקן. מתוכם נוכל לחשב גודל שנקרא "רווח בר סמך" שמבטא את טווח טעות הדגימה, והוא תלוי מאוד בגודל קבוצת המדגם – למשל כמות האנשים שענו על הסקר. לדוגמה, לסקר שנעשה על אלף אנשים יש טעות דגימה של כשלושה אחוזים. כלומר אם תוצאת הסקר היא ש-48 אחוזים מן הנשאלים יצביעו למועמד מסויים, אפשר לומר בוודאות של 95 אחוז שאחוז המצביעים עבור מועמד זה בקרב האוכלוסייה כולה נמצא בין 45 ל-51 אחוזים. ככל שגודל קבוצת המדגם עולה כך פוחתת טעות הדגימה.

גרפים של גבנוניות ושל צידוד חיובי ושלילי

צידוד וגבנוניות

 

במקרים שבהם המשתנה האקראי מתפלג בצורה לא נורמלית, יש פרמטרים נוספים שמתארים את צורת ההתפלגות, כגון צידוד וגבנוניות. צידוד (skewness) הוא מדד לאסימטריה בהתפלגות, ולכן הוא שווה לאפס בהתפלגויות סימטריות כמו ההתפלגות הנורמלית. למשתנה אקראי עם צידוד חיובי יש זנב שנוטה לימין ונוטה לקבל ערכים קטנים יותר מהממוצע, ואם הצידוד שלילי הוא נוטה לערכים גדולים מהממוצע. הדוגמא של התפלגות רמת ההכנסה שבחנו קודם ממחישה התפלגות עם צידוד חיובי, מכיוון שהכנסתם של רוב האנשים קטנה מן הממוצע.

גבנוניות (kurtosis) מתארת את גודל הזנבות (הקצוות) של ההתפלגות לעומת גודל המרכז, והיא נקבעת כך שלהתפלגות נורמלית יש גבנוניות לאפס. למשל, אם מסתכלים על התפלגות של גודלם של יישובים (כפרים, קיבוצים, ערים וכו') במדינה מסוימת מקבלים בדרך כלל שיש הרבה יישובים קטנים ומעט ערים גדולות. במקרה זה, הגבנוניות תהיה שלילית והזנבות יהיו גדולים יותר לעומת גודל המרכז.

כדי לפרש נכון את תוצאות הדגימה, עלינו לדעת כיצד הקבוצה שדגמנו מתפלגת, אם היא סימטרית, ואם לא, לאיזה כיוון היא נוטה. לדוגמה, כשאנחנו מקבלים תוצאות של בדיקות דם, הערך שהתקבל עבורנו יסומן באדום אם הוא חורג מטווח כלשהו. ברוב המקרים, כשרופא יסתכל על תוצאות הבדיקות, הוא לא יתרגש מערך שמסומן באדום, אם הוא לא חורג בצורה משמעותית מן הטווח התקין. הסיבה היא שהטווח התקין הוא טווח סטטיסטי שקשור לשונות, ולכן אם חרגנו ממנו מעט, הדבר לא מצביע בהכרח על בעיה רפואית. בנוסף, המשמעות של הטווח התקין בבדיקות רפואיות תשתנה אם ההתפלגות של האוכלוסייה איננה סימטרית, שכן אז נצפה שיותר אנשים יקבלו ערכים קטנים או גדולים מן הממוצע.

בעולם הסטטיסטיקה יש עוד שלל מושגים ותיאוריות שלא נגענו בהם כאן, כגון התחום רחב הידיים של המבחנים הסטטיסטיים. במבחן סטטיסטי בודקים בין השאר את הדמיון בין שני משתנים אקראיים והתפלגותם. אך גם בעזרת מושגים בסיסיים כמו התפלגות נורמלית, ממוצע ושונות אפשר להבין למה חשוב שהרופא המטפל יפרש את תוצאות הבדיקות הרפואיות, לנתח תוצאות מחקרים ניסיוניים ולדעת על איזה מספר לשים את הכסף כשאנו מטילים שתי קוביות.

4 תגובות

  • אנונימי

    מקור מידע למתעניינים

    הסדרה ״סטטיסטיקה מרפאת״ בתוך הפודקאסט ״רפואה נתמכת ראיות״

  • אנונימי

    הבהרה

    "לדוגמה, התפלגות נורמלית עם ממוצע 7 ושונות 3 משמעותה שב-68 אחוז מהמקרים יתקבל ערך בין 4 ל-10." - האם זה שונות 3 או סטיית תקן 3?

  • נמרוד

    סטיית תקן 3

  • אנונימי

    סטיית תקן