משתנה מתערב

בסטטיסטיקה, משתנה מתערב (מכונה גם ערפלן, גורם מתערב או גורם מבלבל; באנגלית: Confound,‏ Confounder או Confounding variable) הוא משתנה חיצוני המשפיע הן על המשתנה התלוי והן על המשתנה הבלתי תלוי באופן דומה, ולפיכך עלול להוביל למסקנה מוטעית על הקשר הסיבתי ביניהם. השפעה כזו יכולה להיות חלקית או מלאה.

דוגמה להשפעה מלאה: קיים מתאם מובהק בין כמות שיער אפור לבין התקפי לב, כאשר לא מחפשים משתנה מתערב, ניתן להתרשם שצבע השיער גורם להתקפי לב או שהתקפי לב מאפירים את השיער. אולם, ההסבר המקובל הוא שאין קשר סיבתי בין השניים, אלא שקיים גורם שלישי מבלבל – גיל האדם, המשפיע לחיוב על שני המשתנים: עם הגיל מתרבות השערות האפורות וכן מתרבים גם התקפי הלב.

דוגמה להשפעה חלקית: הגיל יכול להיות משתנה מתערב במחקר שמוצא מתאם בין הרגלי תזונה לבין התקפי לב. ישנם קשרי סיבה ומסובב אחדים בין שלושת המשתנים האלה. הגיל גורם גם ללקות בלב וגם לשינוי מסוים בהרגלי התזונה. חלק מההבדלים בין תזונתם של אנשים גורמים להבדלים בתפקוד הלב שלהם. לכן, כאשר משווים את הרגלי התזונה של קבוצת אנשים שלקתה בליבה עם הרגלי התזונה של קבוצת אנשים אחרת שלא לקתה בליבה, אין להסיק שההבדל בתפקוד הלב נובע כולו מהבדלים בתזונה. יש לנטרל את השפעת הגיל על המשתנים. הדרך הפשוטה ביותר מבחינה חישובית והמסובכת ביותר עבור עורכי הדגימות היא לקבל אל המחקר רק אנשים שגילם זהה. למשל, לחקור רק את הקשר בין תזונה להתקפי לב רק אצל אנשים בני 53.

בעבר היה מקובל שלא להשתמש בחלק מהדגימות בסקרים כדי ששתי הקבוצות הנדגמות יהיו בעלות הרכב דומה. עבודתו של הסטטיסטיקאי רונלד פישר באמצע המאה ה-20, מאפשרת לעשות בקרה על משתנים מתערבים ידועים בעזרת נוסחאות. עם זאת, בכל מחקר השוואתי עלולים להשפיע גם משתנים מתערבים לא ידועים.

בניסויים מדעיים ובמיוחד בניסויים קליניים נדרשות בקרות חמורות על תנאי הניסוי, משום שכל שינוי, לבד משינוי בגורם הבלתי תלוי, עלול ליצור משתנה מתערב, שיוביל למסקנות שגויות. ההגבלה היעילה ביותר של הטיית משתנים מתערבים לא ידועים היא ניסוי מבוקר הקצאה אקראית.

ערך זה הוא קצרמר בנושא סטטיסטיקה. אתם מוזמנים לתרום לוויקיפדיה ולהרחיב אותו.