יותר ויותר חשודים בפשע נעצרים בעזרת שימוש באתרים גנאלוגיים, מה שמעורר שאלות אתיות בדבר השימוש במאגרי מידע גנטי. מדענים מישראל בדקו אם אכן אפשר לאתר אדם לפי DNA משפחתי, והם גם מציעים פתרון

באפריל השנה נעצר ג'יימס ד'אנג'לו בחשד שרצח 12 בני אדם ואנס עשרות נשים בשנות ה-70 וה-80. "הרוצח מגולדן סטייט" היה הראשון שנתפס בעזרת השוואת ה-DNA שלו לפרופילים גנטיים שמשתמשים העלו לאתר גנאלוגי. הוא ממש לא היה האחרון. מחקר חדש בהובלת מדענים מהחברה הישראלית MyHeritage מדגיש את הסכנות שעלולות להיות לשימושים כאלו, ואף מציע פיתרון.

חברות מסחריות שמציעות ללקוחותיהן בדיקות גנטיות למטרות כמו מידע על מוצאם ובניית אילן יוחסין הפכו לפופולריות מאוד בשנים האחרונות, בעיקר בארצות הברית. יותר מ-16 מיליון אנשים כבר ביצעו את הבדיקות בחברות המובילות, ancestry.com, 23andMe ו-MyHeritage, הפועלת גם בארצות הברית. את הפרופילים הגנטיים אפשר להשוות לפרופילים אחרים מאותה חברה כדי לנסות ולמצוא קרובי משפחה, וגם להעלות לאתרים גנאלוגים דוגמת GEDmatch, המאפשרים השוואה בין גם פרופילים מהחברות האחרות. חברת MyHeritage מאפשרת גם היא העלאה של פרופילים מחברות אחרות אל המאגר שלה.

כשרשויות החוק החלו להעלות לאתרים כאלו פרופילים שהם עצמן יצרו, מ-DNA שהתגלה בזירות פשע, הן מצאו בהם מכרה זהב. הפרופילים המסחריים מכילים הרבה יותר מידע על כל אדם הנמצא בהם מזה שיש במאגר הגנטי של ה-FBI. בשביל זיהוי ודאי שדגימת DNA אכן שייכת לאדם מסוים, משווים החוקרים את רצף החומר הגנטי בכמה עשרות אזורים מוגדרים ב-DNA. לעומת זאת, הבדיקות המסחריות המיועדות בין השאר לאיתור שורשים משפחתיים, מקיפות הרבה יותר וכוללות את קביעת הרצף של כ-600 אלף אזורים ב-DNA. לכן אפשר לאתר בעזרתן לא רק קרובי משפחה מדרגה ראשונה אלא גם קרובים רחוקים הרבה יותר, כמו בני דודים מדרגה שלישית. בניגוד למאגרים של הרשויות, אין שום פיקוח על שימוש באתרים הגנאלוגים, ובעזרת זיהוי קרובי משפחה וקצת הצלבת מידע פומבי החוקרים יכולים לעתים קרובות להגיע אל החשוד עצמו.

השנה בלבד, מאפריל עד אוגוסט, נעצרו בארצות הברית לפחות 13 חשודים בפשעים על סמך מידע שהשיגו החוקרים מאתרים כאלה. ברוב המקרים מדובר על פשעים שהתרחשו לפני זמן רב, כמו אלו של הרוצח מגולדן סטייט, אבל אחד מהם היה פשע שהתרחש באפריל השנה – מה שמצביע על כך שלפחות חלק מהשוטרים מתייחסים למאגרים הגנטיים כעוד כלי, ומשתמשים בו בעבודתם השוטפת.

השימוש הזה במאגרי המידע מעלה שאלות חוקתיות ומוסריות לא מעטות. עד היום כל החקירות המערבות אתרים גנאלוגים נעשו בארצות הברית, ועסקו בפשעים חמורים - רצח ואונס. אבל אף אחד לא מוכן להתחייב שזה יהיה המצב גם בהמשך. "אני חושב שנראה יותר ויותר שימוש של המשטרה באמצעים אלו, שיכול להתרחב גם לעבירות רכוש, עבירות פוליטיות, או מכל סוג אחר" אמר ד"ר יניב ארליך, המדען הראשי של MyHeritage ופרופסור למדעי המחשב באוניברסיטת קולומביה בארצות הברית, בראיון לאתר מכון דוידסון.

כל אחד יכול להזמין בדיקה ולצרף את ה-DNA שלו למאגרים של מיליוני בני אדם. ערכת בדיקה גנטית | צילום: Shutterstock
כל אחד יכול להזמין בדיקה ולצרף את ה-DNA שלו למאגרים של מיליוני בני אדם. ערכת בדיקה גנטית | צילום: Shutterstock

לצמצם את הרשימה

מה הסיכוי שחיפוש במאגר גנאלוגי אכן יוביל למציאת קרובי משפחה של החשוד, ובהנחה שאלה יימצאו, מה הסיכוי שיובילו את השוטרים אל החשוד עצמו? זה מה שבדקו ארליך ועמיתיו במחקר החדש.

הם השתמשו במאגר של MyHeritage, שכולל 1.28 מיליון פרופילים, והריצו כל פרופיל כאילו היה "המטרה", כלומר ה-DNA שעבורו מחפשים קרובי משפחה. הם גילו שעבור כ-60 אחוזים נמצא במאגר בן דוד מדרגה שלישית, ועבור כ-15 אחוז בן דוד מדרגה שנייה או קרוב יותר. בנוסף עשו החוקרים 30 חיפושים באתר GEDmatch, שאליו אפשר להעלות פרופילים של החברות המסחריות השונות, והעלו ממצאים דומים.

בעזרתו של ד"ר שי כרמי, מבית הספר לבריאות הציבור באוניברסיטה העברית בירושלים, בנו החוקרים מודל המדמה את המגוון הגנטי באוכלוסייה. לפי המודל, מאגר מידע צריך להכיל רק שני אחוזים מאוכלוסייה מסוימת בשביל שיימצא בו לפחות בן דוד מדרגה שלישית של כמעט כל אדם מאותה אוכלוסייה. פירוש הדבר הוא שאם יש לנו מאגר של כשלושה מיליוני אמריקאים ממוצא אירופאי, שהם רוב הלקוחות של החברות המציעות בדיקות גנטיות, יותר מ-90 אחוזים של אנשים ממוצא זה ימצאו קרובי משפחה במאגר.

האם זיהוי של בן דוד מדרגה שלישית אכן יכול להוביל את השוטרים למעצר? רק על סמך קרבת המשפחה, רשימת החשודים תכלול בממוצע כ-850 שמות – לא בדיוק מה שיוביל אותנו ישירות אל החשוד שאנחנו מחפשים. אבל אם נכניס עוד פרטים, למשל מין החשוד, שאפשר ללמוד מה-DNA שלו, הערכה של גילו לפי עדויות ראייה, ובנוסף נגביל את החיפוש לאנשים הגרים ברדיוס של מאה מייל מזירת הפשע (כ-160 קילומטר), הרשימה תצטמצם באופן משמעותי. לפי החישובים של החוקרים, במקרה כזה נישאר עם כ-16-17 חשודים בממוצע, קבוצה קטנה מספיק בשביל לחקור באמצעים משטרתיים מקובלים.

אם כך, נראה שהשיטה החדשה אכן יכולה להיות יעילה מאוד, כל עוד יש לחוקרים גישה למאגר גדול מספיק. מאגר כזה יכול להימצא באתרים גנאלוגיים, אבל גם במאגרים למטרות מחקר, כמו פסיפס, המיזם של משרד הבריאות הישראלי ליצירת מאגר מידע רפואי שיכיל מאה אלף פרופילים.

ארליך מדגיש כי הוא תומך במיזם. "הייתי ממליץ לאנשים להירשם למאגר פסיפס" אמר. "צריך להסתכל על היתרונות: מאגר כזה יכול לעזור למצוא טיפול למחלתו של מישהו קרוב אלינו". עם זאת, מאה אלף פרופילים מתקרבים לסף של שני אחוזים מאוכלוסיית ישראל – מה שאומר שהמאגר יהיה כלי יעיל מאוד אם רשויות החוק ישתמשו בו לחיפוש אחר חשודים בפשע. "אם הוא נגנב על ידי מדינה זרה, הוא יכול לשמש לזיהוי של DNA שהושאר שם" הוסיף ארליך. "גם אם האדם עצמו מעולם לא מסר את הפרטים שלו למאגר".

השימוש במאגרים האלה צפוי רק להתרחב, ויש לכך יתרונות רבים. יניב ארליך | צילום: MyHertigae
השימוש במאגרים האלה צפוי רק להתרחב, ויש לכך יתרונות רבים. יניב ארליך | צילום: MyHertigae

לסנן פרופילים

החששות משימוש בלתי הולם במאגרים הוביל חלק מהחברות להגביל את תנאי השירות שלהן: GEDmatch מאשרים הגשת דגימות בידי רשויות החוק רק במקרה של חקירות "פשעים אלימים" כמו רצח ואונס, ו-MyHeritage אוסרת לחלוטין על צירוף דגימות כאלו – אך כרגע אין לחברות באמת דרך למנוע זאת, והן יכולות לכל היותר למחות על כך לאחר מעשה.

בדיוק עבור הבעיה הזו מציעים ארליך ועמיתיו פתרון: חתימה קריפטוגרפית שתלווה כל אחד מהפרופילים המבוצעים על ידי החברות הגדולות. "כשמשתמש מעלה פרופיל לאתר, אני יכול לבדוק אם החתימה הזו תקפה", מסביר ארליך. במקרה שהחתימה חסרה, הדגימה לא נפסלת אוטומטית, אלא מועברת לבדיקה. "אני לוקח אותך לדף אחר, בודק מי אתה, מתחיל בשיחה איתך. הרעיון הוא לבנות חומה גבוהה יותר, כדי לוודא שמי שמשתמש במאגר הוא לגיטימי".

החוקרים צירפו למאמר דוגמת תוכנה המשאירה חתימה שכזו, אך ארליך הדגיש כי מדובר בדוגמה בלבד. "צריך עוד מחשבה על זה, איך יוצרים את האבטחה, וזה ייקח זמן. המאמר נועד להראות את הבעיה, ולהציע לקובעי המדיניות דרך לחשוב על זה".

לצד החשש משימוש בעייתי בנתונים של מאגרי המידע, גם אם למטרה טובה, צריך לזכור שכמעט כל השימושים שנעשים במאגרים הגנטיים נעשים למטרות חיוביות: מחיפוש קרובים ועד מחקר רפואי. "יש לנו סיפורי הצלחה נפלאים, ילדים מאומצים שמצאו את המשפחות שלהם, ניצולי שואה שמצאו קרובי משפחה לאחר עשרות שנים" סיפר ארליך. "אנחנו אומרים למי שמנהל את המאגרים, תחשבו על שיתוף המידע שלכם. אפשר לבנות דברים מאוד יפים, רק צריך לבנות אותם נכון".

0 תגובות