חברה מסחרית פיתחה שיטה מתקדמת לחיזוי מבנה תלת-ממדי של חלבונים בעזרת בינה מלאכותית. האם זו מהפכה בביולוגיה?

חברה מסחרית עוררה סערה השבוע בתחרות הדו-שנתית לחיזוי מבנה של חלבונים, כשהצליחה לפענח מבנה של חלבונים ברמת דיוק גבוהה מאוד, בעזרת שיטה המבוססת על בינה מלאכותית. האם מדובר במהפכה בביולוגיה או בעוד אחד משורה ארוכה של כלים המסייעים למדענים לפענח את המבנה של חלבונים? ומדוע בכלל חשוב לנו להבין את המבנה הזה? 

מכונות החיים

חלבונים הם מעין מכונות זעירות, שאחראיות על ביצוע רוב התפקידים בתא החי ורבים מהתפקודים של האורגניזם השלם. שניים מהחלבונים המוכרים הם הֶמוֹגְלוֹבִּין, האחראי על הולכת חמצן מהריאות לתאי הגוף, ואִינְסוּלִין, האחראי על ויסות רמות הסוכרים בדם. 

כדי שיצליחו למלא את תפקידם כראוי, רוב החלבונים צריכים להתארגן במבנה תלת- ממדי מסוים מאוד. המוגלובין, למשל, בנוי כך שהוא יכול לקשור אטום חמצן בריאות, ולשחרר אותו במגע עם תאים אחרים. לכן, כדי להבין באמת איך חלבון עובד, או למה הוא מפסיק לעבוד כאשר מתפתחת מחלה מסוימת, צריך להבין את המבנה התלת-ממדי שלו. 

פענוח המבנה התלת-ממדי של חלבונים הוא משימה מורכבת במיוחד, ולעיתים דורשת  כמה שנים טובות של עבודה, אם היא בכלל אפשרית. לשם המחשה, אנחנו מכירים היום את הרצפים הגנטיים שאחראי לייצור של מיליארדי חלבונים בכל מערכות החיים, מתוכם כמה עשרות אלפים אצל בני אדם, אבל מדענים הצליחו לפענח את המבנים רק של כ-170 אלף מהם.

מכונות שאחראיות על תפקודים רבים של הגוף. המבנה של חלבון ההמוגלובין, המספק חמצן לתאים | איור: Andrea Danti, Shutterstock
מכונות שאחראיות על תפקודים רבים של הגוף. המבנה של חלבון ההמוגלובין, המספק חמצן לתאים | איור: Andrea Danti, Shutterstock

התחרות הדו-שנתית לחיזוי מבני חלבונים

מה הקשר בין רצף גנטי לבין מבנה של חלבון? כל חלבון מורכב משרשרת של חומצות אמינו, המחוברות זו לזו כמו חרוזים. בסך הכל עשרים חומצות אמינו שונות מרכיבות את מיליארדי החלבונים בטבע. לכל חלבון יש רצף ייחודי של חומצות אמינו. והוא נקבע לפי הרצף הגנטי, המוצפן ב-DNA שלנו. לאחר הרכבת השרשרת היא מתקפלת ליצירת המבנה התלת-ממדי של החלבון הפעיל. לכאורה, היינו מצפים שבהינתן רצף מסויים של חומצות אמינו, היה אפשר לנבא איך ייראה המבנה התלת-ממדי של החלבון. אבל רק לכאורה.

תחרות CASP (קיצור של Critical Assessment of Techniques for Protein Structure Prediction) שמתקיימת בימים אלה בפעם ה-14, והשנה במתכונת וירטואלית, שמה לה למטרה בדיוק את זה : לחזות את המבנה של חלבון, מתוך הרצף של חומצות האמינו בלבד. כמה שבועות לפני התחרות, המארגנים מפרסמים את רצף חומצות האמינו של כמאה חלבונים, והמשתתפים בתחרות צריכים לנסות לחזות את המבנה התלת-ממדי של החלבונים על סמך הרצף הזה בלבד.

באופן מסורתי, הפתרונות של הקבוצות השונות המשתתפות בתחרות מדורגות בין 0 ל-100, כאשר ציון מעל 85 נחשב קרוב מאוד למבנה האמיתי של החלבון, שפוענח בעזרת שיטות נסיוניות כמו קריסטלוגרפיה בעזרת קרני X, מיקרוסקופיית אלקטרונים או תהודה מגנטית גרעינית.

כל חלבון מורכב משרשרת שרק לאחר ייצורו היא מתקפלת למבנה פעיל. שרשרת חומצות אמינו | איור: CHRISTOPH BURGSTEDT / SCIENCE PHOTO LIBRARY
כל חלבון מורכב משרשרת שרק לאחר ייצורו היא מתקפלת למבנה פעיל. שרשרת חומצות אמינו | איור: CHRISTOPH BURGSTEDT / SCIENCE PHOTO LIBRARY

או אה מה קרה?

השנה נפל דבר. בעוד בתחרויות קודמות הקבוצות המצליחות ביותר לא קיבלו ציונים גבוהים מ-40, הקבוצה המובילה השנה קיבלה ציון של יותר מ-85. זה אומר שהם הצליחו לחזות היטב את מבנה החלבונים, כפי שנקבע בשיטות אחרות. הם הצליחו מאוד עם שני שלישים מהחלבונים, אבל גם הם לא הצליחו לפענח את המבנה של שליש מהחלבונים בתחרות. הקבוצה הזוכה השנה היא חברה מסחרית בשם DeepMind - חברה בת של גוגל, ולא קבוצת מחקר אקדמית.

אז איך הם עשו את זה?

מכיוון שזו חברה מסחרית, ומכיוון שהתחרות בעיצומה, אנחנו לא יודעים עדיין פרטים מלאים (אם כי לדבריהם יפרסמו בקרוב מאמר בכתב עת מדעי, עם פירוט מלא של השיטה), אבל קצה חוט יש. הפעם הראשונה ש-DeepMind  השתתפה בתחרות היתה בתחרות הקודמת בשנת 2018, וגם אז היא זכתה במקום הראשון, בפער גדול מהקבוצות האחרות.

למיטב הבנתנו כרגע, האלגוריתם שהיא פיתחה, שנקרא "קיפול אלפא" (Alpha Fold) עובד כך: בשלב ראשון, לוקחים את הרצף של החלבון שאת המבנה שלו רוצים לפענח, ומחפשים חלבונים בעלי רצף דומה של חומצות אמינו. לפי רמת הדמיון ברצף, אפשר להגדיר עד כמה החלבונים קרובים אבולוציוניות. כעת, אם יש חומצות אמינו שהן שמורות לאורך האבולוציה, או שהן משתנות באופן מתואם לאורך האבולוציה, כנראה יש לכך סיבה טובה מבחינת התפקיד שהחלבון צריך למלא, ולכן מניחים שהן קרובות אחת לשניה גם במבנה התלת מימדי של החלבון, אפילו אם אינן קרובות ברצף, כלומר יהיו זו ליד זו בחלבון הפעיל. 

השימוש במידע אבולוציוני לחיזוי מבני חלבונים אינו חדש, וגם כלים אחרים משתמשים בו. אולם, בעוד הכלים הקיימים משתמשים במידע הזה כדי להגדיר באופן בינארי אם שתי חומצות אמינו יוצרות ביניהן קשר, ב"קיפול אלפא", מתרגמים את המידע האבולוציוני לא למידע בינארי – יש קשר או אין קשר – אלא לרצף של הסתברויות למרחקים האפשריים בין צירופים של שתי חומצות אמינו בחלבון. 

את המידע האבולוציוני, עם מידע מבני מתוך המבנים הקיימים בבנק המידע של החלבונים מזינים לתוך כלי של בינה מלאכותית המכונה "רשת נוירונים". רשת הנוירונים מייצרת מעין סולם ניקוד ייחודי, הנקרא "פונקציית אנרגיה", עבור כל חלבון שהיא לומדת. כדי למצוא את המבנה של החלבון, צריך לחפש את הנקודה האופטימלית בסולם, שהיא הנמוכה ביותר מבחינת אנרגיה, ולכן גם המועדפת. אפשר לדמות את התהליך הזה לחיפוש הנקודה הנמוכה ביותר בטיול בין הרים, גבעות, אוכפים ומישורים. אבל בעוד הטיול המדומיין שלנו מתרחש בדרך כלל במישור דו-מימדי, הטיול במרחב אפשרויות הסידור המרחבי של החלבון מכיל הרבה יותר ממדים. פונקציית האנרגיה של "קיפול אלפא" לוקחת בחשבון גם מידע על הכוחות הפיזיקליים הפועלים בין חומצות האמינו. 

"קיפול אלפא" הוא לא הכלי היחיד בתחרות השנה שהשתמש בבינה מלאכותית כדי לנסות לחזות מבנה של חלבונים, אבל הוא בהחלט הכלי שעשה את זה הכי טוב. 

תגובת שרשרת: המבנה התלת-תממדי של החלבון הוא שקובע את הפעילות שלו | איור: CHRISTOPH BURGSTEDT / SCIENCE PHOTO LIBRARY
תגובת שרשרת: המבנה התלת-תממדי של החלבון הוא שקובע את הפעילות שלו | איור: CHRISTOPH BURGSTEDT / SCIENCE PHOTO LIBRARY

מהפכה בביולוגיה?

האם היכולת לחזות בצורה טובה מבנה של חלבון רק על סמך הרצף שלו תחליף את הצורך בעבודה נסיונית? התשובה הפשוטה היא שככל הנראה לא. קודם כל, אנחנו לא יודעים עדיין עד כמה הכלי הזה יעיל בסוגים רבים של חלבונים. גם רמת ההצלחה של "קיפול אלפא" בתחרות הנוכחית לא הייתה אחידה לכל החלבונים. ועדיין, היא בהחלט יכולה לסייע בפענוח מבנים של חלבונים. פעמים רבות, המידע שאוספים משיטות כמו קריסטלוגרפיה או מיקרוסקופיית אלקטרונים אינו מספיק כדי לפתור מבנה של חלבון, ובהחלט ייתכן שכלי כמו "קיפול אלפא" יכול לסייע להגיע למבנה של חלבון גם עם נתונים גולמיים פחות טובים.

אנדרי קרישטפוביץ' (Kryshtafovych) מאוניברסיטת דייויס שבקליפורניה, אחד השופטים בתחרות, אמר כי "ליכולת לחקור את המבנה של חלבונים בצורה מהירה ואמינה יש פוטנציאל לחולל מהפכה במדעי החיים. כעת, כאשר הבעיה כמעט נפתרה עבור חלבונים בודדים, האתגר הבא הוא לפתח שיטות לחיזוי המבנה של קבוצות של חלבונים הפועלות ביחד (קומפלקסים), שמהן מורכבות המכונות של החיים".

ג'נט ת'ורנתון (Thornton), מהמעבדות האירופיות לביולוגיה מולקולרית ומהמכון האירופאי לביו-אינפורמטיקה (EMBL-EBI), אמרה כי "הבנה טובה יותר של מבני  חלבונים והיכולת לחזות את המבנים שלהם בעזרת מחשב, משמעותה הבנה טובה יותר של החיים, של אבולוציה, וכמובן גם של בריאות ומחלות של בני אדם".

דמיון כמעט מלא. המבנה של שני חלבונים כפי שחזתה התוכנה (כחול) וכפי שנמצא בניסויים (ירוק) | מקור: DeepMind
דמיון כמעט מלא. המבנה של שני חלבונים כפי שחזתה התוכנה (כחול) וכפי שנמצא בניסויים (ירוק) | מקור: DeepMind

האותיות הקטנות

למרות ההתקדמות הגדולה בניבוי המבנה של חלבונים בודדים, עדיין יש הרבה היבטים בהבנת אופן הפעולה של חלבונים שהם קשים יותר לחיזוי, וכדי להבין אותם לעומק צריך לעבוד קשה, במעבדה עם מבחנות ועם חלבונים אמיתיים. ראשית, פעמים רבות התפקוד של חלבון לא תלוי רק ברצף של חומצות האמינו, אלא גם בשינויים כימיים שחלבונים עוברים לאחר שהריבוזום מייצר אותם בתא. בנוסף, לחלק לא מבוטל מהחלבונים אין כלל מבנה תלת-ממדי מוגדר – אצל יונקים מדובר על בערך 30 אחוז מכלל החלבונים בתא, ועדיין יש להם חשיבות ביולוגית עצומה. יתר על כן, אם נחזור רגע למשל של חלבונים כמכונות, תמונה סטטית של מכונה היא נקודת התחלה טובה, ואף הכרחית כדי להבין איך המכונה עובדת. אבל כדי להבין יותר טוב את פעולתה, אנחנו צריכים להבין איך החלקים שלה זזים כתלות בזמן ובחלקים אחרים, וזה מה שנקרא "דינמיקה". את המידע הזה אפשר גם למדל בעזרת מחשב בשיטה שנקראת "דינמיקה מולקולרית" וזיכתה את מפתחיה, בהם חוקרים ישראלים, בפרס נובל בכימיה לשנת 2013, אבל גם היא אינה מושלמת.

החדשות שהגיעו בסוף נובמבר 2020 מהתחרות ה-14 של CASP הן אכן פריצת דרך משמעותית מאוד, אבל קשה לומר שבעיית חיזוי המבנה של חלבונים נפתרה. גם מעבר לפענוח המבנה של חלבונים, למדענים שחוקרים מבנה ותפקוד של חלבונים יש עדיין עוד הרבה מאוד עבודה.