בינה מלאכותית הביסה גיימרים מקצועיים במשחק מרוצים

המשחק הצטרף לשורת משחקים, ובהם שחמט, שבינות מלאכותיות עברו בהם את רמתם של מיטב המוחות האנושיים

בינה מלאכותית שפיתחו חוקרים מחברת סוני AI ניצחה שחקנים מהטובים בעולם במשחק המרוצים "גרנד טוריזמו" של סוני פלייסטיישן. זהו משחק מרוצים המדמה בצורה מציאותית למדי מרוצי מכוניות במציאות, מבחינת השפעתם של חוקי הפיזיקה והשפעת המתחרים אלה על אלה.

בינה מלאכותית היא מערכת ממוחשבת המצוידת במנגנון קבלת החלטות ומיועדת להשיג מטרה מסוימת. מטרות הבינה המלאכותית יכולות להיות מגוונות, כגון השתתפות במשחקים שונים, פענוח תמונות או נהיגה. במקרים רבים, המערכת היא בעלת יכולת למידה, ומשתפרת בביצוע המשימה ככל שהיא צוברת ניסיון, בדומה לבני אדם.

בשנים האחרונות הולך וגובר השימוש במערכות המיישמות עיקרון של למידת חיזוק עמוקה (deep reinforcement learning), שבו המערכת מקבלת כמידע מקדים רק את מבחר הפעולות המותרות, ללא אסטרטגיות מוכנות. לאחר מכן הבינה המלאכותית "מתאמנת" בביצוע הפעולה באופן עצמאי, ומקבלת משוב על מידת ההצלחה שלה. בכל נקודת זמן במשחק, הבינה המלאכותית בוחנת את המצב ובוחרת פעולה לפי מדיניותה העדכנית. לאחר מכן היא מקבלת תמורה, או "ניקוד", בהתאם להצלחת הפעולות שביצעה, ומעדכנת את המדיניות בהתאם לכך.

נער משחק במשחק מירוצים | Shutterstock, OlegDoroshin
בינה מלאכותית ניצחה שחקנים מהטובים בעולם במשחק "גרנד טוריזמו". נער משחק במשחק מרוצים | Shutterstock, OlegDoroshin

רמות ניסיון שבני אדם אינן מסוגלים להגיע אליהן

חוקרים מחברת סוני AI יצרו מערכת בינה מלאכותית המיועדת למשחק זה, שזכתה לשם "גרנד טוריזמו סופי", או בקיצור "GT סופי" ("סופיה" ביוונית עתיקה פירושו "חוכמה"). המערכת צברה מעל 45,000 שעות משחק, וביולי הצליחה לנצח כל שחקן אנושי בזמני הקפה במסלולים שונים במשחק. לשם השוואה, על פי הערכות לא-רשמיות, גיימרים מקצועיים צוברים בערך 20,000-5,000 שעות משחק לאורך הקריירה שלהם. באוקטובר האחרון הצליחה GT סופי לנצח ארבעה מהמתחרים הטובים בעולם במירוצים "ראש בראש", ובכך צירפה את המשחק גרנד טוריזמו לשורת משחקים שבהם מערכות בינה מלאכותית התעלו על השחקנים האנושיים הטובים ביותר. בין המשחקים האחרים נמנים שחמט, גו וStarCraft 2.

החידוש שבניצחון של מערכות בינה מלאכותית על בני אדם במשחק זה מתבטא בשני אלמנטים עיקריים:

נהיגה בקצה גבול החיכוך: המערכת נדרשת לחשב מודלים פיזיקליים של תגובת הסביבה לפעולותיה, ולנצל באופן מרבי את האחיזה בכביש שהחיכוך מאפשר. לדברי החוקרים, "בנהיגה בקצה גבולות החיכוך, טעויות קטנות במודל עלולות להיות קטסטרופליות. התמודדות נגד נהגים אחרים מציבה דרישות גדולות אף יותר לדיוק המודל". כלומר, אלה מודלים מסובכים יותר ופחות סובלניים לטעויות מאשר במשחקים קודמים שבהם ניצחו בינות מלאכותיות.
ספורטיביות: נוסף על המטרה של ניצחון במשחק, החוקרים קבעו לבינה המלאכותית מטרה נוספת: לשחק באופן "ספורטיבי". דרישה זו מגבילה מגוון פעולות בהתמודדות של המערכת עם שחקנים יריבים, אך היא עמומה משהו וקשה לפרוט אותה לפרטים. בני אדם מיישמים שכבות רבות של ניתוח מידע וקבלת החלטות, שרבות מהן אינן מודעות, וכך מצליחים להתמודד עם דרישות שאינן מוגדרות בדייקנות, כמו "להתנהג יפה". תוכנות המחשב המסורתיות שעליהן מבוססת הבינה המלאכותית אינן מסוגלות להתמודד עם דרישות שאינן ברורות ומדויקות, אבל GT סופי יכולה להכניס גם שיקולים כאלו לתהליך קבלת ההחלטות שלה. משימות רבות שעשויות לעבור בעתיד לאחריותן של מערכות בינה מלאכותית, כגון נהיגה ורפואה, דורשות אינטראקציה עם בני אדם והתמודדות והסתגלות לנורמות חברתיות שאינן מוגדרות לפרטי פרטים. לפיכך, התקדמות של בינה מלאכותית לקראת יכולות אלו היא צעד משמעותי.

סרטון של סוני, שמראה את יצירת של GT סופי:

חשיבה לא-אסטרטגית

מאפיין אחד של נהגי מירוצים ש-GT סופי לא הצליחה לשחזר הוא חשיבה אסטרטגית. נהגי מרוצים מקצועיים, וכן שחקני צמרת במשחקים המדמים מירוצים כמו גרנד טוריזמו, חושבים באופן אסטרטגי על השלכות הפעולות שלהם במשחק לטווח הארוך. התוכנה מתקשה בכך. למשל, לדברי החוקרים, "GT סופי מנצלת את ההזדמנות הראשונה לעקוף את היריב – גם אם תוך כדי כך היא משאירה ליריב מספיק מקום כדי לעקוף בחזרה".

נוסף על היותה צעד חשוב לקראת מערכות בינה מלאכותית המתמצאות בנורמות חברתיות, GT סופי עשויה לתרום לפיתוח אסטרטגיות חדשות בנהיגת מרוצים. ייתכן שביצועי התוכנה יתרמו גם לתחום הפיתוח של מכוניות אוטונומיות, אף שיש הבדלים לא מעטים בין דרישות הביצועים התובעניות של נהיגת מרוצים לבין דרישות הבטיחות המחמירות של הסעת בני אדם לצורכי תחבורה יומיומית.