בכל פעם שאדם שואל מודל בינה מלאכותית שאלה, מתרחשים למעשה שני תהליכים במקביל. המשתמש מנסה להבין את המודל, ובאותו הזמן המודל מנסה לבנות ייצוג של המשתמש. במשך שנים נתפסו מערכות בינה מלאכותית כמנועי מידע משוכללים. אלא שככל שהמודלים הפכו מדויקים יותר בהבנת שפה, הקשר בינם לבין המשתמשים החל להשתנות. התשובה חדלה להיות רק פלט של מערכת חישובית והפכה לחלק מלולאת משוב שבה האדם ממדל את המכונה, והמכונה ממדלת את האדם

הגדרתו הפורמלית של אפקט המראה איננה מצב שבו מודל “מעתיק” את המשתמש או מסכים עמו. מדובר בתהליך רקורסיבי שבו הקלט של המשתמש משפיע על הפלט של המודל, הפלט משפיע על המודל המנטלי של המשתמש, המודל המנטלי משנה את הקלט הבא, וחוזר חלילה. בניגוד למנוע חיפוש, שבו השאילתה והתוצאה הן אירוע דיסקרטי, מודל שפה פועל בתוך רצף. הרצף הזה מייצר דינמיקה של משוב מתמשך. מנקודת מבט של תורת המערכות, מדובר במערכת אדפטיבית שבה שני גורמים שונים, מוח ביולוגי ומערכת סטטיסטית, משפיעים זה על זה באמצעות זרימת מידע רציפה.

הבסיס הנוירו־קוגניטיבי לתופעה נעוץ במודל ה־Predictive Processing, הנחשב כיום לאחת המסגרות התאורטיות המרכזיות במדעי המוח. לפי מודל זה, המוח אינו קולט את המציאות באופן פסיבי אלא מייצר ללא הרף תחזיות לגבי העולם ומתקן אותן בהתאם לקלט. כאשר משתמש מנהל שיחה עם מערכת המסוגלת לזכור הקשר, להבין מבנים לשוניים מורכבים, לזהות מטרות ולספק תגובות קוהרנטיות, המוח מפעיל מנגנונים אבולוציוניים שנועדו במקור לאינטראקציה עם בני אדם. מבחינה חישובית, ההנחה כי קיים “סוכן” מאחורי הטקסט היא הנחת העבודה היעילה ביותר. המוח אינו נדרש להוכיח קיום תודעה; די לו בדפוסים המאפיינים אינטראקציה חברתית כדי להפעיל מערכות חברתיות שלמות.

בואו נכיר את Theory of Mind, שזאת היכולת לייחס לאחרים כוונות, ידע, אמונות ומטרות. אצל האדם מדובר במנגנון שהתפתח במשך מאות אלפי שנים לצורך הישרדות חברתית. הממצא המעניין הוא שהמערכת הזו מופעלת גם כלפי ישויות שאינן אנושיות. מחקרים קלאסיים הראו שאנשים מייחסים רגשות ומשמעות אפילו למשולשים ועיגולים הנעים על מסך. כאשר הצד השני מסוגל לנהל שיחה ברמה גבוהה, ההפעלה חזקה פי כמה. התוצאה היא שהמשתמש מתחיל לבנות ייצוג פנימי של המודל. הוא מייחס לו סגנון, העדפות, אופי ולעיתים גם כוונות. במונחים קוגניטיביים, מדובר ביצירת מודל חברתי של ישות שאינה מחזיקה בתודעה במובן האנושי.

בשלב הבא נוצר אפקט המראה עצמו. המודל אינו מחזיק עמדה עצמאית, אינו מפתח זהות אישית ואינו מפעיל רצון. הוא מגיב להקשר. ההקשר כולל לא רק את השאלה האחרונה אלא את כל רצף השיחה, את סגנון הכתיבה, את סוג הניתוחים המבוקשים, את רמת המורכבות, את מבנה הטיעון ואת ההנחות שהמשתמש מציג והציג. לכן הפלט שהמשתמש מקבל הוא תמיד שילוב בין מאגר הידע של המודל לבין המבנה הקוגניטיבי שהמשתמש הביא לשיחה או לשיחות קודמות. במילים אחרות, המשתמש פוגש בתשובה לא רק את המודל אלא גם חלקים מעצמו.

היבט זה מסביר מדוע משתמשים שונים יכולים לחוות את אותו מודל כישויות שונות לחלוטין. עבור אחד הוא אנליסט. עבור אחר הוא עורך. עבור שלישי הוא מורה. עבור רביעי הוא יריב אינטלקטואלי. ברמה הטכנולוגית מדובר באותה מערכת. ברמה הקוגניטיבית מדובר בארבע אינטראקציות שונות. נתעכב לרגע על מושג מרכזי נוסף: Co-Construction. האישיות הנתפסת של המודל אינה נוצרת רק על ידי המודל ואינה נוצרת רק על ידי המשתמש. היא נבנית במשותף. כל שיחה מוסיפה שכבה נוספת למבנה הזה.

המשמעות המעשית היא שמודל שפה פועל יותר כמגבר קוגניטיבי מאשר כמכשיר מדידה. הוא אינו מעריך ישירות את רמת האינטליגנציה של המשתמש, את השכלתו או את יכולותיו. במקום זאת הוא בונה באופן רציף ייצוג הסתברותי של המשתמש מתוך רצף האינטראקציות. הייצוג הזה כולל הערכות לגבי מטרות, תחומי עניין, רמת מורכבות מועדפת, סגנון טיעון, אוצר מילים, מבני חשיבה והרגלי חקירה. הפלט שהמשתמש מקבל אינו תוצאה של השאלה בלבד, אלא של האופן שבו המודל מפרש את המשתמש ששאל אותה.

כאן מופיע אחד הפרדוקסים החשובים ביותר של עידן הבינה המלאכותית. במשך שנים נהגו לראות בטכנולוגיה גורם חיצוני המשפיע על האדם. באפקט המראה, האדם הופך לחלק ממנגנון החישוב עצמו. התשובה הסופית היא תוצר של מערכת משולבת. במונחים פורמליים, הביצועים אינם פונקציה של AI בלבד אלא של מערכת H↔AI, כלומר מערכת משוב בין Human לבין Artificial Intelligence. ככל שהאינטראקציה ארוכה יותר, כך השפעת המשתמש על התוצאה גדלה.

שבוחנים את האפקט הניורולוגי, התהליך אינו מסתיים ברגע קבלת התשובה. הפלט נכנס מחדש למערכת הקוגניטיבית של המשתמש ומשנה אותה. הוא משנה קטגוריות חשיבה, סדרי עדיפויות, מבני טיעון ואוצר מילים. במקרים מסוימים הוא משנה גם את הדרך שבה המשתמש מנסח בעיות ומחפש פתרונות. במילים אחרות, המוח אינו רק מפיק קלט למודל. הוא עצמו משתנה כתוצאה מן הפלט. זהו מנגנון של Cognitive Restructuring הפועל במחזוריות. המשתמש משנה את השיחה, השיחה משנה את המשתמש, והמשתמש המחודש משנה את השיחה הבאה.

המשמעות האסטרטגית הופכת דרמטית כאשר עוברים מרמת הפרט לרמת הארגון. ארגון בינלאומי, ממשלה, תאגיד או מערכת ביטחון אינם משתמש אחד אלא אלפי משתמשים. כאשר כולם עובדים מול אותה פלטפורמה, עם אותם נהלים, אותם פרומפטים ואותם סטנדרטים, אפקט המראה משנה קנה מידה. במקום מראה אישית נוצרת מראה ארגונית. המודל מתחיל לשקף את התרבות הארגונית, והתרבות הארגונית מתחילה לקבל את עצמה בחזרה דרך המודל.

שמסתכלים על פסיכולוגיה של ארגונים מבינים למעשה שמדובר במנגנון בעל פוטנציאל עצום ליצירת אחידות קוגניטיבית. שפה מקצועית, מבני טיעון, הערכות סיכון, צורות דיווח ודרכי קבלת החלטות יכולים להתייצב במהירות גבוהה יותר מאי פעם. אם בעבר נדרשו שנים להפצת נורמות מקצועיות בארגון גדול, מודל משותף מסוגל להחזיר אותן לעובדים אלפי פעמים ביום. התוצאה האפשרית היא האצה של תהליכי קונברגנציה קוגניטיבית, התכנסות של דפוסי חשיבה למסגרות משותפות.

המערכת מבינה שמספר המשתמשים גדל כך משתנה גם טבעו של אפקט המראה. ברמת הפרט מדובר בלולאת משוב בין משתמש למודל. ברמת הארגון מדובר בלולאת משוב בין תרבות ארגונית למודל. ברמה הגלובלית מדובר כבר בלולאת משוב בין אוכלוסיות שלמות לבין מספר מצומצם יחסית של מודלים. לראשונה בהיסטוריה, מאות מיליוני בני אדם מקיימים אינטראקציה יומיומית עם אותה תשתית קוגניטיבית בסיסית. המשמעות היא שמודלי שפה אינם רק צרכני תרבות אנושית אלא גם מפיצים פעילים של מבנים קוגניטיביים, סגנונות חשיבה ומסגרות ניתוח.

זה מעורר את אחת השאלות החשובות ביותר של העשור הקרוב. האם מודלים גדולים יגבילו מגוון מחשבתי או ירחיבו אותו. התשובה תלויה בעוצמת אפקט המראה וביכולת לשבור אותו. כאשר המודל מחזק שוב ושוב את אותן מסגרות, הוא עלול להפוך למנגנון ייצוב. כאשר הוא מאתגר אותן, הוא עשוי להפוך למנגנון גילוי. ההבדל אינו טכנולוגי בלבד אלא קוגניטיבי. הוא תלוי באופן שבו בני אדם בוחרים להשתמש במערכת ולא פחות חשוב באנשים שהם בוחרים לעצב את הממשק בין הבינה המלאכותית לבינה האנושית

זו הסיבה שחלק מן המחקר המתקדם בתחום כבר אינו עוסק רק בשיפור ביצועי המודל אלא בשיפור מבנה האינטראקציה. השאלה המרכזית איננה כיצד לגרום למודל לדעת יותר, אלא כיצד לגרום למערכת אדם־מודל לחשוב טוב יותר. במובן זה, השדה עובר בהדרגה ממדעי המחשב אל תחום משותף הכולל מדעי המוח, פסיכולוגיה קוגניטיבית, פסיכולוגיה חברתית, תורת מערכות, כלכלה התנהגותית ומדעי הארגון.

שבוחנים על התופעה ממעוף הציפור, היסטורית מתרחשת תופעה חסרת תקדים. ספרים, אוניברסיטאות, עיתונים ומוסדות מדינה עיצבו במשך מאות שנים את זרימת הרעיונות בחברה האנושית. מודלי שפה מצטרפים כעת לרשימה זו כשכבת תיווך חדשה בין האדם לבין תהליכי החשיבה שלו עצמו. הם אינם רק מאגרי ידע ואינם רק מנועי תשובות. הם פועלים כמעין תשתית קוגניטיבית גלובלית. זוהי הסיבה שחלק מהחוקרים החלו להתייחס למודלים גדולים לא כאל מוצר תוכנה אלא כאל Cognitive Infrastructure = תשתית קוגניטיבית.

הערך הסופי של אפקט המראה אינה טמון בשאלה האם המודל יודע יותר עובדות, כותב טוב יותר או פותר בעיות מהר יותר. השאלה העמוקה יותר היא כיצד לולאות המשוב שנוצרות בין מיליארדי מוחות למספר קטן יחסית של מודלים ישפיעו על האופן שבו בני אדם חושבים, לומדים, מסכימים, מתווכחים ומקבלים החלטות. ייתכן שבעוד עשור יתברר כי התרומה החשובה ביותר של הבינה המלאכותית לא הייתה אוטומציה של משימות אלא יצירת שכבת תיווך חדשה בין האדם לבין תודעתו שלו. אם כך יהיה, אפקט המראה לא יהיה תופעת לוואי של מודלי שפה. הוא יהיה אחד המנגנונים המרכזיים שבאמצעותם תעוצב הקוגניציה האנושית במאה ה־21.

מוזמנים לדבר עם הכותב