בינה שלומדת למה
המחקר החדש של Anthropic מציע שינוי עומק בשיח בטיחות הבינה המלאכותית: מודל בטוח באמת אינו רק מודל שיודע מה אסור לו לעשות, אלא מודל שמבין מדוע. במקום רשימת איסורים חיצונית, Anthropic בוחנת כיצד מסמכים חוקתיים וסיפורים על AI מיושר יכולים לצמצם התנהגות מסוכנת גם בתרחישים שלא הופיעו באימון עצמו. במחקר דווח כי מערך כזה הפחית שיעורי התנהגות בעייתית מ־65% ל־19%.
ד"ר מריה קרוט
חתול בינה ומכונה לומדת
מערכת חדשות התקשורת
פו הדב זועם !
כתובת אימייל *
סיסמא *
התחבר Create your account
שם פרטי *
שם משפחה *
הרשמה Login
Website (leave empty)