ענקית הייעוץ KPMG נאלצה להסיר דוח מקצועי שפרסמה באוקטובר האחרון, לאחר שהתברר כי הוא מלא בנתונים שגויים, ציטוטים מומצאים והפניות למקורות שלא קיימים. הדוח עסק באופן שבו ארגונים גדולים משלבים סוכני בינה מלאכותית בפעילותם, ונקרא "הגדרה מחדש של מצוינות בעידן של סוכני בינה מלאכותית".

הבדיקה שחשפה את הכשלים בוצעה על ידי חברת GPTZero, המתמחה בזיהוי תוכן שנוצר באמצעות בינה מלאכותית. הממצאים היו מדאיגים: מתוך 45 מראי מקום שנבדקו בדוח, רק 5 הפנו למקורות הנכונים. את כל השאר הגדירו חוקרי GPTZero כמטעות, חלקיים או בלתי ניתנים לאימות בכלל.

ברגע שהממצאים פורסמו, החלו ארגונים שהוזכרו בדוח להגיב בזה אחר זה. בנק UBS דחה נחרצות את הטענה כי הוא מפעיל מערכת לניהול סיכונים מבוססת בינה מלאכותית כפי שתואר, ודרש להסיר את ההתייחסות אליו. גם רשות התחבורה של לונדון וחברת הרכבות השווייצרית הבהירו כי התיאורים במסמך אינם משקפים את המציאות.

דוגמה בולטת נוספת שחשפו החוקרים נוגעת לחברת התעופה Emirates. הדוח טען כי החברה מפעילה צ'טבוט בשם "שרה" המסוגל לשוחח עם נוסעים ולבצע שינויים בהזמנות טיסה. בפועל, "שרה" היא סייעת רובוטית שהוצגה ב-2023, ואינה מסוגלת לבצע שום שינוי בהזמנה.

חוקרי GPTZero טבעו לתופעה שם: "ציטוט לפי תחושה". זה קורה כשמודל בינה מלאכותית משלב פיסות מידע חלקיות, ממציא כותרות ושמות מקורות שנשמעים אמינים, ויוצר הפניות שנראות לגמרי מקצועיות, עד שמישהו טורח לבדוק אותן בפועל.

KPMG הגיבה ומסרה כי החברה "לוקחת ברצינות את הדיוק והאמינות של התוכן שהיא מפרסמת". לדבריה, העובדים מחויבים להנחיות שימוש אחראי בבינה מלאכותית, הכוללות בקרה אנושית ואימות מידע מול מקורות עצמאיים. בינתיים, הדוח הוסר ובחקירה פנימית נפתחה.

שווה לדעת שזה לא מקרה בודד. לפי הדיווחים, פירמות ייעוץ נוספות נאלצו לאחרונה להתמודד עם מקרים דומים, כשדוחות שנכתבו או נערכו בסיוע בינה מלאכותית הכילו טעויות עובדתיות והפניות שגויות שעברו מתחת לרדאר.

הפרשה ממחישה בצורה חדה את הסיכון שבשימוש לא מבוקר בכלי בינה מלאכותית לצורך הפקת תוכן מקצועי, בדיוק בתחום שבו KPMG אמורה היתה להציג מומחיות. תוצאות החקירה הפנימית של החברה טרם פורסמו.

KPMG עדיין לא הבהירה כיצד בדיוק נוצר הדוח ומי אישר את פרסומו.

KPMG הסירה דוח על בינה מלאכותית שהתברר כמלא בממצאים מומצאים

תגובות

רגע, שקט פה מדי